1package Lingua::StopWords::NL; 2 3use strict; 4use warnings; 5 6use utf8; 7 8use Encode qw(encode); 9 10use Exporter; 11our @ISA = qw(Exporter); 12 13our %EXPORT_TAGS = ( 'all' => [ qw( getStopWords ) ] ); 14our @EXPORT_OK = ( @{ $EXPORT_TAGS{'all'} } ); 15our $VERSION = 0.12; 16 17sub getStopWords { 18 if ( @_ and $_[0] eq 'UTF-8' ) { 19 my %stoplist = map { ( $_, 1 ) } _stopwords(); 20 return \%stoplist; 21 } 22 else { 23 my %stoplist = map { ( encode("iso-8859-1", $_), 1 ) } _stopwords(); 24 return \%stoplist; 25 } 26} 27 28sub _stopwords { 29 return qw( 30 de en van ik te dat die in een hij het niet zijn is was op aan 31 met als voor had er maar om hem dan zou of wat mijn men dit zo 32 door over ze zich bij ook tot je mij uit der daar haar naar heb 33 hoe heeft hebben deze u want nog zal me zij nu ge geen omdat 34 iets worden toch al waren veel meer doen toen moet ben zonder 35 kan hun dus alles onder ja eens hier wie werd altijd doch wordt 36 wezen kunnen ons zelf tegen na reeds wil kon niets uw iemand 37 geweest andere 38 ); 39} 40 411; 42