1package Lingua::StopWords::NL;
2
3use strict;
4use warnings;
5
6use utf8;
7
8use Encode qw(encode);
9
10use Exporter;
11our @ISA = qw(Exporter);
12
13our %EXPORT_TAGS = ( 'all' => [ qw( getStopWords ) ] );
14our @EXPORT_OK   = ( @{ $EXPORT_TAGS{'all'} } );
15our $VERSION     = 0.12;
16
17sub getStopWords {
18    if ( @_ and $_[0] eq 'UTF-8' ) {
19        my %stoplist = map { ( $_, 1 ) } _stopwords();
20        return \%stoplist;
21    }
22    else {
23        my %stoplist = map { ( encode("iso-8859-1", $_), 1 ) } _stopwords();
24        return \%stoplist;
25    }
26}
27
28sub _stopwords {
29    return qw(
30            de en van ik te dat die in een hij het niet zijn is was op aan
31            met als voor had er maar om hem dan zou of wat mijn men dit zo
32            door over ze zich bij ook tot je mij uit der daar haar naar heb
33            hoe heeft hebben deze u want nog zal me zij nu ge geen omdat
34            iets worden toch al waren veel meer doen toen moet ben zonder
35            kan hun dus alles onder ja eens hier wie werd altijd doch wordt
36            wezen kunnen ons zelf tegen na reeds wil kon niets uw iemand
37            geweest andere
38    );
39}
40
411;
42