1 use pipeline::Pipeline;
2
make_pipeline() -> Pipeline3 pub fn make_pipeline() -> Pipeline {
4 Pipeline {
5 queue: vec![
6 ("trimmer-pt".into(), trimmer),
7 ("stopWordFilter-pt".into(), stop_word_filter),
8 ("stemmer-pt".into(), stemmer),
9 ],
10 }
11 }
12
13 make_trimmer!(
14 "A-Za-z\\xAA\\xBA\\xC0-\\xD6\\xD8-\\xF6\\xF8-\\u02B8\\u02E0-\\u02E4\\u1D00-\\u1D25\
15 \\u1D2C-\\u1D5C\\u1D62-\\u1D65\\u1D6B-\\u1D77\\u1D79-\\u1DBE\\u1E00-\\u1EFF\\u2071\\u207F\
16 \\u2090-\\u209C\\u212A\\u212B\\u2132\\u214E\\u2160-\\u2188\\u2C60-\\u2C7F\\uA722-\\uA787\
17 \\uA78B-\\uA7AD\\uA7B0-\\uA7B7\\uA7F7-\\uA7FF\\uAB30-\\uAB5A\\uAB5C-\\uAB64\\uFB00-\\uFB06\
18 \\uFF21-\\uFF3A\\uFF41-\\uFF5A"
19 );
20
21 make_stop_word_filter!([
22 "",
23 "a",
24 "ao",
25 "aos",
26 "aquela",
27 "aquelas",
28 "aquele",
29 "aqueles",
30 "aquilo",
31 "as",
32 "até",
33 "com",
34 "como",
35 "da",
36 "das",
37 "de",
38 "dela",
39 "delas",
40 "dele",
41 "deles",
42 "depois",
43 "do",
44 "dos",
45 "e",
46 "ela",
47 "elas",
48 "ele",
49 "eles",
50 "em",
51 "entre",
52 "era",
53 "eram",
54 "essa",
55 "essas",
56 "esse",
57 "esses",
58 "esta",
59 "estamos",
60 "estas",
61 "estava",
62 "estavam",
63 "este",
64 "esteja",
65 "estejam",
66 "estejamos",
67 "estes",
68 "esteve",
69 "estive",
70 "estivemos",
71 "estiver",
72 "estivera",
73 "estiveram",
74 "estiverem",
75 "estivermos",
76 "estivesse",
77 "estivessem",
78 "estivéramos",
79 "estivéssemos",
80 "estou",
81 "está",
82 "estávamos",
83 "estão",
84 "eu",
85 "foi",
86 "fomos",
87 "for",
88 "fora",
89 "foram",
90 "forem",
91 "formos",
92 "fosse",
93 "fossem",
94 "fui",
95 "fôramos",
96 "fôssemos",
97 "haja",
98 "hajam",
99 "hajamos",
100 "havemos",
101 "hei",
102 "houve",
103 "houvemos",
104 "houver",
105 "houvera",
106 "houveram",
107 "houverei",
108 "houverem",
109 "houveremos",
110 "houveria",
111 "houveriam",
112 "houvermos",
113 "houverá",
114 "houverão",
115 "houveríamos",
116 "houvesse",
117 "houvessem",
118 "houvéramos",
119 "houvéssemos",
120 "há",
121 "hão",
122 "isso",
123 "isto",
124 "já",
125 "lhe",
126 "lhes",
127 "mais",
128 "mas",
129 "me",
130 "mesmo",
131 "meu",
132 "meus",
133 "minha",
134 "minhas",
135 "muito",
136 "na",
137 "nas",
138 "nem",
139 "no",
140 "nos",
141 "nossa",
142 "nossas",
143 "nosso",
144 "nossos",
145 "num",
146 "numa",
147 "não",
148 "nós",
149 "o",
150 "os",
151 "ou",
152 "para",
153 "pela",
154 "pelas",
155 "pelo",
156 "pelos",
157 "por",
158 "qual",
159 "quando",
160 "que",
161 "quem",
162 "se",
163 "seja",
164 "sejam",
165 "sejamos",
166 "sem",
167 "serei",
168 "seremos",
169 "seria",
170 "seriam",
171 "será",
172 "serão",
173 "seríamos",
174 "seu",
175 "seus",
176 "somos",
177 "sou",
178 "sua",
179 "suas",
180 "são",
181 "só",
182 "também",
183 "te",
184 "tem",
185 "temos",
186 "tenha",
187 "tenham",
188 "tenhamos",
189 "tenho",
190 "terei",
191 "teremos",
192 "teria",
193 "teriam",
194 "terá",
195 "terão",
196 "teríamos",
197 "teu",
198 "teus",
199 "teve",
200 "tinha",
201 "tinham",
202 "tive",
203 "tivemos",
204 "tiver",
205 "tivera",
206 "tiveram",
207 "tiverem",
208 "tivermos",
209 "tivesse",
210 "tivessem",
211 "tivéramos",
212 "tivéssemos",
213 "tu",
214 "tua",
215 "tuas",
216 "tém",
217 "tínhamos",
218 "um",
219 "uma",
220 "você",
221 "vocês",
222 "vos",
223 "à",
224 "às",
225 "éramos",
226 ]);
227
228 make_stemmer!(Algorithm::Portuguese);
229