1 use pipeline::Pipeline;
2
make_pipeline() -> Pipeline3 pub fn make_pipeline() -> Pipeline {
4 Pipeline {
5 queue: vec![
6 ("trimmer-ro".into(), trimmer),
7 ("stopWordFilter-ro".into(), stop_word_filter),
8 ("stemmer-ro".into(), stemmer),
9 ],
10 }
11 }
12
13 make_trimmer!(
14 "A-Za-z\\xAA\\xBA\\xC0-\\xD6\\xD8-\\xF6\\xF8-\\u02B8\\u02E0-\\u02E4\\u1D00-\\u1D25\
15 \\u1D2C-\\u1D5C\\u1D62-\\u1D65\\u1D6B-\\u1D77\\u1D79-\\u1DBE\\u1E00-\\u1EFF\\u2071\\u207F\
16 \\u2090-\\u209C\\u212A\\u212B\\u2132\\u214E\\u2160-\\u2188\\u2C60-\\u2C7F\\uA722-\\uA787\
17 \\uA78B-\\uA7AD\\uA7B0-\\uA7B7\\uA7F7-\\uA7FF\\uAB30-\\uAB5A\\uAB5C-\\uAB64\\uFB00-\\uFB06\
18 \\uFF21-\\uFF3A\\uFF41-\\uFF5A"
19 );
20
21 make_stop_word_filter!([
22 "",
23 "acea",
24 "aceasta",
25 "această",
26 "aceea",
27 "acei",
28 "aceia",
29 "acel",
30 "acela",
31 "acele",
32 "acelea",
33 "acest",
34 "acesta",
35 "aceste",
36 "acestea",
37 "aceşti",
38 "aceştia",
39 "acolo",
40 "acord",
41 "acum",
42 "ai",
43 "aia",
44 "aibă",
45 "aici",
46 "al",
47 "ale",
48 "alea",
49 "altceva",
50 "altcineva",
51 "am",
52 "ar",
53 "are",
54 "asemenea",
55 "asta",
56 "astea",
57 "astăzi",
58 "asupra",
59 "au",
60 "avea",
61 "avem",
62 "aveţi",
63 "azi",
64 "aş",
65 "aşadar",
66 "aţi",
67 "bine",
68 "bucur",
69 "bună",
70 "ca",
71 "care",
72 "caut",
73 "ce",
74 "cel",
75 "ceva",
76 "chiar",
77 "cinci",
78 "cine",
79 "cineva",
80 "contra",
81 "cu",
82 "cum",
83 "cumva",
84 "curând",
85 "curînd",
86 "când",
87 "cât",
88 "câte",
89 "câtva",
90 "câţi",
91 "cînd",
92 "cît",
93 "cîte",
94 "cîtva",
95 "cîţi",
96 "că",
97 "căci",
98 "cărei",
99 "căror",
100 "cărui",
101 "către",
102 "da",
103 "dacă",
104 "dar",
105 "datorită",
106 "dată",
107 "dau",
108 "de",
109 "deci",
110 "deja",
111 "deoarece",
112 "departe",
113 "deşi",
114 "din",
115 "dinaintea",
116 "dintr-",
117 "dintre",
118 "doi",
119 "doilea",
120 "două",
121 "drept",
122 "după",
123 "dă",
124 "ea",
125 "ei",
126 "el",
127 "ele",
128 "eram",
129 "este",
130 "eu",
131 "eşti",
132 "face",
133 "fata",
134 "fi",
135 "fie",
136 "fiecare",
137 "fii",
138 "fim",
139 "fiu",
140 "fiţi",
141 "frumos",
142 "fără",
143 "graţie",
144 "halbă",
145 "iar",
146 "ieri",
147 "la",
148 "le",
149 "li",
150 "lor",
151 "lui",
152 "lângă",
153 "lîngă",
154 "mai",
155 "mea",
156 "mei",
157 "mele",
158 "mereu",
159 "meu",
160 "mi",
161 "mie",
162 "mine",
163 "mult",
164 "multă",
165 "mulţi",
166 "mulţumesc",
167 "mâine",
168 "mîine",
169 "mă",
170 "ne",
171 "nevoie",
172 "nici",
173 "nicăieri",
174 "nimeni",
175 "nimeri",
176 "nimic",
177 "nişte",
178 "noastre",
179 "noastră",
180 "noi",
181 "noroc",
182 "nostru",
183 "nouă",
184 "noştri",
185 "nu",
186 "opt",
187 "ori",
188 "oricare",
189 "orice",
190 "oricine",
191 "oricum",
192 "oricând",
193 "oricât",
194 "oricînd",
195 "oricît",
196 "oriunde",
197 "patra",
198 "patru",
199 "patrulea",
200 "pe",
201 "pentru",
202 "peste",
203 "pic",
204 "poate",
205 "pot",
206 "prea",
207 "prima",
208 "primul",
209 "prin",
210 "puţin",
211 "puţina",
212 "puţină",
213 "până",
214 "pînă",
215 "rog",
216 "sa",
217 "sale",
218 "sau",
219 "se",
220 "spate",
221 "spre",
222 "sub",
223 "sunt",
224 "suntem",
225 "sunteţi",
226 "sută",
227 "sînt",
228 "sîntem",
229 "sînteţi",
230 "să",
231 "săi",
232 "său",
233 "ta",
234 "tale",
235 "te",
236 "timp",
237 "tine",
238 "toate",
239 "toată",
240 "tot",
241 "totuşi",
242 "toţi",
243 "trei",
244 "treia",
245 "treilea",
246 "tu",
247 "tăi",
248 "tău",
249 "un",
250 "una",
251 "unde",
252 "undeva",
253 "unei",
254 "uneia",
255 "unele",
256 "uneori",
257 "unii",
258 "unor",
259 "unora",
260 "unu",
261 "unui",
262 "unuia",
263 "unul",
264 "vi",
265 "voastre",
266 "voastră",
267 "voi",
268 "vostru",
269 "vouă",
270 "voştri",
271 "vreme",
272 "vreo",
273 "vreun",
274 "vă",
275 "zece",
276 "zero",
277 "zi",
278 "zice",
279 "îi",
280 "îl",
281 "îmi",
282 "împotriva",
283 "în",
284 "înainte",
285 "înaintea",
286 "încotro",
287 "încât",
288 "încît",
289 "între",
290 "întrucât",
291 "întrucît",
292 "îţi",
293 "ăla",
294 "ălea",
295 "ăsta",
296 "ăstea",
297 "ăştia",
298 "şapte",
299 "şase",
300 "şi",
301 "ştiu",
302 "ţi",
303 "ţie",
304 ]);
305
306 make_stemmer!(Algorithm::Romanian);
307