1 use pipeline::Pipeline;
2 
make_pipeline() -> Pipeline3 pub fn make_pipeline() -> Pipeline {
4     Pipeline {
5         queue: vec![
6             ("trimmer-ro".into(), trimmer),
7             ("stopWordFilter-ro".into(), stop_word_filter),
8             ("stemmer-ro".into(), stemmer),
9         ],
10     }
11 }
12 
13 make_trimmer!(
14     "A-Za-z\\xAA\\xBA\\xC0-\\xD6\\xD8-\\xF6\\xF8-\\u02B8\\u02E0-\\u02E4\\u1D00-\\u1D25\
15      \\u1D2C-\\u1D5C\\u1D62-\\u1D65\\u1D6B-\\u1D77\\u1D79-\\u1DBE\\u1E00-\\u1EFF\\u2071\\u207F\
16      \\u2090-\\u209C\\u212A\\u212B\\u2132\\u214E\\u2160-\\u2188\\u2C60-\\u2C7F\\uA722-\\uA787\
17      \\uA78B-\\uA7AD\\uA7B0-\\uA7B7\\uA7F7-\\uA7FF\\uAB30-\\uAB5A\\uAB5C-\\uAB64\\uFB00-\\uFB06\
18      \\uFF21-\\uFF3A\\uFF41-\\uFF5A"
19 );
20 
21 make_stop_word_filter!([
22     "",
23     "acea",
24     "aceasta",
25     "această",
26     "aceea",
27     "acei",
28     "aceia",
29     "acel",
30     "acela",
31     "acele",
32     "acelea",
33     "acest",
34     "acesta",
35     "aceste",
36     "acestea",
37     "aceşti",
38     "aceştia",
39     "acolo",
40     "acord",
41     "acum",
42     "ai",
43     "aia",
44     "aibă",
45     "aici",
46     "al",
47     "ale",
48     "alea",
49     "altceva",
50     "altcineva",
51     "am",
52     "ar",
53     "are",
54     "asemenea",
55     "asta",
56     "astea",
57     "astăzi",
58     "asupra",
59     "au",
60     "avea",
61     "avem",
62     "aveţi",
63     "azi",
64     "aş",
65     "aşadar",
66     "aţi",
67     "bine",
68     "bucur",
69     "bună",
70     "ca",
71     "care",
72     "caut",
73     "ce",
74     "cel",
75     "ceva",
76     "chiar",
77     "cinci",
78     "cine",
79     "cineva",
80     "contra",
81     "cu",
82     "cum",
83     "cumva",
84     "curând",
85     "curînd",
86     "când",
87     "cât",
88     "câte",
89     "câtva",
90     "câţi",
91     "cînd",
92     "cît",
93     "cîte",
94     "cîtva",
95     "cîţi",
96     "că",
97     "căci",
98     "cărei",
99     "căror",
100     "cărui",
101     "către",
102     "da",
103     "dacă",
104     "dar",
105     "datorită",
106     "dată",
107     "dau",
108     "de",
109     "deci",
110     "deja",
111     "deoarece",
112     "departe",
113     "deşi",
114     "din",
115     "dinaintea",
116     "dintr-",
117     "dintre",
118     "doi",
119     "doilea",
120     "două",
121     "drept",
122     "după",
123     "dă",
124     "ea",
125     "ei",
126     "el",
127     "ele",
128     "eram",
129     "este",
130     "eu",
131     "eşti",
132     "face",
133     "fata",
134     "fi",
135     "fie",
136     "fiecare",
137     "fii",
138     "fim",
139     "fiu",
140     "fiţi",
141     "frumos",
142     "fără",
143     "graţie",
144     "halbă",
145     "iar",
146     "ieri",
147     "la",
148     "le",
149     "li",
150     "lor",
151     "lui",
152     "lângă",
153     "lîngă",
154     "mai",
155     "mea",
156     "mei",
157     "mele",
158     "mereu",
159     "meu",
160     "mi",
161     "mie",
162     "mine",
163     "mult",
164     "multă",
165     "mulţi",
166     "mulţumesc",
167     "mâine",
168     "mîine",
169     "mă",
170     "ne",
171     "nevoie",
172     "nici",
173     "nicăieri",
174     "nimeni",
175     "nimeri",
176     "nimic",
177     "nişte",
178     "noastre",
179     "noastră",
180     "noi",
181     "noroc",
182     "nostru",
183     "nouă",
184     "noştri",
185     "nu",
186     "opt",
187     "ori",
188     "oricare",
189     "orice",
190     "oricine",
191     "oricum",
192     "oricând",
193     "oricât",
194     "oricînd",
195     "oricît",
196     "oriunde",
197     "patra",
198     "patru",
199     "patrulea",
200     "pe",
201     "pentru",
202     "peste",
203     "pic",
204     "poate",
205     "pot",
206     "prea",
207     "prima",
208     "primul",
209     "prin",
210     "puţin",
211     "puţina",
212     "puţină",
213     "până",
214     "pînă",
215     "rog",
216     "sa",
217     "sale",
218     "sau",
219     "se",
220     "spate",
221     "spre",
222     "sub",
223     "sunt",
224     "suntem",
225     "sunteţi",
226     "sută",
227     "sînt",
228     "sîntem",
229     "sînteţi",
230     "să",
231     "săi",
232     "său",
233     "ta",
234     "tale",
235     "te",
236     "timp",
237     "tine",
238     "toate",
239     "toată",
240     "tot",
241     "totuşi",
242     "toţi",
243     "trei",
244     "treia",
245     "treilea",
246     "tu",
247     "tăi",
248     "tău",
249     "un",
250     "una",
251     "unde",
252     "undeva",
253     "unei",
254     "uneia",
255     "unele",
256     "uneori",
257     "unii",
258     "unor",
259     "unora",
260     "unu",
261     "unui",
262     "unuia",
263     "unul",
264     "vi",
265     "voastre",
266     "voastră",
267     "voi",
268     "vostru",
269     "vouă",
270     "voştri",
271     "vreme",
272     "vreo",
273     "vreun",
274     "vă",
275     "zece",
276     "zero",
277     "zi",
278     "zice",
279     "îi",
280     "îl",
281     "îmi",
282     "împotriva",
283     "în",
284     "înainte",
285     "înaintea",
286     "încotro",
287     "încât",
288     "încît",
289     "între",
290     "întrucât",
291     "întrucît",
292     "îţi",
293     "ăla",
294     "ălea",
295     "ăsta",
296     "ăstea",
297     "ăştia",
298     "şapte",
299     "şase",
300     "şi",
301     "ştiu",
302     "ţi",
303     "ţie",
304 ]);
305 
306 make_stemmer!(Algorithm::Romanian);
307