1 Popis postup� �esk� synt�zy pou�it�ch ve festival-czech
2 =======================================================
3
4 * Z�kladn� jednotky �e�i
5
6 Z�kladn� jednotky �e�i byly definov�ny dle difonov� sady vypracovan�
7 Mgr. Pavlem Macha�em. Tento materi�l je dostupn� v�bal�ku voice-czech-ph.
8
9 ** Fon�my
10
11 Fon�mov� sada je definovan� standardn�m zp�sobem v�czech.scm. Vlastnosti
12 fon�m� definovan� v�czech.scm byly definov�ny dle pot�eb �esk� synt�zy, bez
13 p��m� n�vaznosti na konkr�tn� jazykov� nebo fonetick� poznatky. R�zn� fon�my
14 p�itom mohou m�t zcela shodn� vlastnosti, nebylo snahou u�init fon�my sv�mi
15 vlastnostmi unik�tn�.
16
17 ** Difony
18
19 Pou��v�me difonovou sadu z�v��e zm�n�n�ho materi�lu Mgr. Pavla Macha�e. Ta
20 v�rozumn� m��e aproximuje mno�inu dvojic hl�sek vyskytuj�c�ch se v��e�tin�.
21
22 ** P�id�v�n� segment�
23
24 ��st procesu stanoven� v�sledn� sekvence difon� se prov�d� a� p�ed samotnou
25 synt�zou, v�czech-after-analysis-hooks. Do sekvence segment� se zde p�id�vaj�
26 um�l� segmenty. C�lem t�chto akc� je dosa�en� lep��ho v�sledn�ho zvuku a
27 p��padn� t� konverze fon�m� pro syntetiz�ry pou��vaj�c� jinou fon�movou sadu.
28 Proto�e se p�id�v�n� segment� prov�d� a� t�sn� p�ed synt�zou, nen� nutno je
29 nijak zohled�ovat v�ur�ov�n� prozodie. Propagace prozodick�ch informac� do
30 p�idan�ch segment� je zaji�t�na automaticky.
31
32 ** Slabiky
33
34 Ve festival-czech je za slabiku pova�ov�no cel� mluven� slovo. Prvn�m d�vodem
35 je, �e je to v�hodn� p�i ur�ov�n� prozodie. Druh�m d�vodem je, �e rozklad slov
36 na slabiky je v��e�tin� obt�n� ur�iteln�. P�i zkoum�n� slabik je relevantn�
37 pouze jejich po�et, kter� je d�n v�skytem samohl�sek a slabikotvorn�ch
38 souhl�sek. Na to nen� rozklad na slabiky zapot�eb�.
39
40
41 * V�slovnost jednotliv�ch slov
42
43 Ur�ov�n� v�slovnosti jednotliv�ch slov je �e�eno prim�rn� LTS pravidly `czech'.
44 Korekce fonetick� formy, ji� nez�visl� na pravopisn�ch pravidlech, se prov�d�
45 ve funkci czech-adjust-segments. Tato funkce se vol� a� po zpracov�n� pauz,
46 proto�e pauzy jsou pro ur�en� v�sledn� fonetick� podoby podstatn�.
47
48 Proto�e sou�asn� �esk� pravopis je p��li� nepravideln�, je nutno si p�i p�evodu
49 psan� formy na fonetickou vypom�hat lexikonem. Lexikon je pojat� jako seznam
50 p�esn� t�ch slov, kter� nejsou a ani rozumn� b�t nemohou pokryta LTS pravidly
51 nebo pro kter� by nespr�vn� prob�hl p�evod z�tokenu na slovo (nap��klad
52 v�p��pad� slova _pst_, kter� by bylo hl�skov�no).
53
54 ** Jak postupovat p�i nalezen� nespr�vn� v�slovnosti slova
55
56 Pokud je slovo obsa�eno v�lexikonu, p��slu�n� z�znam se jednodu�e oprav�.
57 Pokud slovo nen� obsa�eno v�lexikonu, m�lo by b�t v�prvn� �ad� posouzeno, zda
58 p��slu�n� probl�m nen� �ir��ho r�zu a nest�lo by za to jej o�et�it p�id�n�m LTS
59 pravidla.
60
61 Jedn�-li se sp�e o�v�jimku, kterou nem� smysl zohled�ovat v�LTS pravidlech,
62 p�id� se do lexikonu. Jde-li o�slovo ohebn�, m�ly by b�t p�id�ny v�echny jeho
63 tvary, jsou-li vyslovov�ny chybn� t�. Je dobr� zamyslet se i�nad formami
64 vytvo�en�mi p�id�n�m nebo odebr�n�m p�edpon.
65
66 Pokud dojde na p�id�n� nov�ho LTS pravidla, je zapot�eb� prov��it, jak� zm�ny
67 zp�sob�. Optim�ln� by bylo nechat vygenerovat v�slovnost v�ech �esk�ch slov
68 p�ed zm�nou LTS pravidel a po n� a n�sledn� srovnat jejich diff v�stupy. To je
69 v�ak na b�n�ch stroj�ch pom�rn� zdlouhav� z�le�itost a je tedy prakti�t�j�� ji
70 aplikovat pouze na mno�inu slov, kter� mohou b�t p��slu�n�m pravidlem dot�eny.
71 Je-li nov� LTS pravidlo ��dn� ov��eno, m��e b�t p�id�no. Voliteln� lze
72 prov��it slova v�lexikonu, zda se v�slovnost n�kter�ch z�nich neshoduje
73 s�v�sledkem po aplikaci nov�ch LTS pravidel, a�takov� slova z�lexikonu vy�adit.
74
75 ** Tokeny, kter� se expanduj� na v�ce slov
76
77 Je-li z�pis ur�it�ho slova expandov�n na v�cero slov, je nutno jeho expanzi
78 definovat v�prom�nn� czech-multiword-abbrevs. Takov� slova nepat�� do lexikonu
79 -- lexikon definuje jen v�slovnost jednotliv�ch slov.
80
81 ** Pravidla pro p�epis z�textu do fonetick� podoby
82
83 P�i p�episu textu do fonetick� podoby je v�lexikonu dovoleno pou��vat ve�ker�
84 fon�my definovan� v��esk� fon�mov� sad�. P�itom mus� b�t dodr�ena n�sleduj�c�
85 pravidla.
86
87 *** Konverze zn�l�ch souhl�sek na nezn�l� a naopak
88
89 Neprov�d� se konverze zn�l�ch souhl�sek na nezn�l� a naopak, kde to nen�
90 vylo�en� nutn�. Nap��klad spr�vn� (z�hlediska festival-czech) fonetick� p�epis
je(o v c e)91 slova _ovce_ je (o v c e), nikoliv (o f c e). V�slovnost difonu v-c se toti�
92 jednak v�tomto slov� podstatn� neli�� od v�slovnosti tohoto difonu v�jin�ch
93 slovech a jednak se s�opravdovou zn�lou v�slovnost� tohoto difonu v��e�tin�
94 nesetk�me (ani na hranic�ch slov a slovech p�ejat�ch). Jeho spr�vn� v�slovnost
95 tedy bude zaji�t�na v�difonov� datab�zi nebo jej�ch konverzn�ch pravidlech.
96
97 Naproti spr�vn� p�epis slova _magnetismus_ je (m a g n e t i z m u s), proto�e
98 v�n�m se skute�n� jedn� o�pozm�n�nou v�slovnost slova p�ejat�ho a v�koncovce je
99 �esk� difon z-m, nikoliv �esk� difon s-m.
100
101 Toto pravidlo ned�v� z�fonetick�ho hlediska smysl. Jeho c�lem je v�ak
102 zjednodu�en� tvorby polo�ek lexikonu (p�isp�vatel se m��e v�ce dr�et psan�
103 formy a nemus� se zab�vat speci�ln�mi p��pady) a zamezen� lidov� tvo�ivosti
104 v�nejednozna�n�ch p��padech.
105
106 *** Vkl�d�n� r�z�
107
108 Je nutno nezapom�nat na vlo�en� r�z� mezi samohl�skami. Spr�vn� p�epis slova
109 _neefektivn�_ je (n e _ e f e k t i v n~ i:). Naopak spr�vn� p�epis slova
110 _poet_ je (p o e t).
111
112 *** Dvojhl�sky
113
114 Dvojhl�sky se reprezentuj� odpov�daj�c� dvojic� hl�sek. Speci�ln�m p��padem
115 jsou dvojhl�sky obsahuj�c� `i' nebo `i:'. Ve skute�nosti se nejedn�
116 o�dvojhl�sky, vyslovuje se toti� mezi nimi hl�ska `j'. Spr�vn� p�epis slova
117 _poezie_ tedy je (p o e z i j e).
118
119
120 * Prozodie
121
122 Prozodie ve festival-czech zahrnuje intonaci, d�lku, pauzy a p��zvuk. Tyto
123 parametry jsou konstruov�ny p�ev�n� na z�klad� pravidel publikovan�ch
124 v�[palkov�:04].
125
126 V�tn� �seky a p��zvukov� takty jsou konstruov�ny ve f�zi Word, jako zvl�tn�
127 relace IntUnit a StressUnit.
128
129 ** Intonace
130
131 Pravidla pro intonaci byla p�evzata z�[palkov�:04]. Konkr�tn� intona�n�
132 tabulka kadenc� byla p�evzata z�[palkov�-pt��ek:97].
133
134 V�publikovan�ch prozodick�ch pravidlech jsou ur�it� nejasnosti, kter� byly
135 roz�e�eny n�sleduj�c�m zp�sobem:
136
137 - Pro �esti a v�ceslabi�n� p��zvukov� takty se v�pozici F pou��v� intona�n�
138 k�ivka ze skupiny A (v�[palkov�-pt��ek:97] p��slu�n� pravidlo pro pozici F
139 chyb�).
140
141 - Pro pozici F se vol� intona�n� k�ivka ze skupiny A (v�[palkov�:04] nen�
142 specifikov�no).
143
144 - Pro pozici F-1 se vyb�r� pouze z�intona�n�ch k�ivek povolen�ch pro skupinu F
145 (pro jistotu -- v�[palkov�:04] nen� specifikov�no, k��emu by s�ohledem na
146 p�edchoz� �pravu m�ly b�t F-k�ivky skupiny B).
147
148 Nedo�e�ena je detekce dopl�kov�ch t�zac�ch v�t ve funkci czech-yes-no-question,
149 kde chyb� dostate�n� obs�hl� seznam t�zac�ch z�jmen, ��slovek a p��slovc�.
150 M�lo by b�t mo�n� jej z�skat s�pomoc� �esk�ho ispellu.
151
152 ** D�lka
153
154 D�lka se stanovuje na z�klad� po�tu slabik v�p��zvukov�m taktu dle tabulky
155 z�[palkov�:04].
156
157 ** Pauzy
158
159 Pou��v�me pauzy t�� d�lek: nejdel�� (BB), st�edn� (B) a kr�tk� (SB).
160 Umis�ov�n� pauz se definuje v�prom�nn� czech-phrase-cart-tree a funkci
161 czech-adjust-phrase-breaks. Pou�it� metoda ur�ov�n� pauz vych�z�
162 z�[palkov�-pt��ek:66], nen� v�ak p�esnou implementac� t�chto pravidel.
163
164 ** P��zvuk
165
166 Dle [palkov�:04], sekce 1.2db), nen� v�synt�ze �e�tiny ��douc� p��zvuk
167 explicitn� generovat zm�nou dynamiky. P��zvuk je modelov�n intona�n� k�ivkou.
168
169
170 * Odkazy
171
172 [palkov�:04]
173 Zdena Palkov�: Soubor fonetick�ch pravidel jako podklad pro prozodick�
174 komponent automatick� synt�zy TTS v��e�tin�
175
176 [palkov�-pt��ek:97]
177 Zdena Palkov�, Miroslav Pt��ek: Modelling Prosody in TTS Diphone Synthesis in
178 Czech; Forum Phoneticum 63, Frankfurt am Main 1997
179
180 [palkov�-pt��ek:66]
181 Zdena Palkov�, Miroslav Pt��ek: TTS Issues: Prosody modifications in Text;
182 in Speech processing, 6th Czech-German Workshop, Prag 1966, R. V�ch
183 (ed.) pp.32-34
184 + intern� materi�l Z. Palkov�, Z�v�re�n� zpr�va grantu GA�R 405/96/0301
185
186
187 -- Milan Zamazal
188
189 Local variables:
190 mode: outline
191 end:
192