1 Popis postup� �esksyntzy pouitch ve festival-czech
2 =======================================================
3 
4 * Zkladnjednotkyei
5 
6 Zkladnjednotkyei byly definovny dle difonovsady vypracovan7 Mgr. Pavlem Machaem.  Tento materil je dostupnvbalku voice-czech-ph.
8 
9 ** Fonmy
10 
11 Fonmovsada je definovanstandardnm zpsobem vczech.scm.  Vlastnosti
12 fonmdefinovanvczech.scm byly definovny dle potebesksyntzy, bez
13 p��mnvaznosti na konkrtnjazykovnebo fonetickpoznatky.  Rznfonmy
14 pitom mohou mt zcela shodnvlastnosti, nebylo snahou uinit fonmy svmi
15 vlastnostmi uniktn�.
16 
17 ** Difony
18 
19 Pou��vme difonovou sadu zv��e zmnnho materilu Mgr. Pavla Machae.  Ta
20 vrozumnm��e aproximuje mnoinu dvojic hlsek vyskytujcch se v��etin�.
21 
22 ** Pidvnsegment23 
24 ��st procesu stanovenvslednsekvence difonse provdaped samotnou
25 syntzou, vczech-after-analysis-hooks.  Do sekvence segmentse zde pidvaj26 umlsegmenty.  Clem tchto akcje dosaenlep��ho vslednho zvuku a
27 p��padntkonverze fonmpro syntetizry pou��vajcjinou fonmovou sadu.
28 Protoe se pidvnsegmentprovdatsnped syntzou, nennutno je
29 nijak zohledovat vurovnprozodie.  Propagace prozodickch informacdo
30 pidanch segmentje zajitna automaticky.
31 
32 ** Slabiky
33 
34 Ve festival-czech je za slabiku povaovno celmluvenslovo.  Prvnm dvodem
35 je, �e je to vhodnpi urovnprozodie.  Druhm dvodem je, �e rozklad slov
36 na slabiky je v��etinobtnuriteln�.  Pi zkoumnslabik je relevantn37 pouze jejich poet, kterje dn vskytem samohlsek a slabikotvornch
38 souhlsek.  Na to nenrozklad na slabiky zapoteb�.
39 
40 
41 * Vslovnost jednotlivch slov
42 
43 Urovnvslovnosti jednotlivch slov jeeeno primrnLTS pravidly `czech'.
44 Korekce fonetick� formy, ji� nez�visl� na pravopisn�ch pravidlech, se prov�d�
45 ve funkci czech-adjust-segments.  Tato funkce se vol� a� po zpracov�n� pauz,
46 proto�e pauzy jsou pro ur�en� v�sledn� fonetick� podoby podstatn�.
47 
48 Proto�e sou�asn� �esk� pravopis je p��li� nepravideln�, je nutno si p�i p�evodu
49 psan� formy na fonetickou vypom�hat lexikonem.  Lexikon je pojat� jako seznam
50 p�esn� t�ch slov, kter� nejsou a ani rozumn� b�t nemohou pokryta LTS pravidly
51 nebo pro kter� by nespr�vn� prob�hl p�evod z�tokenu na slovo (nap��klad
52 v�p��pad� slova _pst_, kter� by bylo hl�skov�no).
53 
54 ** Jak postupovat p�i nalezen� nespr�vn� v�slovnosti slova
55 
56 Pokud je slovo obsa�eno v�lexikonu, p��slu�n� z�znam se jednodu�e oprav�.
57 Pokud slovo nen� obsa�eno v�lexikonu, m�lo by b�t v�prvn� �ad� posouzeno, zda
58 p��slu�n� probl�m nen� �ir��ho r�zu a nest�lo by za to jej o�et�it p�id�n�m LTS
59 pravidla.
60 
61 Jedn�-li se sp�e o�v�jimku, kterou nem� smysl zohled�ovat v�LTS pravidlech,
62 p�id� se do lexikonu.  Jde-li o�slovo ohebn�, m�ly by b�t p�id�ny v�echny jeho
63 tvary, jsou-li vyslovov�ny chybn� t�.  Je dobr� zamyslet se i�nad formami
64 vytvo�en�mi p�id�n�m nebo odebr�n�m p�edpon.
65 
66 Pokud dojde na p�id�n� nov�ho LTS pravidla, je zapot�eb� prov��it, jak� zm�ny
67 zp�sob�.  Optim�ln� by bylo nechat vygenerovat v�slovnost v�ech �esk�ch slov
68 p�ed zm�nou LTS pravidel a po n� a n�sledn� srovnat jejich diff v�stupy.  To je
69 v�ak na b�n�ch stroj�ch pom�rn� zdlouhav� z�le�itost a je tedy prakti�t�j�� ji
70 aplikovat pouze na mno�inu slov, kter� mohou b�t p��slu�n�m pravidlem dot�eny.
71 Je-li nov� LTS pravidlo ��dn� ov��eno, m��e b�t p�id�no.  Voliteln� lze
72 prov��it slova v�lexikonu, zda se v�slovnost n�kter�ch z�nich neshoduje
73 s�v�sledkem po aplikaci nov�ch LTS pravidel, a�takov� slova z�lexikonu vy�adit.
74 
75 ** Tokeny, kter� se expanduj� na v�ce slov
76 
77 Je-li z�pis ur�it�ho slova expandov�n na v�cero slov, je nutno jeho expanzi
78 definovat v�prom�nn� czech-multiword-abbrevs.  Takov� slova nepat�� do lexikonu
79 -- lexikon definuje jen v�slovnost jednotliv�ch slov.
80 
81 ** Pravidla pro p�epis z�textu do fonetick� podoby
82 
83 P�i p�episu textu do fonetick� podoby je v�lexikonu dovoleno pou��vat ve�ker�
84 fon�my definovan� v��esk� fon�mov� sad�.  P�itom mus� b�t dodr�ena n�sleduj�c�
85 pravidla.
86 
87 *** Konverze zn�l�ch souhl�sek na nezn�l� a naopak
88 
89 Neprov�d� se konverze zn�l�ch souhl�sek na nezn�l� a naopak, kde to nen�
90 vylo�en� nutn�.  Nap��klad spr�vn� (z�hlediska festival-czech) fonetick� p�epis
je(o v c e)91 slova _ovce_ je (o v c e), nikoliv (o f c e).  V�slovnost difonu v-c se toti�
92 jednak v�tomto slov� podstatn� neli�� od v�slovnosti tohoto difonu v�jin�ch
93 slovech a jednak se s�opravdovou zn�lou v�slovnost� tohoto difonu v��e�tin�
94 nesetk�me (ani na hranic�ch slov a slovech p�ejat�ch).  Jeho spr�vn� v�slovnost
95 tedy bude zaji�t�na v�difonov� datab�zi nebo jej�ch konverzn�ch pravidlech.
96 
97 Naproti spr�vn� p�epis slova _magnetismus_ je (m a g n e t i z m u s), proto�e
98 v�n�m se skute�n� jedn� o�pozm�n�nou v�slovnost slova p�ejat�ho a v�koncovce je
99 �esk� difon z-m, nikoliv �esk� difon s-m.
100 
101 Toto pravidlo ned�v� z�fonetick�ho hlediska smysl.  Jeho c�lem je v�ak
102 zjednodu�en� tvorby polo�ek lexikonu (p�isp�vatel se m��e v�ce dr�et psan�
103 formy a nemus� se zab�vat speci�ln�mi p��pady) a zamezen� lidov� tvo�ivosti
104 v�nejednozna�n�ch p��padech.
105 
106 *** Vkl�d�n� r�z�
107 
108 Je nutno nezapom�nat na vlo�en� r�z� mezi samohl�skami.  Spr�vn� p�epis slova
109 _neefektivn�_ je (n e _ e f e k t i v n~ i:).  Naopak spr�vn� p�epis slova
110 _poet_ je (p o e t).
111 
112 *** Dvojhl�sky
113 
114 Dvojhl�sky se reprezentuj� odpov�daj�c� dvojic� hl�sek.  Speci�ln�m p��padem
115 jsou dvojhl�sky obsahuj�c� `i' nebo `i:'.  Ve skute�nosti se nejedn�
116 o�dvojhl�sky, vyslovuje se toti� mezi nimi hl�ska `j'.  Sprvnpepis slova
117 _poezie_ tedy je (p o e z i j e).
118 
119 
120 * Prozodie
121 
122 Prozodie ve festival-czech zahrnuje intonaci, dlku, pauzy a p��zvuk.  Tyto
123 parametry jsou konstruovny pevnna zkladpravidel publikovanch
124 v�[palkov�:04].
125 
126 Vtn� �seky a p��zvukovtakty jsou konstruovny ve fzi Word, jako zvltn127 relace IntUnit a StressUnit.
128 
129 ** Intonace
130 
131 Pravidla pro intonaci byla pevzata z�[palkov�:04].  Konkrtnintonan132 tabulka kadencbyla pevzata z�[palkov�-pt��ek:97].
133 
134 Vpublikovanch prozodickch pravidlech jsou uritnejasnosti, kterbyly
135 rozeeny nsledujcm zpsobem:
136 
137 - Proesti a vceslabinp��zvukovtakty se vpozici F pou��vintonan138   kivka ze skupiny A (v�[palkov�-pt��ek:97] p��slunpravidlo pro pozici F
139   chyb�).
140 
141 - Pro pozici F se volintonankivka ze skupiny A (v�[palkov�:04] nen142   specifikovno).
143 
144 - Pro pozici F-1 se vybrpouze zintonanch kivek povolench pro skupinu F
145   (pro jistotu -- v�[palkov�:04] nenspecifikovno, k��emu by sohledem na
146   pedchoz� �pravu mly bt F-kivky skupiny B).
147 
148 Nedoeena je detekce doplkovch tzacch vt ve funkci czech-yes-no-question,
149 kde chybdostatenobshlseznam tzacch zjmen, ��slovek a p��slovc�.
150 Mlo by bt monjej zskat spomoc� �eskho ispellu.
151 
152 ** Dlka
153 
154 Dlka se stanovuje na zkladpotu slabik vp��zvukovm taktu dle tabulky
155 z�[palkov�:04].
156 
157 ** Pauzy
158 
159 Pou��vme pauzy t�� dlek: nejdel�� (BB), stedn� (B) a krtk� (SB).
160 Umisovnpauz se definuje vpromnnczech-phrase-cart-tree a funkci
161 czech-adjust-phrase-breaks.  Pouitmetoda urovnpauz vychz162 z�[palkov�-pt��ek:66], nenvak pesnou implementactchto pravidel.
163 
164 ** P��zvuk
165 
166 Dle [palkov�:04], sekce 1.2db), nenvsyntzeetiny ��doucp��zvuk
167 explicitngenerovat zmnou dynamiky.  P��zvuk je modelovn intonankivkou.
168 
169 
170 * Odkazy
171 
172 [palkov�:04]
173   Zdena Palkov�: Soubor fonetickch pravidel jako podklad pro prozodick174   komponent automaticksyntzy TTS v��etin175 
176 [palkov�-pt��ek:97]
177   Zdena Palkov�, Miroslav Pt��ek: Modelling Prosody in TTS Diphone Synthesis in
178   Czech; Forum Phoneticum 63, Frankfurt am Main 1997
179 
180 [palkov�-pt��ek:66]
181   Zdena Palkov�, Miroslav Pt��ek: TTS Issues: Prosody modifications in Text;
182   in Speech processing, 6th Czech-German Workshop, Prag 1966, R. Vch
183   (ed.) pp.32-34
184   + internmateril Z. Palkov�, Zvrenzprva grantu GAR 405/96/0301
185 
186 
187 -- Milan Zamazal
188 
189 Local variables:
190 mode: outline
191 end:
192