Unified Language-Independent DNN-Based G2P Converter

dc.contributor.authorJůzová, Markéta
dc.contributor.authorTihelka, Daniel
dc.contributor.authorVít, Jakub
dc.date.accessioned2022-03-14T11:00:20Z
dc.date.available2022-03-14T11:00:20Z
dc.date.issued2019
dc.description.abstractPředstavujeme jednotný model pro převod grafémů na fonémy založený na hlubokých neuronových sítích. Na rozdíl od obvyklých přístupů, které používají pro trénovaní slovník, používáme celé fráze, což nám umožňuje zachytit různé jazykové vlastnosti, např. spodobu znělosti přes hranici slov, bez nutnosti definovat specifika pro konkrétní jazyk. Vyhodnocení přístupu probíhá na třech různých jazycích - angličtině, češtině a ruštině. Každý z nich vyžaduje řešení specifických vlastností, a proto to obvykle vede k použití odlišných přístupů. První výsledky použití navrhovaného modelu prokazují, že je schopný se specifika jednotlivých jazyků naučit. Považujeme tedy model za jazykově nezávislý pro širokou škálu jazyků.cs
dc.description.abstract-translatedWe introduce a unified Grapheme-to-phoneme conversion framework based on the composition of deep neural networks. In contrary to the usual approaches building the G2P frameworks from the dictionary, we use whole phrases, which allows us to capture various language properties, e.g. cross-word assimilation, without the need for any special care or topology adjustments. The evaluation is carried out on three different languages -- English, Czech and Russian. Each requires dealing with specific properties, stressing the proposed framework in various ways. The very first results show promising performance of the proposed framework, dealing with all the phenomena specific to the tested languages. Thus, we consider the framework to be language-independent for a wide range of languages.en
dc.format5 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier.citationJŮZOVÁ, M. TIHELKA, D. VÍT, J. Unified Language-Independent DNN-Based G2P Converter. In Proceedings of the 20th Annual Conference of the International Speech Communication Association (Interspeech 2019). Red Hook, NY: Curran Associates, Inc., 2019. s. 2085-2089. ISBN: 978-1-5108-9683-3 , ISSN: 2308-457Xcs
dc.identifier.doi10.21437/Interspeech.2019-2335
dc.identifier.isbn978-1-5108-9683-3
dc.identifier.issn2308-457X
dc.identifier.obd43926897
dc.identifier.uri2-s2.0-85098105505
dc.identifier.urihttp://hdl.handle.net/11025/47118
dc.language.isoenen
dc.project.IDGA19-19324S/Plně trénovatelná syntéza české řeči z textu s využitím hlubokých neuronových sítícs
dc.project.IDSGS-2019-027/Inteligentní metody strojového vnímání a porozumění 4cs
dc.publisherInternational Speech Communication Association (ISCA)en
dc.relation.ispartofseriesProceedings of the 20th Annual Conference of the International Speech Communication Association (Interspeech 2019)en
dc.rightsPlný text není přístupný.cs
dc.rights© International Speech Communication Associationen
dc.rights.accessclosedAccessen
dc.subjectpřevod grafémy-fonémy, fonetická transkripce, hluboké neuronové sítě se zpětnou vazbou, syntéza řečics
dc.subject.translatedgrapheme-to-phoneme, phonetic transcription, recurrent deep neural network, speech synthesisen
dc.titleUnified Language-Independent DNN-Based G2P Converteren
dc.title.alternativeSjednocený jazykově nezávislý model fonetické transkripce založený na hlubokých neuronových sítíchcs
dc.typekonferenční příspěvekcs
dc.typeConferenceObjecten
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
Interspeech_2019_2335_juzova_tihelka_vit.pdf
Size:
209.88 KB
Format:
Adobe Portable Document Format