Phonetic speech segmentation of audiobooks by using adapted LSTM-based acoustic models

Hanzlíček, Zdeněk

Phonetic speech segmentation of audiobooks by using adapted LSTM-based acoustic models

Files

978-3-031-22419-5_27.pdf (471.09 KB)

Date issued

2022

Authors

Hanzlíček, Zdeněk

Matoušek, Jindřich

Publisher

Springer Nature Switzerland

Abstract

Tento článek popisuje fonetickou segmentací audioknih pomocí LSTM neuronových sítí. Segmentační procedura zahrnuje iterativní adaptaci výchozího hlasově nezávislého modelu. Experimentální data zahrnují 5 audioknih nahraných různými českými osobnostmi. Zhruba 20 minut každé audioknihy je opatřeno přesnou ruční segmentací vytvořenou fonetickými experty. Experimenty popsané v tomto článku se zaměřují na nalezení optimálního nastavení segmentační procedury a zkoumají vliv jednotlivých parametrů na přesnost výsledné segmentace.

Subject(s)

audiknihy, fonetická segmentace, LSTM

Citation

HANZLÍČEK, Z. MATOUŠEK, J. Phonetic speech segmentation of audiobooks by using adapted LSTM-based acoustic models. In Lecture Notes in Artificial Intelligence. Cham: Springer Nature Switzerland, 2022. s. 317–327. ISBN: 978-3-031-22418-8 , ISSN: 0302-9743

Item identifier

https://doi.org/2-s2.0-85148685025
http://hdl.handle.net/11025/51722
https://doi.org/10.1007/978-3-031-22419-5_27

Collections

OBD
Conference Papers (KKY)

Show full item record

Phonetic speech segmentation of audiobooks by using adapted LSTM-based acoustic models

Files

Date issued

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Subject(s)

Citation

Item identifier

Collections