Diarization Based on Identification with X-Vectors

dc.contributor.authorZajíc, Zbyněk
dc.contributor.authorPsutka, Josef
dc.contributor.authorMüller, Luděk
dc.date.accessioned2021-02-22T11:00:22Z
dc.date.available2021-02-22T11:00:22Z
dc.date.issued2020
dc.description.abstractV tomto článku popisujeme diarizaci mono telefonních dat z Jazykové poradny Ústavu pro jazyk český. Náš navrhovaný přístup k diarizaci využívá informace o identitě jednoho z účastníků hovoru. V klasickém přístupu k diarizaci nahrazujeme shlukování x-vektorů identifikací řečníka.cs
dc.description.abstract-translatedIn this paper, we describe a diarization of mono channel telephone recordings from The Language Consulting Center providing the Czech language consultancy service. In our proposed approach to a diarization, we use information about the known identity of one speaker (the language counsellor) acquired from the text transcription at the beginning of the conversation. In the state-of-the-art diarization based on the x-vectors clustering, we replace the clustering step by the identification of each segment of the recording against the counsellor’s identity x-vector and the general x-vector model that represents the client. Our proposed diarization without resegmentation step can be used as an online approach. Because of the uniqueness of our data, we compare our results with the Kaldi diarization as the baseline system.en
dc.format12 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier.citationZAJÍC, Z., PSUTKA, J., MÜLLER, L. Diarization Based on Identification with X-Vectors. In: Speech and Computer, 22nd International Conference, SPECOM 2019, St. Petersburg, Russia, October 7-9,2020, Proceedings. Cham: Springer, 2020. s. 667-678. ISBN 978-3-030-60275-8, ISSN 0302-9743.cs
dc.identifier.doi10.1007/978-3-030-60276-5_64
dc.identifier.isbn978-3-030-60275-8
dc.identifier.issn0302-9743
dc.identifier.obd43930813
dc.identifier.uri2-s2.0-85092921730
dc.identifier.urihttp://hdl.handle.net/11025/42726
dc.language.isoenen
dc.project.IDLM2018101/LINDAT/CLARIAH-CZ – Digitální výzkumná infrastruktura pro jazykové technologie, umění a humanitní vědycs
dc.project.ID90101/Velká výzkumná infrastruktura povinnost (J) - LINDAT/CLARIAH-CZcs
dc.project.IDDG16P02B009/Zpřístupnění dotazů jazykové poradny v lingvisticky strukturované databázics
dc.project.IDLM2015042/E-infrastruktura CESNETcs
dc.project.ID90042/Velká výzkumná infrastruktura povinnost (J) - CESNET IIcs
dc.publisherSpringeren
dc.relation.ispartofseriesSpeech and Computer, 22nd International Conference, SPECOM 2019, St. Petersburg, Russia, October 7-9,2020, Proceedingsen
dc.rightsPlný text není přístupný.cs
dc.rights© Springeren
dc.rights.accessclosedAccessen
dc.subjectdiarizace, identifikace, x-vektor, automatické rozpoznávání řečics
dc.subject.translatedDiarization, Identification, X-vector, Automatic speech recognitionen
dc.titleDiarization Based on Identification with X-Vectorsen
dc.title.alternativeDiarizace založená na identifikaci pomocí x-vektorůcs
dc.typekonferenční příspěvekcs
dc.typeconferenceObjecten
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen

Files