Asking Questions: an Innovative Way to Interact with Oral History Archives

dc.contributor.authorŠvec, Jan
dc.contributor.authorBulín, Martin
dc.contributor.authorFrémund, Adam
dc.contributor.authorPolák, Filip
dc.date.accessioned2025-06-20T08:56:44Z
dc.date.available2025-06-20T08:56:44Z
dc.date.issued2023
dc.date.updated2025-06-20T08:56:44Z
dc.description.abstractThe paper describes our initial effort to use Transformer-based neural networks for understanding and presenting oral history archives. Such archives of interviews often contain large passages of the interviewee’s speech. Our approach automatically generates relevant questions, which enrich such monotonous parts and allows the listener to better orient in the interview. The generated questions also allow for finding interesting parts of the interview without changing the original meaning of the testimony. We present our working pipeline consisting of a Wav2Vec speech recognizer, BERT-based punctuation detection, T5 asking questions model and BERT-based semantic continuity model.en
dc.description.abstractTato práce popisuje naše počáteční úsilí využít neuronové sítě založené na modelu Transformer pro porozumění a prezentaci archivů orální historie. Tyto archivy obsahují často rozsáhlé pasáže výpovědí osob, s nimiž byl veden rozhovor. Prezentujeme přístup pro automatické generování relevantních otázek, které obohatí tyto monotónní pasáže a umožní posluchači lépe se orientovat v průběhu interview. Tyto generované otázky také umožňují nalézt zajímavé části interview, aniž by byl změněn původní význam svědectví. Náš postup zahrnuje rozpoznávání řeči pomocí modelu Wav2Vec, detekci interpunkce založenou na modelu BERT, model T5 pro generování relevantních otázek a model založený na modelu BERT pro ohodnocení sémantické kontinuity navrhovaných otázek s odpovídajícím kontextem.cz
dc.format2
dc.identifier.doi10.21437/Interspeech.2023
dc.identifier.isbnneuvedeno
dc.identifier.issn2308-457X
dc.identifier.obd43940529
dc.identifier.orcidŠvec, Jan 0000-0001-8362-5927
dc.identifier.orcidBulín, Martin 0000-0003-0276-3143
dc.identifier.orcidFrémund, Adam 0000-0001-8780-6629
dc.identifier.orcidPolák, Filip 0009-0003-3969-3772
dc.identifier.urihttp://hdl.handle.net/11025/61627
dc.language.isoen
dc.project.IDSGS-2022-017
dc.project.IDGA22-27800S
dc.publisherInternational Speech Communication Association
dc.relation.ispartofseriesINTERSPEECH 2023
dc.subjectquestion answeringen
dc.subjectsemantic searchen
dc.subjectoral history archivesen
dc.subjectautomatické generování otázek, sémantické vyhledávání, archivy orální historiecz
dc.titleAsking Questions: an Innovative Way to Interact with Oral History Archivesen
dc.titleAutomatické generování otázek: Nový způsob pro interakci s archivy orální historiecz
dc.typeStať ve sborníku (D)
dc.typeSTAŤ VE SBORNÍKU
dc.type.statusPublished Version
local.files.count1*
local.files.size190654*
local.has.filesyes*
local.identifier.eid2-s2.0-85171543989

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
Svec_Bulin_Fremund_Polak_interspeech_2023.pdf
Size:
186.19 KB
Format:
Adobe Portable Document Format
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: