Asking Questions: an Innovative Way to Interact with Oral History Archives
| dc.contributor.author | Švec, Jan | |
| dc.contributor.author | Bulín, Martin | |
| dc.contributor.author | Frémund, Adam | |
| dc.contributor.author | Polák, Filip | |
| dc.date.accessioned | 2025-06-20T08:56:44Z | |
| dc.date.available | 2025-06-20T08:56:44Z | |
| dc.date.issued | 2023 | |
| dc.date.updated | 2025-06-20T08:56:44Z | |
| dc.description.abstract | The paper describes our initial effort to use Transformer-based neural networks for understanding and presenting oral history archives. Such archives of interviews often contain large passages of the interviewee’s speech. Our approach automatically generates relevant questions, which enrich such monotonous parts and allows the listener to better orient in the interview. The generated questions also allow for finding interesting parts of the interview without changing the original meaning of the testimony. We present our working pipeline consisting of a Wav2Vec speech recognizer, BERT-based punctuation detection, T5 asking questions model and BERT-based semantic continuity model. | en |
| dc.description.abstract | Tato práce popisuje naše počáteční úsilí využít neuronové sítě založené na modelu Transformer pro porozumění a prezentaci archivů orální historie. Tyto archivy obsahují často rozsáhlé pasáže výpovědí osob, s nimiž byl veden rozhovor. Prezentujeme přístup pro automatické generování relevantních otázek, které obohatí tyto monotónní pasáže a umožní posluchači lépe se orientovat v průběhu interview. Tyto generované otázky také umožňují nalézt zajímavé části interview, aniž by byl změněn původní význam svědectví. Náš postup zahrnuje rozpoznávání řeči pomocí modelu Wav2Vec, detekci interpunkce založenou na modelu BERT, model T5 pro generování relevantních otázek a model založený na modelu BERT pro ohodnocení sémantické kontinuity navrhovaných otázek s odpovídajícím kontextem. | cz |
| dc.format | 2 | |
| dc.identifier.doi | 10.21437/Interspeech.2023 | |
| dc.identifier.isbn | neuvedeno | |
| dc.identifier.issn | 2308-457X | |
| dc.identifier.obd | 43940529 | |
| dc.identifier.orcid | Švec, Jan 0000-0001-8362-5927 | |
| dc.identifier.orcid | Bulín, Martin 0000-0003-0276-3143 | |
| dc.identifier.orcid | Frémund, Adam 0000-0001-8780-6629 | |
| dc.identifier.orcid | Polák, Filip 0009-0003-3969-3772 | |
| dc.identifier.uri | http://hdl.handle.net/11025/61627 | |
| dc.language.iso | en | |
| dc.project.ID | SGS-2022-017 | |
| dc.project.ID | GA22-27800S | |
| dc.publisher | International Speech Communication Association | |
| dc.relation.ispartofseries | INTERSPEECH 2023 | |
| dc.subject | question answering | en |
| dc.subject | semantic search | en |
| dc.subject | oral history archives | en |
| dc.subject | automatické generování otázek, sémantické vyhledávání, archivy orální historie | cz |
| dc.title | Asking Questions: an Innovative Way to Interact with Oral History Archives | en |
| dc.title | Automatické generování otázek: Nový způsob pro interakci s archivy orální historie | cz |
| dc.type | Stať ve sborníku (D) | |
| dc.type | STAŤ VE SBORNÍKU | |
| dc.type.status | Published Version | |
| local.files.count | 1 | * |
| local.files.size | 190654 | * |
| local.has.files | yes | * |
| local.identifier.eid | 2-s2.0-85171543989 |
Files
Original bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- Svec_Bulin_Fremund_Polak_interspeech_2023.pdf
- Size:
- 186.19 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: