Current State of the UWebASR - Web-Based ASR Service for Czech, Slovak, German, and English

dc.contributor.authorŠvec, Jan
dc.contributor.authorLehečka, Jan
dc.contributor.authorIrcing, Pavel
dc.date.accessioned2026-04-24T18:05:59Z
dc.date.available2026-04-24T18:05:59Z
dc.date.issued2025
dc.date.updated2026-04-24T18:05:59Z
dc.description.abstractWe describe the current state of UWebASR, a web-based automatic speech recognition (ASR) service tailored for academic use, supporting Czech, Slovak, German, and English. Developed initially within LINDAT/CLARIAH-CZ, the system has evolved by integrating domain-tuned wav2vec 2.0 models, an open HTTP API, and feedback-driven enhancements. UWebASR is used across diverse research contexts, including oral history and sign language dataset preparation. The service is integrated with the CLARIN infrastructure via the LINDAT/CLARIAH-CZ services webpage and also via the BAS transcription portal, facilitating its reuse and access across Europe’s research community.en
dc.description.abstractPopisujeme současný stav UWebASR, webové služby automatického rozpoznávání řeči (ASR) přizpůsobené pro akademické použití s podporou češtiny, slovenštiny, němčiny a angličtiny. Systém, původně vyvinutý v rámci projektu LINDAT/CLARIAH-CZ, se dále rozvíjel integrací modelů wav2vec 2.0 optimalizovaných pro danou doménu, otevřeného HTTP API a vylepšení založených na zpětné vazbě. UWebASR se používá v různých výzkumných kontextech, včetně přípravy datových sad pro orální historii a znakový jazyk. Služba je integrována s infrastrukturou CLARIN prostřednictvím webové stránky služeb LINDAT/CLARIAH-CZ a také prostřednictvím transkripčního portálu BAS, což usnadňuje její opětovné použití a přístup v celé evropské výzkumné komunitě.cz
dc.format5
dc.identifier.isbnneuvedeno
dc.identifier.issn2773-2177
dc.identifier.obd43947639
dc.identifier.orcidŠvec, Jan 0000-0001-8362-5927
dc.identifier.orcidLehečka, Jan 0000-0002-3889-8069
dc.identifier.orcidIrcing, Pavel 0000-0001-6967-1687
dc.identifier.urihttp://hdl.handle.net/11025/67835
dc.language.isoen
dc.project.IDLM2023062
dc.publisherCLARIN
dc.relation.ispartofseriesCLARIN Annual Conference 2025
dc.subjectspeech recognitionen
dc.subjectweb servisen
dc.subjectCLARINen
dc.subjectrozpoznávání řečicz
dc.subjectwebová službacz
dc.subjectCLARINcz
dc.titleCurrent State of the UWebASR - Web-Based ASR Service for Czech, Slovak, German, and Englishen
dc.titleAktuální stav webové služby ASR UWebASR pro češtinu, slovenštinu, němčinu a angličtinucz
dc.typeStať ve sborníku (D)
dc.typeSTAŤ VE SBORNÍKU
dc.type.statusPublished Version
local.files.count1*
local.files.size681276*
local.has.filesyes*

Files

Original bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
CLARIN2025_ConferenceProceedings.pdf#page=104.pdf
Size:
665.31 KB
Format:
Adobe Portable Document Format
License bundle
Showing 1 - 1 out of 1 results
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: