Current State of the UWebASR - Web-Based ASR Service for Czech, Slovak, German, and English
| dc.contributor.author | Švec, Jan | |
| dc.contributor.author | Lehečka, Jan | |
| dc.contributor.author | Ircing, Pavel | |
| dc.date.accessioned | 2026-04-24T18:05:59Z | |
| dc.date.available | 2026-04-24T18:05:59Z | |
| dc.date.issued | 2025 | |
| dc.date.updated | 2026-04-24T18:05:59Z | |
| dc.description.abstract | We describe the current state of UWebASR, a web-based automatic speech recognition (ASR) service tailored for academic use, supporting Czech, Slovak, German, and English. Developed initially within LINDAT/CLARIAH-CZ, the system has evolved by integrating domain-tuned wav2vec 2.0 models, an open HTTP API, and feedback-driven enhancements. UWebASR is used across diverse research contexts, including oral history and sign language dataset preparation. The service is integrated with the CLARIN infrastructure via the LINDAT/CLARIAH-CZ services webpage and also via the BAS transcription portal, facilitating its reuse and access across Europe’s research community. | en |
| dc.description.abstract | Popisujeme současný stav UWebASR, webové služby automatického rozpoznávání řeči (ASR) přizpůsobené pro akademické použití s podporou češtiny, slovenštiny, němčiny a angličtiny. Systém, původně vyvinutý v rámci projektu LINDAT/CLARIAH-CZ, se dále rozvíjel integrací modelů wav2vec 2.0 optimalizovaných pro danou doménu, otevřeného HTTP API a vylepšení založených na zpětné vazbě. UWebASR se používá v různých výzkumných kontextech, včetně přípravy datových sad pro orální historii a znakový jazyk. Služba je integrována s infrastrukturou CLARIN prostřednictvím webové stránky služeb LINDAT/CLARIAH-CZ a také prostřednictvím transkripčního portálu BAS, což usnadňuje její opětovné použití a přístup v celé evropské výzkumné komunitě. | cz |
| dc.format | 5 | |
| dc.identifier.isbn | neuvedeno | |
| dc.identifier.issn | 2773-2177 | |
| dc.identifier.obd | 43947639 | |
| dc.identifier.orcid | Švec, Jan 0000-0001-8362-5927 | |
| dc.identifier.orcid | Lehečka, Jan 0000-0002-3889-8069 | |
| dc.identifier.orcid | Ircing, Pavel 0000-0001-6967-1687 | |
| dc.identifier.uri | http://hdl.handle.net/11025/67835 | |
| dc.language.iso | en | |
| dc.project.ID | LM2023062 | |
| dc.publisher | CLARIN | |
| dc.relation.ispartofseries | CLARIN Annual Conference 2025 | |
| dc.subject | speech recognition | en |
| dc.subject | web servis | en |
| dc.subject | CLARIN | en |
| dc.subject | rozpoznávání řeči | cz |
| dc.subject | webová služba | cz |
| dc.subject | CLARIN | cz |
| dc.title | Current State of the UWebASR - Web-Based ASR Service for Czech, Slovak, German, and English | en |
| dc.title | Aktuální stav webové služby ASR UWebASR pro češtinu, slovenštinu, němčinu a angličtinu | cz |
| dc.type | Stať ve sborníku (D) | |
| dc.type | STAŤ VE SBORNÍKU | |
| dc.type.status | Published Version | |
| local.files.count | 1 | * |
| local.files.size | 681276 | * |
| local.has.files | yes | * |
Files
Original bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- CLARIN2025_ConferenceProceedings.pdf#page=104.pdf
- Size:
- 665.31 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 out of 1 results
No Thumbnail Available
- Name:
- license.txt
- Size:
- 1.71 KB
- Format:
- Item-specific license agreed upon to submission
- Description: