Current State of the UWebASR - Web-Based ASR Service for Czech, Slovak, German, and English
Date issued
2025
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
CLARIN
Abstract
We describe the current state of UWebASR, a web-based automatic speech recognition (ASR) service tailored for academic use, supporting Czech, Slovak, German, and English. Developed initially within LINDAT/CLARIAH-CZ, the system has evolved by integrating domain-tuned wav2vec 2.0 models, an open HTTP API, and feedback-driven enhancements. UWebASR is used across diverse research contexts, including oral history and sign language dataset preparation. The service is integrated with the CLARIN infrastructure via the LINDAT/CLARIAH-CZ services webpage and also via the BAS transcription portal, facilitating its reuse and access across Europe’s research community.
Popisujeme současný stav UWebASR, webové služby automatického rozpoznávání řeči (ASR) přizpůsobené pro akademické použití s podporou češtiny, slovenštiny, němčiny a angličtiny. Systém, původně vyvinutý v rámci projektu LINDAT/CLARIAH-CZ, se dále rozvíjel integrací modelů wav2vec 2.0 optimalizovaných pro danou doménu, otevřeného HTTP API a vylepšení založených na zpětné vazbě. UWebASR se používá v různých výzkumných kontextech, včetně přípravy datových sad pro orální historii a znakový jazyk. Služba je integrována s infrastrukturou CLARIN prostřednictvím webové stránky služeb LINDAT/CLARIAH-CZ a také prostřednictvím transkripčního portálu BAS, což usnadňuje její opětovné použití a přístup v celé evropské výzkumné komunitě.
Popisujeme současný stav UWebASR, webové služby automatického rozpoznávání řeči (ASR) přizpůsobené pro akademické použití s podporou češtiny, slovenštiny, němčiny a angličtiny. Systém, původně vyvinutý v rámci projektu LINDAT/CLARIAH-CZ, se dále rozvíjel integrací modelů wav2vec 2.0 optimalizovaných pro danou doménu, otevřeného HTTP API a vylepšení založených na zpětné vazbě. UWebASR se používá v různých výzkumných kontextech, včetně přípravy datových sad pro orální historii a znakový jazyk. Služba je integrována s infrastrukturou CLARIN prostřednictvím webové stránky služeb LINDAT/CLARIAH-CZ a také prostřednictvím transkripčního portálu BAS, což usnadňuje její opětovné použití a přístup v celé evropské výzkumné komunitě.
Description
Subject(s)
speech recognition, web servis, CLARIN, rozpoznávání řeči, webová služba, CLARIN