Current State of the UWebASR - Web-Based ASR Service for Czech, Slovak, German, and English

Date issued

2025

Journal Title

Journal ISSN

Volume Title

Publisher

CLARIN

Abstract

We describe the current state of UWebASR, a web-based automatic speech recognition (ASR) service tailored for academic use, supporting Czech, Slovak, German, and English. Developed initially within LINDAT/CLARIAH-CZ, the system has evolved by integrating domain-tuned wav2vec 2.0 models, an open HTTP API, and feedback-driven enhancements. UWebASR is used across diverse research contexts, including oral history and sign language dataset preparation. The service is integrated with the CLARIN infrastructure via the LINDAT/CLARIAH-CZ services webpage and also via the BAS transcription portal, facilitating its reuse and access across Europe’s research community.
Popisujeme současný stav UWebASR, webové služby automatického rozpoznávání řeči (ASR) přizpůsobené pro akademické použití s podporou češtiny, slovenštiny, němčiny a angličtiny. Systém, původně vyvinutý v rámci projektu LINDAT/CLARIAH-CZ, se dále rozvíjel integrací modelů wav2vec 2.0 optimalizovaných pro danou doménu, otevřeného HTTP API a vylepšení založených na zpětné vazbě. UWebASR se používá v různých výzkumných kontextech, včetně přípravy datových sad pro orální historii a znakový jazyk. Služba je integrována s infrastrukturou CLARIN prostřednictvím webové stránky služeb LINDAT/CLARIAH-CZ a také prostřednictvím transkripčního portálu BAS, což usnadňuje její opětovné použití a přístup v celé evropské výzkumné komunitě.

Description

Subject(s)

speech recognition, web servis, CLARIN, rozpoznávání řeči, webová služba, CLARIN

Citation