ULSAna: Universal Language Semantic Analyzer
Date issued
2019
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
INCOMA Ltd.
Abstract
Představujeme online vícejazyčný systém pro pro povrchovou sémantickou analýzu v 51 jazycích. Doména vstupních dat není nijak omezena. Systém využívá pro všechny jazyky pouze anglická trénovací data. Výsledná sémantická anotace je tedy konzistentní napříč všemi jazyky Jako základní stavební kameny využíváme značkování sémantických rolí z CoNLL a univerzální syntaktickou anotaci Universal Dependencies. Systém je veřejně dostupný a podporuje dávkové zpracování, takže může být snadno využit pro výzkumné účely.
We present a live cross-lingual system capable of producing shallow semantic annotations of natural language sentences for 51 languages at this time. The domain of the input sentences is in principle unconstrained. The system uses single training data (in English) for all the languages. The resulting semantic annotations are therefore consistent across different languages. We use CoNLL Semantic Role Labeling training data and Universal dependencies as the basis for the system. The system is publicly available and supports processing data in batches; therefore, it can be easily used by the community for research tasks.
We present a live cross-lingual system capable of producing shallow semantic annotations of natural language sentences for 51 languages at this time. The domain of the input sentences is in principle unconstrained. The system uses single training data (in English) for all the languages. The resulting semantic annotations are therefore consistent across different languages. We use CoNLL Semantic Role Labeling training data and Universal dependencies as the basis for the system. The system is publicly available and supports processing data in batches; therefore, it can be easily used by the community for research tasks.
Description
Subject(s)
Zpracování přirozeného jazyka, sémantická analýza, značkování sémantických rolí, vícejazyčný přístup, demonstrační aplikace
Citation
PRAŽÁK, O., KONOPÍK, M. ULSAna: Universal Language Semantic Analyzer. In: Natural Language Processing in a Deep Learning World. Varna: INCOMA Ltd., 2019. s. 967-972. ISBN 978-954-452-055-7 , ISSN 1313-8502.