ULSAna: Universal Language Semantic Analyzer

Date issued

2019

Journal Title

Journal ISSN

Volume Title

Publisher

INCOMA Ltd.

Abstract

Představujeme online vícejazyčný systém pro pro povrchovou sémantickou analýzu v 51 jazycích. Doména vstupních dat není nijak omezena. Systém využívá pro všechny jazyky pouze anglická trénovací data. Výsledná sémantická anotace je tedy konzistentní napříč všemi jazyky Jako základní stavební kameny využíváme značkování sémantických rolí z CoNLL a univerzální syntaktickou anotaci Universal Dependencies. Systém je veřejně dostupný a podporuje dávkové zpracování, takže může být snadno využit pro výzkumné účely.
We present a live cross-lingual system capable of producing shallow semantic annotations of natural language sentences for 51 languages at this time. The domain of the input sentences is in principle unconstrained. The system uses single training data (in English) for all the languages. The resulting semantic annotations are therefore consistent across different languages. We use CoNLL Semantic Role Labeling training data and Universal dependencies as the basis for the system. The system is publicly available and supports processing data in batches; therefore, it can be easily used by the community for research tasks.

Description

Subject(s)

Zpracování přirozeného jazyka, sémantická analýza, značkování sémantických rolí, vícejazyčný přístup, demonstrační aplikace

Citation

PRAŽÁK, O., KONOPÍK, M. ULSAna: Universal Language Semantic Analyzer. In: Natural Language Processing in a Deep Learning World. Varna: INCOMA Ltd., 2019. s. 967-972. ISBN 978-954-452-055-7 , ISSN 1313-8502.
OPEN License Selector