Are the Multilingual Models Better? Improving Czech Sentiment with Transformers

Přibáň, Pavel

Are the Multilingual Models Better? Improving Czech Sentiment with Transformers

Files

Přibáň-RANLP-2021-Are-the-crosslingual.pdf (502.67 KB)

Date issued

2021

Authors

Přibáň, Pavel

Steinberger, Josef

Publisher

INCOMA Ltd.

Abstract

V tomto článku se zaměřujeme na zlepšení českého sentimentu pomocí modelů založených na architektuře Transformer a jejich vícejazyčných verzí. Řešíme úlohu detekce polarity pro češtinu na třech českých datových sadách. Trénujeme a provádíme experimenty s pěti vícejazyčnými a třemi monolinguálními modely. Porovnáváme výkonnost monolinguálních a vícejazyčných modelů, včetně srovnání se starším přístupem založeným na rekurentních neuronových sítích. Dále testujeme vícejazyčné modely a jejich schopnost přenášet znalost z angličtiny do češtiny (a naopak). Naše experimenty ukazují, že obrovské vícejazyčné modely mohou překonat výkonnost monolinguálních modelů. Jsou také schopny detekovat polaritu v jiném jazyce bez trénovacích dat, přičemž jejich výkon není horší než 4,4 % ve srovnání s nejlepšími monolinguálními modely. Navíc jsme dosáhli nových state-of-the-art výsledků na všech třech datových sadách.

Subject(s)

Analýza českého sentiment, architektura Transformer, vícejazyčnost

Citation

PŘIBÁŇ, P. STEINBERGER, J. Are the Multilingual Models Better? Improving Czech Sentiment with Transformers. In Deep Learning for Natural Language Processing Methods and Applications. Shoumen: INCOMA Ltd., 2021. s. 1138-1149. ISBN: 978-954-452-072-4 , ISSN: 1313-8502

Item identifier

https://doi.org/2-s2.0-85123600594
http://hdl.handle.net/11025/47188
https://doi.org/10.26615/978-954-452-072-4_128

Collections

OBD
Conference Papers (KIV)

Show full item record

Are the Multilingual Models Better? Improving Czech Sentiment with Transformers

Files

Date issued

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Subject(s)

Citation

Item identifier

Collections