Machine Learning Approach to Fact-Checking in West Slavic Languages
Date issued
2019
Journal Title
Journal ISSN
Volume Title
Publisher
INCOMA Ltd.
Abstract
Detekce tzv. fake news a úzce souvisejícího ověřování faktů získala v poslední době velkou pozornost. Výzkum možností automatizace těchto úloh byl již částečně proveden v anglickém jazyce, ale pro ostatní jazyky existuje pouze několik výzkumných článků (např. (Baly et al., 2018)) a nejsme si vědomi žádného výzkumu pro západoslovanské jazyky. V tomto článku představujeme dataset pro češtinu, polštinu a slovenštinu. Dále jsou v článku popsány základní experimenty s tímto datasetem, které poskytují referenční výsledky pro další výzkum.
Fake news detection and closely-related fact-checking have recently attracted a lot of attention. Automatization of these tasks has been already studied for English. For other languages, only a few studies can be found (e.g. (Baly et al., 2018)), and to the best of our knowledge, no research has been conducted for West Slavic languages. In this paper, we present datasets for Czech, Polish, and Slovak. We also ran initial experiments which set a baseline for further research into this area.
Fake news detection and closely-related fact-checking have recently attracted a lot of attention. Automatization of these tasks has been already studied for English. For other languages, only a few studies can be found (e.g. (Baly et al., 2018)), and to the best of our knowledge, no research has been conducted for West Slavic languages. In this paper, we present datasets for Czech, Polish, and Slovak. We also ran initial experiments which set a baseline for further research into this area.
Description
Subject(s)
Ověřování faktů, strojové učení, západoslovanské jazyky
Citation
PŘIBÁŇ, P.., HERCIG, T.., STEINBERGER, J.. Machine Learning Approach to Fact-Checking in West Slavic Languages. In: Natural Language Processing in a Deep Learning World. Varna: INCOMA Ltd., 2019. s. 973-979. ISBN 978-954-452-055-7 , ISSN 1313-8502.