Testování podobnosti vět

Date issued

2017

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Cílem této práce je prozkoumat problematiku výpočtu sémantické podobnosti dvou českých vět. V této práci jsou představeny některé metody pro výpočet sémantické podobnosti jednotlivých slov i celých vět. Lidmi ohodnocené původní věty jsou převzaty z dat z mezinárodní soutěže SemEval. Testování sémantické podobnosti vět je prováděno na vytvořeném českém korpusu, který se skládá z 1200 dvojic vět bodově ohodnocených od 0 do 5 na základě jejich sémantické podobnosti. Přesnost vypočtené sémantické podobnosti u testovacích dvojic vět je měřena pomocí Pearsonovy korelace.

Description

Subject(s)

zpracování přirozeného jazyka, strojové učení, sémantická podobnost vět, předzpracování textu, lineární regrese

Citation

OPEN License Selector