Detekce slov s nepravidelnou výslovností v českém textu

Date issued

2012

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Cílem této diplomové práce je navrhnout a implementovat systém, který automaticky hledá a označuje slova s nepravidelnou výslovností v českých textech. Nepravidelná výslovnost slova je taková výslovnost, která nelze odvodit pomocí pravidel české fonetické transkripce. Pro řešení je použit klasifikátor, který roztřídí všechna slova do dvou tříd, a to do třídy slov s pravidelnou výslovností a třídy slov s nepravidelnou výslovností. Natrénovaný klasifikátor zohledňuje i slovník výjimek zabudovaný v existujícím fonetickém transkriberu. Výsledky této práce ukazují, že nejlepší klasifikace slov je dosaženo při použití klasifikátoru podle k-nejbližšího souseda. Dalšími zkoumanými klasifikátory v této práci byly neuronové sítě, lineární SVC a rozhodovací stromy.

Description

Subject(s)

nepravidelná výslovnost, fonetická transkripce, automatická detekce jazyka, jazykový model, klasifikace, lineární systém rovnic, klasifikátor podle k-nejbližšího souseda, neuronové sítě

Citation

Collections