Optimální metody dataminingu pro zpracování semistrukturovaných medicínských dat
Date issued
2016
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Cílem mé diplomové práce bylo navrhnout řešení a vytvořit program, který by umožňoval korekce lékařských textů na základě velmi rozsáhlých a různorodých semistrukturovaných dat z lékařských zpráv. V práci teoreticky popisuji možnosti zpracování několik dataminingových algoritmů pro klasifikaci textů. Je zde popsán princip mnou navrženého řešení, které využívá databázi pro ukládání trénovacích dat. V práci využívám fulltextové vyhledávání pro účely navrhování oprav zkratek a celkovou korekci lékařských textů, založenou na CouchDB a Apache Lucene. Pro vylepšené hledání oprav medicínského textu jsem používal metody dataminingu. Závěr obsahuje celkové hodnocení úspěšnosti datamining algoritmů a fulltextových databází.
Description
Subject(s)
dolování znalostí, fulltext, naivní bayes, svm, c4.5, k-nejblížších sousedů, algoritmy, medicínská data, semistrukturovaná data, weka, couchdb