Vyhledávání v Sémantickém webu použitím přirozeného jazyka

Abstract

Disertační práce popisuje kompletní systém pro vyhledávání v sémantickém webu použitím přirozeného jazyka. Systém je představen v kontextu výzkumu na poli Information Retrieval, sémantického webu, porozumění přirozenému jazyku a rozhraní využívajících přirozený jazyk. Hlavní výhodou rozhraní využívajících přirozený jazyk je možnost zadat otázku celou větou namísto vyplňování webových formulářů nebo použití pouze klíčových slov. Vyvinutý systém využívá technologie sémantického webu tradičními i novými způsoby. Myšlenka sémantického webu vnesla mnoho zajímavých konceptů do modelování domén a sdílení dat napříč doménami. Navíc kombinace sémantického webu a rozhraní využívajích přirozený jazyk skýtá nové možnosti pro vylepšení uživatelského komfortu při vyhledávání. Disertační práce má tyto hlavní přínosy. Zaprvé: byl navržen nový formalismum pro zachycení sémantiky otázky v přirozeném jazyce. Tento formalismum využívá technologií sémantického webu. Zadruhé: byl vyvinut statistický model pro sémantickou analýzu založený na strojovém učení. Zatřetí: systém byl otestován na reálných datech a reálných otázkách. Systém byl testován na doméně pro vyhledávání ubytování. Data byla získána z reálných webových portálů stejně jako testovací otázky v přirozeném jazyce. Práce se zabývá teoretickými i praktickými problémy, které musí být ve funkčním systému vyřešeny. Je popsán celý postup získání dat, korpus otázek, návrh ontologií, anotace, sémantická analýza a vyhledávání. Na závěr je provedeno velmi důkladné vyhodnocení funkčnosti systému. Pozornost je také zaměřena na otevřené problémy, např. výkon, použitelnost, přenositelnost na jinou doménu a jazyk a zdroje webových dat.

Description

Subject(s)

rozhraní, sémantické vyhledávání, porozumění, přirozenýjazyk

Citation

OPEN License Selector