Automatická identifikace revizí textových dokumentů

dc.contributor.advisorKonopík Miloslav, Ing. Ph.D.
dc.contributor.authorKupilík, Filip
dc.contributor.refereeKrál Pavel, Doc. Ing. Ph.D.
dc.date.accepted2017-8-29
dc.date.accessioned2018-01-15T15:04:45Z
dc.date.available2016-10-10
dc.date.available2018-01-15T15:04:45Z
dc.date.issued2017
dc.date.submitted2017-6-29
dc.description.abstractCílem této práce je navrhnout, vytvořit a otestovat algoritmus pro identifi- kaci revizí v množině textových dokumentů. V první části práce jsou zmapo- vány současné přístupy ve vyhledávání dokumentů a popsány stávající algo- ritmy pro identifikaci podobných dokumentů. Druhá část se zabývá návrhem a implementací algoritmu zaměřeného na detekci revizí, jehož úspěšnost je ověřena na vytvořené kolekci testovacích dokumentů. Výsledky získané z provedených experimentů jsou porovnány s výsledky vybraných stávajících algoritmů.cs
dc.description.abstract-translatedThe goal of the thesis is to design, create and test an algorithm which iden- tifies the revisions of test documents. The first part of the thesis is focused on analysing current approaches to document searching and a identification of highly similar documents (near-duplicates). The second part deals with a design and an implementation of a new algorithm. The efficiency of the algorithm is verified on a set of test documents. The tests results are com- pared with the results of the experiments which were done with the selected existing algorithms.en
dc.description.resultObhájenocs
dc.format49 s. (71189 znaků)cs
dc.format.mimetypeapplication/pdf
dc.identifier71953
dc.identifier.urihttp://hdl.handle.net/11025/27699
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectrevizecs
dc.subjectduplikátycs
dc.subjectapache lucenecs
dc.subjectvyhledávání informacícs
dc.subjectvektorový modelcs
dc.subjectkullback-leiblerova divergencecs
dc.subjectrozpoznávání pojmenovaných entitcs
dc.subject.translatedrevisionen
dc.subject.translatedduplicatesen
dc.subject.translatedapache luceneen
dc.subject.translatedinformation retrievalen
dc.subject.translatedvector space modelen
dc.subject.translatedkullback-leibler divergenceen
dc.subject.translatednamed-entity recognitionen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelBakalářskýcs
dc.thesis.degree-nameBc.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleAutomatická identifikace revizí textových dokumentůcs
dc.title.alternativeAutomated Identification of Revisions of Text Documentsen
dc.typebakalářská prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=71953

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
bakalarka.pdf
Size:
532.26 KB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A14B0296P-hodnoceni.pdf
Size:
620.39 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A14B0296P-posudek.pdf
Size:
435.01 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A14B0296P-obhajoba.pdf
Size:
200.48 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce