Vícejazyčné vyhledávání v textových dokumentech

dc.contributor.advisorLenc Ladislav, Ing. Ph.D.
dc.contributor.authorMatura, Ondřej
dc.contributor.refereeKrál Pavel, Doc. Ing. Ph.D.
dc.date.accepted2023-6-13
dc.date.accessioned2023-08-02T10:47:36Z
dc.date.available2022-10-3
dc.date.available2023-08-02T10:47:36Z
dc.date.issued2023
dc.date.submitted2023-5-4
dc.description.abstractTato bakalářská práce zkoumá potenciál pro zlepšení vícejazyčného vyhledávání informací (CLIR) v rámci portálu Porta fontium, který poskytuje přístup k historickým materiálům z Česko-Bavorského pohraničí. Je tedy důležité umožnit vyhledávání v českých i německých dokumentech zároveň. Práce nejprve poskytuje přehled metod CLIR, zahrnující jak tradiční, tak moderní přístupy. Tato analýza zdůrazňuje silné a slabé stránky každé metody, čímž připravuje cestu pro návrh řešení. Poté studie zkoumá dostupné CLIR datasety a hodnotící metriky. Následně jsou provedeny experimenty pro vyhodnocení výkonnosti vybraných CLIR metod s využitím identifikovaných datasetů a metrik. Tato analýza směřuje k vývoji softwarového modulu CLIR, který bude možné použít v systému Porta fontium.cs
dc.description.abstract-translatedThis bachelor's thesis investigates the potential for improving cross-language information retrieval (CLIR) within the Porta fontium portal, which provides access to historical materials from the Czech-Bavarian border region. It is therefore important to enable simultaneous search in both Czech and German documents. The thesis first provides an overview of CLIR methods, including both traditional and modern approaches. This analysis highlights the strengths and weaknesses of each method, paving the way for a solution proposal. Afterwards, the study examines available CLIR datasets and evaluation metrics. Experiments are then conducted to evaluate the performance of selected CLIR methods, using the identified datasets and metrics. This analysis leads to the development of a CLIR software module that can be integrated into the Porta fontium system.en
dc.description.resultObhájeno
dc.format40 s. (68 000 znaků)
dc.identifier93738
dc.identifier.urihttp://hdl.handle.net/11025/53763
dc.language.isocs
dc.publisherZápadočeská univerzita v Plzni
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectclircs
dc.subjectnlpcs
dc.subjectbert modelcs
dc.subjectslovní vektorycs
dc.subject.translatedcliren
dc.subject.translatednlpen
dc.subject.translatedbert modelen
dc.subject.translatedword embeddingsen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-levelBakalářský
dc.thesis.degree-nameBc.
dc.thesis.degree-programInformatika a výpočetní technika
dc.titleVícejazyčné vyhledávání v textových dokumentechcs
dc.title.alternativeMultilingual text document retrievalen
dc.typebakalářská práce

Files

Original bundle
Showing 1 - 5 out of 7 results
No Thumbnail Available
Name:
Vicejazycne vyhledavani v textovych dokumentech.pdf
Size:
606.07 KB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A19B0135P_Hodnoceni.pdf
Size:
98.94 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A19B0135P_Posudek.pdf
Size:
23.66 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A19B0135P_Obhajoba.pdf
Size:
42.34 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce
No Thumbnail Available
Name:
A19B0135P_Zadani.pdf
Size:
14.36 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha