Multi-modální rozpoznávání historických pojmenovaných entit

dc.contributor.advisorKrál Pavel, prof. Ing. Ph.D.cs
dc.contributor.authorTrefil, Jiřícs
dc.contributor.refereeLenc Ladislav, Ing. Ph.D.cs
dc.date.accepted2025-06-16
dc.date.accessioned2026-02-20T16:03:45Z
dc.date.available2024-09-09
dc.date.available2026-02-20T16:03:45Z
dc.date.issued2025-05-14
dc.date.submitted2025-05-14
dc.description.abstractTato diplomová práce se zabývá multimodálním rozpoznáváním pojmenovaných entit. Práce vysvětluje problematiku v této oblasti, časté problémy spojené při zpracování přirozeného jazyka a také důvody, proč se touto úlohou zabývat. Dále představuje tři datové sady z této domény, dvě veřejně dostupné a jednu vlastnoručně vytvořenou. První dvě zmíněné sady vznikly kolekcí tweetů ze sociální sítě Twitter, třetí datová sada byla vytvořena ze souboru pěti knih o historii českoněmeckého území. Většina výzkumu v této oblasti se soustředila výlučně na textovou modalitu. Multimodální rozpoznávání nabývá v poslední době na popularitě, zejména díky velkému objemu dat a jejich dostupnosti. Cílem této práce je zjistit, zda multimodální přístup rozpoznávání pojmenovaných entit přinese lepší výsledky než jejich unimodální zpracování. Jsou navrženy tři unikátní architektury neuronových sítí, které používají specializované moduly na zpracování textu a obrázků. Během této práce vzniklo celkem 23 unikátních topologií, které používají zejména rekurentní neuronové sítě a transformer architekturu. Použity byly také Velké jazykové modely, konkrétně GPT-4o a Llama 3.1. Experimenty prokázaly, že multimodální zpracování v některých případech pomůže zvýšit úspěšnost rozpoznávánícs
dc.description.abstract-translatedThis thesis focuses on multimodal named entity recognition (NER). It explains the main issues in this domain, the common problems associated with natural language processing and the motivation behind this task. It also presents three datasets from this research field, two publicly available and one self-created. The first two of the mentioned datasets were created by collecting tweets from the social media network Twitter, while the third dataset was created from a collection of books on the history of the Czech-German territory. Most of the research in this area has focused exclusively on text modality. Multimodal recognition has recently gained popularity due to the large amount of data and its availability. The aim of this work is to determine whether multimodal NER would yield better results than unimodal one. Three unique neural network architectures have been proposed that use specific modules to process text and image data. A total of 23 unique topologies were developed for the experiments, mainly using recurrent neural networks and transformer architecture. Large language models, namely GPT-4o and Llama 3.1 were also used. Experiments have shown that a multimodal processing can in fact improve performance of recognition in some cases.en
dc.description.departmentKatedra informatiky a výpočetní technikycs
dc.description.resultObhájenocs
dc.format107
dc.identifier99641
dc.identifier.urihttp://hdl.handle.net/11025/65891
dc.language.isoen
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezenícs
dc.rights.accessopenAccesscs
dc.subjectzpracování přirozeného jazykacs
dc.subjectrozpoznávání pojmenovaných entitcs
dc.subjectBERTcs
dc.subjectLlama 3.1cs
dc.subjectViTcs
dc.subjectmulti-modální rozpoznávání pojmenovaných entitcs
dc.subjectpythoncs
dc.subject.translatednatural language processingen
dc.subject.translatednamed entity recognitionen
dc.subject.translatedBERTen
dc.subject.translatedLlama 3.1en
dc.subject.translatedViTen
dc.subject.translatedmultimodal named entity recognitionen
dc.subject.translatedpythonen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programSoftwarové a informační systémycs
dc.titleMulti-modální rozpoznávání historických pojmenovaných entitcs
dc.typediplomová prácecs
local.files.count6*
local.files.size56137503*
local.has.filesyes*
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=99641

Files

Original bundle
Showing 1 - 5 out of 6 results
No Thumbnail Available
Name:
A22N0060P-zadani_DP.pdf
Size:
21.91 KB
Format:
Adobe Portable Document Format
Description:
VŠKP - příloha
No Thumbnail Available
Name:
A22N0060P_prilohy.zip
Size:
48.4 MB
Format:
ZIP
Description:
VŠKP - příloha
No Thumbnail Available
Name:
DP_Trefil_A22N0060P.pdf
Size:
4.81 MB
Format:
Adobe Portable Document Format
Description:
VŠKP
No Thumbnail Available
Name:
PO_Trefil_A22N0060P.pdf
Size:
30.13 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta VŠKP
No Thumbnail Available
Name:
PV_Trefil_A22N0060P.pdf
Size:
75.83 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího VŠKP

Collections