Neuronové sítě pro zpracování přirozeného jazyka

dc.contributor.advisorBulín Martin, Ing. M.Sc.
dc.contributor.authorČedík, Jan
dc.contributor.refereeFrémund Adam, Ing.
dc.date.accepted2023-6-20
dc.date.accessioned2024-01-15T23:11:14Z
dc.date.available2022-10-17
dc.date.available2024-01-15T23:11:14Z
dc.date.issued2023
dc.date.submitted2023-5-22
dc.description.abstractTato bakalářská práce se zabývá zpracováním přirozeného jazyka pomocí neuronových sítí. V současnosti dochází k rychlému rozvoji neuronových sítí v tomto oboru, přičemž společnost OpenAI je hlavním průkopníkem s jejími velkými modely založenými na architektuře Transformer. Teoretická část se zaměřuje právě na tuto architekturu, konkrétně na architektury T5, BERT a GPT. V praktické části provádíme experimenty jak v češtině, tak v angličtině, založené na architektuře T5. Shromáždili jsme data obsahující přirozené dialogy mezi jednotlivci. Pro dosažení co nejlepších předpovědí výstupu se snažíme o různé modifikace trénovacích dat, jako je značkování nebo augmentace. Hodnocení se provádí pomocí modelu sémantické návaznosti, který porovnává vstup a výstup modelu.cs
dc.description.abstract-translatedThis bachelor's thesis deals with natural language processing using neural networks. Currently, there is a rapid development of neural networks in this field, with the company OpenAI being a major pioneer with its large models based on the Transformer architecture. The theoretical part focuses on this architecture, specifically the T5, BERT, and GPT architectures. In the practical part, we conduct experiments in both Czech and English languages based on the T5 architecture. We gathered data containing natural dialogues between individuals. Through various modifications of the training data, such as tagging or augmentation, we aim to achieve the best possible output predictions. Evaluation is performed using a semantic continuity model, comparing the input and output of the model.en
dc.description.resultObhájeno
dc.formatx, 56s. (86 705 znaků)
dc.identifier93415
dc.identifier.urihttp://hdl.handle.net/11025/55115
dc.language.isocs
dc.publisherZápadočeská univerzita v Plzni
dc.rightsPlný text práce je přístupný bez omezení
dc.subjectneuronové sítěcs
dc.subjectzpracování přirozeného jazykacs
dc.subjecttransformer architekturacs
dc.subjectbertcs
dc.subjectt5cs
dc.subjectgptcs
dc.subjectaugmentacecs
dc.subjectúprava datcs
dc.subjectchatbotcs
dc.subject.translatedneural networksen
dc.subject.translatednatural language processingen
dc.subject.translatedtransformer architectureen
dc.subject.translatedberten
dc.subject.translatedt5en
dc.subject.translatedgpten
dc.subject.translatedaugmentationen
dc.subject.translateddata modificationen
dc.subject.translatedchatboten
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných věd
dc.thesis.degree-levelBakalářský
dc.thesis.degree-nameBc.
dc.thesis.degree-programKybernetika a řídicí technika
dc.titleNeuronové sítě pro zpracování přirozeného jazykacs
dc.title.alternativeNeural networks for natural language processingen
dc.typebakalářská práce

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
BP_Cedik.pdf
Size:
2.91 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
PosudekVedoucihoSTAG.pdf
Size:
61.16 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
posudek.pdf
Size:
312.57 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
Prubeh obhajoby Cedik.pdf
Size:
82.09 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce