Neuronové sítě pro zpracování přirozeného jazyka

Date issued

2023

Journal Title

Journal ISSN

Volume Title

Publisher

Západočeská univerzita v Plzni

Abstract

Tato bakalářská práce se zabývá zpracováním přirozeného jazyka pomocí neuronových sítí. V současnosti dochází k rychlému rozvoji neuronových sítí v tomto oboru, přičemž společnost OpenAI je hlavním průkopníkem s jejími velkými modely založenými na architektuře Transformer. Teoretická část se zaměřuje právě na tuto architekturu, konkrétně na architektury T5, BERT a GPT. V praktické části provádíme experimenty jak v češtině, tak v angličtině, založené na architektuře T5. Shromáždili jsme data obsahující přirozené dialogy mezi jednotlivci. Pro dosažení co nejlepších předpovědí výstupu se snažíme o různé modifikace trénovacích dat, jako je značkování nebo augmentace. Hodnocení se provádí pomocí modelu sémantické návaznosti, který porovnává vstup a výstup modelu.

Description

Subject(s)

neuronové sítě, zpracování přirozeného jazyka, transformer architektura, bert, t5, gpt, augmentace, úprava dat, chatbot

Citation