SharePoint Add-In pro vytěžování dat z dokumentů

dc.contributor.advisorWegschmied David, Ing.
dc.contributor.authorKutková, Veronika
dc.contributor.refereeKryl Martin, Ing.
dc.date.accepted2017-6-19
dc.date.accessioned2018-01-15T15:02:15Z
dc.date.available2016-9-1
dc.date.available2018-01-15T15:02:15Z
dc.date.issued2017
dc.date.submitted2017-5-17
dc.description.abstractTato práce je zaměřena na návrh a vytvoření SharePoint add-inu zajišťujícího vytěžování dat z naskenovaných faktur. V rámci experimentu byl vyzkoušen a porovnán vzorek OCR nástrojů. Nejlepších výsledků z~bezplatných řešení dosáhl nástroj OnlineOCR.net. Vyzkoušeno bylo také několik metod vytěžování dat z faktur. Jako nejvhodnější se ukázala metoda založená na Locality-Sensitive Hashing. Tyto poznatky byly využity při návrhu a implementaci výsledného add-inu. Kompletní řešení je hostováno na cloudové platformě Microsoft Azure. Pro asynchronní zpracovávání požadavků na vytěžování dat bylo použito několik Azure komponent (fronta, webová úloha). Výsledkem je funkční add-in do SharePoint Online, jehož použití částečně automatizuje ruční přepis faktur do systému a minimalizuje vzniklé chyby.cs
dc.description.abstract-translatedThis thesis is focused on design and implementation of invoice data mining add-in for SharePoint. A couple of OCR tools were tested and compared, as~well as several invoice data mining methods. Experiments proved that OnliceOCR.net is the most precise free OCR tool. As for invoice data mining, Locality-Sensitive Hashing based method turned out to be the most suitable. Observed results were used to~design and implement the add-in. The complete solution is hosted on Microsoft Azure cloud platform. Few Azure components (storage queue, webjob) were used to process the data mining requests asynchonously. The outcome of this thesis is the add-in for SharePoint Online, partially automating the invoice transcription process and reducing data entry errors.en
dc.description.resultObhájenocs
dc.format106 s.cs
dc.format.mimetypeapplication/pdf
dc.identifier71421
dc.identifier.urihttp://hdl.handle.net/11025/27140
dc.language.isocscs
dc.publisherZápadočeská univerzita v Plznics
dc.rightsPlný text práce je přístupný bez omezení.cs
dc.rights.accessopenAccessen
dc.subjectsharepointcs
dc.subjectadd-incs
dc.subjectvytěžování datcs
dc.subjectdolování datcs
dc.subjectrozpoznávání znakůcs
dc.subjectocrcs
dc.subjectúčetní dokumentycs
dc.subjectfakturacs
dc.subjectoffice 365cs
dc.subjectmicrosoft azurecs
dc.subject.translatedsharepointen
dc.subject.translatedadd-inen
dc.subject.translateddata miningen
dc.subject.translatedoptical character recognitionen
dc.subject.translatedocren
dc.subject.translatedfinancial documentsen
dc.subject.translatedinvoiceen
dc.subject.translatedoffice 365en
dc.subject.translatedmicrosoft azureen
dc.thesis.degree-grantorZápadočeská univerzita v Plzni. Fakulta aplikovaných vědcs
dc.thesis.degree-levelNavazujícícs
dc.thesis.degree-nameIng.cs
dc.thesis.degree-programInženýrská informatikacs
dc.titleSharePoint Add-In pro vytěžování dat z dokumentůcs
dc.title.alternativeData Mining SharePoint Add-Inen
dc.typediplomová prácecs
local.relation.IShttps://portal.zcu.cz/StagPortletsJSR168/CleanUrl?urlid=prohlizeni-prace-detail&praceIdno=71421

Files

Original bundle
Showing 1 - 4 out of 4 results
No Thumbnail Available
Name:
DP_Kutkova.pdf
Size:
7.06 MB
Format:
Adobe Portable Document Format
Description:
Plný text práce
No Thumbnail Available
Name:
A14N0077Phodnoceni-ved.PDF
Size:
835.99 KB
Format:
Adobe Portable Document Format
Description:
Posudek vedoucího práce
No Thumbnail Available
Name:
A14N0077Pposudek-op.PDF
Size:
716.22 KB
Format:
Adobe Portable Document Format
Description:
Posudek oponenta práce
No Thumbnail Available
Name:
A14N0077Pobhajoba.PDF
Size:
213.61 KB
Format:
Adobe Portable Document Format
Description:
Průběh obhajoby práce

Collections