Systém pro extrakci informací z kriminalistických textů
Date issued
2016
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
Práce se zabývá zpracováním nestrukturovaných dokumentů a následným zpracováním extrahovaných dat. Největší pozornost je věnována extrakci jmen osob, ze kterých je následně vytvářena sociální (kriminální) síť. Dále je ukázán způsob, jakým tuto síť efektivně destabilizovat. V práci jsou ukázány možnosti detekce komunit, které se spolu často v textech vyskytují, prostorové a časové analýzy. Systém by mohl usnadnit práci např. investigativním reportérům nebo policii, která má k dispozici velké množství textových dokumentů. Jejich ruční zpracování, zejména pokud jsou hledána vodítka napříč několika dokumenty, může být obtížné. Jelikož tyto záznamy mohou obsahovat osobní údaje, je zde představen anonymizátor, který tyto údaje dokáže anonymizovat a následně deanonymizovat. Funkčnost systému byla ověřena na testovací sérii článků, které se věnují teroristickým útokům v Paříži a Bruselu.
Description
Subject(s)
zpracování nestrukturovaných dokumentů, sociální sítě, destabilizace kriminální sítě, anonymizace osobních údajů, rozpoznávání pojmenovaných entit