Identification and classification of DICOM files with burned-in text content

Date issued

2019

Journal Title

Journal ISSN

Volume Title

Publisher

Elsevier

Abstract

Pozadí: Chráněné osobní a zdravotní informace vypálené v pixelech snímku ve formátu DICOM nejsou z různých důvodů indikovány. To komplikuje sekundární použití takových dat. V posledních letech došlo k několika pokusům o anonymizaci nebo de-identifikaci souborů DICOM. Stávající přístupy mají různá omezení. Neexistuje žádné zcela spolehlivé řešení. Zejména u velkých datových souborů je nutné rychle analyzovat a identifikovat soubory, které potenciálně narušují soukromí. Metody: Klasifikace je založena na adaptivně-iterativním algoritmu navrženém k identifikaci jedné ze tří tříd. Existuje několik transformací obrazu, optické rozpoznávání znaků a filtry; pak je učiněno lokální rozhodnutí. Potvrzené lokální rozhodnutí je konečné. Klasifikátor byl trénován na datovém souboru složeném z 15 334 snímků různých modalit. Výsledky: Falešně pozitivní hodnoty jsou ve všech případech pod 4,00 % a 1,81 % v případě kritického případu detekce chráněných osobních a zdravotních informací. Vážená průměrná citlivost klasifikátoru byla 94,85 %, vážená průměrná inverzní citlivost dosahovala 97,42 % a Cohenův Kappa koeficient byl 0,920. Závěr: Navrhovaný přístup pro klasifikaci textu vypáleného ve snímcích je vysoce konfigurovatelný a schopný analyzovat obrázky z různých modalit se šumem na pozadí. Řešení bylo validováno a jeho cílem je identifikovat DICOM soubory, pro které musí být omezený přístup nebo musí být důkladně de-identifikovány kvůli problémům s výskytem osobních údajů. Na rozdíl od stávajících nástrojů lze rozpoznaný text, včetně jeho souřadnic, dále použít pro de-identifikaci.

Description

Subject(s)

Vypálené chráněné osobní a zdravotní údaje, klasifikace, de-identifikace, DICOM, HIPAA, detekce textu

Citation

BRYCHCÍN, T., TAYLOR, S., SVOBODA, L. Cross-lingual word analogies using linear transformations between semantic spaces. Expert Systems with Applications, 2019, roč. 135, č. NOV 30 2019, s. 287-295. ISSN 0957-4174.
OPEN License Selector