Towards Automatic Medical Report Classification in Czech
Date issued
2023
Journal Title
Journal ISSN
Volume Title
Publisher
ScitePress
Abstract
This paper deals with the automatic classification of medical reports in the form of unstructured texts in Czech. The outcomes of this work are intended to be integrated into a coding assistant, a system that will help the clinical coders with the manual coding of the diagnoses. To solve this task, we compare several approaches based on deep neural networks. We compare the models in two different scenarios to show their advantages and drawbacks. The results demonstrate that hierarchical GRU with attention outperforms all other models in both cases. The experiments further show that the system can significantly reduce the workload of the operators and thus also saves time and money. To the best of our knowledge, this is the first attempt at automatic medical report classification in the Czech language.
Tento článek se zabývá automatickou klasifikací lékařských zpráv ve formě nestrukturovaných českých textů. Výstupy této práce jsou určeny k začlenění do kódovacího asistenta, systému, který pomůže lidským kodérům s manuálním kódováním diagnóz. Pro řešení používáme několik přístupů založených na hlubokých neuronových sítích. Modely porovnáváme ve dvou scénářích a naše výsledky ukazují, že hiearchický GRU model překonává v obou scénářích všechnz ostatní modely. Experimenty ukazují, že budoucí systém výrazně sníží pracovní zátět lidských kodérů a tím ušetří také čas a peníze. Naše studie je první, která se zaměřuje na automatické kodóvání lekařských zpráv v českém jazyce.
Tento článek se zabývá automatickou klasifikací lékařských zpráv ve formě nestrukturovaných českých textů. Výstupy této práce jsou určeny k začlenění do kódovacího asistenta, systému, který pomůže lidským kodérům s manuálním kódováním diagnóz. Pro řešení používáme několik přístupů založených na hlubokých neuronových sítích. Modely porovnáváme ve dvou scénářích a naše výsledky ukazují, že hiearchický GRU model překonává v obou scénářích všechnz ostatní modely. Experimenty ukazují, že budoucí systém výrazně sníží pracovní zátět lidských kodérů a tím ušetří také čas a peníze. Naše studie je první, která se zaměřuje na automatické kodóvání lekařských zpráv v českém jazyce.
Description
Subject(s)
Machine Learning, Classification, Multi-Label, Single-Label, Medical Data, Machine Learning, Klasifikace, Multi-Label, Single-Label, Medicínská data