Koncept Data Lakehouse pro zpracování medicínských dat

Abstract

Diplomová práce se zabývá problematikou nového typu úložiště Data Lakehouse, které je koncipováno pro ukládání heterogenních dat. V teoretické části je zmíněna evoluce jednotlivých typů úložišť a zevrubně je popisuje. Hlavním cílem je ukládat medicínské záznamy do tohoto typu úložiště a následně s nimi pracovat. Toto aktuálně řeší MRE platforma, která je vyvíjena a provozována na FAV ZČU. Pro ověření vhodnosti úložiště pro oblast medicínských dat byla vyvinuta aplikace, která implementuje úložiště Data Lakehouse za pomocí open-source projektu Delta Lake. První část aplikace tvoří administrace, která poskytuje kompletní správu uživatelů a obsahuje sekce zajišťující správu úložiště. Druhou část tvoří úložiště a skrze REST API poskytuje veškeré funkce pro jeho správu. Výsledné testování aplikace ukazuje vhodnost použití úložiště pro medicínská data. Na základě testování jsou popsány i náměty pro případná zlepšení a rozšíření stávající práce.

Description

Subject(s)

medicínská data, koncept úložiště, data lakehouse, delta lake, mre platforma, dasta, res-q, dicom, hl7, etl, elt, fair data

Citation

Collections

OPEN License Selector