Možnosti analytického rozšíření úložiště Data Lakehouse
Date issued
2024
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Západočeská univerzita v Plzni
Abstract
V diplomové práci jsou diskutovány analytické a statistické možnosti rozšíření datového úložiště Data Lakehouse. Nejdříve je zkoumán koncept úložiště data lakehouse, následně jsou popsány již existující implementace tohoto úložiště - Databricks a koncept Data Lakehouse, na který je v této práci navazováno. Následně jsou zkoumána dostupná data pro Data Lakehouse z platformy MRE ZČU zabývající se shromažďováním medicínských dat. Následně jsou navrhnuty možnosti rozšíření Data Lakehouse, následuje popis jejich implementace, výběr technologií a problémy, na které bylo narazeno při implementaci těchto návrhů. Nakonec je implementace otestována, výsledek práce porovnán s MRE, navrženy další možnosti rozšíření Data Lakehouse, shrnuty a vyhodnoceny dosažené výsledky.
Description
Subject(s)
delta lake, apache spark, vizualizace a statistika, datová analýza, preact, zpracování informací, data lakehouse