Зміст:
Визначення - Що означає Data Lake?
Озеро даних - це масивне, легкодоступне централізоване сховище великих обсягів структурованих та неструктурованих даних.Техопедія пояснює дані Лейк
Архітектура озера даних є підходом до великих даних. Дані не класифікуються, коли вони зберігаються у сховищі, оскільки значення даних спочатку не зрозуміло. В результаті підготовка даних виключається. Таким чином, озеро даних є менш структурованим порівняно зі звичайним сховищем даних. Коли доступ до даних, вони лише класифікуються, організовуються або аналізуються.
Hadoop, рамка з відкритим кодом для обробки та аналізу великих даних, може використовуватися для просіювання даних у сховищі.