Зміст:
Визначення - Що означає вилучення даних?
Вилучення даних - це те, де дані аналізуються та проскакуються для отримання відповідної інформації з джерел даних (наприклад, бази даних) за певною схемою. Проводиться подальша обробка даних, яка включає додавання метаданих та іншу інтеграцію даних; ще один процес в робочому процесі даних.
Більшість вилучень даних відбувається з неструктурованих джерел даних та різних форматів даних. Ці неструктуровані дані можуть бути в будь-якій формі, такі як таблиці, індекси та аналітика.
Техопедія пояснює вилучення даних
Дані на складі можуть надходити з різних джерел, для зберігання даних потрібні три різні методи для використання вхідних даних. Ці процеси відомі як Видобуток, Перетворення та Завантаження (ETL).
Процес вилучення даних включає вилучення даних з розкопаних джерел даних. Потім витяги даних завантажуються в область постановки реляційної бази даних. Тут використовується логіка вилучення, а вихідна система запитується на дані за допомогою інтерфейсів програмування додатків. Після цього процесу дані тепер готові пройти фазу трансформації процесу ETL.
