ETL (витяг, перетворення та завантаження) - один з найважливіших процесів в аналітиці великих даних - і водночас це може бути одним із найбільших вузьких місць. (Докладніше про великі дані, перегляньте 5 корисних великих курсів даних, які можна взяти в Інтернет.)
Причина ETL настільки важлива в тому, що більшість даних, які збирає бізнес, не готові в своєму сирому вигляді для аналізу даних аналітичного рішення. Для того щоб рішення аналітики створило розуміння, необроблені дані потрібно витягнути з програми, де вона зараз перебуває, перетворити у формат, який може прочитати програма аналітики, а потім завантажити в саму програму аналітики.
Цей процес є аналогом приготування. Ваші сирі інгредієнти - це ваші необроблені дані. Їх потрібно витягти (придбати в магазині), перетворити (приготувати), а потім завантажити (покрити), перш ніж їх можна буде проаналізувати (скуштувати). Складність і витрати можуть масштабуватися непередбачувано - легко зробити мак-н-сир для себе, але набагато складніше створити меню гурманів для 40 осіб на вечері. Потрібно сказати, що помилка в будь-якій точці може зробити вашу страву непереборною.