Зміст:
Коли я розпочав цю статтю, я планував перелічити різні типи великих платформ даних. Але, після трьох днів спроб зібрати всі різні пропозиції великих даних - реляційні проти нереляційні, SQL проти NoSQL та бази даних проти фреймворку - в деякий вигляд порядку, я вирішив уникнути цього безладу.
Щоб додати образи до травми, я сподівався представити людину, яка придумала термін "великі дані", як частину статті. Але я навіть не можу цього зробити. Немає узгодженої відповіді. Насправді існує повноцінний дослідницький проект, який вивчає, хто спочатку придумав великі дані. Натомість я спробую ознайомитись з деякими ключовими способами використання великих даних. Це набагато важливіше. І це цікавіше і дивніше, ніж можна подумати.
Як це сталося
Аналітики, що використовують традиційний майнінг даних, роками маніпулюють даними. Цим же аналітикам зараз важко впоратися з кількістю та різноманітністю даних, що зберігаються бізнесом, приватними організаціями та державними установами.