Захоплююча презентація Кейт Кроуфорд, головний науковий співробітник Microsoft Research, на конференції Strata 2013 детальніше вивчає великі дані та те, що це означає, вивчаючи деякі з того, що Кроуфорд називає "алгоритмічними ілюзіями" та обмеженнями широкомасштабних рішень даних які охоплюються у багатьох частинах ділового світу.
Використовуючи фундаментальну аналогію з оптичною ілюзією, що стосується спінінг-кота, Кроуфорд стверджує, що хоча великі дані є важливими для багатьох бізнес-застосунків, існує більш ніж один спосіб інтерпретувати багато результатів наборів даних, які можуть здаватися об'єктивними для людей, що приймають рішення .
"Речі можуть розглядатися по-різному", - сказав Кроуфорд, посилаючись на документ, в якому вона та співавтор Девід Бойд розмірковують про деякі основні принципи використання великих даних, включаючи те, що Кроуфорд називає "міфологією", або переконання, що великі дані приносять абсолютну правду і об'єктивізм проекту. За її словами, лідери часто пов'язують великі дані з об'єктивним зором пташиного польоту, ігноруючи те, що вона назвала трьома основними обмеженнями або міркуваннями, які можуть вплинути на цю об'єктивність ключовими способами: упередженість, сигнал та масштаб.
Починаючи з упередженості, Кроуфорд використовує приклади затоплення в Австралії та США, щоб показати, що великі дані не завжди відповідають дійсності на вулиці. Вона пов'язана з другим принципом, сигналом, додатково ілюструючи, як набори даних можуть відображати приховані факти, які можуть сильно перекручувати результати. В якості одного із прикладів Кроуфорд наводив різні види світових карт, які були розроблені, намагаючись показати об'єктивний погляд на відносну величину континентів та націй.
"Карти не нейтральні", - сказав Крофорд. "Ми робимо вибір кожного разу, коли вирішуємо представляти наші дані."
Щоб додатково проілюструвати принцип, Кроуфорд використовує приклад програми, яка повідомляє про виїмки в Бостоні міським чиновникам, припускаючи, що такі програми, які працюють на смартфонах та мобільних пристроях, можуть призвести до того, що загальні звіти виглядають так, як карти перепису із зазначенням відносного віку і дохід у місті чи муніципалітеті.
"Ми ризикуємо додатково закріпити певні види соціальної нерівності", - сказав Кроуфорд, вказуючи на тих, хто може залишитися без даного великого набору даних через різницю у використанні технологій.
"Що станеться, якщо ви живете в тіні великих наборів даних?" вона сказала.
Крім того, Кроуфорд також розповідає про дослідження років тому, що ставив під сумнів, чи інформація на високому рівні завжди представляє більш детальні дані та чи завжди "об'єктивна панорама" працює як точніше представлення, ніж дані в меншому масштабі. Кроуфорд також просить слухачів думати не просто про великі дані, а про "дані з глибиною". Під цим вона має на увазі дані, які справді спрямовують читачів на об'єктивну реальність, а не наближаються до деталей із більш глобальним підходом, який, хоч і простіше зрозуміти, може залишати ключові елементи того, що насправді існує.