Q:
Що означають великі дані для офіційної статистики?
A:Питання про те, як великі дані можуть змінити офіційну статистику та дослідження федеральних чи урядових установ, є захоплюючим, почасти через характер сучасних систем видобутку та збору даних.
У чомусь великі дані конкурують з іншими традиційними методами збору інформації. Наприклад, широко узагальнені дані з Інтернету можуть бути більш точним прогнозом, ніж те, що виробляється "спільнотою експертів" у певній галузі. Це означає, що великі дані можуть підштовхувати різні типи офіційної статистики до більш точних прогнозів або більш ефективної методології.
Інший спосіб, згідно з яким дані, можливо, змінять офіційну статистику, полягає в тому, що майбутні методи дослідження можуть інтегрувати рішення з великими даними, щоб отримати вигоду з цього компонента дослідницьких зусиль. Наприклад, Бюро перепису населення США здійснює багато фізичних перевірок людей, будівель та інфраструктури в США, грунтуючись на своїй статистиці на спостереженнях та реакціях у реальному часі. Внесення великих даних до зусиль Бюро перепису населення США може означати агрегування даних Інтернету про ці самі системи та порівняння їх з тим, що виявляють працівники на місцях. Існує будь-яка кількість способів інтегрувати великі дані та польові дослідження, які визначатимуть конкретні результати для будь-якого економічного, соціального чи галузевого науково-дослідного проекту.
Коротше кажучи, великі дані перетворять офіційну статистику на більш сучасну та вдосконалену форму звітності, де ретельна фізична таблиця посилюється технічними моделями та алгоритмами, які працюють на основі усереднення або проектування з величезних обсягів видобутих чи зібраних даних. Це лише одна з причин того, що величезний набір великих даних, зібраних урядами та підприємствами, настільки цінний і ретельно охороняється.