Будинки Бази даних Використання алгоритмів для прогнозування виборів: чат із намальованою підводкою

Використання алгоритмів для прогнозування виборів: чат із намальованою підводкою

Anonim

Дрю буде презентувати на саміті Big Data Innovation 30 і 31 січня в Лас-Вегасі: http://analytics.theiegroup.com/bigdata-lasvegas, а також спікери з Обами за Америку, Best Buy, LinkedIn, The New York Times, Nokia, Bitly, Barnes & Nobles, Walmart Labs та багато іншого.


Посилання для реєстрації: http://bit.ly/Zs3wms


Це інтерв'ю провів Джордж Хілл і опублікував журнал Big Data Innovation.


Яка реакція на ваші прогнози?


Більшість реакцій було зосереджено на різниці в точності між нами, хто вивчав опитування громадської думки, та передбаченнями популярних експертів та коментаторів "відчуття кишки". У день виборів такі аналітики даних, як я, Нейт Сілвер (блог New York Times FiveThirtyEight), Саймон Джекман (Університет Стенфорда та Хаффінгтон Пост) та Сем Ванг (Принстонський виборчий консорціум) - все оцінювали шанси Обами на переобрання понад 90% і вірно прогнозували 332 голоси на виборах за Обаму як найімовірніший результат. Тим часом, такі спеціалісти, як Карл Роув, Джордж Вілл та Стів Форбс, сказали, що Ромні збирається перемогти - а в деяких випадках легко. Це призвело до розмови про "перемогу для квантів", яку, сподіваюся, перенесе на майбутні вибори.


Як ви оцінюєте алгоритм, використаний у ваших прогнозах?


Моя модель прогнозування оцінювала результати голосування держави та остаточне голосування на виборах кожного дня кампанії, починаючи з червня. Я хотів, щоб оцінка цих прогнозів була максимально справедливою і об'єктивною - і не залишала мені жодної кімнати, коли вони помилялися. Так, приблизно за місяць до виборів я розмістив на своєму веб-сайті набір з восьми критеріїв оцінювання, якими я користувався, коли будуть відомі результати. Як виявилося, модель працювала чудово. Протягом літа він передбачав, що Обама виграє всі свої штати 2008 року за вирахуванням штату Індіана та Північну Кароліну, і ледве не відступив від цього прогнозу навіть після того, як підтримка Обами зросла вгору у вересні, а потім занепала після перших президентських дебатів.


Кількість даних, що використовуються протягом цієї кампанії як незалежними аналітиками, так і командами кампанії, була величезною, які наслідки це має для використання даних у 2016 році?


Кампанія 2012 року показала, що можна керувати, довіряти та застосовувати багато різних різноманітних джерел кількісної інформації для різних цілей. Ми, сторонні люди, змогли передбачити результат виборів далеко заздалегідь. Всередині кампаній було досягнуто величезних успіхів щодо орієнтації на виборців, відстеження думок, збору коштів та виборців. Тепер, коли ми знаємо, що ці методи можуть працювати, я думаю, що назад немає. Я очікую, що репортери та коментатори кампанії будуть сприймати агрегацію опитувань набагато серйозніше у 2016 році. І хоча в даний час Обама і демократи мають перевагу в технології передвиборчої кампанії, я був би здивований, якби республіканці швидко не наздогнали.


Ви вважаєте, що успіх цієї кампанії, що керується даними, означає, що менеджерам кампаній зараз потрібно бути аналітиком, а також стратегом?


Керівникам кампаній, можливо, не потрібно бути самими аналітиками, але вони повинні більше розуміти, як можна використовувати дані та технології в свою користь. Кампанії завжди використовували дослідження опитування для формулювання стратегії та вимірювання настроїв виборців. Але зараз доступний ряд інших потужних інструментів: веб-сайти соціальних мереж, бази даних для виборців, мобільні смартфони та маркетинг електронної пошти. І це є доповненням до недавніх досягнень методологій опитування та статистичного моделювання думок. Зараз в американській агітаційній політиці відбувається багато нововведень.


Вам вдалося передбачити результати виборів за 6 місяців до того, як ви вважаєте, що реалістичний максимальний термін для точного прогнозування результату за допомогою ваших методів аналітики?


Близько чотирьох-п’яти місяців - це приблизно стільки назад, скільки наука дозволяє нам зараз піти; і це навіть трохи натискає на це. До цього опитування просто не були достатньо інформативними щодо можливого результату: занадто багато людей або не визначилися, або не почали звертати увагу на кампанію. Історичні економічні та політичні фактори, які, як було показано, співвідносяться з результатами виборів, також починають втрачати свою передбачувальну силу, як тільки ми вийдемо за рамки приблизно 4-5 місяців. На щастя, це все ще надає кампаніям достатньо часу для складання стратегії та прийняття рішень щодо розподілу своїх ресурсів.

Використання алгоритмів для прогнозування виборів: чат із намальованою підводкою