Будинки Розвиток Як концепція рівноваги може інформувати проекти машинного навчання?

Як концепція рівноваги може інформувати проекти машинного навчання?

Anonim

Q:

Як концепція рівноваги може інформувати проекти машинного навчання?

A:

Загалом, рівновага інформує машинне навчання, прагнучи стабілізувати середовище машинного навчання та створювати результати за допомогою сумісного поєднання детермінованих та ймовірнісних компонентів.

Експерти описують "рівновагу" як ситуацію, коли раціональні суб'єкти в системі машинного навчання досягають консенсусу щодо стратегічних дій - зокрема, рівновага Неша в теорії ігор передбачає два чи більше цих раціональних акторів, що консолідують стратегії, визнаючи, що жоден гравець не отримує користі від зміна певної стратегії, якщо інші гравці не змінюють свою.

Безкоштовне завантаження: машинне навчання і чому це важливо

Особливо популярна і проста демонстрація рівноваги Неша включає просту матрицю, де кожен з двох гравців обирає двійковий результат.

Сказане є досить технічним способом описати рівновагу та як вона працює. Набагато неформальніший спосіб проілюструвати концепцію рівноваги, особливо вищенаведений приклад двох раціональних акторів, кожен з яких має бінарний вибір, - це подумати про те, що можна назвати сценарієм "крокування один до одного в передпокої середньої школи".

Припустимо, двоє людей гуляють у різні сторони передпокою середньої школи (або будь-якого іншого типу району), де є лише місце для двох людей на ширину. Два відкритих шляху - це бінарні результати. Якщо двоє раціональних акторів виберуть різні бінарні результати, які не суперечать один одному, вони пройдуть повз один одного і привітаються. Якщо вони обирають два суперечливих бінарних результату - вони йдуть в одному просторі, і одному з них потрібно буде поступатися.

У наведеному вище прикладі, якщо обидва раціональні суб'єкти обирають два сумісні та не суперечливі результати, загальний консенсус полягає в тому, що жоден не здобуває змін, змінюючи свою стратегію - в цьому випадку напрямки ходіння - якщо інша людина не змінить свою.

Сказане являє собою рівновагу, яку можна моделювати в будь-якій конструкції машинного навчання. Враховуючи цей простий приклад, результатом завжди будуть співпрацювати два раціональних актори, або іншими словами, двоє людей, що проходять повз один одного.

Протилежне можна назвати "нерівновагою" - якщо двоє раціональних суб'єктів виберуть суперечливі результати, як було сказано, одному з них доведеться дати результат. Однак програма ML, що моделює це, може бути кинута у нескінченний цикл, якщо обидва вирішать поступатися - так, як двоє людей рухаються, щоб намагатися розмістити один одного і продовжують йти до зіткнення.

Рівноваги, подібні до вище, як правило, будуть використовуватися в машинному навчанні для створення консенсусу та стабілізації моделей. Інженери та розробники шукатимуть ті сценарії та ситуації, які виграють від рівноваги, і працюватимуть над тим, щоб змінити чи впоратися з тими, які цього не роблять. Дивлячись на приклади реального світу, які відповідають рівновагам МЛ, легко зрозуміти, наскільки цей вид аналізу в системі машинного навчання є однозначно повчальним для з'ясування способів моделювання поведінки людини шляхом створення раціональних акторів та агентів. Це лише один чудовий приклад того, як рівновага може бути використана для досягнення успіхів у застосуванні систем машинного навчання.

Як концепція рівноваги може інформувати проекти машинного навчання?