Q:
Як концепція рівноваги може інформувати проекти машинного навчання?
A:Загалом, рівновага інформує машинне навчання, прагнучи стабілізувати середовище машинного навчання та створювати результати за допомогою сумісного поєднання детермінованих та ймовірнісних компонентів.
Експерти описують "рівновагу" як ситуацію, коли раціональні суб'єкти в системі машинного навчання досягають консенсусу щодо стратегічних дій - зокрема, рівновага Неша в теорії ігор передбачає два чи більше цих раціональних акторів, що консолідують стратегії, визнаючи, що жоден гравець не отримує користі від зміна певної стратегії, якщо інші гравці не змінюють свою.
| Безкоштовне завантаження: машинне навчання і чому це важливо |
Особливо популярна і проста демонстрація рівноваги Неша включає просту матрицю, де кожен з двох гравців обирає двійковий результат.
Сказане є досить технічним способом описати рівновагу та як вона працює. Набагато неформальніший спосіб проілюструвати концепцію рівноваги, особливо вищенаведений приклад двох раціональних акторів, кожен з яких має бінарний вибір, - це подумати про те, що можна назвати сценарієм "крокування один до одного в передпокої середньої школи".
Припустимо, двоє людей гуляють у різні сторони передпокою середньої школи (або будь-якого іншого типу району), де є лише місце для двох людей на ширину. Два відкритих шляху - це бінарні результати. Якщо двоє раціональних акторів виберуть різні бінарні результати, які не суперечать один одному, вони пройдуть повз один одного і привітаються. Якщо вони обирають два суперечливих бінарних результату - вони йдуть в одному просторі, і одному з них потрібно буде поступатися.
У наведеному вище прикладі, якщо обидва раціональні суб'єкти обирають два сумісні та не суперечливі результати, загальний консенсус полягає в тому, що жоден не здобуває змін, змінюючи свою стратегію - в цьому випадку напрямки ходіння - якщо інша людина не змінить свою.
Сказане являє собою рівновагу, яку можна моделювати в будь-якій конструкції машинного навчання. Враховуючи цей простий приклад, результатом завжди будуть співпрацювати два раціональних актори, або іншими словами, двоє людей, що проходять повз один одного.
Протилежне можна назвати "нерівновагою" - якщо двоє раціональних суб'єктів виберуть суперечливі результати, як було сказано, одному з них доведеться дати результат. Однак програма ML, що моделює це, може бути кинута у нескінченний цикл, якщо обидва вирішать поступатися - так, як двоє людей рухаються, щоб намагатися розмістити один одного і продовжують йти до зіткнення.
Рівноваги, подібні до вище, як правило, будуть використовуватися в машинному навчанні для створення консенсусу та стабілізації моделей. Інженери та розробники шукатимуть ті сценарії та ситуації, які виграють від рівноваги, і працюватимуть над тим, щоб змінити чи впоратися з тими, які цього не роблять. Дивлячись на приклади реального світу, які відповідають рівновагам МЛ, легко зрозуміти, наскільки цей вид аналізу в системі машинного навчання є однозначно повчальним для з'ясування способів моделювання поведінки людини шляхом створення раціональних акторів та агентів. Це лише один чудовий приклад того, як рівновага може бути використана для досягнення успіхів у застосуванні систем машинного навчання.

