Будинки Розвиток Що таке навчання підкріплення? - визначення з техопедії

Що таке навчання підкріплення? - визначення з техопедії

Зміст:

Anonim

Визначення - Що означає зміцнення навчання?

Навчання підкріплення в умовах штучного інтелекту - це тип динамічного програмування, який здійснює підготовку алгоритмів, використовуючи систему винагороди та покарання.

Алгоритм навчання або агент, який навчається, вивчає, взаємодіючи зі своїм оточенням. Агент отримує винагороду за правильне виконання та штраф за неправильне виконання. Агент вчиться без втручання людини, максимізуючи свою винагороду і зводячи до мінімуму свою кару.

Техопедія пояснює навчання з посилення

Підсилення навчання - це підхід до машинного навчання, який надихається психологією біхевіоризму. Це схоже на те, як дитина вчиться виконувати нове завдання. Навчання підсилення контрастує з іншими підходами машинного навчання тим, що алгоритм не вказує прямо, як виконувати завдання, але працює над проблемою самостійно.

Як агент, який може бути автомобілем, що керує автомобілем, або програмою, що грає в шахи, взаємодіє зі своїм оточенням, отримує стан винагороди залежно від того, як це виконує, наприклад безпечне водіння до місця призначення або виграш у грі. І навпаки, агент отримує штраф за неправильне виконання робіт, наприклад, за вихід з дороги або за перевірку.

Агент з часом приймає рішення щодо максимізації своєї винагороди та мінімізації штрафу за допомогою динамічного програмування. Перевага такого підходу до штучного інтелекту полягає в тому, що він дозволяє програмі AI навчатися без програміста, який чітко визначає, як агент повинен виконувати завдання.

Що таке навчання підкріплення? - визначення з техопедії