Зміст:
Визначення - Що означає Q-навчання?
Q-навчання - це термін для структури алгоритмів, що представляє навчальне підкріплення без моделей. Оцінюючи політику та використовуючи стохастичне моделювання, Q-навчання знаходить найкращий шлях в процесі прийняття рішення Маркова.
Техопедія пояснює Q-навчання
Технічний склад алгоритму Q-навчання включає агент, набір станів і набір дій на стан.
Функція Q використовує ваги для різних етапів у поєднанні з коефіцієнтом знижки, щоб оцінити винагороду.
Хоча це може здатися простою ідеєю, Q-навчання має першорядне значення у багатьох моделях посиленого навчання та глибокого навчання. Один з найкращих прикладів - це глибоке Q-навчання, яке допомагає програмам машинного навчання вивчати стратегії ігрових ігор у різних видах відеоігор, наприклад, в іграх Atari 1980-х років. Тут згорнута нейронна мережа бере зразки гри, щоб розробити стохастичну модель, яка допоможе комп’ютеру знати, як краще грати в гру з часом.
Q-навчання має великий потенціал для сприяння просуванню штучного інтелекту та машинного навчання.
