Будинки Тенденції Що таке q-навчання? - визначення з техопедії

Що таке q-навчання? - визначення з техопедії

Зміст:

Anonim

Визначення - Що означає Q-навчання?

Q-навчання - це термін для структури алгоритмів, що представляє навчальне підкріплення без моделей. Оцінюючи політику та використовуючи стохастичне моделювання, Q-навчання знаходить найкращий шлях в процесі прийняття рішення Маркова.

Техопедія пояснює Q-навчання

Технічний склад алгоритму Q-навчання включає агент, набір станів і набір дій на стан.

Функція Q використовує ваги для різних етапів у поєднанні з коефіцієнтом знижки, щоб оцінити винагороду.

Хоча це може здатися простою ідеєю, Q-навчання має першорядне значення у багатьох моделях посиленого навчання та глибокого навчання. Один з найкращих прикладів - це глибоке Q-навчання, яке допомагає програмам машинного навчання вивчати стратегії ігрових ігор у різних видах відеоігор, наприклад, в іграх Atari 1980-х років. Тут згорнута нейронна мережа бере зразки гри, щоб розробити стохастичну модель, яка допоможе комп’ютеру знати, як краще грати в гру з часом.

Q-навчання має великий потенціал для сприяння просуванню штучного інтелекту та машинного навчання.

Що таке q-навчання? - визначення з техопедії