Будинки Аудіо Що є частково спостережуваним процесом прийняття рішення щодо маркова (pomdp)? - визначення з техопедії

Що є частково спостережуваним процесом прийняття рішення щодо маркова (pomdp)? - визначення з техопедії

Зміст:

Anonim

Визначення - Що означає частково спостережуваний процес рішення Маркова (POMDP)?

Частково спостережуваний процес рішення Маркова (POMPD) - це процес рішення Маркова, в якому агент не може безпосередньо спостерігати за базовими станами моделі. Процес прийняття рішень Маркова (MDP) - це математична основа для моделювання рішень, що показує систему з низкою станів і забезпечує дії керівника, що приймає рішення, на основі цих станів.

POMPD спирається на цю концепцію, щоб показати, як система може вирішувати проблеми обмеженого спостереження.

"Техопедія" пояснює частково спостережуваний процес рішення Маркова (POMDP)

У частково спостережуваному процесі прийняття рішення Маркова, оскільки базові стани не є прозорими для агента, корисною є концепція, яка називається "стан віри". Стан переконань надає спосіб розібратися з неоднозначністю, притаманною моделі.

POMPD є корисним у навчанні підкріплення, коли система може переходити модель MPD або POMPD, використовуючи те, що відомо, щоб створити чіткішу картину ймовірних результатів.

Що є частково спостережуваним процесом прийняття рішення щодо маркова (pomdp)? - визначення з техопедії