СловариФорумКупитьСкачатьКонтакты

   Английский +
Google | Forvo | +
к фразам

Q-learning

ударения
ИИ. обучение с использованием функции полезности (метод, применяемый в искусственном интеллекте при агентном подходе. На основе получаемого от среды вознаграждения агент формирует функцию полезности Q, что впоследствии дает ему возможность уже не случайно выбирать стратегию поведения, а учитывать опыт предыдущего взаимодействия со средой. Одно из преимуществ такого обучения состоит в возможности сравнивать ожидаемую полезность доступных действий, не формируя модели окружающей среды. Применяется для ситуаций, которые можно представить в виде марковского процесса принятия решений. Alex_Odeychuk)
нейр.сет. Q-обучение (clck.ru dimock)
Q-learning
: 1 фраза в 1 тематике
Нейронные сети1