English | Russian |
delayed feedback modeling | моделирование запаздывающей обратной связи (Alex_Odeychuk) |
following trials and feedback | методом проб и ошибок (пример: In 2011, International Business Machines Corp.’s -winning Watson computer showcased the power of its deep- learning techniques, which enabled the computer to optimize its strategy following trials and feedback.: Jeopardy! A.Rezvov) |
learning from weak or partial feedback | обучение со слабой или частичной обратной связью (Alex_Odeychuk) |
partial feedback | частичная обратная связь (Alex_Odeychuk) |
reinforcement learning with human feedback | обучение с подкреплением на основе отзывов людей (Alex_Odeychuk) |
reinforcement learning with human feedback | обучение с подкреплением на основе человеческих предпочтений (Alex_Odeychuk) |
reinforcement learning with human feedback | обучение с подкреплением и обратной связью от человека (rb.ru Alex_Odeychuk) |