Перейти к основному содержанию
EDU-MMCS
Вы используете гостевой доступ (
Вход
)
Обучение с подкреплением
В начало
Курсы
Осенний семестр
Магистратура
RL
Тематический план
Выбрать тему Общее
Общее
Свернуть всё
Развернуть всё
Выбрать элемент Список группы
Список группы
Гиперссылка
Недоступно, пока не выполнено: Ваше поле
Адрес электронной почты
не пустое
Выбрать элемент Курс от Яндекса Practical_RL
Курс от Яндекса Practical_RL
Гиперссылка
Выбрать элемент Пример многоступенчатого обучения с вариацией награждений
Пример многоступенчатого обучения с вариацией награждений
Гиперссылка
Выбрать элемент Вопросы к экзаменуДинамическое программирование, к...
Вопросы к экзамену
Динамическое программирование, конечный горизонт, Уравнение Беллмана.
Фильтрация сигнала с помощью динамического программирования.
Динамическое программирование бесконечный горизонт. Стационарный вариант.
Стационарное уравнение Беллмана и Q - функция. Рекуррентные методы решения стационарного уравнения Беллмана.
Марковская цепочка. Стационарный вариант. Ядро.
Восстановление ядра по марковской временной последовательности.
Марковская цепочка с наблюдением. Динамическое программирование и вычисление правдоподобия.
Вычисление максимума правдоподобия по ненаблюдаемой составляющей и задача восстановления бинарного сигнала.
Процесс с управляемым ядром. Восстановление управляемого ядра по наблюдаемой вход-выходной последовательности.
Задача стационарного стохастического оптимального управления. Уравнение Беллмана.
Вычисление функции Беллмана как задача стохастического программирования.
Вычисление Q-функции при небольшом числе состояний и небольшом числе управлений.
Вычисление Q-функции при линейном управлении. Метод Монте-Карло.
Выбрать тему Введение
Введение
Выбрать элемент Лабораторная работа 1
Лабораторная работа 1
Задание
Срок сдачи:
понедельник, 23 сентября 2024, 23:59
Выбрать тему Марковские процессы
Марковские процессы
Выбрать элемент Лабораторная работа 2
Лабораторная работа 2
Задание
Выбрать тему Q-learning
Q-learning
Выбрать элемент Лабораторная работа 3
Лабораторная работа 3
Задание
Выбрать элемент Лабораторная работа 4. Deep Q-learning
Лабораторная работа 4. Deep Q-learning
Задание
Выбрать тему Бандиты, разведка, практические уловки
Бандиты, разведка, практические уловки
Выбрать элемент Лабораторная работа 5
Лабораторная работа 5
Задание
Выбрать тему Тема 5
Тема 5
Выбрать тему Тема 6
Тема 6
Выбрать тему Тема 7
Тема 7
Выбрать тему Тема 8
Тема 8