Лабораторная 6. Кнопки и коробки
Требуемые условия завершения
Открыто с: четверг, 21 ноября 2024, 14:50
Срок сдачи: четверг, 5 декабря 2024, 15:00
Есть агент, кнопки и коробки. Научите агента нажимать на кнопки, чтобы он смог сбежать.
Заготовка и инструкции: https://github.com/RobolabGs2/AI_RL_Lab_02/
Основные баллы (10)
- [5 баллов] Есть хотя бы одна кнопка агент обучен на неё нажимать.
- [5 баллов] Кнопок больше двух, и агент умеет нажимать на все с помощью коробок (опционально и себя).
Бонусные баллы (10)
- [+5 баллов] Если после нажатия кнопок уровень не заканчивается, а открывается дверь, через которую агент должен уйти.
- [+5 баллов] За добавление препятствий (динамически меняющихся от запуска к запуску).
Статьи
Простая статья про любопытство
https://unity.com/ru/blog/engine-platform/solving-sparse-reward-tasks-with-curiosity
Сложная статья про любопытство
https://pathak22.github.io/noreward-rl/
Про простой q-лёрнинги
https://spinningup.openai.com/en/latest/algorithms/ddpg.html#background
Про Soft Actor-Critic
https://spinningup.openai.com/en/latest/algorithms/sac.html