00:14:32
Model Based RL для игр Atari
Описание
Современные model-free RL алгоритмы могут решать сложные задачи, например Atari игры, но им требуются десятки миллионов взаимодействий со средой — эквивалентно нескольким неделям тренировки в реальном времени. Люди же могут научится играть в эти игры за минуты.
На предстоящем семинаре мы обсудим новую статью Model Based Reinforcement Learning for Atari, где авторы предложили алгоритм, превосходящий state-of-the-art model-free подходы при сильном ограничении в числе взаимодействий со средой.
Докладчик: Игорь Филиппов.
Ссылка на слайды: https://drive.google.com/file/d/13Yxodmvs8_de5UrNXM1zjpIWYhtxaH5K/view?usp=sharing
Рекомендуемые видео

Новая Битва экстрасенсов, 25 сезон, 8 выпуск
2 128 451 просмотров

ПОПАДАНЦЫ АУДИОКНИГА: ВЕК ОГНЯ И КАМНЯ
439 414 просмотров

Аватар: Путь воды | Avatar: The Way of Water (2022, 4K)
5 104 657 просмотров

Зеленая миля (1999) / The Green Mile
320 920 просмотров

КАК МОШЕННИКИ ВТЯГИВАЮТ НАС В ПРЕСТУПЛЕНИЯ: разбор с УБК МВД
1 723 просмотров

Марсианин (фильм, 2015)
1 589 667 просмотров

Мстители: Финал (2019) | Avengers: Endgame (Дубляж)
210 050 просмотров

Атлас (фильм, 2024)
857 723 просмотров

ПОПАДАНЦЫ АУДИОКНИГА: БРОДЯГА И ЕГО ВЕРНЫЙ ПЁС
360 057 просмотров

Гладиатор (2000) / Gladiator
1 186 710 просмотров

Хищник: Планета смерти (фильм, 2025) Predator: Badlands
411 476 просмотров

Гладиатор 2 (фильм, 2024)
1 952 574 просмотров

Властелин колец: Возвращение короля | Режиссёрская версия (2003)
2 370 772 просмотров

Мстители: Война бесконечности (2018) | Avengers: Infinity War (Дубляж)
279 772 просмотров

Дьявол носит Prada (фильм, 2006)
344 046 просмотров

Аватар | Avatar (2009, расширенная версия, 4K)
1 512 306 просмотров

Интерстеллар | Interstellar (2014)
2 316 093 просмотров

Гарри Поттер и Тайная комната | Harry Potter and the Chamber of Secrets (2002)
4 974 974 просмотров

Побег из Шоушенка (фильм, 1994)
1 213 494 просмотров

С каждым часом я становлюсь всё более беременной
1 596 904 просмотров