Главная » Архив меток: AlphaGo

Архив меток: AlphaGo

[Перевод] Обучение с подкреплением никогда не работало

TL;DR: Обучение с подкреплением (RL) всегда было сложным. Не волнуйтесь, если стандартные техники глубинного обучения не срабатывают. В статье Алекса Ирпана хорошо изложены многие современные проблемы глубинного RL. Но большинство из них не новые — они существовали всегда. На самом деле это фундаментальные проблемы, лежащие в основе RL с момента его создания. В этой статье я надеюсь довести до вас ...

Читать далее »