Monte Carlo

  • ХабрахабрФото [Перевод] Оптимизация стратегии игры в Блэкджек методом Монте-Карло

    [Перевод] Оптимизация стратегии игры в Блэкджек методом Монте-Карло

    Перевод статьи подготовлен специально для студентов курса «Machine learning». Начиная от AlphaGo и AlphaStar, все большее число видов деятельности, в которых раньше доминировал человек, теперь завоевано агентами ИИ, работающими на основе обучения с подкреплением. Обучение с подкреплением штурмом взяло мир Искусственного Интеллекта. В последних нескольких статьях от GradientCrescent мы рассмотрели различные фундаментальные аспекты обучения с подкреплением, от основ систем с…

    Читать далее »


Кнопка «Наверх»