lightgbm

  • ХабрахабрФото Kaggle для футболистов. Разбираем подходы призеров соревнований по детекции столкновений (5 — 3 место)

    Kaggle для футболистов. Разбираем подходы призеров соревнований по детекции столкновений (5 — 3 место)

    Недавно закончилось соревнование от американской национальной футбольной лиги (NFL), которая объединилась с AWS, чтобы прокачать системы спортивной видеоаналитики. Организаторы поставили простую, казалось бы, задачу — точно определить, в каких случаях игроки сталкиваются друг с другом во время матча по американскому футболу. Мы с коллегами приняли участие, но не успели реализовать все свои идеи. Зато изучили подходы других команд и поняли,…

    Читать далее »
  • ХабрахабрФото Улучшаем прогнозы Facebook* Prophet с помощью LightGBM и Optuna

    Улучшаем прогнозы Facebook* Prophet с помощью LightGBM и Optuna

    В данной статье я расскажу о нескольких полезных способах улучшения качества предсказаний модели Facebook Prophet. В этой статье я не буду уделять внимание таким подходам, как denoising или различным трансформациям (например, box-cox), а сконцентрируюсь на двух методах, которые позволят получить лучшее качество, не внося изменения в данные. На Хабре уже есть подробные обзоры Prophet (ссылка), поэтому мы ограничимся кратким введением.…

    Читать далее »
  • ХабрахабрФото [Перевод] Orchest — конструктор конвейеров Machine Learning

    [Перевод] Orchest — конструктор конвейеров Machine Learning

    Orchest содержит Jupyter Notebook, не требует ациклических ориентированных графов, а работать можно на Python, R и Julia. Также можно запустить сервис VSCode, метрики TensorBoard — и это далеко не всё. Руководством о создании конвейера ML при помощи Orchest делимся к старту флагманского курса по Data Science. Чтобы обучить и оценить модель, воспользуемся данными двоичной классификации Kaggle В-клеточной антигенной детерминанты COVID-19/SARS.…

    Читать далее »
  • ХабрахабрФото [Из песочницы] Rekko Challenge — как занять 2-е место в конкурсе по созданию рекомендательных систем

    [Из песочницы] Rekko Challenge — как занять 2-е место в конкурсе по созданию рекомендательных систем

    Моя команда в Тинькофф занимается построением рекомендательных систем. Всем привет. Также мы построили рекомендательную систему спецпредложений от партнеров и занимается индивидуальными подборками Stories в приложении Tinkoff. Если вы довольны вашим ежемесячным кэшбэком, то это наших рук дело. А еще мы любим участвовать в соревнованиях по машинному обучению чтобы держать себя в тонусе. Организаторы преследовали цель улучшить существующую рекомендательную систему. На…

    Читать далее »
  • ХабрахабрФото Kaggle: не можем ходить — будем бегать

    Kaggle: не можем ходить — будем бегать

    Насколько сложна тема машинного обучения? Если Вы неплохо математически подкованы, но объем знаний о машинном обучении стремится к нулю, как далеко Вы сможете зайти в серьезном конкурсе на платформе Kaggle? О площадке и конкурсе Kaggle — это сообщество интересующихся ML (от новичков до крутых профи) и площадка для проведения конкурсов (часто с внушительным призовым фондом). Такой как раз был в…

    Читать далее »
  • ХабрахабрФото Как прогнозировать спрос и автоматизировать закупки с помощью machine learning: кейс Ozon

    Как прогнозировать спрос и автоматизировать закупки с помощью machine learning: кейс Ozon

    Значит, все это есть и на складах компании — и чем дольше товары там лежат, тем дороже обходятся компании. В интернет магазине Ozon есть примерно всё: холодильники, детское питание, ноутбуки за 100 тысяч и т.д. Чтобы выяснить, сколько и чего людям захочется заказать, а Ozon нужно будет закупить, мы использовали machine learning. Прогноз продаж: сложности задачи Прежде чем углубляться в…

    Читать далее »
  • ХабрахабрФото Что внутри XGBoost, и при чем здесь Go

    Что внутри XGBoost, и при чем здесь Go

    В мире машинного обучения одними из самых популярных типов моделей являются решающее дерево и ансамбли на их основе. Преимуществами деревьев являются: простота интерпретации, нет ограничений на вид исходной зависимости, мягкие требования к размеру выборку. Деревья имеют и крупный недостаток — склонность к переобучению. Поэтому почти всегда деревья объединяют в ансамбли: случайный лес, градиентный бустинг и др. Сложной теоретической и практической…

    Читать далее »
  • ХабрахабрФото [Из песочницы] Соревнование Kaggle Home Credit Default Risk — анализ данных и простые предсказательные модели

    [Из песочницы] Соревнование Kaggle Home Credit Default Risk — анализ данных и простые предсказательные модели

    На датафесте 2 в Минске Владимир Игловиков, инженер по машинному зрению в Lyft, совершенно замечательно объяснил, что лучший способ научиться Data Science — это участвовать в соревнованиях, запускать чужие решения, комбинировать их, добиваться результата и показывать свою работу. Собственно в рамках этой парадигмы я и решил посмотреть внимательнее на соревнование по оценке кредитного риска от Home Credit и объяснить (начинающим…

    Читать далее »


Кнопка «Наверх»