xgboost

  • ХабрахабрФото Под капотом поискового движка: Как Uzum Market применяет ML, чтобы вы нашли желаемое

    Под капотом поискового движка: Как Uzum Market применяет ML, чтобы вы нашли желаемое

    Привет, меня зовут Даша, я отвечаю за ранжирование в команде поиска Uzum Market. За время существования нашей команды мы успели накопить достаточный багаж факапов знаний, чтобы начать делиться им с вами. Поиск — один из основных источников дохода маркетплейсов. Сценарий, где пользователь приходит на платформу с конкретной целью приобрести товар гораздо более вероятен, чем тот, где он зашел полистать ленту.…

    Читать далее »
  • ХабрахабрФото Kaggle для футболистов. Разбираем подходы призеров соревнований по детекции столкновений (5 — 3 место)

    Kaggle для футболистов. Разбираем подходы призеров соревнований по детекции столкновений (5 — 3 место)

    Недавно закончилось соревнование от американской национальной футбольной лиги (NFL), которая объединилась с AWS, чтобы прокачать системы спортивной видеоаналитики. Организаторы поставили простую, казалось бы, задачу — точно определить, в каких случаях игроки сталкиваются друг с другом во время матча по американскому футболу. Мы с коллегами приняли участие, но не успели реализовать все свои идеи. Зато изучили подходы других команд и поняли,…

    Читать далее »
  • ХабрахабрФото [Перевод] Развёртывание XGBoost-моделей с помощью Ray Serve

    [Перевод] Развёртывание XGBoost-моделей с помощью Ray Serve

    XGBoost — это оптимизированная библиотека, реализующая алгоритм градиентного бустинга. Эта библиотека спроектирована с прицелом на высокую продуктивность и гибкость, в ней используется параллельная работа с древовидными структурами, что позволяет быстро и эффективно решать различные задачи из сфер Data Science и Machine Learning. В предыдущем материале мы исследовали три подхода к ускорению обучения XGBoost-моделей. Библиотека XGBoost, после появления, быстро стала эталонным…

    Читать далее »
  • ХабрахабрФото [Перевод] Три подхода к ускорению обучения XGBoost-моделей

    [Перевод] Три подхода к ускорению обучения XGBoost-моделей

    Фреймворк XGBoost (Extreme Gradient Boosting, экстремальный градиентный бустинг) — это эффективная опенсорсная реализация алгоритма градиентного бустинга. Этот фреймворк отличается высокой скоростью работы, а модели, построенные на его основе, обладают хорошей производительностью. Поэтому он пользуется популярностью при решении задач классификации и регрессии с использованием табличных наборов данных. Но процесс обучения XGBoost-моделей может занять много времени. В предыдущем материале мы говорили о плюсах и минусах различных…

    Читать далее »
  • ХабрахабрФото Жизненный цикл ML в боевых условиях

    Жизненный цикл ML в боевых условиях

    В реальном внедрении ML само обучение занимает от силы четверть усилий. Остальные три четверти — подготовка данных через боль и бюрократию, сложный деплой часто в закрытом контуре без доступа в интернет, настройка инфраструктуры, тестирование и мониторинг. Документы на сотни листов, ручной режим, конфликты версий моделей, open source и суровый enterprise — все это ждет data scientist’а. Но такие «скучные» вопросы…

    Читать далее »
  • ХабрахабрФото Рекомендации в Okko: как заработать сотни миллионов, перемножив пару матриц

    Рекомендации в Okko: как заработать сотни миллионов, перемножив пару матриц

    Для пользователей онлайн-кинотеатров это частая проблема, а для самих кинотеатров — упущенная прибыль. Знакома ли вам ситуация, когда на выбор фильма вы тратите гигантское количество времени, сопоставимое со временем самого просмотра? В статье я расскажу вам как она устроена с алгоритмической и технической точек зрения, как мы подходим к её разработке и как оцениваем результаты. К счастью, у нас есть…

    Читать далее »
  • ХабрахабрФото Пишем XGBoost с нуля — часть 2: градиентный бустинг

    Пишем XGBoost с нуля — часть 2: градиентный бустинг

    Всем привет! В этой статье мы реализуем алгоритм градиентного бустинга и в конце создадим свой собственный XGBoost. В прошлой статье мы разбирались, как устроены решающие деревья, и с нуля реализовалиалгоритм построения, попутно оптимизируя и улучшая его. Повествование будет идти по той же схеме: пишем алгоритм, описываем его, в заверешение подводим итоги, сравнивая результаты работы с аналогами из Sklearn'а. В этой…

    Читать далее »
  • ХабрахабрФото Что внутри XGBoost, и при чем здесь Go

    Что внутри XGBoost, и при чем здесь Go

    В мире машинного обучения одними из самых популярных типов моделей являются решающее дерево и ансамбли на их основе. Преимуществами деревьев являются: простота интерпретации, нет ограничений на вид исходной зависимости, мягкие требования к размеру выборку. Деревья имеют и крупный недостаток — склонность к переобучению. Поэтому почти всегда деревья объединяют в ансамбли: случайный лес, градиентный бустинг и др. Сложной теоретической и практической…

    Читать далее »
  • ХабрахабрФото Прогнозирование продаж недвижимости. Лекция в Яндексе

    Прогнозирование продаж недвижимости. Лекция в Яндексе

    Успех в проектах по машинному обучению обычно связан не только с умением применять разные библиотеки, но и с пониманием той области, откуда взяты данные. Отличной иллюстрацией этого тезиса стало решение, предложенное командой Алексея Каюченко, Сергея Белова, Александра Дроботова и Алексея Смирнова в конкурсе PIK Digital Day. Они заняли второе место, а спустя пару недель рассказали о своём участии и построенных…

    Читать далее »
  • ХабрахабрФото Применение моделей CatBoost внутри ClickHouse. Лекция Яндекса

    Применение моделей CatBoost внутри ClickHouse. Лекция Яндекса

    В каких ситуациях удобно применять предобученные модели машинного обучения внутри ClickHouse? Почему для такой задачи лучше всего подходит метод CatBoost? Не так давно мы провели встречу, посвящённую одновременному использованию этих двух опенсорс-технологий. На встрече выступил разработчик Николай Кочетов — его лекцией мы и решили с вами поделиться. Николай разбирает описанную задачу на примере алгоритма предсказания вероятности покупки. [embedded content] —…

    Читать далее »


Кнопка «Наверх»