Хабрахабр

Краудсорсинг в ML Boot Camp. Считаем mIOU без картинок для новой задачи от Одноклассников

Привет! Лето — жаркое. Организаторы «айтишных» чемпионатов много сидели на солнце, сгорели и схватили удар, но главное — собрали новую задачу для очередного (уже девятого) контеста на платформе ML Boot Camp. Чемпионат пройдёт онлайн в течение месяца.

Сейчас на платформе зарегистрировано более 10 тысяч специалистов. Часто бывает, что задачи, которые на ней появляются, не всем по зубам (богам Kaggle в том числе). Для чего мы это делаем? Нужно развиваться и пробовать, причем на реальных данных, а не синтетическом булшите. Победы придут со временем.

Тема задачи — это детектирование объектов на изображениях. Задача, которую хотим предложить вам решить в этом соревновании, отличается от всех предыдущих. И это не петабайты данных. Формулировка задачи подразумевает, что в наборе данных будут картинки, но, что забавно, их нет. В социальной сети Одноклассники, как и в других продуктах, существует задача фильтровать контент. И даже не гигабайты.
Тема популярная и, на самом деле, очень важная. Представьте, что ваш ребенок увидит не ту картинку — его мир навсегда изменится.

Вкратце, в статье Алексей рассказал про игровое приложение «Модератор Одноклассников», в котором пользователи социальной сети классифицируют изображения на хорошие и плохие, получая за это различные плюшки, а также поделился способом решения задачи по увеличению DAU (Daily Active Users) приложения с помощью алгоритмов машинного обучения. Два года назад Алексей Сенников написал статью про то, как Одноклассники привлекают своих пользователей к решению данной проблемы.

Неплохо, да? К слову, DAU сейчас у приложения 40 тысяч пользователей, и более 1’000’000 решений в день.

Задача нового контеста

В социальной сети Одноклассники есть платформа для разметки данных. На ней пользователям была дана задача выделить прямоугольником заданный объект на фотографии. По ответам людей восстановить истинное положение объекта.

На входе вы получите краудсорсинговую разметку и данные в виде любимых всеми табличек. В ответ вы должны будете прислать просто файл с предсказаниями.

Датасет и бейзлайн будут опубликованы в день старта соревнования на ML Boot Camp.

Для оценки решения будет использоваться метрика mIOU (mean intersection over union). Если еще не сталкивались с данной метрикой, то рекомендуем прочитать о ней статью.

Расписание

Чемпионат будет идти в онлайн формате. Стартуем 27 июня в 19:00, закрываем сабмиты 29 июля в 12:00. Итоги подводим тоже 29 июля в 13:00.

Регистрируйтесь или подписывайтесь на канал @mrgchamps. Все зарегистрированные пользователи на платформе получат напоминалку на почту. Попутно войдите в сообщество участников (чат @mlbootcamp на 1400 человек) в Telegram, чтобы точно быть в теме всего происходящего.

Подарки

   
Куда же без них. Во-первых, лучшие участники получат:

1 место: MacBook Pro 13', 2-ядерный процессор, 256 GB SSD, 16 RAM.
2 место: iPhone XS Max, 256 GB.
3 — 6 место: Apple Watch Series 3 42mm или Samsung Gear S3 Frontier на выбор.
7 — 10 место: Western Digital My Passport 4 TB.

Во-вторых, футболки с крутым принтом получат топ-30% пользователей от всего количества участников.

Литература

Для хорошего старта в чемпионате советуем прочитать статьи:

  1. Grouper: Optimizing Crowdsourced Face Annotations
  2. Maximum Likelihood Estimation of Observer Error-Rates Using the EM Algorithm

Приходите, участвуйте, учитесь и побеждайте!

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть