Главная » Архив меток: Data Mining

Архив меток: Data Mining

Многорукие бандиты в рекомендациях

Меня зовут Миша Каменщиков, я занимаюсь Data Science и разработкой микросервисов в команде рекомендаций Авито. Всем привет! С докладом на эту тему я выступал на конференции Highload++ Siberia и на мероприятии «Data & Science: Маркетинг». В этой статье я расскажу про наши рекомендации похожих объявлений и о том, как мы улучшаем их при помощи многоруких бандитов. Сначала — небольшой обзор ...

Читать далее »

Deep Learning: Распознавание сцен и достопримечательностей на изображениях

Время пополнять копилку хороших русскоязычных докладов по Machine Learning! Копилка сама не пополнится! Андрей — программист-исследователь, занимающийся машинным зрением в компании Mail. В этот раз мы познакомимся с увлекательным рассказом Андрея Боярова про распознавание сцен. Ru Group. Задача эта посложнее, чем изученное распознавание объектов: сцена — более комплексное и менее формализованное понятие, выделить признаки труднее. Распознавание сцен — одна из ...

Читать далее »

Правда и ложь систем распознавания лиц

Пожалуй нет ни одной другой технологии сегодня, вокруг которой было бы столько мифов, лжи и некомпетентности. Врут журналисты, рассказывающие о технологии, врут политики которые говорят о успешном внедрении, врут большинство продавцов технологий. Каждый месяц я вижу последствия того как люди пробуют внедрить распознавание лиц в системы которые не смогут с ним работать.Тема этой статьи давным-давно наболела, но было всё как-то ...

Читать далее »

Зов Даты, или Как прошел второй хакатон Почты Mail.Ru

14-15 июля Почта Mail.Ru провела свой второй хакатон SmartMail Hack 2: Call of Data. Участникам нужно было разработать новое, интересное и полезное решение для представления данных из Почты. И по горячим следам спешим рассказать о победивших на хакатоне проектах. Как проходил хакатон Напомним вводную: Но, на самом деле, Почта — это огромное хранилище личных данных. «Мы все привыкли, что Почта ...

Читать далее »

3-е место в отборочном этапе DataScienceGame 2018

DataScienceGame — это международное студенческое соревнование, которое проводится на ежегодной основе. Недавно закончился отборочный этап DataScienceGame2018, который проходил в формате kaggle InClass. Нашей команде удалось оказаться на 3м месте среди более чем 100 команд и при этом НЕ пройти в финальный этап. Командное взаимодействие На больших соревнованиях на kaggle команды обычно формируются по ходу из людей с близким скором по ...

Читать далее »

С точностью до сотых: топ-10 докладов SmartData 2017

Надо полагать, что и оценки докладам после прошлогодней конференции они выставляли очень вдумчиво. Зрители конференции SmartData — люди, которые любят работать с данными. И заодно, чтобы порадовать любителей данных, указали по каждому из десяти докладов все сопутствующие числа: место в топе, точный зрительский рейтинг, количество зрителей. А теперь по этим оценкам мы составили топ-10 видеозаписей. Так что, пожалуй, не стоит ...

Читать далее »

[Перевод] Базы данных Microsoft Research теперь доступны для всех

Мы рады рассказать вам о том, что наши коллеги из подразделения Microsoft Research опубликовали данные, полученные в результате многолетних трудов по курированию и изучению информации из научных работ. В частности, стали доступны данные по инженерии, компьютерным наукам, информатике, математике, физике, биологии, социальным и естественным наукам. Подробнее под катом! Все это время мы повсеместно наблюдали актуальность четвертой парадигмы научных открытий, предложенной ...

Читать далее »

[Из песочницы] Модели Эло и ЭлоБета в снукере

В нем есть всё: гипнотизирующая красота интеллектуальной игры, элегантность ударов киём и психологическая напряжённость соревнования. На протяжении многих лет я слежу за снукером, как за спортом. Но есть одна вещь, которая мне не нравится — его рейтинговая система. Такого недостатка лишена модель Эло, которая следит за "силой" игроков и обновляет её в зависимости от результатов матчей и "силы" соперника. Её ...

Читать далее »

Офлайн А/Б тестирование в ритейле

События, о которых рассказывается в посте, произошли в одной теплой стране в 21ом веке. Это реальная история. Из уважения к профессии всё рассказано так, как было на самом деле. На всякий случай имена персонажей были изменены. В этом посте речь пойдет про пресловутое А/Б тестирование, к сожалению даже в 21ом веке его не избежать. Привет, хабор. Об одной такой адаптации ...

Читать далее »

[Из песочницы] Нейробугу́рт. Как мы научили нейросеть придумывать мемы на год раньше Стэнфорда

К написанию статьи меня подтолкнула вот эта новость (+исследование) про изобретение генератора мемов учеными из Стэнфордского университета. В своей статье я попытаюсь показать, что вам не нужно быть ученым из Стэнфорда, чтобы делать с нейросетями интересные вещи. В статье я описываю, как в 2017 году мы обучили нейронную сеть на корпусе из примерно 30 000 текстов и заставили ее генерировать ...

Читать далее »