Главная » Архив меток: data science

Архив меток: data science

Конструктивные элементы надежного enterprise R приложения

Естественно, что методы удобные для консольного пошагового применения человеком, который глубоко в теме, оказываются малопригодными для создания приложения для конечного пользователя. Тем, кто работает с R, хорошо известно, что изначально язык разрабатывался как инструмент для интерактивной работы. (говорим R, подразумеваем, в основном, Shiny web приложения).Однако, не все так плохо. Возможность получить развернутую диагностику сразу по факту ошибки, проглядеть все переменные ...

Читать далее »

Рубрика «Читаем статьи за вас». Февраль — Март 2018

Привет, Хабр! Продолжаем публиковать рецензии на научные статьи от членов сообщества Open Data Science из канала #article_essense. Хотите получать их раньше всех — вступайте в сообщество! Статьи на сегодня: Learning Semantic Segmentation with Diverse Supervision (University of Manitoba, Shanghai University, 2018) TVAE: Triplet-Based Variational Autoencoder using Metric Learning (Stanford University, 2018) Neural-Symbolic Learning and Reasoning: A Survey and Interpretation Overcoming ...

Читать далее »

Машинное обучение и экструдер полипропилена: история 3 места на хакатоне Сибура

Хакатон "Цифровой завод", организованный Сибуром и AI Community, состоялся на прошлых выходных. Одна из двух задач хакатона была на тему predictive maintenance — нужно было предсказывать проблемы в работе экструдера. Её мы и решили. Рассказ сосредоточен в основном на data science'ной части решения, и о том, как нам удалось научиться неплохо прогнозировать довольно редкие события. Зачем понадобилось прогнозировать остановки экструдера ...

Читать далее »

Постановка Data Science задач и взаимодействие с бизнесом

В этот раз снова о Data Science. Привет, Хабр. Думаю, многим знакома методология CRISP-DM, о которой говорят на большинстве курсов, но вот про первый пункт (business understanding) информации достаточно мало, в зря, ведь он очень важный. Давайте разберем все на примере. Поэтому в этой статье мы поговорим о взаимодействии с бизнесом и о том, какие обычно бывают проблемы и сложности ...

Читать далее »

[Перевод] Просто добавь воды: разработка с H2O.ai

Привет, Хабр! В течение последних нескольких лет интерес к технологиям машинного обучения и искусственного интеллекта быстро рос. Решение H2O.ai становится все более популярным в этой сфере: оно поддерживает быстрые алгоритмы машинного обучения в оперативной памяти и недавно получило поддержку глубокого обучения. Сегодня поговорим о разработке с использованием H2O. Быстрые, масштабируемые и надежные решения этих категорий все чаще рассматриваются как необходимые ...

Читать далее »

Обработка текстов на естественных языках

Сейчас в эту область вкладываются очень большие деньги и в ней решают немало разнообразных задач. Сегодня мы затрагиваем такую интересную тему, как естественные языки. Она привлекает внимание не только индустрии, но и научного сообщества. Может ли машина думать? Исследователи связывают анализ естественных языков с принципиальным вопросом: может ли машина мыслить? Известный философ Рене Декарт давал однозначно отрицательный ответ. Неудивительно, учитывая ...

Читать далее »

Как в hh.ru тестируют поиск по вакансиям

Я уже делился рассказом о нашем опыте применения искусственного интеллекта в поиске на hh.ru, а сегодня хотел бы остановиться на измерении качества этого поиска поподробнее.Для нормальной работы поиска крайне важна система метрик — локальных, A/B-тестов, очередей на проде и т. д., и эта система требует отдельного внимания и ресурсов. Неправильно думать, что достаточно просто запилить крутой ML и прикрутить все ...

Читать далее »

Самые страшные ошибки, которые допускают DS. Встреча в офисе Авито 24 апреля

На следующей неделе, во вторник, 24 апреля, приглашаем специалистов по Data Science на митап, который мы организуем вместе с AI Community и AI Today. Привет! Подробно обсудим CRISP-DM и Tips&Tricks, которые можно использовать в работе. Будем говорить о самых страшных ошибках, которые допускают DS. Регистрируйтесь на встречу и приглашайте коллег. Вы услышите доклады Ивана Гуза, Игоря Слинько и Станислава Гафарова. ...

Читать далее »

Data Fest 2018: анонс и регистрация

Data Fest — крупнейшая бесплатная конференция для исследователей, инженеров и разработчиков, связанных с анализом и обработкой данных, машинным обучением, а также тем, что пресса любит называть AI. Друзья, приглашаем вас на пятый московский Data Fest, который состоится 28 апреля на территории дизайн-завода FLACON. Ru Group и «умные» ответы в Почте Mail. Вы узнаете про AI в продуктах Mail. Ru, как ...

Читать далее »

Персонализируй это. Отчёт с Avito Data Science Meetup: Personalization

Публикуем отчёт с митапа Avito Data Science Meetup: Personalization, который проходил у нас в офисе. Всем привет! Под катом — видеозаписи, презентации, ссылка на фотоотчёт. Участники обсуждали моделирование пользовательских предпочтений в мультимодальных данных и кластеризацию волатильных объявлений с помощью EM-алгоритма. Эти взаимодействия мультимодальны, то есть составлены из различных типов данных, таких как пользовательские рейтинги, отзывы, фотографии или их социальные взаимодействия. ...

Читать далее »