CleverDATA

  • ХабрахабрФото [Перевод] Лучшие инструменты с открытым исходным кодом и библиотеки для Deep Learning — ICLR 2020 Experience

    [Перевод] Лучшие инструменты с открытым исходным кодом и библиотеки для Deep Learning — ICLR 2020 Experience

    Сложно найти на Хабре человека, который не слышал бы про нейронные сети. Регулярные новости о свежих достижениях нейронных сетей заставляют удивляться широкую публику, а также привлекают новых энтузиастов и исследователей. Привлеченный поток специалистов способствует не только еще большим успехам нейронных моделей, но и приводит к развитию инструментов для более удобного использования Deep Learning подходов. Помимо всем известных фреймворков Tensorflow и…

    Читать далее »
  • ХабрахабрФото Уроки волшебства для кота, дейтинг для беременных и астрология

    Уроки волшебства для кота, дейтинг для беременных и астрология

    В ходе исследований различных аудиторий Data Scientists наблюдают как закономерные, так и удивительные факты, которые ярко характеризуют социум вокруг нас. В этой статье я расскажу о тех курьёзах и необычных случаях, которые заметила при выполнении задач, связанных с аудиторным анализом, исследованием интересов пользователей Интернета и покупательского поведения различных социальных групп.  Какие социологические особенности удалось выяснить благодаря применению моделей машинного обучения?…

    Читать далее »
  • ХабрахабрФото [Перевод] Использование методов анализа графов для поиска аномалий

    [Перевод] Использование методов анализа графов для поиска аномалий

    Несмотря на то, что описание данных с помощью графов практикуется еще с позапрошлого столетия, использование их в решении повседневных задач по анализу данных лишь набирает обороты. Хотя основное внимание уделяется, как водится, графовым эмбеддингам и сверточным сетям, маленькие шаги предпринимаются и в алгоритмах по поиску аномалий или антифроде. Основная обзорная статья, на которую ссылается большинство специалистов в своих в докладах…

    Читать далее »
  • ХабрахабрФото В поисках обеда: распознавание активности по данным фитнес-трекера

    В поисках обеда: распознавание активности по данным фитнес-трекера

    Мне посчастливилось участвовать в проекте SOLUT, который стартовал в ЛАНИТ около года назад. Проект развивается благодаря активному участию Центра компетенции больших данных ЛАНИТ (ЦК Дата), и главное технологическое новшество проекта заключается в использовании машинного обучения для мониторинга человеческой активности. Основным источником данных для нас являются сенсоры фитнес-трекеров, закрепленные на руках работников. В первую очередь, результаты распознавания помогают поднять производительность труда и…

    Читать далее »
  • ХабрахабрФото Рынок аудиторных данных сегмента Интернет-рекламы и маркетинга. Часть. 2. Статистика

    Рынок аудиторных данных сегмента Интернет-рекламы и маркетинга. Часть. 2. Статистика

    Мы продолжаем публикацию результатов исследования рынка аудиторных данных в сегменте интернет-рекламы и маркетинга за 2019 год, подготовленного нашей компанией CleverDATA и Ассоциацией развития финансовых технологий.  Ранее мы рассказали, как изменилось законодательство в сфере аудиторных данных в России и за рубежом, а в этой статье  — представим статистику рынка. Отчет базируется на профессиональном опыте наших экспертов и статистике работы площадки 1DMC,…

    Читать далее »
  • ХабрахабрФото [Перевод] 8 лучших трендов International Conference on Learning Representations (ICLR) 2019

    [Перевод] 8 лучших трендов International Conference on Learning Representations (ICLR) 2019

    Тема анализа данных и Data Science в наши дни развивается с поразительной скоростью. Для того, чтобы понимать актуальность своих методов и подходов, необходимо быть в курсе работ коллег, и именно на конференциях удается получить информацию о трендах современности. К сожалению, не все мероприятия можно посетить, поэтому статьи о прошедших конференциях представляют интерес для специалистов, не нашедших времени и возможности для…

    Читать далее »
  • ХабрахабрФото Natural Language Processing онлайн-чеков: курс уроков волшебства для обычного кота и другие проблемы

    Natural Language Processing онлайн-чеков: курс уроков волшебства для обычного кота и другие проблемы

    Компания CleverDATA занимается разработкой платформы для работы с большими данными. В частности, на нашей платформе есть возможность работать с  информацией из чеков онлайн-покупок. Перед нами стояла задача научиться обрабатывать текстовые данные чеков и строить на них выводы о потребителях для создания соответствующих характеристик на бирже данных. Было естественно для решения этой задачи обратиться к машинному обучению. В этой статье мы…

    Читать далее »
  • ХабрахабрФото [Перевод] Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение

    [Перевод] Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение

    Представляю вашему вниманию перевод статьи «Создаем музыку: когда простые решения превосходят по эффективности глубокое обучение» о том, как искусственный интеллект применяется для создания музыки. Автор не использует нейронные сети для генерации музыки, а подходит к задаче, исходя из знания теории музыки, на основе мелодии и гармонии. Другой особенностью статьи является метод сравнения музыкальных произведений на основе матриц самоподобия. Такой подход,…

    Читать далее »
  • ХабрахабрФото Анатомия рекомендательных систем. Часть вторая

    Анатомия рекомендательных систем. Часть вторая

    Неделю назад я делал здесь обзор существующих алгоритмов рекомендаций. В этой статье я продолжу данный обзор: расскажу об item-based варианте коллаборативной фильтрации, о методах, основанных на матричных разложениях, проблемах тестирования, а также о менее «раскрученных» (но не менее интересных) алгоритмах. Коллаборативная фильтрация (Item-based вариант) Подход Item-based является естественной альтернативой классическому подходу User-based, описанному в первой части, и почти полностью его…

    Читать далее »
  • ХабрахабрФото Анатомия рекомендательных систем. Часть первая

    Анатомия рекомендательных систем. Часть первая

    Я работаю дата-саентистом в компании CleverDATA. Мы занимаемся проектами в области машинного обучения, и один из наиболее частых запросов на разработку основанных на машинном обучении маркетинговых решений — это разработка рекомендательных моделей. Часть материала базируется на неплохом курсе по рекомендательным системам лаборатории MovieLens (которая большинству знакома по одноименному датасету для тестирования рекомендаций), остальное – из личного опыта. В данной статье…

    Читать далее »


Кнопка «Наверх»