Data Mining

  • Хабрахабр

    Анализ данных из последнего слива Intel

    // (C) 2020 Intel Corporation. All rights reserved.// Your use of Intel Corporation's design tools, logic functions and other // software and tools, and its AMPP partner logic functions, and any output // files from any of the foregoing (including device programming or simulation // files), and any associated documentation or information are expressly subject // to the terms and…

    Подробнее »
  • Хабрахабр

    Заметки Дата Саентиста: как измерить время забега марафона лежа на диване

    Продолжая цикл заметок про реальные проблемы в Data Science, мы сегодня разберемся с живой задачей и посмотрим, какие проблемы нас ждут в пути. Например, помимо Data Science, я давно увлекаюсь атлетикой и одной из целей в беге для меня, конечно, является марафон. А где марафон там и вопрос — за сколько же бежать? Часто ответ на этот вопрос дается на…

    Подробнее »
  • Хабрахабр

    Как сделать поиск по файлоболотам в 104 строки кода на python

    Продолжая тематику коротких полезных скриптов, хотелось бы познакомить читателей с возможностью построения поиска по контенту файлов и изображений в 104 строки. Это конечно не будет умопомрачительным по качеству решением — но вполне годным для простых нужд. Также в статье не будет ничего изобретаться — все пакеты open source. И да — пустые строки в коде тоже считаются. Небольшая демонстрация работы…

    Подробнее »
  • Хабрахабр

    [Из песочницы] Аномалии общероссийского голосования по поправкам к Конституции России. Часть 1

    Общероссийское голосование по вопросу одобрения изменений, вносимых в Конституцию Российской Федерации, проводилось с 25 июня по 1 июля 2020 года (wikipedia). Основная цель данной заметки — это продемонстрировать как можно быстро начать работать с данными голосования и показать наличие определенного вида аномалий в них. Все вычисления, визуализации и парсинг данных приведены в Google Colab, который доступен по этой ссылке google…

    Подробнее »
  • Хабрахабр

    Симуляционное моделирование механической системы средствами визуального программирования Scilab\Xcos

    Вместо предисловия. Эта небольшая по объему работа была экстренно выполнена с учебными и демонстрационными целями около года назад на базе уже разработанной ранее модели струны. Как водится, потом полежав энное время без дела, недавно она попалась мне на глаза. Что такое Scilab, рассказывать здесь смысла нет — интернетом читатель пользоваться умеет. Интересным для читателя, уже знакомым с Scilab, эта работа…

    Подробнее »
  • Хабрахабр

    Что может пойти не так с Data Science? Сбор данных

    Сегодня существует 100500 курсов по Data Science и давно известно, что больше всего денег в Data Science можно заработать именно курсами по Data Science (зачем копать, когда можно продавать лопаты?). Основной минус этих курсов в том, что они не имеют ничего общего с реальной работой: никто не даст вам чистые, обработанные данные в нужном формате. И когда вы выходите с…

    Подробнее »
  • Хабрахабр

    [Из песочницы] Байесовские сети при помощи Питона — что и зачем?

    Дисклеймер: данная статья является адаптированным переводом. Оригинал можно прочесть здесь. Байесовские сети при помощи Питона — объяснение с примерами Из-за ограниченности информации (особенно на родном русском) и ресурсов работы, байесовские сети окружены рядом проблем. И можно было бы спать спокойно, если бы их реализация не осуществлялась в большинстве передовых технологий эры, таких как искусственный интеллект и машинное обучение. Основываясь на…

    Подробнее »
  • Хабрахабр

    [Из песочницы] Парадокс дней рождений на данных ВКонтакте

    Привет! Я решил проверить парадокс дней рождений на данных, которые доступны из ВК. Что такое парадокс дней рождений? Попробуйте ответить на вопрос: Какое количество людей в комнате необходимо, чтобы у двух людей были одинаковые дни рождения с вероятностью 0.5? (дата и месяц). Парадокс дней рождений отвечает на этот вопрос. Для того, чтобы решить задачу стоит выделить несколько предпосылок: В модели…

    Подробнее »
  • Хабрахабр

    Лучшие data-продукты рождаются в полях

    Большинство наших интернет-заказов собираются с торговых залов магазинов, а не со складов. Это приводит к ошибкам между тем, что показывается на сайте, и тем, что мы можем реально собрать в интернет-заказ.Из-за высокой скорости оборота товаров в магазинах и сложности систем управления стоком возникают ошибки, которые можно обнаруживать автоматически. Опираясь на наши знания систем и используя социальный инжиниринг, мы предложили решение, которое позволяло бы автоматически находить проблемные товары и корректировать их сток перед публикацией на сайте. Меня зовут Марина…

    Подробнее »
  • Хабрахабр

    От AI до VR: как промышленность и ритейл используют новые технологии

    Привет, Хабр! Меня зовут Алексей Сидорин. В КРОК я больше пяти лет помогаю внедрять роботов, а также системы дистанционного обучения и геймификации российским и международным компаниям. А недавно стал комьюнити-менеджером нетворкинг-платформы Digital Leader. DL – это международный проект, который объединяет представителей бизнеса и специалистов в ИТ. На прошлой неделе мы провели онлайн-конфу по теме Индустрии 4.0. Представители лидеров промышленного рынка…

    Подробнее »


Кнопка «Наверх»
Закрыть