Data Mining

  • Софт

    Семь раз отмерь, один раз внедри BI инструмент

    Не так давно я столкнулся с задачей по переходу на новую BI-систему для нашей компании. Поскольку мне пришлось погрузиться довольно глубоко и основательно в данный вопрос, я решил поделиться с уважаемым сообществом своими мыслями на этот счет. В рамках 3 недель тестирования мы опробовали 4 инструмента: Tableau, Looker, Periscope/Sisense, Mode analytics. На просторах интернета есть немало статей на эту тему,…

    Подробнее »
  • Хабрахабр

    Подборка рабочих примеров обработки данных

    Привет, читатель. Ведь ни для кого не секрет, что обучение на хороших примерах проходит эффективнее и быстрее. По стопам моего первого поста подборки датасетов для машинного обучения — сделаю подборку относительно свежих датасетов с рабочими примерами по обработке данных. Посмотрим, что интересного нам смогут показать одни из лучших примеров по обработке данных. Схема работы с текущим постом унаследуется от моего…

    Подробнее »
  • Хабрахабр

    [Из песочницы] Как выглядят банки изнутри

    Данная визуализация в три этапа основана на реальных клиентских операциях банка с отозванной лицензией. Так выглядит банк изнутри. Используя теорию графов, выделяем всех его клиентов в качестве узлов, а операции по счёту используем как ребра. В качестве источника данных — главная бухгалтерская книга банка. А высокая оценка модулярности графа указывает на сложную внутреннюю структуру. Сумма операции, в таком случае, будет…

    Подробнее »
  • Хабрахабр

    Белый шум рисует черный квадрат

    Любой аналитик, в начале своей работы, проходит ненавистный этап определения идентификации параметров распределения. Потом, с наработкой опыта, для него согласование полученных остаточных разбросов означает, что какой-то этап, в анализе Big Data, пройден и можно двигаться дальше. Уже нет необходимости проверять сотни моделей на соответствие различным уравнениям регрессии, искать отрезки с переходными процессами, составлять композицию моделей. Терзать себя сомнениями: «Может есть,…

    Подробнее »
  • Хабрахабр

    Собаку съел на нейронных сетях

    Вот видишь ты на улице пёсика. Ты всегда видишь на улице пёсиков. Вот кто-то вообще их не замечает и не имеет хлопот, вот нет этих душевных терзаний, и вообще можно считать, что им на улице норм. Но ты же! И заметил, и глаза у тебя на мокром месте, такой думаешь: «пёсик. уаа, такой миленький, взял бы но не могу. Но…

    Подробнее »
  • Хабрахабр

    Как мы обучили нейронную сеть классифицировать шурупы

    Нейронная сеть может опознать котика на фотографии, найти диван, улучшить видеозапись, нарисовать картинку из щенят или простого наброска. К этому мы уже привыкли. Новости о нейросетях появляются почти каждый день и стали обыденными. Компании Grid Dynamics поставили задачу не обыденную, а сложную — научить нейросеть находить специфический шуруп или болт в огромном каталоге интернет-магазина по одной фотографии. Задачка сложнее, чем…

    Подробнее »
  • Хабрахабр

    [Перевод] Что я узнал о машинном обучении, поработав в 12 стартапах

    Всем привет. Поработав в 12 стартапах в сфере машинного обучения, я сделал восемь полезных выводов о продуктах, данных и людях. Менялась и моя роль. Все стартапы были из разных сфер (финтех, биотехнологии, здравоохранение, технологии обучения) и на разных этапах: и на этапе pre-seed, и на этапе приобретения крупной компанией. Все эти компании старались создать хороший продукт, и многим это удалось.…

    Подробнее »
  • Хабрахабр

    Организуем ML-проект с помощью Ocean

    Вступление При старте нового проекта эти полезные знания помогают увереннее начать исследование, переиспользовать полезные методы и получить первые результаты быстрее. За годы разработки ML- и DL-проектов у нашей студии накопились и большая кодовая база, и много опыта, и интересные инсайты и выводы. Это позволит эффективнее обучить новых сотрудников, ввести их в курс дела и погрузить в проект. Очень важно, чтобы…

    Подробнее »
  • Хабрахабр

    Сэмплирование и точность вычислений

    Или нужно провести детальное исследование по каждому клиенту, где клиентов миллионы. Ряд моих коллег сталкиваются с проблемой, что для расчета какой-то метрики, например, коэффициента конверсии, приходится кверить всю базу данных. Не очень-то прикольно ждать по 5-15-40 минут, пока считается простая метрика, чтобы выяснить, что тебе нужно посчитать что-то другое или добавить что-то еще. Такого рода квери могут работать довольно долго,…

    Подробнее »
  • Хабрахабр

    Дайджест статей машинного обучения и искусственного интеллекта

    Хабр, привет. Всем приятного чтения! Отфильтровав большое количество статей, конференций и подписок — собрал для вас все наиболее значимые гайды, статьи и лайфхаки из мира машинного обучения и искусственного интеллекта. Что вы знаете про искусственный интеллект и машинное обучение? 1. Проекты искусственного интеллекта, с которыми можно поиграться уже сегодня. Эти модные понятия всё чаще на слуху, но далеко не все…

    Подробнее »


Кнопка «Наверх»
Закрыть