анализ данных

  • Хабрахабр

    [Перевод] Как дата-сайентист машину покупал

    После многих лет жизни и работы в Нидерландах мне с семьёй пришло время возвращаться в Штаты и менять велосипеды на автомобили. Я решил подойти к решению этой задачи так, как подошёл бы любой хороший специалист по обработке и анализу данных. В Америке очень сложно жить без машины, и, так как мы наши машины продали перед переездом, теперь нам надо было…

    Подробнее »
  • Хабрахабр

    Множественные эксперименты: теория и практика

    В современном мире сложно представить развитие продукта без A/B-тестирования. Чтобы успешно запустить продукт или новую функциональность — надо грамотно спроектировать A/B, рассчитать и интерпретировать его результаты. Иногда нам требуется тестирование более чем для двух групп. В этой статье мы рассмотрим как раз такой случай — множественное тестирование: поговорим о том, когда и зачем следует проводить множественные тесты; рассмотрим основные методы…

    Подробнее »
  • Хабрахабр

    [Из песочницы] Визуальное представление выборов в Санкт-Петербурге — магия накрутки голосов

    Привет! Все данные о голосовании находятся в открытом доступе на сайте избирательной комиссии, мы не будем ничего ломать, а просто визуализируем информацию с этого сайта www.st-petersburg.vybory.izbirkom.ru в нужном для нас виде, проведем совсем несложный анализ и определим некоторые «волшебные» закономерности. В сентябре этого (2019) года прошли выборы Губернатора Санкт-Петербурга. Это сервис, который позволяет запускать Jupyter Notebook'и, имея доступ к GPU…

    Подробнее »
  • Хабрахабр

    Большое интервью про Big Data: зачем за нами следят в соцсетях и кто продает наши данные?

    Специалист по Big Data, Артур Хачуян, рассказал, как соцсети могут читать наши сообщения, как наш телефон нас подслушивает, и кому все это нужно. Disclaimer. Есть люди, которые экономят время и любят текст, есть те, кто не может на работе или в дороге смотреть видео, но с радостью читает Хабр, есть слабослышащие, для которых звуковая дорожка недоступна или сложна для восприятия.…

    Подробнее »
  • Хабрахабр

    [Перевод] Руководство по Discovery.js: быстрое начало

    Наша цель — создать инспектор NPM-зависимостей, то есть интерфейс для исследования структуры node_modules. Это и последующие руководства проведут вас через процесс создания решения на основе проекта Discovery.js. Если у вас есть идеи, как можно что-то улучшить, напишите нам. Примечание: Discovery.js находится на ранней стадии разработки, поэтому со временем что-то будет упрощаться и становиться полезнее. Аннотация Изучить весь код руководства можно…

    Подробнее »
  • Хабрахабр

    [Перевод] 50 оттенков matplotlib — The Master Plots (с полным кодом на Python)

    Те, кто работает с данными, отлично знают, что не в нейросетке счастье — а в том, как правильно обработать данные. Но чтобы их обработать, необходимо сначала проанализировать корреляции, выбрать нужные данные, выкинуть ненужные и так далее. Для подобных целей часто используется визуализация с помощью библиотеки matplotlib.Встретимся «внутри»! Настройка Отдельные диаграммы, впрочем, переопределяют свои настройки сами. Запустите следующий код для настройки.…

    Подробнее »
  • Хабрахабр

    Maltego ближе к телу. Часть 2

    Здравствуйте, дорогие друзья. Вот, наконец-то, и добрался я до написания второй статьи, посвященной Maltego. Кто не читал первую – обязательно прочитайте вот тут. В ней я писал, что же такое Maltego в целом, а в этой статье я расскажу, с чем его едят. Картинок будет очень много. Я, конечно, постараюсь показать максимум неочевидных вещей, с которыми столкнулся в процессе работы…

    Подробнее »
  • Хабрахабр

    Полезная help-ссылка для работы с данными

    Хабр, привет. Представляю вам главную help-ссылку для работы с данными. Материал в Гугл-доке подойдет как профессионалам, так и тем, кто только учится работать с данными. Пользуйтесь и прокачивайте скиллы сами + делитесь с коллегами. Поэтому, можете сразу ознакомиться с документом. Дальнейшее описание поста — это содержание help-ссылки. Либо начать с её содержания, которую прикрепляю ниже. Поэтому предлагаю сделать этот пост…

    Подробнее »
  • Хабрахабр

    Расчет нулевой гипотезы, на примере анализа зарплат украинских программистов

    Решил поделиться, да бы и самому не забывать, как можно использовать простые статистические инструменты для анализа данных. В качестве примера использовался анонимный опрос относительно зарплат, стажа и позиций украинских программистов за 2014 и 2019 год. (1) Этапы анализа Препроцессинг данных и предварительный анализ (кому интересно код тут) Графическое представление данных. Функция плотности распределения. Формулируем нулевую гипотезу (H0) (2) Выбираем метрику…

    Подробнее »
  • Хабрахабр

    Белый шум рисует черный квадрат. Часть 2. Решение

    В первой публикации рассказывалось о том, что есть подзабытая теорема Эрдёша-Реньи, из которой следует, что в случайном ряде, длины N, с вероятностью близкой к 1 существует подряд из одинаковых значений длиной \log_2. Указанное свойство случайной величины можно использовать для ответа на вопрос: «После обработки больших данных, подчиняется ли остаточный ряд закону случайных чисел или нет?» Попытался в публикации, показать возможности…

    Подробнее »


Кнопка «Наверх»
Закрыть