Главная » Архив меток: Визуализация данных

Архив меток: Визуализация данных

Получаем разницу между бинарными файлами при помощи vcdiff

Понадобилось мне это для того чтобы понять в каком месте и как файл JPEG испорчен в процессе передачи. Описан в RFC 3284. VCDIFF — формат и алгоритм для дельта кодирования. Delta encoding) — способ представления данных в виде разницы (дельты) между последовательными данными вместо самих данных. Дельта-кодирование (англ. Но с таким же успехом это могут быть и бинарные файлы. Для ...

Читать далее »

Ни GA, ни ЯМ. Как мы сделали собственный кликстрим

Благодаря этому можем узнать кучу необходимых вещей: нажимают ли на сердечки больше, чем на звёздочки, в какие часы пишут более развёрнутые описания, в каких регионах чаще промахиваются по зелёным кнопкам. Мы собираем более двух миллиардов аналитических событий в сутки. Расскажу о технической стороне кликстрима в Авито: устройство событий, их отправка и доставка, аналитика, отчёты. Систему сбора и анализа событий можно ...

Читать далее »

Как создать карту московских парковок с помощью Kepler.gl

Несколько месяцев назад вышла первая версия Kepler.gl — нового Open Source инструмента для визуализации и анализа больших наборов гео-данных. В этой статье я предлагаю вам познакомится с основными возможностями приложения и создать с его помощью две картографические визуализации, которые позволят нам узнать несколько интересных фактов о платных парковках Москвы. Но сперва несколько слов о том, кто и зачем создал Kepler.gl ...

Читать далее »

Визуализация комментариев ютуб-каналов международных и локальных touhou-сообществ

Всем привет! Мы развиваем идеи первого поста и продолжаем визуализировать и изучать комментарии на ютубе. На этот раз мы поработаем с глобальными и локальными ютуб-сообществами. Как взаимодействуют комментаторы, которые пишут на разных языках? Собирается ли из множества локальных групп единое глобальное сообщество, или дело сложнее, чем кажется? И причем здесь Touhou Project? Давайте выясним. Комментарии и сообщества — жанровая специфика, ...

Читать далее »

Анализ вакансий HeadHunter

Узнать кому больше всех платят, кто наиболее востребован и много чего еще. Однажды мне стало интересно, а что если попробовать проанализировать вакансии и составить по ним некоторые топы. Были собраны и обработаны вакансии за май этого года. В качестве источника данных я использовала всем известный HeadHunter. Только за месяц, потому что API не позволяет получить больше. Сбор данных Запросы должны ...

Читать далее »

Сборник демографических рассказов в одной карте

Решил рассказать об этом на Хабре, поскольку есть надежда, что реализованный способ визуализации данных может пригодиться еще кому-то. В свежем номере журнала The Lancet опубликована моя статья — любопытная карта и небольшое к ней пояснение. (2018). Kashnitsky, I., & Schöley, J. The Lancet, 392(10143), 209–210. Regional population structures at a glance. 1016/S0140-6736(18)31194-2 https://doi.org/10. Собственно, вот карта в высоком разрешении (кликабельно). ...

Читать далее »

МИС. Шаблоны исследований

Сегодня же предлагаем окунуться в мир шаблонов для протоколов исследований. В прошлый раз было описано, какие базовые сущности используются для хранения медицинских данных в МИС Нумеди. Что же представляет собой шаблон? Протокол исследования – документ, выдаваемый пациенту на руки. По большому счету можно выбрать любой формат описания абстрактных данных, который бы позволил сохранить иерархическую структуру. Красивые картинки и цветные буквы ...

Читать далее »

Сбор статистики MTProto Proxy

Содержание Предыстория Сбор статистики Отображение статистики Визуализация и ведение статистики Развертка Заключение Предыстория Привет хабр, телеграм сейчас на пике популярности, все скандалы, интриги, блокировки вертятся вокруг него, в связи с чем телеграм выкатил свой вариант прокси под названием MTProto Proxy который призван помочь с обходом блокировки. Однако предоставленные телеграмом сервисы для мониторинга MTProto Proxy не дают возможности наблюдать статистику в ...

Читать далее »

[Из песочницы] На переднем краю науки: анализ статей arxiv.org

On Bose-Einstein condensation and superfluidity of trapped photons with coordinate-dependent mass and interactions Berman1,2, Roman Ya. Oleg L. Lozovik3,4 Kezerashvili1,2, and Yurii E. 1Physics Department, New York City College of Technology, The City University of New York, 2The Graduate School and University Center, The City University of New York, Brooklyn, NY 11201, USA 3Institute of Spectroscopy, Russian Academy of Sciences, ...

Читать далее »

Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin

Все рано или поздно приходят к аналитике за данными. В больших многопользовательских играх (да и синглплеере) без этого уже вообще никуда. Сколько пользователей предпочитают новый режим; где слабые места монетизации; куда смотреть геймдизайнерам, чтобы повысить вовлеченность игроков; и еще миллион вещей — подсчитывается вообще всё. И всё это влияет на решения, которые потом принимают разработчики. А вот внедряют аналитику все ...

Читать далее »