Главная » Архив меток: R

Архив меток: R

Насколько R быстр для продуктива?

В качестве ИС может быть документооборот, сервис деск, багтрекер, электронный журнал, складской учет и пр. Есть такой популярный класс задач, в которых требуется проводить достаточно глубокий анализ всего объема цепочек работ, регистрируемых какой-либо информационной системой (ИС). И грабли, на которые можно наступить, тоже во многом похожи. Нюансы проявляются в моделях данных, API, объемах данных и иных аспектах, но принципы решения ...

Читать далее »

Совмещение R и Python: зачем, когда и как?

И если да, то зачем это может быть нужно? Наверное, многие из тех, кто занимается анализом данных, когда-нибудь думали о том, возможно ли использовать в работе одновременно R и Python. Да и как вообще выбрать лучший способ совмещения языков, если гугл выдает примерно 100500 вариантов? В каких случаях будет полезным и эффективным для проектов? Давайте попробуем разобраться в этих вопросах. ...

Читать далее »

Data-mining и Твиттер

Среди социальных сетей Твиттер более других подходит для добычи текстовых данных в силу жесткого ограничения на длину сообщения, в которое пользователи вынуждены поместить все самое существенное. Предлагаю угадать, какую технологию обрамляет это облако слов? Статья о том, как это осуществить с помощью языка программирования R. Используя Твиттер API можно извлекать и анализировать самую разнообразную информацию. Написание кода занимает не так ...

Читать далее »

[Из песочницы] Обзор R пакетов для интернет маркетинга, часть 1

В этой статье я подскажу готовые расширения (пакеты) для языка R, с помощью которых вы можете автоматизировать процесс сбора данных из большинства популярных рекламных систем и платформ веб аналитики. Всем привет, если вы занимаетесь интернет маркетингом наверняка вам ежедневно приходится сталкиваться со множеством рекламных сервисов и как минимум одной платформой веб аналитики, если вам требуется хотя бы раз в месяц, ...

Читать далее »

Венгерский алгоритм, или о том, как математика помогает в распределении назначений

Привет, друзья! В этой статье хотел бы рассказать про интересный алгоритм из дисциплины «Исследование операций» а именно про Венгерский метод и как с его помощью решать задачи о назначениях. Немного затрону теории про то, в каких случаях и для каких задач применим данный алгоритм, поэтапно разберу его на мною выдуманном примере, и поделюсь своим скромным наброском кода его реализации на ...

Читать далее »

Сборник демографических рассказов в одной карте

Решил рассказать об этом на Хабре, поскольку есть надежда, что реализованный способ визуализации данных может пригодиться еще кому-то. В свежем номере журнала The Lancet опубликована моя статья — любопытная карта и небольшое к ней пояснение. (2018). Kashnitsky, I., & Schöley, J. The Lancet, 392(10143), 209–210. Regional population structures at a glance. 1016/S0140-6736(18)31194-2 https://doi.org/10. Собственно, вот карта в высоком разрешении (кликабельно). ...

Читать далее »

[Из песочницы] Модели Эло и ЭлоБета в снукере

В нем есть всё: гипнотизирующая красота интеллектуальной игры, элегантность ударов киём и психологическая напряжённость соревнования. На протяжении многих лет я слежу за снукером, как за спортом. Но есть одна вещь, которая мне не нравится — его рейтинговая система. Такого недостатка лишена модель Эло, которая следит за "силой" игроков и обновляет её в зависимости от результатов матчей и "силы" соперника. Её ...

Читать далее »

[Из песочницы] Наивный Байес, или о том, как математика позволяет фильтровать спам

Привет! В этой статье я расскажу про байесовский классификатор, как один из вариантов фильтрации спам-писем. Пройдемся по теории, затем закрепим практикой, ну и в конце предоставлю свой набросок кода на мною обожаемом языке R. Буду стараться излагать максимально легкими выражениями и формулировками. Приступим! Без формул никуда, ну и краткая теория Байесовский классификатор относится к разряду машинного обучения. Суть такова: система, ...

Читать далее »

Зимой и летом одним цветом? Поиск сезонности в данных

Всплески интереса к цветам, новогодним подаркам и шинам — вполне ожидаемы. Однажды мы решили посмотреть, какие сезонные интересы есть у пользователей 2ГИС в разных городах. Мы решили ими не ограничиваться и пойти дальше, проверив все сферы деятельности во всех 113 городах присутствия. В этой статье я расскажу, как мы искали сезонности и какие особенности поведения пользователей в них обнаружили. Зачем ...

Читать далее »

Конструктивные элементы надежного enterprise R приложения

Естественно, что методы удобные для консольного пошагового применения человеком, который глубоко в теме, оказываются малопригодными для создания приложения для конечного пользователя. Тем, кто работает с R, хорошо известно, что изначально язык разрабатывался как инструмент для интерактивной работы. (говорим R, подразумеваем, в основном, Shiny web приложения).Однако, не все так плохо. Возможность получить развернутую диагностику сразу по факту ошибки, проглядеть все переменные ...

Читать далее »