Главная » Архив меток: анализ данных

Архив меток: анализ данных

«Трое в лодке, нищета и собаки», или как Антиплагиат ищет парафраз

Наступил новый учебный год. Студенты получили расписание занятий и стали задумываться о пьянках-гулянках-девушках-гитарах будущей сессии. Написание курсовых, дипломов, статей и диссертаций не за горами. А значит, грядут и анализ текстов на наличие заимствований, и отчеты о проверке, и прочая головная студенческая и администраторская боль. И у сотен тысяч людей (без шуток – мы посчитали!) уже возникает закономерный вопрос – как ...

Читать далее »

Выявление содержательных профилей в VK

Ботов отличать от людей и правда сложновато. Я и сам толком не могу это сделать. Но зато я придумал неплохой велоси... метод, как отличать в VK «интересных людей» от «не очень интересных». В плане сетевого общения, естественно, а не по жизни. Если вам в друзья стучится кто-то, а вы с первого взгляда не можете понять это вообще нормальный человек или ...

Читать далее »

[Из песочницы] MongoDB и исследование рынка ИТ-вакансий

Вы когда-нибудь анализировали вакансии? Месяц назад? Задавались вопросом, в каких технологиях наиболее сильна потребность рынка труда на текущий момент? Год назад? Как часто открываются новые вакансии Java-разработчиков в определенном районе Вашего города и как активно они закрываются? Поехали! В этой статье я расскажу Вам, как можно достичь желаемого результата и построить отчетную систему по интересующей нас теме. Источник Выбор пал ...

Читать далее »

«Storytelling with Data», Cole Nussbaumer Knaflic: неформальный обзор-конспект книги

«Наши сайнтисты сгенерировали кучу графиков, а мы совершенно не знаем, куда их девать. Давайте попробуем их хоть как-то пристроить». (с) подслушано В моей работе я постоянно встречаю крайне сомнительные визуализации данных. «Плохие графики везде. Но это происходит. Никто не делает плохие графики намеренно. В каждой компании во всех отраслях экономики сотрудниками всех уровней. Опять и опять. Это происходит там, где ...

Читать далее »

[Перевод] Добро пожаловать в эпоху нигилизма приватности

На Google и Facebook легко свалить вину, но на самом деле компании собирали, продавали и повторно использовали наши личные данные в течение десятилетий, а теперь, когда общественность наконец заметила, уже слишком поздно. Война за приватность давно закончилась, и мы проиграли. Его называют «Врата в ад». Месторождение природного газа в Дервезе (Туркменистан) провалилось в подземную пещеру, создав непрерывно горящий кратер диаметром ...

Читать далее »

[Перевод] Поддержка Python в Power BI

Мы рады сообщить, что Python, язык программирования, широко используемый статистиками, учеными и аналитиками, теперь интегрирован в наш open-source Power BI Desktop. После включения функции в настройках вы cможете использовать Python для очистки, анализа и визуализации данных. Подробнее под катом! Вы можете это сделать в диалоговом окне «Получить данные». Первой интеграционной фичей, которую мы добавили, является возможность запуска скриптов Python непосредственно ...

Читать далее »

Графические процессоры в решении современных IT-задач

Современные GPU являются сердцем множества сложнейших проектов в сфере машинного обучения и анализа данных. Графические процессоры (graphics processing unit, GPU) — яркий пример того, как технология, спроектированная для задач графической обработки, распространилась на несвязанную область высокопроизводительных вычислений. Помимо колоссального прироста производительности, произошло разделение устройств по типу использования. В нашей обзорной статье мы расскажем, как клиенты Selectel используют оборудование с GPU, ...

Читать далее »

3-е место в отборочном этапе DataScienceGame 2018

DataScienceGame — это международное студенческое соревнование, которое проводится на ежегодной основе. Недавно закончился отборочный этап DataScienceGame2018, который проходил в формате kaggle InClass. Нашей команде удалось оказаться на 3м месте среди более чем 100 команд и при этом НЕ пройти в финальный этап. Командное взаимодействие На больших соревнованиях на kaggle команды обычно формируются по ходу из людей с близким скором по ...

Читать далее »

[Из песочницы] Модели Эло и ЭлоБета в снукере

В нем есть всё: гипнотизирующая красота интеллектуальной игры, элегантность ударов киём и психологическая напряжённость соревнования. На протяжении многих лет я слежу за снукером, как за спортом. Но есть одна вещь, которая мне не нравится — его рейтинговая система. Такого недостатка лишена модель Эло, которая следит за "силой" игроков и обновляет её в зависимости от результатов матчей и "силы" соперника. Её ...

Читать далее »

Допинг для аналитики: почему стоит обратить внимание на Apache Zeppelin

Все рано или поздно приходят к аналитике за данными. В больших многопользовательских играх (да и синглплеере) без этого уже вообще никуда. Сколько пользователей предпочитают новый режим; где слабые места монетизации; куда смотреть геймдизайнерам, чтобы повысить вовлеченность игроков; и еще миллион вещей — подсчитывается вообще всё. И всё это влияет на решения, которые потом принимают разработчики. А вот внедряют аналитику все ...

Читать далее »