seaborn
-
Хабрахабр
Визуализация столбца из DataFrame с помощью библиотеки Seaborn
Попробуем визуализировать данные по рекламным кампаниям, которые храняться в DataFrame. Дано: DataFrame, в котором хранится статистика по рекламным кампаниям по следующим показателям: CampaignName Date Impressions Clicks Ctr Cost AvgCpc BounceRate AvgPageviews ConversionRate CostPerConversion Conversions Импортируем все необходимое: import seaborn as sns from pandas import Series,DataFrame Прочитаем наш DataFrame из csv f=DataFrame.from_csv("cashe.csv",header=0,sep='',index_col=0,parse_dates=True) Визуализируем данные столбца «AvgCpc» sns.distplot(f['AvgCpc'],bins=25) plt.show() Получим следующий график:…
Читать далее » -
Хабрахабр
Идентификация мошенничества с использованием Enron dataset. Часть 2-ая, поиск оптимальной модели
Если вы не читали первую часть, ознакомиться с ней можно здесь. Представляю вашему вниманию вторую часть статьи о поиске подозреваемых в мошениничестве на основе данных из Enron Dataset. Сейчас речь пойдет про процесс построения, оптимизации и выбора модели, которая даст ответ: стоит ли подозревать человека в мошеничестве? Также было исправлено смещение в исходных данных, заполнены пробелы(NaN), после чего данные были…
Читать далее » -
Хабрахабр
[Из песочницы] Идентификация мошенничества с использованием Enron dataset. Часть 1-ая, подготовка данных и отбор признков
Этому способствовала не их сфера деятельности (электроэнергия и контракты на ее поставку), а резонанс в связи с мошенничеством в ней. Корпорация Enron — это одна из наиболее известных фигур в американском бизнесе 2000-ых годов. Но закончилось всё так же быстротечно: в период 2000-2001гг. В течении 15 лет доходы корпорации стремительно росли, а работа в ней сулила неплохую заработную плату. С…
Читать далее »