парсинг сайтов
-
Хабрахабр
19,6 млн рублей за 2022 год. Парсинг сайтов. 25 советов желающим заняться
Меня зовут Максим Кульгин, моя компания xmldatafeed занимается парсингом сайтов в России порядка четырёх лет. По итогам прошедшего 2022 года поделюсь советами для тех, кто думает о подобном бизнесе. Бизнес очень интересный, но наполнен нюансами, которые и расскажу в статье. Я ранее рассказывал про наш опыт развития бизнеса на парсинге сайтов в двух статьях (часть 1 и часть 2). Теперь хочу подвести итоги 2022…
Читать далее » -
Хабрахабр
Что и кому должен продуктовый аналитик? ч.1
Последние несколько месяцев я проходила квест под названием «уволиться с позиции маркетингового аналитика в FMCG и получить оффер на позицию продуктового аналитика в IT». Хочу поделиться опытом и систематизировать информацию, собранную за это время из разных источников. А для того, чтобы не быть голословной, рассказывая, о том, какими навыками должен обладать продуктовый аналитик, начну с обзора открытой информации о требованиях…
Читать далее » -
Хабрахабр
[Из песочницы] Большой туториал по обработке спортивных данных на python
Последние пару лет в свободное время занимаюсь триатлоном. Этот вид спорта очень популярен во многих странах мира, в особенности в США, Австралии и Европе. В настоящее время набирает стремительную популярность в России и странах СНГ. Речь идет о вовлечении любителей, не профессионалов. В отличие от просто плавания в бассейне, катания на велосипеде и пробежек по утрам, триатлон подразумевает участие в…
Читать далее » -
Хабрахабр
Правда про парсинг сайтов, или «все интернет-магазины делают это»
В этой статье я постараюсь наиболее просто рассказать о парсинге сайтов и его основных нюансах. Моя компания занимается парсингом сайтов уже более трёх лет и ежедневно мы парсим около 300 сайтов. Я обычно открыто пишу об этом в соц.сетях (плюс мы много чего из итогов парсинга крупнейших магазинов России выкладываем бесплатно — публично), что вызывает бурные обсуждения и неодобрение со…
Читать далее » -
Хабрахабр
[] Граббер 2GIS в семь строчек кода, или почему важно контролировать лимиты запросов на сервер
Сегодня я хотел бы поделиться с Вами одним из самых неожиданных для меня мест, где эти данные лежат почти что на поверхности, да еще и в огромных количествах. Наверное любому из тех, кто хоть как-то причастен к области анализа данных хотя-бы раз приходилось сталкиваться с поиском сторонних источников получения этих самых данных. Знакомьтесь — это 2GIS. Как ты это сделал?…
Читать далее »