data science
-
Хабрахабр
Кластеризация в ML: от теоретических основ популярных алгоритмов к их реализации с нуля на Python
Кластеризация — это набор методов без учителя для группировки данных по определённым критериям в так называемые кластеры, что позволяет выявлять сходства и различия между объектами, а также упрощать их анализ и визуализацию. Из-за частичного сходства в постановке задач с классификацией кластеризацию ещё называют unsupervised classification. В данной статье описан не только принцип работы популярных алгоритмов кластеризации от простых к более продвинутым,…
Читать далее » -
Хабрахабр
[Перевод] Как я случайно сэкономил компании полмиллиона долларов
Разработчик под ником Ludic*, автор технического блога Ludicity, сэкономил своей компании полмиллиона долларов за пять минут. Это больше, чем он заработал для работодателей за всю его карьеру, поскольку сфера деятельности, о которой далее пойдёт речь, — обман. Он всего лишь нажал на пять кнопок. Под катом Ludic рассказывает, как так получилось, и почему ему обидно, что произошедшая ситуация возможна в…
Читать далее » -
Хабрахабр
100 вопросов для подготовки к собесу Python
Доброго времени суток! Представляю подборку из 100 вопросов с собесов на позицию джуна Python-разработчика. На Хабре есть неплохие статьи на тему подготовки к собеседованию и всё в таком духе, но прямо набора вопросов/ответов на понимание Python в формате чек-листа не встречал. Для кого статья? для тех, кто думает, что знает Python как 5 пальцев — проверьте себя) кому предстоят собесы,…
Читать далее » -
Хабрахабр
От логики и риторики до теории множеств и матанализа. Полезные материалы по Data Science и машинному обучению
Привет, Хабр! Меня все еще зовут Ефим, и я все еще MLOps-инженер в отделе Data- и ML-продуктов Selectel. В предыдущей статье я кратко рассказал про основные ресурсы, которые могут помочь начинающему специалисту ворваться в бурлящий котел Data Science. Но после выхода материала я понял, что задача систематизации знаний гораздо сложнее, чем казалось. Настолько, что проиллюстрировать ее можно только табличкой ниже:…
Читать далее » -
Хабрахабр
Импортозамещаем numpy, pandas, scipy и sklearn
Hidden text Спойлер: это тизер. Конечно же, ни о каком импортозамещении речи нет. Просто мы хайпуем на возросшей волне популярности DA и DS, получаем фан, и при этом пытаемся утилизировать преимущества C++. No cringe, no fear. О чем говорим? Речь пойдет о библиотеках-аналогах numpy, pandas, scipy и sklearn на C++ (np, pd, scipy, sklearn соответственно). Эти проекты изначально задумывались как…
Читать далее » -
Хабрахабр
Сможете ли вы отличить собаку от кошки, или Как объяснить проблемы дата-сайентиста коллегам. Часть 1
Этот материал начинает серию из трех постов о том, как объяснить проблемы дата-сайентистов сотрудникам вашей компании, которые ничего не понимают в data science. В первой части я доступно расскажу о нынешнем положении специалистов, их проблемах и типичных запросах, с которыми они сталкиваются. Счастье дата-сайентистов Мы живем в прекрасное для каждого дата-сайентиста время. Наконец-то на модели машинного обучения возник спрос со…
Читать далее » -
Хабрахабр
Семантическая сегментация на основе архитектуры U-Net и определение расстояния между объектами
Всем привет! Возвращаясь к бытовому применению нейронных сетей, изначально была идея усовершенствовать модель детекции свободного парковочного места из предыдущей моей статьи (Определение свободного парковочного места с помощью Computer Vision), сделать возможность сегментации дороги, тротуара и исключать из парковочных мест, автомобили, которые стоят на газоне (было несколько гневных комментариев на этот счёт). Однако в процессе размышлений, я решил сделать отдельную модель…
Читать далее » -
Хабрахабр
Kaggle — практическое изучение Big Data. Что это за платформа, и как она работает
Привет, Хабр! Время от времени здесь публикуются статьи с упоминанием Kaggle. Это крупнейшая международная платформа соревнований по Data Science. В организации соревнований участвуют крупные и не очень компании, а многие задачи решают реальные проблемы медицины, ИИ, разработки и т. п. Если вы слышали что-то о Kaggle, но ещё не пробовали платформу в работе, то эта статья для вас. В ней относительно…
Читать далее » -
Хабрахабр
Отчёт о KuberConf’ 2023
Информационная служба Хабра посетила конференцию KuberConf’ 2023, посвящённую Kubernetes® от компании Yandex Cloud. Эта конференция — узкоспециализированное мероприятие для людей, работающих с Kubernetes®, имеющих отношение к созданию сервисов и решению бизнес-задач с его помощью в финтехе, e-commerce, HoReCa и так далее. Интересно, что сначала билеты на это мероприятие раздавали в telegram-группе Kubernetes®-сообщества и только потом была открыта регистрация на него,…
Читать далее » -
Хабрахабр
Решение задачи определения RUL трансформаторов с помощью машинного обучения на python
Дисклеймер: целью создания статьи было знакомство с задачей, данными и одним из подходов к ее решению, а также популяризация машинного обучения в промышленности. В статье представлен скорее бейзлайн для решения задачи, речь о продакшн-рэди решении не идет. Статью стоит воспринимать как туториал по решению задачи, который снижает порог входа и мотивирует попробовать решить задачу самостоятельно. Для кого: Статья предназначена для…
Читать далее »