Хабрахабр

Курс по Machine Learning от Почты Mail.Ru

27 сентября начинается курс по машинному обучению от Почты Mail.Ru. Занятия будут проходить два раза в неделю в офисе Mail.Ru Group в течение трех месяцев. Регистрация открыта для студентов московских ВУЗов.

Ru расскажут об ML-технологиях, которые применяются для того, чтобы сделать Почту еще более удобным и современным продуктом. В ходе курса специалисты Почты и Антиспама Mail. Под катом подробности о курсе: формат, программа, авторы и перспективы для выпускников.

Формат

Курс состоит из 20 занятий: 18 лекций и 2 экзамена (промежуточный и финальный). Каждое занятие содержит теоретическую и практическую части; в ходе практической части слушатели разработают несколько классификаторов, основательно поработают с текстом и реализуют базовые алгоритмы, понимание которых необходимо в работе.

По словам авторов, «сложность будет подобрана так, чтобы над задачей нужно было поломать голову, но не в ущерб учебе в университете». Также участников ждет 5 практических домашних заданий.

Программа

  1. Регрессия от одной переменной и нескольких переменных. Переобучение и способы борьбы с ним.
  2. Логистическая регрессия. Бинарная и многоклассовая классификация. Классификатор kNN.
  3. Метод опорных векторов.
  4. Работа с текстом: препроцессинг и векторное представление, задачи классификации.
  5. Тематическое моделирование: pLSI, LDA.
  6. Векторное представление текста: word2vec, fastText.
  7. Алгоритмы понижения размерности: PCA, LSH.
  8. EM-алгоритм, k-means и s-means алгоритм.
  9. Иерархические алгоритмы кластеризации. Метрики оценки кластеризации.
  10. Деревья решений. Ансамбли деревьев: случайный лес.
  11. Градиентный бустинг над деревьями: xgboost.
  12. AB-тестирование.
  13. Интервальные оценки качества классификаторов в production.

Занятия будут проходить два раза в неделю (вторник, четверг) с 18:00 до 21:00 в офисе Mail.Ru Group с 27 сентября по 11 декабря.

В отличие от большинства курсов по ML, в данном сделан упор на практику, а не на академическую составляющую. Курс разработан для того, чтобы подробнее рассказать, как машинное обучение используется в реальных задачах. Главная цель авторов заключается в том, чтобы после прохождения курса студенты могли решать типовые практические задачи.

Стажировка после обучения

Выпускникам будет предложена оплачиваемая стажировка в командах машинного обучения Почты и Антиспама, где методами ML решаются такие задачи, как фильтрация нежелательного трафика, определение взломов, отделение важных писем от неважных, классификация смысловой направленности писем и др. Видео о команде Почты.

На стажировку можно попасть только после завершения образовательных проектов компании Mail. Стажеры работают над боевыми задачами, их единственное отличие от опытных коллег — возможность выстроить гибкий график, работая 20 часов в неделю. Ru Group.

Как поступить на курс

Курс рассчитан на старшекурсников и аспирантов технических ВУЗов, обучающихся на математическом или физико-техническом направлении.

Ссылка на тест придет на почту, указанную при регистрации, и будет доступна в течение двух суток. Чтобы попасть на курс, необходимо зарегистрироваться по ссылке до 10:00 (мск) 22 сентября и пройти онлайн-тестирование в любое время с 10:00 22 сентября по 10:00 24 сентября. Занятия начнутся 27 сентября.

Необходимый минимум для поступления:

  • знания линейной алгебры и теории вероятностей;
  • умение программировать на Python;
  • знакомство с Numpy и Sklearn;
  • плюсом будет знание методов оптимизации.

Материалы для подготовки:

  1. книги: Зорич «Математический анализ», Ю.В. Прохоров, Л.С. Пономаренко «Лекции по теории вероятностей и математической статистике», Боровков А.А. «Теория вероятностей», Гмурман В.Е. «Теория вероятностей и математическая статистика»;
  2. курс лекций «Нейронные сети в ML» на обучающем канале Технострим;
  3. полезная информация по Python.

Первое занятие пройдет уже на следующей неделе. Регистрируйтесь на курс, проходите обучение и присоединяйтесь к ML-индустрии!

Теги
Показать больше

Похожие статьи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»
Закрыть