Хабрахабр

Что почитать и посмотреть для старта в Data Science: книги, словари и курсы

Подборка ресурсов по математике, статистике и программированию для начинающих Дата Сайентистов. Ознакомьтесь с материалами, если вы планируете учиться на онлайн-курсах. Так вы опередите одногруппников, а заодно прокачаете полезный навык — изучать дополнительные материалы самостоятельно.

Технический английский

Большинство материалов из подборки — на английском языке. Поэтому в первую очередь нужно разобраться в технической лексике и научиться понимать сложные термины. Эти ресурсы помогут сориентироваться в технической литературе, если ваш уровень английского — средний или ниже среднего.

Cambridge Dictionary

Математика

В первую очередь научитесь быстро осваивать любые математические концепции. В этом поможет обучающий ролик How to Learn Mathematics Fast
Прокачайте математическое мышление и изучите:
Чтобы осознать универсальность математики, посмотрите серию семинаров Эдварда Френкела Mathematics: the language of nature.

Дополнительная теория и практика по математике

Освежить в памяти базовые понятия математики помогут следующие ресурсы:

Курс «Теория вероятностей» на Coursera

Чтобы еще больше прокачать знания по матричной алгебре, пройдите сложный курс Linear Algebra от MIT. Задание со звездочкой.

Статистика

Для обучения на курсе Нетологии Data Scientist, достаточно базовых знаний статистики. Их можно получить из раздела Statistics and probability в «Академии Хана». Ознакомиться с полным списком тем по статистике, которые будем рассматривать во время обучения, можно в подборке The 10 Statistical Techniques Data Scientists Need to Master. Для поступления разбираться в них детально не нужно, но лучше получить общее представление.

Курс Data Scientist в Нетологии

Дополнительно стоит пройти курс Statistics for Applications от MIT, но для этого нужно понимать: Задание со звездочкой.

  • что такое выборка и генеральная совокупность;
  • меры центральной тенденции и изменчивости;
  • сравнение средних.

Программирование

Студенты курса Data Scientist пишут код на языке Python. Чтобы писать код во время обучения, достаточно освоить основные понятия языка: операторы, типы данных, переменные, циклы, функции, классы. Быстро разобраться в основах и попрактиковаться самостоятельно помогут следующие ресурсы:
Если вы хотите разобраться в Python подробнее и под руководством наставника, можете параллельно проходить курс «Python для анализа данных».

Базы данных

Чтобы мыслить в контексте данных, нужно разобраться, как устроены и работают базы реляционных данных. Для этого достаточно освоить основы SQL — пройти третью неделю курса по основам анализа данных для бизнеса от Колорадского университета в Боулдере. Отработать знания на практике можно в следующих заданиях:
Углубленные знания по базам данных можно получить на курсе «SQL для аналитика».

Резюмируем: ключевые рекомендации

  • Если вы планируете освоить профессию Data Scientist на курсах, прокачайте технический английский. Это понадобится для изучения дополнительных материалов и документации.
  • Изучите или освежите в памяти основы математики, статистики, Python и SQL.
  • Читайте гайды, смотрите обучающие лекции и выполняйте практические задания для закрепления информации.
Показать больше

Похожие публикации

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Кнопка «Наверх»