Вы ошеломлены, ища ресурсы, чтобы понять математику, лежащую в основе науки о данных и машинного обучения? Мы вас прикрыли.

Мотивация

Изучение теоретических основ для науки о данных или машинного обучения может быть непростым делом, поскольку оно включает в себя несколько областей математики и длинный список онлайн-ресурсов.

В этой статье моя цель - предложить ресурсы для создания математической базы, необходимой для начала практической / исследовательской работы в области науки о данных. Эти предложения основаны на моем собственном опыте в области науки о данных и с учетом последних ресурсов, предложенных сообществом.

Однако предположим, что вы новичок в машинном обучении и хотите найти работу в отрасли. В таком случае я не рекомендую изучать всю математику перед тем, как приступить к реальной практической работе. Вы, вероятно, разочаруетесь, поскольку начали с теории (скучно?) перед практикой (весело!). Такой восходящий подход контрпродуктивен.

Мой совет - сделать это наоборот (подход сверху вниз), научиться кодировать, использовать стек PyData (Pandas, sklearn, Keras и т. Д.), Испачкать руки, строя реальные проекты, использовать документацию по библиотекам. и YouTube / Medium обучающие программы. ТОГДА, вы начнете видеть более широкую картину, заметив отсутствие у вас теоретических знаний, чтобы понять, как работают эти алгоритмы; в этот момент изучение математики будет иметь для вас гораздо больше смысла!

Вот статья фантастической команды fast.ai, в которой говорится о нисходящем подходе к обучению.



И еще один, сделанный Джейсоном Браунли в его блоге «Мастерство машинного обучения».



Ресурсы

Я разделю ресурсы на три раздела (линейная алгебра, исчисление, статистика и вероятность); список ресурсов не будет иметь определенного порядка. Ресурсы разнообразны: видеоуроки, книги, блоги и онлайн-курсы.

Линейная алгебра

Линейная алгебра используется в машинном обучении, чтобы понять, как работают алгоритмы. Все дело в векторных / матричных / тензорных операциях; никакой черной магии здесь нет!

  1. Серия линейной алгебры Академии Хана (для начинающих).
  2. Кодим матричный курс (и книга).
  3. 3Blue1Brown серия линейной алгебры .
  4. Курс fast.ai линейной алгебры для программистов, тесно связанный с современным рабочим процессом машинного обучения.
  5. Первый курс на Coursera Математика для специализации машинного обучения.
  6. Книга Введение в прикладную линейную алгебру - векторы, матрицы и наименьшие квадраты. »
  7. Курс линейной алгебры Массачусетского технологического института, очень обширный.
  8. Обзор Stanford CS229 Linear Algebra.

Исчисление

Исчисление используется в машинном обучении для формулирования функций, используемых для обучения алгоритмов достижению их цели, известной как функции потерь / стоимости / цели.

  1. Серия« Исчисление Академии Хана (для начинающих).
  2. Серия 3Blue1Brown Calculus.
  3. Второй курс на Coursera Математика для специализации машинного обучения.
  4. Матричное исчисление, необходимое для работы с глубоким обучением.
  5. Исчисление одной переменной MIT.
  6. Многопараметрическое исчисление Массачусетского технологического института.
  7. Обзор Стэнфордского дифференциального исчисления CS224n.

Статистика и вероятность

Оба используются в машинном обучении и науке о данных для анализа и понимания данных, обнаружения и вывода ценных идей и скрытых закономерностей.

  1. Статистика Академии Хана и вероятностные ряды (для начинающих).
  2. Видя теория: визуальное введение в вероятность и статистику.
  3. Введение в описательную статистику от Udacity.
  4. Введение в выводную статистику от Udacity.
  5. Статистика со специализацией R от Coursera.
  6. Обзор теории вероятностей Stanford CS229.

Бонусные материалы

  1. Часть первая Книги глубокого обучения.
  2. Математический фон CMU для курса машинного обучения.
  3. Математика для машинного обучения.

Итак, я отдал свою тщательно подобранную папку закладок по математике на всеобщее благо! Я надеюсь, что это поможет вам расширить свои знания о машинном обучении и побороть страх обнаружить, что происходит за кулисами ваших операторов импорта sklearn / Keras / pandas.

Мы приветствуем ваш вклад в виде просмотра одного из перечисленных ресурсов или добавления новых замечательных.