Вы ошеломлены, ища ресурсы, чтобы понять математику, лежащую в основе науки о данных и машинного обучения? Мы вас прикрыли.
Мотивация
Изучение теоретических основ для науки о данных или машинного обучения может быть непростым делом, поскольку оно включает в себя несколько областей математики и длинный список онлайн-ресурсов.
В этой статье моя цель - предложить ресурсы для создания математической базы, необходимой для начала практической / исследовательской работы в области науки о данных. Эти предложения основаны на моем собственном опыте в области науки о данных и с учетом последних ресурсов, предложенных сообществом.
Однако предположим, что вы новичок в машинном обучении и хотите найти работу в отрасли. В таком случае я не рекомендую изучать всю математику перед тем, как приступить к реальной практической работе. Вы, вероятно, разочаруетесь, поскольку начали с теории (скучно?) перед практикой (весело!). Такой восходящий подход контрпродуктивен.
Мой совет - сделать это наоборот (подход сверху вниз), научиться кодировать, использовать стек PyData (Pandas, sklearn, Keras и т. Д.), Испачкать руки, строя реальные проекты, использовать документацию по библиотекам. и YouTube / Medium обучающие программы. ТОГДА, вы начнете видеть более широкую картину, заметив отсутствие у вас теоретических знаний, чтобы понять, как работают эти алгоритмы; в этот момент изучение математики будет иметь для вас гораздо больше смысла!
Вот статья фантастической команды fast.ai, в которой говорится о нисходящем подходе к обучению.
И еще один, сделанный Джейсоном Браунли в его блоге «Мастерство машинного обучения».
Ресурсы
Я разделю ресурсы на три раздела (линейная алгебра, исчисление, статистика и вероятность); список ресурсов не будет иметь определенного порядка. Ресурсы разнообразны: видеоуроки, книги, блоги и онлайн-курсы.
Линейная алгебра
Линейная алгебра используется в машинном обучении, чтобы понять, как работают алгоритмы. Все дело в векторных / матричных / тензорных операциях; никакой черной магии здесь нет!
- Серия линейной алгебры Академии Хана (для начинающих).
- Кодим матричный курс (и книга).
- 3Blue1Brown серия линейной алгебры .
- Курс fast.ai линейной алгебры для программистов, тесно связанный с современным рабочим процессом машинного обучения.
- Первый курс на Coursera Математика для специализации машинного обучения.
- Книга Введение в прикладную линейную алгебру - векторы, матрицы и наименьшие квадраты. »
- Курс линейной алгебры Массачусетского технологического института, очень обширный.
- Обзор Stanford CS229 Linear Algebra.
Исчисление
Исчисление используется в машинном обучении для формулирования функций, используемых для обучения алгоритмов достижению их цели, известной как функции потерь / стоимости / цели.
- Серия« Исчисление Академии Хана (для начинающих).
- Серия 3Blue1Brown Calculus.
- Второй курс на Coursera Математика для специализации машинного обучения.
- Матричное исчисление, необходимое для работы с глубоким обучением.
- Исчисление одной переменной MIT.
- Многопараметрическое исчисление Массачусетского технологического института.
- Обзор Стэнфордского дифференциального исчисления CS224n.
Статистика и вероятность
Оба используются в машинном обучении и науке о данных для анализа и понимания данных, обнаружения и вывода ценных идей и скрытых закономерностей.
- Статистика Академии Хана и вероятностные ряды (для начинающих).
- Видя теория: визуальное введение в вероятность и статистику.
- Введение в описательную статистику от Udacity.
- Введение в выводную статистику от Udacity.
- Статистика со специализацией R от Coursera.
- Обзор теории вероятностей Stanford CS229.
Бонусные материалы
- Часть первая Книги глубокого обучения.
- Математический фон CMU для курса машинного обучения.
- Математика для машинного обучения.
Итак, я отдал свою тщательно подобранную папку закладок по математике на всеобщее благо! Я надеюсь, что это поможет вам расширить свои знания о машинном обучении и побороть страх обнаружить, что происходит за кулисами ваших операторов импорта sklearn / Keras / pandas.
Мы приветствуем ваш вклад в виде просмотра одного из перечисленных ресурсов или добавления новых замечательных.