Я учусь в WorldQuant Unversity (WQU) с октября 2018 года. Это двухлетняя бесплатная онлайн-программа магистратуры по финансовому инжинирингу. На данный момент я прошел 4 курса: (1) Финансовые рынки, (2) Эконометрика (с использованием R), (3) Стохастический процесс с дискретным временем и (4) Стохастический процесс с непрерывным временем. В настоящее время я изучаю (5) вычислительные финансы (с использованием python).

Математика для DataScience

Математику иногда называют непрактичным способом изучения науки о данных. Однако, основываясь на том, чему я научился в WQU, я думаю, что математика и статистика необходимы для практического применения науки о данных. Кодирование R или Python с плохой математической подготовкой сгенерирует немного.

На coursera и edX есть много онлайн-курсов, где мы можем изучать математику. Курсы, предлагаемые Гарвардом или Массачусетским технологическим институтом, великолепны среди других. Что касается финансового инжиниринга, я многому научился из Темы математики с приложениями в финансах / «Открытый курс MIT». WQU — это сложный курс, но это также хорошее место для изучения математики на уровне выпускников с практическим применением в области финансов.

Знание предметной области для DataScience

В области науки о данных работает много профессиональных математиков и компьютерных ученых. Чтобы повысить ценность сообщества, я думаю, что знание предметной области является ключом для других. Например, даже когда мы применяем простую PCA к многомерному реальному набору дат, нам нужны знания предметной области, чтобы оценить результат. Моя область - финансы (у меня есть финансовое образование), и именно поэтому я учусь в WQU. Есть также много других курсов MOOC, где мы можем изучить применение в области финансов.

Doc.ai приобретает crestle.ai в 2018 году и запускает новый курс искусственного интеллекта для медицинских работников. Это также пример интеграции знаний предметной области с наукой о данных.

Полная занятость для DataScience

Большинство студентов WQU работает полный рабочий день. Работая и учась (онлайн) параллельно, я думаю, что между ними есть положительная обратная связь.

R или Python для DataScience

Я думаю, это зависит от того, что мы хотим сделать. R имеет отличные библиотеки для статистики и анализа временных рядов. Например, легко построить модель ARMA + GARCH в R, но сложно в python. С другой стороны, у Python есть отличные библиотеки машинного обучения и сообщества. Возможности серверной части (django) также являются преимуществом для Python.

Во 2-м модуле WQU «Эконометрика» в курсе использовался R. В текущем 5-м модуле «Вычислительные финансы» курс разработан на Python.

(Я создал простое руководство по Python на основе того, что узнал из WQU. См.: https://github.com/YoheiKo/py_basics)