Добро пожаловать! Наука о данных — удивительная область с огромным потенциалом роста и развития, поэтому давайте взглянем на некоторые инструменты/языки, которые такая крупная компания, как Google, использует для своих проектов по науке о данных!
Языки
Прежде всего, давайте взглянем на языки программирования, которые использует Google:
Питон
Это не проблема, множество компаний используют Python, поскольку это один из самых популярных языков программирования. Для этого языка также доступно множество пакетов для науки о данных, это, вероятно, самый важный язык, который Google использует для науки о данных.
SQL
Еще одним очень важным языком, который использует Google, является SQL. Это определенно строительные блоки многих проектов, связанных с наукой о данных. SQL позволяет нам создавать базы данных и общаться с ними, поэтому, если вы планируете подать заявку в Google, вам необходимо знать этот язык.
R
Далее у нас есть R, еще один очень популярный статистический язык, используемый Google. Основная способность R — обработка данных / манипулирование данными, для этого языка также доступно множество пакетов!
МАТЛАБ
Наконец, у нас есть MATLAB, довольно популярный язык программирования, который также используется в Google. Вот в чем дело: я думаю, что MATLAB очень важен, но барьер для входа довольно высок из-за лицензии, необходимой для его кодирования. Я заметил, что многие позиции в области науки о данных на самом деле не требуют этого языка.
Пакеты машинного обучения
Затем у нас есть пакеты машинного обучения, на самом деле было только 3, которые я рассматривал как требования для должностей по науке о данных в Google.
ТензорФлоу
Первый пакет не вызывает затруднений, TensorFlow на самом деле был создан самими Google, поэтому имеет смысл только то, что им требуются знания с этим пакетом.
ПиТорч
Далее у нас есть PyTorch, пакет машинного обучения, фактически разработанный FaceBook. Из всех трех этих пакетов PyTorch упоминался меньше всего, но его было достаточно, чтобы попасть в этот список.