На прошлой неделе Microsoft анонсировала свою новую функцию Python в Excel, которая позволит пользователям писать код Python в Excel.
Как большой поклонник Python и Excel, вот мои 5 первоначальных мыслей об этой интеграции:
1. Это хорошая идея?
По моему мнению, да.
Как специалист по обработке данных, я использую Excel и Python в своем рабочем процессе по обработке данных уже более десяти лет.
У каждого инструмента есть свои преимущества. Когда я занимаюсь анализом данных, я обычно использую Excel для быстрого визуального анализа (условное форматирование, создание графиков и т. д.) и Python для всей тяжелой работы (манипулирование данными, применение алгоритмов и т. д.).
Благодаря этой интеграции вместо переключения между Excel и Python все можно сделать в одном месте. Для меня чем меньше инструментов мне нужно переключаться, тем лучше.
2. Расширенное машинное обучение в Excel
На данный момент машинное обучение предназначено для людей, которые знают, как работать с Python, R и т. д. Благодаря добавлению Python в Excel пользователи Excel теперь получают доступ к миру машинного обучения.
Например, специалист по данным может обучить модель на Python, а аналитики данных смогут использовать эту модель для прогнозирования в Excel без каких-либо дополнительных технических навыков. 🤯
С другой стороны, я много лет работал преподавателем по науке о данных, и я обнаружил, что студенты часто неправильно интерпретируют модели, когда только начинают.
Поэтому я бы сказал пользователям Excel, которые в конечном итоге используют Python в Excel: очень важно узнать, как работают алгоритмы машинного обучения, чтобы правильно их интерпретировать. Не попадайте в опасную зону!
3. Библиотека панд Python в Excel
Pandas — популярная библиотека манипулирования данными в Python, чрезвычайно мощная.
Есть несколько вещей, для выполнения которых мне потребовалось бы несколько шагов в Excel, но которые я мог бы легко выполнить, используя одну строку кода на Python с помощью pandas. Например:
- Группировка данных и возврат первой строки каждой группы →
df.groupby().head()
- Отмена поворота данных из широкого формата в длинный →
pd.melt()
Как пользователь Python, я хотел бы сделать это со своими данными в Excel. Очень здорово, что это наконец-то стало возможным. Я думаю, что добавление панд в Excel — одно из самых больших преимуществ этой интеграции.
4. Визуализации Python в Excel
В анонсирующем видео Python в Excel, которое Microsoft выпустила на прошлой неделе, они несколько раз упоминают возможности визуализации данных Python в Excel.
Вот в чем дело: мне очень не нравится создавать визуализации данных в Python. Код длинный и его сложно настроить. Трудно делать простые вещи, например, менять положение метки, менять цвета и т. д.
Мне вообще нравится экспортировать данные из Python и импортировать их в Excel или Tableau для создания визуализаций! Лично я считаю, что графики легче создавать и они выглядят лучше, если использовать другие инструменты.
Я уверен, что пользователи Excel будут думать так же, когда попытаются создать сложные визуализации Python в Excel.
5. Вычисления Python в облаке
Еще одна вещь, которую я заметил в рекламном видеоролике, заключалась в том, что они кратко упомянули, что все вычисления Python в Excel будут выполняться в облаке.
Когда вы обычно пишете код Python, он запускается локально, то есть на вашем компьютере, и этот код выполняется довольно быстро.
Раньше, когда я запускал код Python в облаке, это занимало немного больше времени. Раньше я учил студентов писать код Python в Jupyter Notebook локально и в Google Colab в облаке. С Colab обычно все было хорошо, но если возникали проблемы с сетевым подключением или большой набор данных, выполнение кода занимало больше времени.
Поэтому, когда я услышал, что вычисления Python в Excel будут выполняться в облаке, я заколебался. Это то, что мне бы очень хотелось проверить, чтобы увидеть, действительно ли возникнут проблемы со скоростью.
Последние мысли
На данный момент Python в Excel доступен не всем. Подгруппа пользователей бета-канала Microsoft сможет его протестировать, и в конечном итоге он станет доступен пользователям Windows.
Как пользователю Mac, мне придется подождать еще немного. Но я уверен, что объединение двух моих любимых инструментов обработки данных того стоит. 😎