Мы рады сообщить, что Plotly и NVIDIA объединились, чтобы предоставить возможности искусственного интеллекта (AI) и машинного обучения (ML) с ускорением на GPU для гораздо более широкой аудитории бизнес-пользователей. Интегрируя интерфейс Plotly Dash с серверной частью NVIDIA RAPIDS, мы предлагаем один из самых высокопроизводительных стеков AI и ML, доступных на сегодняшний день в Python. Все это с открытым исходным кодом и доступно в нескольких строках кода Python.
Что касается Enterprise, то Dash Enterprise Kubernetes (DEK) теперь поставляется с готовой поддержкой горизонтально масштабируемого ускорения графического процессора с помощью RAPIDS и Dask. Создав приложение Dash + RAPIDS на своем компьютере, передайте его в руки бизнес-пользователям, загрузив его в DEK. Не требуется ИТ или команда DevOps 🙅♀️.
Генеральный директор NVIDIA Дженсен Хуанг упомянул некоторые из первых плодов этого партнерства в первую минуту своего выступления Кухня GTC 2020 на прошлой неделе, а сегодня мы более официально объявляем о нашем партнерстве.
Типичная панель управления бизнес-аналитикой (BI) или аналитическое приложение объединяет графики, карты и элементы управления для обеспечения интерактивного доступа к запросам и моделям ИИ, работающим на больших и сложных наборах данных. Любая организация, поставляющая товары или услуги в большом масштабе, будет иметь миллионы записей для анализа, распределенных во времени и пространстве и по различным более абстрактным измерениям. Построение высокопроизводительного приложения на основе такого набора данных обычно требует усилий нескольких команд в течение нескольких недель и приводит к сложной многоуровневой архитектуре. Новые технологии, такие как Dash и RAPIDS, меняют этот ландшафт, позволяя отдельным разработчикам Python легко и быстро создавать аналитические приложения, которые более производительны, чем их сложные аналоги.
Plotly’s Dash - это платформа с открытым исходным кодом, разработанная Plotly, которая позволяет разработчикам создавать интерактивные аналитические веб-приложения с большим объемом данных на чистом Python без использования Javascript. Традиционная разработка аналитических приложений полного стека осуществляется в группах, некоторые из которых специализируются на серверных / серверных технологиях, таких как Python, некоторые - на интерфейсных технологиях, таких как React, а некоторые - на науке о данных. Dash обеспечивает тесно интегрированную внутреннюю и внешнюю части, управляемую с помощью простых функций Python. Это означает, что группам по обработке и анализу данных, производящим модели и анализу, больше не нужно полагаться на специалистов по серверной части для предоставления этих моделей клиентской части через API-интерфейсы, и больше не нужно полагаться на специалистов по интерфейсу для создания пользовательских интерфейсов для подключения к эти API.
RAPIDS - это набор библиотек с открытым исходным кодом, разработанных с NVIDIA для ускорения рабочих нагрузок Python в области науки о данных, выполняя их на графических процессорах, а не на процессорах. RAPIDS обеспечивает значительно ускоренную замену наиболее популярных библиотек науки о данных Python, таких как Pandas, Scikit-Learn и NetworkX. RAPIDS сокращает цикл проверки гипотезы-запроса-проверки для специалистов по данным, быстро выполняя запросы к полным дезагрегированным наборам данных на локальных и удаленных рабочих станциях, вместо того, чтобы ждать результатов или тратить время на агрегирование или выборку наборов данных или загрузку их в удаленные базы данных для получения до желаемого уровня производительности запросов. Это означает, что с помощью RAPIDS специалисты по обработке данных могут меньше полагаться на специалистов по проектированию данных или администрированию баз данных, которые обычно несут ответственность за эти задачи агрегирования и извлечения-преобразования-загрузки (ETL).
Используя Dash и RAPIDS вместе, отдельным специалистам по данным больше не нужно идти на компромисс между железным треугольником производительности, агрегации и времени выполнения. Теперь они могут работать независимо по всему аналитическому стеку, от необработанных данных до пользовательского интерфейса, чтобы быстро доставлять приложения своим пользователям. Приложение Dash + RAPIDS обычно представляет собой менее тысячи строк легко читаемого кода на чистом Python для создания плавно интерактивного интерфейса для пользователей и может работать на узлах с одним или несколькими графическими процессорами. Эти интерфейсы могут прозрачно агрегировать данные для общего обзора в масштабе всего бизнеса, обеспечивая при этом интуитивно понятные операции среза, кубика и детализации, которые работают так же быстро, с одним и тем же необработанным набором данных. Если в прошлом, чтобы получить хорошую производительность на одном узле, пользователи могли получить доступ только к предварительно агрегированным данным на уровне штата или округа, а также на ежедневном или почасовом уровне, теперь приложения могут повторно агрегировать данные на лету на любом уровне, или предоставить доступ к отдельным записям, чтобы выявить детализированные шаблоны, которые обычно скрыты агрегатами. RAPIDS также можно использовать для быстрого обучения, переобучения и выполнения моделей машинного обучения на тех же больших, детализированных наборах данных.
Команда RAPIDS только что опубликовала статью, в которой подробно описывается, как они создали приложение Dash + RAPIDS, которое позволяет интерактивно исследовать набор данных из 300 миллионов строк: по одной строке на человека, живущего в США. Plotly и команда RAPIDS в ближайшие дни и недели опубликуют больше статей, демонстрирующих некоторые из плодов нашего сотрудничества, поэтому мы рекомендуем вам подписаться на Plotly на Medium или Twitter (и RAPIDS на Medium или Twitter »), Чтобы отслеживать эти обновления. А пока свяжитесь с нами, если у вас есть какие-либо вопросы о Dash или вы хотите узнать больше о партнерстве!