Общие сведения.Я попробовал Kubeflow 1.0 в мае 2020 года с узким фокусом на конвейерах облачного машинного обучения.
В последнем выпуске Kubeflow 1.3 они упростили процесс установки, повысили безопасность и удобство работы пользователей. Даже с этими обновлениями пользователям, не являющимся техническими/неинженерными, по-прежнему приходится учиться. Еще одним улучшением является возможность выбирать компоненты, которые вы хотите установить.
ИМО, идеальный вариант использования — это многофункциональная группа по науке о данных, состоящая из инженеров платформ, инженеров по машинному обучению и специалистов по данным. .
- Настройка и улучшенный UX/UI.
Относительно простая настройка по сравнению с версией 1.0, простой для понимания UX и адаптивный пользовательский интерфейс.
Я попробовал это на кластере GKE с 6 узлами (общие ресурсы кластера = 12 ядер, 60 ГБ).
О, теперь они готовы использовать JuptyterLab, код VS с открытым исходным кодом (Code-Server) и Студио.
Code-Server (VS Code в браузере)
По сравнению с версией 1.0 готовые конвейеры и эксперименты работают без проблем. Вы можете выполнить множество настроек (которые я не исследовал).
Другие обновления и улучшения
- Katib теперь AutoML (для настройки гиперпараметров)
- Тома для создания и подключения Объектное хранилище или PV/PVC
- Tensorboards for Visualizations (я не уверен, насколько широко это будет использоваться)
- KFP поставляется в двух вариантах
* KFP с рабочими процессами Argo в качестве версии по умолчанию.
* KFP с Tekton (это дополнительная опция при участии IBM и RedHat) - Запуски
* Специальные запуски вручную
* Запланированные запуски (с использованием рабочих процессов Argo) - Метрики и пользовательский интерфейс метаданных также улучшились.
Резюме:
К Kubeflow возобновился интерес почти всех крупных компаний, предоставляющих облачные услуги (AWS, GCP, Azure, IBM, RedHat/OpenShift). В дополнение к этим облачным провайдерам теперь вы можете запускать Kubeflow в качестве оператора или на Microk8s, MiniKF, Kind и т. д.