Все, что вам нужно знать об AIOps
Введение
Искусственный интеллект трансформирует практически все области и отрасли, будь то маркетинг, продажи, управление персоналом и ИТ-операции. Мы генерируем больше данных, чем когда-либо, в результате настраивается больше серверов для хранения и обработки этих данных, и требуется постоянно контролировать серверы, чтобы предотвратить любые сбои (закрытие серверов). Тем не менее предприятия сталкиваются с перебоями в работе из-за того, что текущие системы мониторинга реагируют (возникает проблема, и тогда группы ИТ-операций получают уведомление об этом).
Влияние сбоев!
Компания Cisco провела интервью с 6000 мировых ИТ-руководителей из Австралии, Канады, Франции, Германии, Великобритании и США. Вот несколько заслуживающих внимания открытий:
- Средняя стоимость отключения корпоративной службы в США составляет 402 000 долларов, а в Великобритании — 212 000 долларов.
- 97 % руководителей сообщили как минимум об одном сбое в обслуживании, связанном с критически важным для бизнеса приложением.
- Среднее среднее время решения (MTTR) проблемы колеблется в пределах семи часов.
Вышеуказанные проблемы связаны с тем, что эти предприятия в настоящее время используют системы реактивного мониторинга, и их можно решить с помощью AIOps.
Что такое AIOps?
Термин AIOps означает «Искусственный интеллект для ИТ-операций». Это приложение искусственного интеллекта/машинного обучения для упреждающего обнаружения и решения проблем, возникающих в рамках ИТ-операций.
Как AIOps может помочь?
- Перейти от реактивного к проактивному управлению проблемами.
- Добейтесь более быстрого среднего времени решения (MTTR) проблем.
- Ускорьте и улучшите процесс принятия решений, автоматизировав процесс решения проблем.
Варианты использования AIOPS
Ниже приведены основные варианты использования AIOps:
- Упреждающее обнаружение аномалий
AIOps позволяет обнаруживать аномалии проблем, с которыми сталкиваются ИТ-серверы, путем мониторинга больших объемов серверных данных. С помощью AIOps предприятие может активно отслеживать показатели серверов и обнаруживать аномалии до того, как они станут слишком серьезными. Например, рассмотрим систему AIOps для отслеживания использования дисков серверов. Если использование диска внезапно возрастет, система AIOps обнаружит эту аномалию и предупредит ИТ-группу до того, как возникнет реальная проблема.
2. Анализ основных причин
Несколько аспектов, связанных с сервером, таких как диск, память, ЦП, ввод-вывод и т. д., могут дать серверу сбой, и группе ИТ-операций становится сложно определить основную причину. AIOps дают представление о корреляции между инцидентами (или метриками сервера), наблюдая за каждой метрикой сервера и, таким образом, помогают ИТ-команде правильно диагностировать проблему. Например, на диаграмме тенденций, показанной ниже, использование диска начинает расти, и в результате также увеличивается использование памяти и ЦП. Система AIOps может обнаружить, что основной причиной этого роста показателей является увеличение использования диска.
3. Интеллектуальное оповещение
Одна из проблем традиционных реактивных систем управления проблемами заключается в том, что они вызывают огромное количество предупреждений. ИТ-специалисты устанавливают некоторые предопределенные пороговые значения для серверных метрик, например, 90-процентное пороговое значение для показателя использования дисков серверов. Теперь всякий раз, когда использование дискового пространства сервера превышает 90 %, будет выдаваться предупреждение. Поскольку каждый сервер ведет себя по-разному, это статическое отсечение 90% не работает для каждого сервера, что приводит к большому количеству ложных предупреждений.
Решения AIOps, извлекая уроки из исторических данных, выдают только точные предупреждения и, таким образом, уменьшают общее количество предупреждений.
4. Автоматическое решение проблем
Как только решение AIOps определит основную причину проблемы, ИТ-команды могут сделать еще один шаг вперед и использовать машинное обучение или некоторые задания ETL для запуска процессов автоматического разрешения проблем для устранения проблем.
5. Планирование емкости
Поскольку AIOps обеспечивает упреждающее обнаружение аномалий, ИТ-команды знают, какая проблема может возникнуть в будущем, и поэтому они могут соответствующим образом планировать ресурсы, чтобы сосредоточиться на предстоящих проблемах и решать их заранее.
Если вы нашли этот блог полезным и узнали что-то интересное об AIOps, пожалуйста, хлопайте, делитесь и комментируйте историю, чтобы показать свою любовь и поддержку :)
Во-первых, вы должны получать мои сообщения в свой почтовый ящик Сделайте это здесь! ;)
Во-вторых, если вам нравится работать с Medium, подумайте о том, чтобы поддержать меня и тысячи других авторов, подписавшись на членство. Это стоит всего 5 долл. США в месяц, это очень поддерживает нас, писателей, и у вас также есть возможность зарабатывать на своих произведениях.