Обнаружение аномалий в данных временных рядов

Обнаружение аномалий во временных рядах может помочь людям, выявляя закономерности, которые не являются нормальными. Это может быть полезно во многих различных ситуациях, например, для определения тенденции в данных, которая может указывать на проблему.

Например, если данные о продажах показывают внезапное падение, это может указывать на то, что что-то не так. Обнаружение аномалий также можно использовать для обнаружения необычного поведения данных временных рядов, что может быть полезно при выявлении потенциального мошенничества или проблем с безопасностью.

Когда мы хотим создать детекторы на основе ИИ;

Сначала нам нужно подумать о том, что мы пытаемся обнаружить. В основном мы используем этот тип детекторов для данных временных рядов. Поэтому нам нужно подумать о том, какие аномалии мы хотим обнаружить в наших данных временного ряда.

Существует много различных типов аномалий, но некоторые из наиболее распространенных:

— Всплески. Всплеск — это аномалия, при которой данные внезапно увеличиваются или уменьшаются на большую величину.

— Пропуски. Пропуск — это аномалия, при которой данные внезапно уменьшаются на большую величину.

— Тенденции. Тенденция — это аномалия, при которой данные меняют направление, например, с увеличения на уменьшение.

— Выбросы. Выброс — это аномалия, которая далека от остальных данных. После того, как мы решили, какие типы аномалий мы хотим обнаружить, нам нужно собрать данные.

Эти данные могут быть собраны из множества различных источников, таких как датчики, финансовые данные или данные из социальных сетей.

Когда у нас есть эти данные, нам нужно их предварительно обработать. Эта предварительная обработка может включать очистку данных, нормализацию данных или создание признаков.

Далее нам нужно подумать о том, как наша система ИИ научится обнаруживать аномалии. Есть два распространенных способа решения этой проблемы:

Обучение под наблюдением. В этом подходе мы используем обучающий набор данных нормальных и ненормальных примеров для обучения нашей системы искусственного интеллекта. Затем система учится выявлять аномалии на основе шаблонов, которые она извлекла из обучающих данных.
Обучение без учителя. В этом подходе мы не используем обучающий набор данных. Вместо этого система ИИ ищет в данных закономерности, которые необычны или отличаются от остальных данных. Это может быть сложнее сделать правильно, но в некоторых ситуациях это может быть более эффективным.

После того, как мы определились с нашим подходом, нам нужно выбрать метод обнаружения аномалий. Существует множество различных методов обнаружения аномалий, но вот некоторые из них:

Статистические методы. Эти методы ищут необычные закономерности в данных, которые плохо объясняются остальными данными.
Методы машинного обучения. Эти методы используют алгоритмы для изучения данных и выявления шаблонов, указывающих на аномалию.
Методы интеллектуального анализа данных. Эти методы ищут необычные закономерности в данных, которые не могут быть хорошо объяснены остальными данными.

После того, как мы выбрали наш метод, нам нужно реализовать его и протестировать на наших данных. Это можно сделать с помощью различных инструментов, в зависимости от выбранного нами метода. После того, как мы внедрили наш метод, нам нужно оценить его, чтобы увидеть, насколько хорошо он работает. Есть несколько разных способов сделать это:

Метод ожидания. В этом подходе мы разделяем наши данные на обучающий набор и тестовый набор. Мы обучаем нашу систему ИИ на тренировочном наборе, а затем оцениваем ее на тестовом наборе.
Перекрестная проверка. В этом подходе мы разделяем наши данные на несколько разных наборов. Мы обучаем нашу систему искусственного интеллекта на одном наборе, а затем оцениваем ее на других наборах. Это повторяется до тех пор, пока все наборы не будут использованы как в качестве обучающего набора, так и в качестве тестового набора.
Bootstrap. В этом подходе мы создаем несколько разных наборов данных путем выборки из нашего исходного набора данных. Затем мы обучаем и оцениваем нашу систему ИИ на каждом из этих наборов данных.

После того, как мы оценили нашу систему, мы можем развернуть ее в реальном мире и начать использовать для обнаружения аномалий. Также вы можете проверить эту статью для более научного источника, в ней используется метод ML.

смотрите также:

Новые материалы

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

ИИ в аэрокосмической отрасли

Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Data Visualization Neural Networks Startup Tutorial Statistics Productivity Reactjs Learning