Введение
Абстрактный анализ основных компонентов (АГК) — это мощный статистический метод для ограничения переменных, с которыми мы сталкиваемся, и мы используем его, когда переменные сильно коррелированы. Поскольку PCA становится важным инструментом для неконтролируемого многомерного анализа данных и уменьшения размерности. Следовательно, PCA был объединен с технологиями искусственного интеллекта для повышения производительности многих приложений, таких как обработка изображений, распознавание образов, классификация и обнаружение устаревших аномалий. Целью данного обзора является предоставление всестороннего обзора литературы по анализу основных компонентов (АГК).
Что такое ППШ?
PCA — очень полезный статистический метод, который имеет множество применений в таких областях, как распознавание лиц и сжатие изображений, и является распространенным методом поиска закономерностей в многомерных данных. Но основная проблема с добычей научных наборов данных заключается в том, что данные часто бывают очень многомерными. Когда количество измерений достигает сотен или даже тысяч, вычислительное время алгоритмов распознавания образов может стать непомерно высоким. Во многих случаях существует большое количество признаков, которые представляют объект. Одной из проблем является время вычислений для распознавания шаблонов.
Если мы посмотрим на рисунок выше, то обнаружим, что у нас есть несколько точек, нарисованных на двумерной плоскости. Есть два основных компонента. PC1 является основным компонентом, объясняющим максимальный контраст изображения в данных. PC2 — еще один важный компонент, ортогональный PC1.
Каковы основные компоненты АПК?
Главные компоненты представляют собой прямую линию, которая фиксирует большую часть дисперсии данных. У них есть направление и размер. Главные компоненты представляют собой ортогональные (перпендикулярные) проекции данных на пространство меньших размеров.
Теперь, когда мы немного разобрались с основами PCA, давайте взглянем на следующую тему, посвященную PCA в машинном обучении.
Многочисленные применения PCA в изучении Бога
Первоначально PCA имел множество применений, в том числе следующие:
1. В отображении нескольких данных и его размерах.
2. Используйте его, чтобы уменьшить размеры медицинских данных.
3. Используется для изменения размера изображения.
4. Используйте его в финансах для анализа данных склада и подписи его возвратов.
5. Метод помогает находить закономерности в наборе данных, содержащем высокие размерности.
Каковы этапы работы PCA?
1. Нормализация данных
Вот консолидация данных перед внедрением PCA в первую очередь. Так как это гарантирует, что каждая функция должна иметь среднее значение = 0 и дисперсию = 1.
2. Построение ковариационной матрицы
Здесь мы строим квадратную матрицу, чтобы выразить связь между двумя или более функциями в многомерном наборе данных.
3. Найдите собственные векторы и собственные значения
Теперь мы можем вычислить собственные векторы/единичные векторы и собственные значения. Собственные значения представляют собой скаляр, на который мы умножаем собственный вектор ковариационной матрицы.
Заключение
Анализ основных компонентов — это широко используемый метод обучения без учителя для уменьшения размерности. А пока мы надеемся, что эта статья поможет вам понять, что такое PCA и его применение. Я посмотрел на реализации PCA и на то, как они работают.
Мохамед Б. Махмуд. Специалист по анализу данных.