Что означает слово «поддержка» в контексте машины опорных векторов, которая представляет собой модель обучения с учителем?
Что означает поддержка в машине опорных векторов?
Ответы:
Скопировано из Википедии:
Гиперплоскость с максимальным запасом и поля для SVM, обученного с образцами из двух классов. Образцы на границе называются опорными векторами.
В SVM результирующая разделяющая гиперплоскость приписывается подмножеству векторов признаков данных (т. Е. Тем, у которых связанные с ними множители Лагранжа больше 0). Эти векторы признаков были названы опорными векторами, потому что интуитивно можно было сказать, что они «поддерживают» разделяющую гиперплоскость, или вы могли сказать, что для разделяющей гиперплоскости опорные векторы играют ту же роль, что и опоры здания.
Теперь формально, перефразируя книгу Бернхарда Шолкопфа и Александра Дж. Смола под названием «Обучение с ядрами», стр. 6:
«В процессе поиска уникальной оптимальной гиперплоскости мы рассматриваем гиперплоскости с нормальными векторами w, которые могут быть представлены в виде общих линейных комбинаций (т. е. с неравномерными коэффициентами) тренировочных шаблонов. Например, мы можем захотеть устранить влияние паттернов, находящихся очень далеко от границы решения, либо потому, что мы ожидаем, что они не улучшат ошибку обобщения функции решения, либо потому, что мы хотели бы уменьшить вычислительные затраты на оценку функции решения. плоскость будет зависеть только от подмножества тренировочных шаблонов, называемых опорными векторами».
То есть разделяющая гиперплоскость зависит от этих векторов признаков обучающих данных, они на нее влияют, она на них основана, следовательно, они ее поддерживают.
В пространстве ядра самый простой способ представить разделяющую гиперплоскость — это расстояние до экземпляров данных. Эти экземпляры данных называются «векторами поддержки».
Пространство ядра может быть бесконечным. Но пока вы можете вычислить сходство ядра с опорными векторами, вы можете проверить, на какой стороне гиперплоскости находится объект, не зная фактического вида этой бесконечномерной гиперплоскости.
В 2D вы, конечно, могли бы просто составить уравнение для гиперплоскости. Но это не дает никаких реальных преимуществ, кроме понимания SVM.