ОСНОВНАЯ МАТЕМАТИКА ДЛЯ НАУКИ ДАННЫХ
Основы математики для науки о данных: введение в системы линейных уравнений
Понимать и визуализировать изображение строк и столбцов систем линейных уравнений
В этой статье вы сможете использовать то, что вы узнали о векторах (см. Здесь), матрицах (см. Здесь) и линейных преобразованиях (здесь). Это позволит вам преобразовывать данные в системы линейных уравнений. Вы также можете посмотреть Основы математики для науки о данных, чтобы узнать, как можно использовать системы уравнений и линейную алгебру для решения задачи линейной регрессии.
Линейные уравнения - это формализация взаимосвязи между переменными. Возьмем пример линейной связи между двумя переменными x и y, определяемую следующим уравнением:
Вы можете представить эти отношения в декартовой плоскости:
Помните, что каждая точка на линии соответствует решению этого уравнения: если вы замените x и y координатами точки на прямой в этом уравнении, равенство доволен. Это означает, что существует бесконечное количество решений (каждая точка в строке).
Также можно рассматривать более одного линейного уравнения с использованием одних и тех же переменных: это система уравнений.
Система линейных уравнений
Система уравнений - это набор уравнений, описывающих взаимосвязь между переменными. Например, давайте рассмотрим следующий пример:
У вас есть два линейных уравнения, и оба они характеризуют взаимосвязь между переменными x и y. Это система с двумя уравнениями и двумя переменными (в данном контексте также называемыми неизвестными).
Вы можете рассматривать системы линейных уравнений (каждую строку системы) как несколько уравнений, каждое из которых соответствует строке. Это называется изображением строки.
Вы также можете рассматривать систему как разные столбцы, соответствующие коэффициентам, масштабирующим переменные. Это называется изображением столбца. Давайте посмотрим на эти две фотографии подробнее.
Изображение строки
При изображении строки каждая строка системы соответствует уравнению. В предыдущем примере есть два уравнения, описывающие связь между двумя переменными x и y.
Представим два уравнения графически:
Наличие более одного уравнения означает, что значения x и y должны удовлетворять большему количеству уравнений. Помните, что x и y из первого уравнения совпадают с x и y из второго уравнения. .
Все точки на синей линии удовлетворяют первому уравнению, а все точки на зеленой линии удовлетворяют второму уравнению. Это означает, что только точка на обеих линиях удовлетворяет двум уравнениям. Система уравнений решается, когда x и y принимают значения, соответствующие координатам пересечения линий.
В этом примере эта точка имеет координату x 0,8 и координату y 2,6. Если вы замените эти значения в системе уравнений, у вас будет:
Это геометрический способ решения системы уравнений. Линейная система решена для x = 0,8 и y = 2,6.
Изображение столбца
Просмотр системы в виде столбцов называется изображением столбца: вы рассматриваете свою систему как неизвестные значения (x и y), которые масштабируют векторы.
Чтобы лучше это увидеть, давайте изменим уравнения так, чтобы переменные были с одной стороны, а константы - с другой. Во-первых, у вас есть:
а для второго:
Теперь вы можете написать систему как:
Теперь вы можете посмотреть на рисунок 3, чтобы увидеть, как преобразовать два уравнения в одно векторное уравнение.
Справа на рисунке 3 представлено векторное уравнение. Слева есть два вектора-столбца, а справа - один вектор-столбец. Как вы видели в Essential Math for Data Science, это соответствует линейной комбинации следующих векторов:
а также
С помощью изображения столбца вы заменяете несколько уравнений одним векторным уравнением. В этой перспективе вы хотите найти линейную комбинацию левых векторов, которая дает вам правый вектор.
Решение на картинке в столбце такое же. Рисунки в виде строк и столбцов - это всего лишь два разных способа рассмотрения системы уравнений:
Это работает: вы получите вектор правой стороны, если воспользуетесь геометрическим решением, найденным вами.
Представим систему уравнений как линейную комбинацию векторов. Возьмем снова предыдущий пример:
На рисунке 4 показано графическое представление двух векторов с левой стороны (векторы, которые вы хотите объединить, на картинке синим и красным) и вектора с правой стороны уравнения (вектор, который вы хотите объединить). получить из линейной комбинации, выделенной зеленым цветом на картинке).
Вы можете видеть на рисунке 4, что вы можете достичь вектора правой стороны, комбинируя векторы левой стороны. Если вы масштабируете векторы со значениями 2,6 и 0,8, линейная комбинация приведет вас к вектору в правой части уравнения.
Количество решений
В некоторых линейных системах нет единственного решения. Фактически линейные системы уравнений могут иметь:
- Нет решения.
- Одно решение.
- Бесконечное количество решений.
Давайте рассмотрим эти три возможности (с изображением строки и изображения столбца), чтобы увидеть, как невозможно для линейной системы иметь более одного решения и менее чем бесконечное число решений.
Возьмем следующую линейную систему уравнений, по-прежнему с двумя уравнениями и двумя переменными:
Начнем с представления этих уравнений:
Как вы можете видеть на рисунке 5, нет точки, которая бы находилась одновременно на синей и зеленой линиях. Это означает, что эта система уравнений не имеет решения.
Вы также можете графически понять, почему нет решения, через изображение в столбце. Запишем систему уравнений следующим образом:
Записав его как линейную комбинацию векторов-столбцов, вы получите:
На рисунке 6 показаны векторы-столбцы системы. Вы можете видеть, что невозможно достичь конечной точки зеленого вектора, комбинируя синий и красный векторы. Причина в том, что эти векторы линейно зависимы (подробнее в Essential Math for Data Science). Вектор, которого нужно достичь, находится за пределами диапазона векторов, которые вы объединяете.
Вы можете столкнуться с другой ситуацией, когда система имеет бесконечное количество решений. Рассмотрим следующую систему:
Поскольку уравнения одинаковы, бесконечное количество точек находится на обеих прямых и, следовательно, существует бесконечное количество решений для этой системы линейных уравнений. Это, например, аналогично случаю с одним уравнением и двумя переменными.
С точки зрения изображения столбца у вас есть:
и с векторным обозначением:
На рисунке 8 графически представлены соответствующие векторы. Вы можете видеть, что существует бесконечное количество способов достичь конечной точки зеленого вектора с комбинациями синего и красного векторов.
Поскольку оба вектора идут в одном направлении, существует бесконечное количество линейных комбинаций, позволяющих достичь вектора правой стороны.
Резюме
Подводя итог, у вас может быть три возможных ситуации, показанных двумя уравнениями и двумя переменными на рисунке 9.
Невозможно, чтобы две линии пересекались более одного раза и менее бесконечного числа раз.
Принцип верен для большего количества размеров. Например, с тремя плоскостями в ℝ³, по крайней мере, две могут быть параллельны (без решения), три могут пересекаться (одно решение) или три могут накладываться друг на друга (бесконечное количество решений).
Представление линейных уравнений матрицами.
Теперь, когда вы можете писать векторные уравнения, используя изображение столбца, вы можете пойти дальше и использовать матрицу для хранения векторов столбцов.
Возьмем снова следующую линейную систему:
Вы можете увидеть в Essential Math for Data Science, что вы можете записывать линейные комбинации как произведение матрицы и вектора. Матрица соответствует двум конкатенированным векторам-столбцам из левой части:
И вектор соответствует коэффициентам, взвешивающим векторы-столбцы матрицы (здесь x и y):
Ваша линейная система становится следующим матричным уравнением:
Это приводит к следующим обозначениям, широко используемым для записи линейных систем:
Ax = b
с A матрицей, содержащей векторы-столбцы, x вектором коэффициентов и b получившийся вектор, который мы назовем целевым вектором. Это позволяет вам перейти от исчисления, где уравнения рассматриваются отдельно, к линейной алгебре, где каждая часть линейной системы представлена в виде векторов и матриц. Эта абстракция очень мощная и позволяет использовать теорию векторного пространства для решения систем линейных уравнений.
С помощью изображения столбца вы хотите найти коэффициенты линейной комбинации векторов столбцов в левой части уравнения. Решение существует только в том случае, если целевой вектор находится в пределах их диапазона.
Этот пост представляет собой образец моей книги Essential Math for Data Science!
Получите книгу здесь: https://www.essentialmathfordatascience.com/