Практические задачи, математика и искусственный интеллект

В конце первого поста я написал, что дальше мы будем изучать базовую нейронную сеть, но позже я понял, что должен быть другой раздел, в котором искусственный интеллект обсуждается с математической точки зрения. Это тема этого небольшого раздела, за которым последует сообщение о перцептронах.

Способность формулировать проблему в форме уравнений в голове, на листе бумаги или в компьютере позволяет нам искать решения и переводить их в действия в реальном мире. Если бросить мяч в вакууме, есть решение в закрытом виде:

что позволяет вам предвидеть положение мяча в любой момент в будущем в зависимости от начальных условий и предпринимать действия, основанные на этих знаниях.

Многие общие практические случаи - это проблемы, которые описываются хорошо известными уравнениями, но не имеют решения в замкнутой форме, например x (t) = f (начальные условия), потому что эволюция системы во времени и взаимодействие между ее компонентами слишком сложны для решения или потому, что эти уравнения зависят от данных, которые частично неизвестны. Назову несколько примеров:

Допустим, вы хотите запустить спутник на орбиту вокруг Земли и хотите жестко запрограммировать команды управления ракетой перед запуском. Теоретически вы могли бы это сделать, потому что движение вашей ракеты описывается хорошо известными уравнениями классической механики, термодинамики расширяющегося топлива и аэродинамики. Но на практике мы не знаем, как полностью выразить позицию ракеты, просто используя начальные условия. По этой причине мы задаем ему запрограммированную траекторию, но также оснащаем его дорогими датчиками (IMU - блок инерциальной навигации и другие типы), чтобы иметь точные измерения, на которые автомобиль может реагировать, управляя рулем.
Определить качество антенны только по ее форме и материалам, из которых она сделана, - непростая задача, которую можно решить, просто решив набор уравнений, даже несмотря на то, что теория электромагнетизма сформулирована очень хорошо. Когда форма становится неправильной, очень быстро становится невозможно точно решить уравнения, и нам нужно либо аппроксимировать части антенны как« блоки , взаимодействующие друг с другом», либо смоделировать волну, проходящую через антенну, решить для определенного момента в время, постепенно увеличивая время и снова решая уравнения. - Более сложная версия проблемы - которая подводит нас к третьему типу проблем, когда у вас есть набор ограничений для антенны, скажем так, производительности. в заданном диапазоне частот, размеров, материала и т. д., и вам нужно придумать дизайн. Можете ли вы сформулировать мыслительный процесс?

Тем не менее, третья область практических проблем - это те, которые, как мы знаем, могут быть представлены в виде некоторого набора уравнений и даже могут быть решены (потому что мы продолжаем их решать, не задумываясь об этом), но не имеем идея, что это за уравнения.

Определение того, принадлежит ли лицо на фотографии вашему другу или объект перед вами - лошадь,
Определение рукописных цифр в почтовом индексе для сортировки,
Как найти лучший перевод абзаца с английского на французский
Формулировка правил, позволяющих двуногому роботу ходить. Трудно сформулировать точное движение и реакцию, требуемые каждую секунду, учитывая точную позу, скорость и местность, а также поддержание баланса при этом! И мы, люди, делаем это от рождения!
Разработка новой антенны с учетом ряда ограничений.

Я должен сказать, что успешное решение таких задач не ограничивается людьми. Каждый живой организм реагирует на сенсорные стимулы, которые он получает из окружающей среды, и модель реакции на стимулы быстро становится слишком сложной, чтобы мы могли полностью сформулировать ее в виде уравнений.

Введите AI.

Суть алгоритмов искусственного интеллекта заключается в способности найти - а затем решить - приближенное уравнение для тех проблем, для которых мы не можем сформулировать уравнение. Во многих подходах к ИИ мы создаем целевую функцию (другое название - функция потерь), которая минимизируется, когда наш алгоритм ИИ работает хорошо, а цель этапа обучения - найти глобальный минимум этой целевой функции без явного решения исходной системы уравнений проблема, поскольку она (и останется) неизвестной.

Благодаря вычислительной мощности современных компьютеров мы можем создавать модели, которые достаточно богаты параметрами (некоторые нейронные сети компьютерного зрения имеют миллиарды параметров), чтобы они могли аппроксимировать чрезвычайно сложные уравнения, то есть обнаруживать отношения между различными функциями на входе, которые влияют на результат. В нейронных сетях эти отношения устанавливаются на этапе обучения модели ИИ. Этап обучения разработан таким образом, чтобы дать ИИ-модели положительную обратную связь, когда она работает правильно, и отрицательную, когда она совершает ошибку, и эта обратная связь приводит к изменению параметров модели, подталкивая ее к лучшей работе в следующая итерация. Считается, что модель ИИ хорошо обучена, если она способна обобщать - то есть правильно решать не только те самые случаи, которые были представлены ей во время обучения, но также и другие случаи, с которыми он никогда раньше не сталкивался. Когда он это делает, это означает, что он действительно обнаружил глубокие взаимосвязи между различными функциями в данных, которые важны для (неизвестной) точной функции, описывающей проблему.

смотрите также:

Новые материалы

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

ИИ в аэрокосмической отрасли

Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Data Visualization Neural Networks Startup Tutorial Statistics Productivity Reactjs Learning