Глубокие нейронные сети. Упражняться. Часть 1.

Руководство по машинному обучению и анализу данных от А до Я.

Сообщите нам, если вас интересует разработка программного обеспечения для блокчейн и финтех, или просто скажите Привет в Pharos Production Inc.

В предыдущих двух статьях мы рассмотрели базовую теорию DNN - градиентный спуск, прямое и обратное распространение ошибки и еще несколько. На этот раз мы реализуем всю эту теорию с помощью Python.

Этот материал основан на Udacity Self-Driving Car Engineer Nanodegree - совершенно потрясающем учебном материале. Я очень рекомендую записаться на их курсы прямо сейчас. PS: Нет, мне не заплатили :)

Подготовить

Начнем с импортированных библиотек и подготовки данных. Мы будем использовать numpy, Boston House-price Dataset (регрессия) из SciKitLearn и пару для утилит переупорядочивания данных - перемешать и пересчитать.

SKLearn уже приготовил для нас два набора:

‘data’ - данные для изучения
‘target’ - цели регрессии

Затем мы нормализуем данные - приводим значения к условно общему масштабу. Мы используем здесь стандартный балл, потому что популяция известна, она хорошо работает для нормально распределенных популяций.

Затем мы берем объекты из массива. X_.shape показывает (506, 13). Итак, у нас есть 13 функций и 506 обучающих выборок. Также мы определяем 10 перцептронов в скрытом слое. Затем мы должны инициализировать веса со случайным равномерным распределением значений и смещения нулями. W и b с индексом 1 - это веса и смещения между входным и скрытым слоем, с индексом 2 - между скрытым слой и вывод.

Затем мы определяем входные данные и объединяем их в словарь. Кроме того, мы должны определить гиперпараметры нашей сети, где m - это количество выборок, а steps_per_epoch - количество раз, когда мы выполняем пакетную выборку входных данных. данные в расчете на каждую эпоху.

Определим основные операции. Все они мы рассмотрели в предыдущих статьях. Итак, все они известны, кроме топологической_сортировки. Топологическая сортировка, ну, предполагая, что все операции выполняются как Направленный ациклический граф и операции сортировки по порядку в соответствии с алгоритмом Кана.

Последняя часть представляет собой самостоятельный расчет. Мы запускаем несколько эпох каждый раз при вычислении потерь и новых весов и смещений. Мы случайным образом разбиваем образцы на партии. Затем запустите прямое и обратное распространение, вычислите стохастический градиентный спуск, а затем потери . С каждым разом потеря становится все меньше и меньше.

Стохастический градиентный спуск

Его реализация довольно проста.

Прямое и обратное распространение

Мы определяем прямые и обратные свойства в каждом узле, поэтому они различны для каждой операции. Например, прямая опора не реализована во входном узле.

Топологическая сортировка

Алгоритм Кана:

Инициализировать отсортированный список пустым, а счетчик - 0
Вычислить степени всех узлов
Хранить все узлы со степенью 0 в очереди
Пока очередь не пуста
Возьмите узел U и поместите его в отсортированный список. Увеличьте счетчик.
Для всех ребер (U, V) уменьшите степень V и поместите V в очередь, если обновленная степень равна 0.
Если счетчик не равен количеству узлов, происходит цикл.

Среднеквадратичная ошибка

Сигмоид (логистическая функция)

Линейное преобразование

Входной узел

Посмотри. Входной узел не имеет прямого метода, потому что вперед нечего делать, но обратный метод содержит градиенты.

Узел

И последний - родительский класс всех узлов. Он содержит интерфейс для всех дочерних классов. Мы инициализируем каждый класс списком входов, пустым значением и пустыми выходными узлами. Когда мы связываем узел со входами, мы перебираем их, добавляя текущий узел к их выходам.

Сделанный

Вы можете найти весь исходный код в нашем Github Repo.

Спасибо за чтение!

смотрите также:

Новые материалы

Объяснение документов 02: BERT

BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Startup Data Visualization Neural Networks Tutorial Statistics Productivity Reactjs Learning