Я начал свое путешествие в колледже с большим интересом к изучению того, как работает мозг, и закончил изучением биологии с упором на неврологию. Я узнал о том, как устроен мозг, как устроены нейроны и как они взаимодействуют друг с другом, посылая сигналы по всему телу. Изучение всей этой информации было очень приятно для меня, но только до этого момента. Я проводил исследования, чтобы узнать, как функционируют определенные части мозга, но быстро потерял интерес к работе. Это больше не возбуждало. Я переключился с изучения биологии на изучение программирования и недавно открыл для себя мир машинного обучения и нейронных сетей. Как ЗАВОРАЖИВАЕТСЯ! Мои знания в области нейронауки, возможно, не так уж полезны для понимания математики реализации нейронной сети и понимания того, как работает машинное обучение, но они определенно заинтриговали меня и увлекли понимание того, как эти две вещи работают и идут рука об руку. рука. Итак, я попытаюсь объяснить, что такое нейронная сеть.

Так выглядит нейрон в биологии.

Так выглядит нейрон, являющийся частью нейронной сети. Они очень похожи на меня, так что я думаю, что моя неврология должна быть перенесена. Хотел бы я, чтобы это работало именно так. Но я готов потратить время на изучение структуры этого конкретного нейрона. Нейрон в нейронной сети получает входные данные, которые могут быть изображениями или аудиофайлами для сложной нейронной сети. Эти входные данные представляют собой либо исходное изображение или аудиофайл, либо «увеличенную» часть исходного изображения/аудиофайла, созданного предыдущим нейроном. Каким бы ни был вход, он затем направляется к функции активации нейрона. Эта функция активации определяется создателем нейронной сети, вами или мной, и производит конечный результат работы нейрона. В зависимости от функции активации нейрон получает другое имя, связанное с ним. Одним из них является ReLU, что означает выпрямленную линейную единицу. Нейрон ReLU полезен для лучшего обучения более глубоких нейронных сетей, но подробнее об этом в отдельной статье блога.

ЧТО ТАКОЕ КРУГИ И ЛИНИИ? Кружки — это нейроны, а линии соединяют один нейрон с другим типом нейрона, так что вход одного нейрона в конечном итоге проходит через множество различных функций активации, которые дополнительно анализируют и разлагают исходный вход!

Входной слой самый простой для понимания. На диаграмме выше есть скрытые слои, которые дополнительно анализируют ввод. Чем больше скрытых слоев имеет нейронная сеть, тем более точными будут выходные данные нейронной сети. Эти скрытые слои имеют разные имена в зависимости от математических функций, которые они выполняют. Существуют сверточные слои, которые в основном используются для анализа изображений и аудиофайлов (для классификации изображений и анализа аудио), объединяющие слои, которые используются для уменьшения количества параметров, применяемых к выходным данным, чтобы сеть и вычисления НАМНОГО быстрее и полностью подключенный слой, который занимается обучением нейронной сети для получения более качественных и надежных результатов.

В будущем я углублюсь в то, как работает каждая часть нейронной сети!