Что такое трансферное обучение?

Проще говоря, трансферное обучение использует алгоритм, который уже был обучен для решения другой, но связанной проблемы. Мы пытаемся использовать то, что уже узнали, чтобы помочь нашему алгоритму легче обобщать отношения между данными. Вместо того, чтобы обучать алгоритм с нуля на том, что данных может быть недостаточно для получения хорошего прогноза, почему бы не использовать алгоритм, который уже был предварительно обучен на миллионах изображений?

Как это делается? Веса.

Слои в нейронных сетях предназначены для поиска различных характеристик. Как правило, начальные слои ищут в изображениях более общую информацию, а более поздние слои ищут более отличительные характеристики. В трансферном обучении мы хотим воспользоваться моделью, которая уже обучена распознавать обобщения изображения. Это означает, что мы, как правило, переобучаем только последние слои нейронной сети для удовлетворения потребностей нашей конкретной бизнес-задачи (используя новые обучающие данные).

Чем это может помочь?

Трансферное обучение имеет много преимуществ. Среди наиболее примечательных — его способность экономить время на обучении, снижать затраты ресурсов и избегать неэффективных моделей из-за отсутствия достаточного количества данных. Если вы похожи на меня и не можете перестать думать о том, как это можно применить на практике, ознакомьтесь с этим сообщением в блоге автора Деррика Мвити с сайта neptune.ai.

Дополнительные источники для дальнейшего чтения:

https://builtin.com/data-science/transfer-learning