Искусственный интеллект и умный дом — часть 2

Глубокое обучение

Глубокое обучение было впервые предложено Hinton et al. в 2006 году. Суть глубокого обучения заключается в искусственной нейронной сети, которая относится к набору алгоритмов, решающих различные задачи, такие как изображения и тексты, в многослойных нейронных сетях. Ядром глубокого обучения является изучение признаков, целью которого является получение информации о признаках через иерархическую сеть, чтобы решить важную проблему ручного проектирования признаков в прошлом.

Глубокое обучение — это структура, которая содержит несколько важных алгоритмов:

  • Сверточные нейронные сети (CNN)
  • Автоэнкодер
  • Разреженное кодирование
  • Ограниченная машина Больцмана (RBM)
  • Сети глубокого убеждения (DBN)
  • Рекуррентная нейронная сеть (RNN)

Глубокое обучение применяется уже 14 лет с момента выдвижения концепции. Для разных типов (изображение, голос, текст) необходимо выбирать разные модели сети для достижения наилучших результатов. Кроме того, сочетание обучения с подкреплением и глубокого обучения также дало много отличных результатов в последние годы, например, AlphaGo — один из них.

(1) Распознавание лиц

Распознавание изображений — самое популярное приложение в области глубокого обучения. Будь то глубокое обучение или другие методы машинного обучения (например, векторная машина), распознавание изображений популярно для исследований. Именно поэтому и возник конкурс ImageNet. ImageNet пригласила крупных исследователей ИИ для проверки эффектов алгоритмов, создав мощную библиотеку изображений, которая способствовала активному развитию и привела к сегодняшней области ИИ.

(2) Распознавание голоса

С тех пор, как глубокое обучение было введено в область распознавания речи в 2009 году, всего за несколько лет частота ошибок, основанная на традиционной смешанной модели Гаусса (GMM) в наборе данных TIMIT, снизилась с 21,7% до 17,9%, что привлекло широкое распространение. внимание в отрасли. GoogleNow от Google, Siri от Apple, Skype Translator от Microsoft и iFlytek — все это алгоритмы, основанные на глубоком обучении. Распознавание речи в настоящее время хорошо развито, и некоторые китайские диалекты теперь можно точно распознавать.

(3) Обработка естественного языка

Обработка естественного языка (NLP) — это предметная область, которая автоматически анализирует и характеризует естественный язык человека путем построения вычислительных алгоритмов. Обработка естественного языка имеет пять основных задач, а именно классификацию, сопоставление, перевод, прогнозирование структуры и последовательный процесс принятия решений. В этих задачах слова, фразы, предложения, абзацы и даже документы обычно обрабатываются как ряд тегов (строк), хотя сложность не одинакова.

Фактически, предложения являются наиболее широко используемой единицей обработки. Недавние исследования показали, что глубокое обучение может улучшить выполнение первых четырех задач и стало самой передовой технологией для решения этих задач.

Сегодня широко используются системы на основе НЛП, такие как мощная поисковая система Google и голосовой помощник Alexa от Amazon. Кроме того, NLP также может помочь машинам выполнять задачи, связанные со сложными естественными языками, такие как машинный перевод и создание диалогов.

Почему высококачественные обучающие данные так важны для машинного обучения ИИ?

Текущий искусственный интеллект также называют интеллектом данных. На данном этапе разработки чем больше слоев нейронной сети, тем больший объем размеченных данных требуется. Действительно, данные играют важную роль. Таким образом, все разработчики от Google и Microsoft до обычных индивидуальных разработчиков уделяют большое внимание качественному размечению данных.

В текущей практике приложений ИИ разный уровень качества данных демонстрирует ценность решений ИИ с очень очевидным разрывом. Если общие наборы данных, используемые предыдущей моделью алгоритма, представляют собой грубые зерна, то в настоящее время модель алгоритма нуждается в индивидуальной питательной еде. Если компании хотят еще больше улучшить коммерциализацию определенных моделей, они должны постепенно переходить от общего набора данных к созданию уникального.

НЛП Сервис

Мы предоставляем различные типы NLP в электронной коммерции, розничной торговле, поисковых системах, социальных сетях и т. д. Наши услуги включают голосовую классификацию, анализ настроений, распознавание текста и классификацию текста (релевантность чат-бота).

В партнерстве с более чем 30 различными языковыми сообществами по всему миру ByteBridge теперь предоставляет услуги по сбору данных и текстовым аннотациям, охватывающие такие языки, как английский, китайский, испанский, корейский, бенгальский, вьетнамский, индонезийский, турецкий, арабский, русский. и многое другое.

Конец

Передайте свои задачи по маркировке данных на аутсорсинг в ByteBridge, и вы сможете получать высококачественные обучающие наборы данных машинного обучения дешевле и быстрее!

  • Бесплатная пробная версия без кредитной карты: вы можете быстро получить образец результата, проверить результат и оставить отзыв непосредственно нашему менеджеру проекта.
  • 100% подтверждено людьми
  • Прозрачное и стандартное ценообразование: доступны четкие цены (работа включена)

Почему бы не попробовать?

Источник: https://zhuanlan.zhihu.com/p/136740483