Скорее всего, большинству из нас приходилось сталкиваться с такими терминами, модными словечками, которые часто ассоциируются со всем технологическим. Независимо от того, решаете ли вы купить новый телефон, водить новую машину или пользоваться бытовым изделием, корпорации часто используют такие термины, как «ИИ» и «работает на основе машинного обучения», в надежде поднять статус своих продуктов и оправдать их высокие цены. Тем не менее, оценка таких «умных» продуктов часто связана с производством их передового оборудования, производство которого часто довольно дорого (подробнее обсуждается в следующих главах).
Как человека, решившего сменить карьеру с операционного аналитика на дипломированного специалиста по данным, меня беспокоит, что большинство людей склонны бросаться конкретными терминами, относящимися к области, в которой я решил специализироваться, не зная, что и как они из себя представляют. Связанный. Эта статья направлена на устранение неоднозначности и разъяснение некоторых из тех терминов, которые занимают видное место в нашей повседневной жизни.
Итак, в чем разница между наукой о данных, искусственным интеллектом, машинным обучением и глубоким обучением?
Наука о данных
Наука о данных — это междисциплинарная область, в которой используются научные методы, процессы, алгоритмы и системы для извлечения знаний и идей как из структурированных, так и из неструктурированных данных.
Область науки о данных приобрела известность за последнее десятилетие, поскольку инструменты BI (Business Intelligence) боролись с внезапным притоком неструктурированных данных, поступающих из разных источников. Таким образом, требуются более совершенные инструменты и методы для обработки и анализа такой информации.
Другие варианты использования, связанные с наукой о данных, можно найти здесь.
Искусственный интеллект
Искусственный интеллект (1956 г.) — это общая концепция машин, действующих таким образом, который имитирует или имитирует человеческий интеллект. ИИ может иметь множество функций, таких как человеческое общение или принятие решений.
Применяется в следующих областях — здравоохранение, автомобилестроение, финансы, правительство, видеоигры и т. д.
Машинное обучение
Машинное обучение, основанное в 1980-х годах, является подмножеством искусственного интеллекта (ИИ) и состоит из методов, которые позволяют компьютерам разбираться в данных и предоставлять приложения ИИ (то есть способность учиться без явного программирования для этого). . Такие вещи, как распознавание изображений и извлечение смысла из текста, выполняются с помощью машинного обучения, в отличие от жестко закодированных алгоритмов и систем, основанных на правилах ИИ *ИИ имитирует поведение человека, машинное обучение имитирует действия человека и модели обучения.
Отличным примером является то, как нас учат читать. Мы начинаем с чтения простых книг, изучения конкретных правил и исключений, связанных с языком книги, а затем переходим к более сложным произведениям (романам, стихам и т. д.).
В этом заключается концепция машинного обучения — предоставить алгоритму (т. е. вашему мозгу) множество данных (правила и нормы) и позволить ему разобраться (структурировать предложение/абзац/эссе). Накормите алгоритм большим количеством данных о пациентах, сообщите ему, у каких из них был диагностирован положительный результат, и заставьте его находить конкретные индикаторы, которые могут прогнозировать медицинские результаты на основе симптомов и тестов пациентов.
Машинное обучение: нейронные сети (например, ИНС — искусственные нейронные сети)
Часто статьи, посвященные теме науки о данных, включают термин «нейронные сети», так что же такое нейронная сеть?
Это искусственная копия человеческого мозга, идея использования искусственных нейронов, соединенных синапсами, для решения сложных задач, с которыми не справились алгоритмы, — предсказания конкретных результатов на основе больших наборов данных и т. д.
Тем не менее, у машинного обучения все еще были проблемы, и оно застряло на вещах, с которыми легко справлялись дети начальной школы. Например, идентификация и дифференциация объектов — ребенок может легко распознать своего родителя (т. различение собак и волков (т. е. распознавание изображений).
Имитация процесса обучения человека с помощью алгоритмов машинного обучения имеет некоторые ограничения. Помните, что концепция машинного обучения была введена еще в 80-х, устройства имели значительно меньшую вычислительную мощность из-за ограничений хранилища и других аппаратных ограничений. В то время устройства могли запускать только простые связанные нейронные сети, которые включали максимум пару 1000 нейронов, в отличие от человеческого мозга, который имеет сложную взаимосвязанную систему из около 86 миллиардов нейронов.
Глубокое обучение
Что приводит нас к последнему подмножеству, расположенному на графике выше, глубокому обучению. Проще говоря; глубокое обучение — это современная версия машинного обучения. Новые устройства и технологии, которые позволили нам создать искусственные нейронные сети с увеличением количества нейронов, слоев и взаимосвязей.
Глубокое обучение часто упоминается в определенных темах, от автономных автомобилей до определения настроений по книгам и песням (например, анализ настроений) и так далее.
Некоторые приложения: автоматическое распознавание речи, обработка визуального искусства, обработка естественного языка, системы рекомендаций и т. д.
ПРИМЕР глубокого обучения:
Обработка естественного языка, используемая чат-ботами, помощниками по голосовому телефону и другими, является отличным методом глубокого обучения, который широко используется в последние несколько лет.
Пример НЛП в действии: представьте, что вы специалист по данным, работающий на онлайн-торговой платформе. Обработка естественного языка, или просто НЛП, может выполнять то, что известно как анализ настроений для отдельных списков акций, обеспечивая прогнозирование их эффективности. Это основано на настроении публики и стойкости определенной акции, такие действия часто фиксируются из социальных сетей и новостных сайтов. Чтобы узнать больше о том, как это делается, я настоятельно рекомендую прочитать эту статью.
Другие примеры применения глубокого обучения см. на следующей странице.
Это не означает, что глубокое обучение не имеет определенных пределов и ограничений. Письменные статьи, такие как Критическая оценка Гэри Маркуса по глубокому обучению, упоминают о проблемах, возникших в этой области, таких как аппаратные ограничения (то есть убывающая сила закона Мура) и так далее. Отличное чтение для всех, кто интересуется обнаружением определенных препятствий в области глубокого обучения.
Заключение
Я надеюсь, что эта статья внесла некоторую ясность в различные термины, часто используемые в нашей повседневной жизни. Пожалуйста, не стесняйтесь комментировать и дайте мне знать, если есть какие-либо проблемы, с которыми вы можете столкнуться при чтении этой статьи.
В следующей статье будут рассмотрены три типа машинного обучения: контролируемое, неконтролируемое и обучение с подкреплением, а также некоторый действенный код, написанный на Python.
Ссылки
- Бхарти, С. и Гита, А. (2017). Анализ настроений для эффективного прогнозирования фондового рынка. [Электронная книга] Доступно по адресу: https://www.researchgate.net/publication/317214679_Sentiment_Analysis_for_Effective_Stock_Market_Prediction.
- Джеффкок, П. (2018). В чем разница между ИИ, машинным обучением и глубоким обучением? [Блог] Доступен по адресу https://blogs.oracle.com/bigdata/difference-ai-machine-learning-deep-learning.
- Маркус, Г. (2017). Глубокое обучение: критическая оценка. [Электронная книга] Доступно по адресу: https://arxiv.org/ftp/arxiv/papers/1801/1801.00631.pdf.
- Шалф, Дж. и Леланд, Р. (2015). Вычисления за рамками закона Мура. [Электронная книга] Доступно по адресу: https://www.researchgate.net/publication/288855758_Computing_beyond_Moore's_Law [По состоянию на 8 ноября 2019 г.].
- Шарма, Х. (2019). Что такое наука о данных? Руководство для начинающих по науке о данных. [Блог] Доступен по адресу https://www.edureka.co/blog/what-is-data-science/.