Вы проведете анализ настроений с помощью сервисов AWS ML за считанные минуты. Никаких предварительных знаний ML не требуется.

Вы познакомитесь с AWS Athena, AWS Glue, AWS Comprehend и AWS QuickSight.

СОДЕРЖАНИЕ

Введение

Демонстрационный пример

AWS S3

Понимание AWS

Клей AWS

AWS Афина

AWS QuickSight

Заключение

ВВЕДЕНИЕ

В этом нежном вступлении мы проведем базовый анализ настроений с помощью нескольких сервисов, связанных с машинным обучением AWS.

  • Мы получим данные о клиентах из корзины S3 и проведем анализ настроений с помощью AWS Comprehend.
  • Затем мы получим схему результата файла Comprehend с помощью AWS Glue.
  • Мы сделаем базовый SQL-запрос с помощью AWS Athena.
  • Затем мы создадим базовую панель инструментов с помощью AWS QuickSight.

Мы также увидим основную информацию об этих сервисах AWS.

Давайте начнем.

ДЕМО-СЛУЧАЙ

Вы работаете специалистом по обработке и анализу данных в консалтинговой компании Z.
Магазин Blue-Green Retail Store является одним из клиентов компании Z.
У них есть многочисленные комментарии от клиентов относительно их покупок.
Магазин розничной торговли Blue-Green хочет получить некоторую информацию из этих комментариев.

Ничего сложного :)

AWS S3 — ОБЛАЧНОЕ ХРАНИЛИЩЕ ОБЪЕКТОВ

Amazon Simple Storage Service (Amazon S3) — это сервис хранения объектов, предлагающий лучшую в отрасли масштабируемость, доступность данных, безопасность и производительность. (https://aws.amazon.com/s3/)

Мы получим данные от наших клиентов.

Давайте получим данные.

Глядя на данные, мы видим комментарии клиентов к продуктам.

Давайте создадим корзину S3 и под ней создадим 4 папки.

Затем загрузите данные во входную папку.

AWS COMPREHEND — АНАЛИЗ НАСТРОЕНИЙ

«Извлекайте и понимайте ценную информацию из текста в документах».

Давайте извлечем и поймем ценную информацию из данных с помощью Comprehend.

Мы создадим задание на анализ.

Мы выберем тип анализа настроений с выбором английского языка.

Затем мы выберем местоположение данных и место вывода.

И, наконец, создайте новую роль IAM.

Через несколько минут анализ будет готов.

Давайте посмотрим детали работы.

Как видим, у нас есть место выхода для анализа. Давайте перейдем к корзине S3 и посмотрим на результат.

Давайте загрузим вывод и посмотрим, что внутри него.

ХОРОШО. У нас есть анализ настроений. Каждая строка имеет результат тональности и оценку тональности.

Мы можем перейти к SQL-запросам.

AWS GLUE — СЕРВИС БЕССЕРВЕРНОЙ ИНТЕГРАЦИИ ДАННЫХ

«AWS Glue — это бессерверный сервис интеграции данных, который упрощает обнаружение, подготовку и объединение данных для аналитики, машинного обучения и разработки приложений. AWS Glue предоставляет все возможности, необходимые для интеграции данных, поэтому вы можете начать анализировать свои данные и использовать их уже через несколько минут, а не месяцев». (www.amazon.com)

AWS Glue автоматически обнаруживает и профилирует данные с помощью каталога данных Glue. Давайте воспользуемся этой функцией и получим схему анализа настроений.

Сначала загрузите файл в папку Glue в корзине S3.

Давайте откроем Glue и добавим базу данных.

И добавьте сканер, чтобы определить схему для наших данных.

И посмотрите схему данных.

Теперь мы готовы выполнять SQL-запросы к данным.

AWS ATHENA — БЕССЕРВЕРНАЯ ИНТЕРАКТИВНАЯ СЛУЖБА ЗАПРОСОВ

«Amazon Athena — интерактивный сервис запросов, упрощающий анализ данных в Amazon S3 с помощью стандартного SQL. Athena не имеет серверов, поэтому не нужно управлять инфраструктурой, и вы платите только за те запросы, которые выполняете». (www.amazon.com)

Прежде чем делать SQL-запросы, нам нужно определить выходную папку для результатов запроса.

Используя ранее определенные базы данных и схему, мы можем выполнять SQL-запросы. Давайте посмотрим первые 10 строк наших данных.

Столбец оценки тональности нуждается в некоторых корректировках.

Намного лучше. Мы готовы получить визуализацию нашего анализа.

AWS QUICKSIGHT — СЛУЖБА БИЗНЕС-АНАЛИЗА

Мы регистрируем QuickSight и разрешаем доступ к сервисам S3 и Athena для получения данных и запросов для визуализации.

Затем мы выбираем новый анализ и для этого создаем новые наборы данных.

И выбираем стол.

И мы готовы создать нашу панель инструментов, чтобы представить ее нашим клиентам.

Вот и все.

ЗАКЛЮЧЕНИЕ

В этом руководстве мы познакомились с несколькими сервисами AWS ML.

Мы использовали AWS S3, AWS Comprehend, AWS Glue, AWS Athena и AWS QuickSight.

Вместе с ними мы провели анализ настроений и подготовили демо-дашборд.

Эта статья является частью списка AWS-ML. Другие статьи цикла вы можете найти здесь.

Я надеюсь, что это поможет.

Кстати, когда тема вам понравится, вы можете ее показать, поддержав 👏

Не стесняйтесь оставлять комментарий.

Всего наилучшего 🤘

Если вам нравится читать мой контент, подпишитесь на меня. Кроме того, вы можете поддержать других авторов и меня, подписавшись на Medium. Использование моей реферальной ссылки не будет стоить вам дополнительных денег.