Вы проведете анализ настроений с помощью сервисов AWS ML за считанные минуты. Никаких предварительных знаний ML не требуется.
Вы познакомитесь с AWS Athena, AWS Glue, AWS Comprehend и AWS QuickSight.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
В этом нежном вступлении мы проведем базовый анализ настроений с помощью нескольких сервисов, связанных с машинным обучением AWS.
- Мы получим данные о клиентах из корзины S3 и проведем анализ настроений с помощью AWS Comprehend.
- Затем мы получим схему результата файла Comprehend с помощью AWS Glue.
- Мы сделаем базовый SQL-запрос с помощью AWS Athena.
- Затем мы создадим базовую панель инструментов с помощью AWS QuickSight.
Мы также увидим основную информацию об этих сервисах AWS.
Давайте начнем.
ДЕМО-СЛУЧАЙ
Вы работаете специалистом по обработке и анализу данных в консалтинговой компании Z.
Магазин Blue-Green Retail Store является одним из клиентов компании Z.
У них есть многочисленные комментарии от клиентов относительно их покупок.
Магазин розничной торговли Blue-Green хочет получить некоторую информацию из этих комментариев.
Ничего сложного :)
AWS S3 — ОБЛАЧНОЕ ХРАНИЛИЩЕ ОБЪЕКТОВ
Amazon Simple Storage Service (Amazon S3) — это сервис хранения объектов, предлагающий лучшую в отрасли масштабируемость, доступность данных, безопасность и производительность. (https://aws.amazon.com/s3/)
Мы получим данные от наших клиентов.
Давайте получим данные.
Глядя на данные, мы видим комментарии клиентов к продуктам.
Давайте создадим корзину S3 и под ней создадим 4 папки.
Затем загрузите данные во входную папку.
AWS COMPREHEND — АНАЛИЗ НАСТРОЕНИЙ
«Извлекайте и понимайте ценную информацию из текста в документах».
Давайте извлечем и поймем ценную информацию из данных с помощью Comprehend.
Мы создадим задание на анализ.
Мы выберем тип анализа настроений с выбором английского языка.
Затем мы выберем местоположение данных и место вывода.
И, наконец, создайте новую роль IAM.
Через несколько минут анализ будет готов.
Давайте посмотрим детали работы.
Как видим, у нас есть место выхода для анализа. Давайте перейдем к корзине S3 и посмотрим на результат.
Давайте загрузим вывод и посмотрим, что внутри него.
ХОРОШО. У нас есть анализ настроений. Каждая строка имеет результат тональности и оценку тональности.
Мы можем перейти к SQL-запросам.
AWS GLUE — СЕРВИС БЕССЕРВЕРНОЙ ИНТЕГРАЦИИ ДАННЫХ
«AWS Glue — это бессерверный сервис интеграции данных, который упрощает обнаружение, подготовку и объединение данных для аналитики, машинного обучения и разработки приложений. AWS Glue предоставляет все возможности, необходимые для интеграции данных, поэтому вы можете начать анализировать свои данные и использовать их уже через несколько минут, а не месяцев». (www.amazon.com)
AWS Glue автоматически обнаруживает и профилирует данные с помощью каталога данных Glue. Давайте воспользуемся этой функцией и получим схему анализа настроений.
Сначала загрузите файл в папку Glue в корзине S3.
Давайте откроем Glue и добавим базу данных.
И добавьте сканер, чтобы определить схему для наших данных.
И посмотрите схему данных.
Теперь мы готовы выполнять SQL-запросы к данным.
AWS ATHENA — БЕССЕРВЕРНАЯ ИНТЕРАКТИВНАЯ СЛУЖБА ЗАПРОСОВ
«Amazon Athena — интерактивный сервис запросов, упрощающий анализ данных в Amazon S3 с помощью стандартного SQL. Athena не имеет серверов, поэтому не нужно управлять инфраструктурой, и вы платите только за те запросы, которые выполняете». (www.amazon.com)
Прежде чем делать SQL-запросы, нам нужно определить выходную папку для результатов запроса.
Используя ранее определенные базы данных и схему, мы можем выполнять SQL-запросы. Давайте посмотрим первые 10 строк наших данных.
Столбец оценки тональности нуждается в некоторых корректировках.
Намного лучше. Мы готовы получить визуализацию нашего анализа.
AWS QUICKSIGHT — СЛУЖБА БИЗНЕС-АНАЛИЗА
Мы регистрируем QuickSight и разрешаем доступ к сервисам S3 и Athena для получения данных и запросов для визуализации.
Затем мы выбираем новый анализ и для этого создаем новые наборы данных.
И выбираем стол.
И мы готовы создать нашу панель инструментов, чтобы представить ее нашим клиентам.
Вот и все.
ЗАКЛЮЧЕНИЕ
В этом руководстве мы познакомились с несколькими сервисами AWS ML.
Мы использовали AWS S3, AWS Comprehend, AWS Glue, AWS Athena и AWS QuickSight.
Вместе с ними мы провели анализ настроений и подготовили демо-дашборд.
Эта статья является частью списка AWS-ML. Другие статьи цикла вы можете найти здесь.
Я надеюсь, что это поможет.
Кстати, когда тема вам понравится, вы можете ее показать, поддержав 👏
Не стесняйтесь оставлять комментарий.
Всего наилучшего 🤘
Если вам нравится читать мой контент, подпишитесь на меня. Кроме того, вы можете поддержать других авторов и меня, подписавшись на Medium. Использование моей реферальной ссылки не будет стоить вам дополнительных денег.