Что такое анализ настроений?
Вы когда-нибудь печатали положительный отзыв о своем любимом приборе и публиковали его в Интернете? Как насчет эмоционально заряженной серии твитов, критикующих качество сети быстрого питания? Нейтральный рейтинг продукта Amazon? У всех этих постов есть одна общая черта: ваши эмоции. Людям относительно легко расшифровать эмоции и контекст в тексте, хотя определенно бывают случаи, когда люди неверно истолковывают эмоции, стоящие за текстом. Если люди не всегда точны, как машины могут быть лучше?
Начнем с того, что такое текст. Текст — это просто неструктурированные данные — информация, которая не соответствует заданной модели данных или предопределенной схеме. Неструктурированные данные составляют 80–90% данных. Интернет в основном состоит из неструктурированных данных, таких как текст, видео, аудио и журналы. С другой стороны, структурированные данные — это информация, которая имеет четко определенные модели данных и типы данных, которые обычно хранятся в реляционных базах данных, легко доступных для анализа. По сравнению со структурированными данными, неструктурированные данные трудно хранить, трудно обрабатывать и трудно анализировать, так почему же расшифровка запутанного эмоционального значения текста может быть проще? Оказывается, с помощью задачи обработки естественного языка (NLP), называемой анализом настроений, машины могут определять эмоциональное содержание текста так же хорошо, а может быть, и лучше, чем люди.
При работе с текстовыми данными анализ тональности анализирует и определяет тональность и намерения, стоящие за фрагментом текста. Существуют разные подходы к анализу настроений: от моделей машинного обучения с учителем до методов на основе лексики и гибридных подходов. При использовании методов контролируемого машинного обучения s слова и предложения часто извлекаются в функции, над которыми работают модели машинного обучения. Люди помечают обучающие наборы данных правильными результатами, затем модели учатся на данных и связанных с ними классификациях и оценках. При использовании подходов, основанных на лексике (также известных как подходы, основанные на знаниях), слова в тексте помечаются как положительные или отрицательные с помощью словаря. Гибридные подходы представляют собой смесь различных подходов.
Бизнес: как настроение влияет на выбор
Компании часто обращаются к общественности, когда решают, в каком направлении двигаться с точки зрения обслуживания, рекламы, продуктов и брендинга. Например, американский бренд завтраков Aunt Jemima был переименован в Pearl Milling Company в 2021 году из-за разногласий вокруг истории названия. Негативные отзывы и пресса, объясняющие расистские архетипы, стоящие за названием и логотипом компании, привели к тому, что репутация компании и ее продукты пострадали, поэтому они изменили название своего бренда. Когда у потребителей так много покупательной способности, мнения имеют значение.
Анализ настроений также широко известен как анализ мнений. Акт интеллектуального анализа мнений может помочь организациям собирать неструктурированные данные из источников в социальных сетях и извлекать из них идеи. Компании могут использовать интеллектуальный анализ мнений для сбора информации о своем бренде, репутации и потенциальных изменениях, которые они могут внести в будущем.
Допустим, вы пишете пост в Instagram или комментируете популярный бренд печенья Oreos. Недавно они изменили свой давний и вкусный рецепт и продали эти новые печенья в продуктовые магазины. Вы разочарованы недавним изменением формулы и решаете пожаловаться на него в Интернете. Вы и все остальные, кого волнует изменение формулы, публикуйте свои мнения, будь то отрицательные, положительные или нейтральные. Затем производитель Oreo, компания Nabisco, может получить отзывы из разных веб-источников и провести анализ настроений, чтобы увидеть, было ли изменение воспринято положительно или отрицательно, а затем переоценить свои будущие усилия.
Различные типы анализа настроений
Анализ настроений можно разделить на разные категории в зависимости от того, как организация хочет интерпретировать отзывы потребителей. Существует две основные категории: крупнозернистые и мелкозернистые.
Детальный анализ тональности позволяет нам взглянуть на тональность в более широкой перспективе, где мы можем найти и расшифровать тональность на уровне всего документа или всего предложения. В крупнозернистом анализе есть два компонента: классификация субъективности и определение настроений. Классификация субъективности определяет, является ли предложение фактическим или субъективным. Обнаружение тональности определяет, имеет ли предложение тональность, и если да, то является ли она положительной или отрицательной.
С другой стороны, масштаб меньше при детальном анализе настроений. Мы пытаемся определить тему настроения на уровне подпредложения. Предложение сначала разбивается на разные релевантные части. Затем каждая часть рассматривается по отношению к другим подпредложениям, что позволяет аналитикам определить тему предложения и цель обратной связи. Это помогает компаниям понять, почему писатель выражает свое мнение определенным образом. Детальный анализ помогает нам понять полярность, которая определяет категории так, как вы часто видите в опросах, с такими уровнями, как «Очень положительно» и «Очень отрицательно».
Давайте посмотрим на пример.
- Текст: Oreo намного лучше, чем Nilla Wafers или Chips Ahoy.
- Анализ: Oreos является подлежащим в этом предложении; их сравнивают с двумя другими продуктами: Nilla Wafers и Chips Ahoy. Настроение негативное по отношению к другим продуктам из-за использования слов «намного лучше».
Вот еще один:
- Текст: Я пытался использовать кнопку отключения микрофона, но эта ужасная штука сломалась!
- Анализ. Тема – микрофон, обсуждаемая функция – кнопка отключения звука, а мнение явно негативное, поскольку потребитель описывает ее как "ужасную" и "сломанную". их функция нуждается в улучшении.
Благодаря как мелкозернистому, так и крупнозернистому анализу настроений компании могут оценивать восприятие продуктов и функций в больших масштабах.
Этика и другие вопросы
Могут возникнуть этические проблемы с предприятиями, использующими анализ настроений для финансовой и коммерческой выгоды. В то время как компании могут очень кратко сообщить вам мелким шрифтом, что ваша информация и онлайн-активность могут быть получены и проанализированы с целью получения прибыли, многие люди не подозревают, что их данные собираются. Добровольное участие и информированное согласие являются важными этическими соображениями в исследованиях, но анализ настроений иногда может стирать грань между законностью и моралью. Существует также вероятность того, что, когда анализ настроений используется крупными корпорациями для получения коммерческой выгоды, он может негативно повлиять на отдельных лиц или группы.
Обработка естественного языка и искусственный интеллект в целом могут быть особенно подвержены человеческим предубеждениям. На первый взгляд то, что машины узнают, какие слова связаны с положительными и отрицательными чувствами, может показаться достаточно невинным. Если мы посмотрим глубже, модели анализа настроений вполне могут изучить дискриминационную предвзятость на своих входных данных и могут каким-то образом распределить человеческую дискриминацию и предубеждения в свои результаты. К счастью, разрабатываются инструменты и метрики для анализа предвзятости моделей анализа настроений, чтобы люди могли выявлять и смягчать предвзятость моделей. Кроме того, машины не всегда могут быть на 100% точными при интерпретации человеческих эмоций. Машины могут не распознавать тон и сарказм в тексте, в отличие от людей, которые обычно довольно легко улавливают сарказм в тексте и речи. Можно ошибиться в чувствах и мнениях, а решения, принятые на основе неточной информации, могут иметь реальные последствия для бренда.
Анализ настроений может дать глубокое понимание мнений и чувств людей. Это позволяет специалистам по данным и аналитикам определить, отрицательно или положительно отзывается клиент о продуктах или услугах компании. Обладая этими знаниями, предприятия могут создавать стратегии, которые учитывают настроения потребителей и вносят изменения в будущее.