В этом посте кратко изложена статья «Методы анализа настроений на основе лексики».

Ссылка на статью: https://mitpressjournals.org/doi/abs/10.1162/COLI_a_00049

Майте Табоада, Джулиан Брук, Милан Тофилоски, Кимберли Фолл, Манфред Стеде, 2011 г., «Методы анализа настроений на основе лексикона», в журнале «Вычислительная лингвистика», том 37, выпуск 2, стр. 267–307.

В этой статье анализ тональности и расчет семантической ориентации выполняются с помощью методов, основанных на лексике. В этом исследовании проводится использование словаря, созданного вручную из определенного корпуса, и присвоение баллов семантической ориентации словам для расчета значений семантической ориентации входных предложений посредством анализа настроений. Интересно, что это исследование оказалось более успешным, чем другие в этой области, благодаря его эффективности в других наборах данных из разных тем, вызванной тщательным анализом и выравниванием слов классификатором во входных предложениях. Применяя хитрые методы, такие как использование сдвига вместо отрицания семантических оценок и ирреальное блокирование (исключение нерелевантных слов), классификатору удалось распространить свой успех в основном на другие корпуса.

Кроме того, авторы не только проверили успешность своих моделей с другими наборами тестовых данных, но и изменили свой обучающий набор данных. Тем не менее успех классификатора в основном сохранился в этой новой конфигурации. После этого они решили проверить свои обучающие данные — словарь — и присвоили баллы семантической направленности, чтобы авторы были уверены в успехе с обеих сторон работы. Для этого они воспользовались сервисом Amazon Mechanical Turk, чтобы вручную проверить свои собственные оценки семантической ориентации с учетом значений как полярности, так и силы. Таким образом, используемый словарь также проверяется людьми, что показало качество исследования в этой статье.

В заключение, как научная статья, опубликованная в 2011 году журналом MIT Press Journal — Computational Lingustics — с более чем тысячей ссылок, это исследование является одной из важных статей, которая обеспечила успешную альтернативу машинному обучению с помощью методов на основе лексики в области. обработка естественного языка, в частности расчет семантической ориентации и анализ настроений в качестве приложения-классификатора.