Научитесь выполнять анализ настроений с помощью библиотеки transformers от Hugging Face всего за 3 строчки кода с помощью Python и глубокого обучения.

Анализ настроений - это процесс определения того, является ли текст положительным, отрицательным или нейтральным. Такой анализ очень полезен при попытке извлечь полезную информацию из обзоров продуктов или услуг, отзывов клиентов и многого другого.

Во-первых, давайте установим transformers библиотеку для анализа настроений,

pip install transformers

Затем, импортируя функцию pipeline из библиотеки трансформаторов,

# Importing the pipeline function from the transformers library
from transformers import pipeline

Конвейерный метод отвечает за:

  • Предварительная обработка: преобразование исходного текста в числовой для предварительно обученной модели GPT-2.
  • Вывод модели: создание прогнозов с использованием предварительно обученной модели GPT-2.
  • Постобработка: преобразование прогноза в правильный результат.

Вызов функции конвейера, указав задачу как «анализ настроений» и модель как «distilbert-base-uncased-finetuned-sst-2-english»,

# Creating a TextClassificationPipeline for Sentiment Analysis
 
pipe = pipeline(task='sentiment-analysis', model='distilbert-base-uncased-finetuned-sst-2-english')

DistilBERT - это модель трансформеров, меньшая и более быстрая, чем BERT, которая была предварительно обучена на том же корпусе в режиме самоконтроля с использованием базовой модели BERT в качестве учителя. Это означает, что он был предварительно обучен только необработанным текстам, и никто не пометил их каким-либо образом (поэтому он может использовать много общедоступных данных) с автоматическим процессом для создания входных данных и меток из этих текстов с использованием базовой модели BERT.

Пришло время провести анализ настроений! Мы можем использовать TextClassificationPipeline, то есть pipe, следующим образом для выполнения анализа настроений:

# Analyzing sentiment
print(pipe("I like this hat."))
[{'label': 'POSITIVE', 'score': 0.9995846152305603}]

Вы хотите изучать Python, Data Science и машинное обучение во время прохождения сертификации? Вот несколько самых продаваемых курсов Udemy, на которые мы рекомендуем вам записаться:

  1. Завершите учебный лагерь по Python в 2021 году от нуля до героя на Python - уже зарегистрировано более 1 000 000 студентов!
  2. Python for Data Science and Machine Learning Bootcamp - уже зарегистрировано более 400 000 студентов!
  3. Полное руководство по TensorFlow для глубокого обучения с помощью Python - уже зарегистрировано более 90 000 студентов!
  4. Учебный курс по науке о данных и машинному обучению с R - уже записано более 70 000 студентов!
  5. The Complete SQL Bootcamp 2021: Go from Zero to Hero - уже записано более 400 000 студентов!

Отказ от ответственности: когда вы совершаете покупку по указанным выше ссылкам, мы можем получать комиссию в качестве партнера.

Первоначально опубликовано на https://www.theclickreader.com.