Построение моделей НЛП для анализа настроений с использованием Huggingface и Gradio

NLP (обработка естественного языка) – это область искусственного интеллекта, связанная с взаимодействием между компьютерами и людьми с использованием естественного языка. Он включает в себя использование методов для обработки, анализа и генерации текста и речи на человеческом языке. Это дает машинам возможность читать, понимать и извлекать смысл из человеческих языков.

Анализ настроений – это особое применение НЛП, которое включает выявление и извлечение из текста субъективной информации, например определение эмоционального тона высказывания. Его можно использовать для анализа отзывов клиентов, сообщений в социальных сетях и других форм текстовых данных, чтобы понять общественное мнение и отношение. Он использует машинное обучение и лексический анализ, чтобы классифицировать текст как положительный, отрицательный или нейтральный по настроению. Он часто используется для мониторинга социальных сетей, обслуживания клиентов и исследования рынка.

В этом проекте вы узнаете, как создать модель, которая будет классифицировать твиты, сделанные о вакцинах против COVID-19, как провакцинальные, нейтральные или антивакцинные. Мы построим 2 модели анализа настроений и сравним их эффективность. Эти модели не будут создаваться с нуля. Однако мы будем использовать предварительно обученные модели от Huggingface.

Huggingface – это платформа с открытым исходным кодом на основе искусственного интеллекта для обработки естественного языка (NLP), которая предоставляет доступ к предварительно обученным моделям, наборам данных и показателям оценки. Это позволяет разработчикам легко обучать, тестировать и развертывать модели обработки естественного языка и создавать приложения, такие как чат-боты, языковой перевод и обобщение текста. Платформа также включает в себя набор современных предварительно обученных моделей, которые можно точно настроить для различных задач НЛП, таких как анализ настроений, ответы на вопросы и генерация текста. Hugging Face также предоставляет простые в использовании инструменты для обучения, тестирования и развертывания моделей и предлагает интеграцию с популярными платформами машинного обучения, такими как TensorFlow, PyTorch и scikit-learn.

Есть несколько преимуществ использования предварительно обученных моделей из Hugging Face по сравнению с созданием модели с нуля. О преимуществах обнимания лица мы поговорим в другой статье.

Шаги, связанные с тонкой настройкой модели Hugging Face, могут различаться в зависимости от конкретного варианта использования и задачи, но общий процесс будет включать следующие шаги:

Выберите предварительно обученную модель: выберите предварительно обученную модель из библиотеки моделей Hugging Face, подходящую для вашей задачи.

Подготовьте свои данные: подготовьте помеченный набор данных для тонкой настройки. Обычно это включает предварительную обработку данных, например токенизацию и дополнение текста.

Настройте модель: настройте модель для точной настройки, указав такие параметры, как количество слоев для точной настройки, скорость обучения и размер пакета.

Обучите модель. Обучите модель на размеченных данных, указав количество эпох обучения.

Оцените модель: оцените производительность точно настроенной модели на протянутом тестовом наборе, чтобы измерить ее точность.

Сохраните и разверните модель. Сохраните настроенную модель в формате, который можно загрузить и использовать в приложении.

Дальнейшая точная настройка: при необходимости повторите шаги 4–6 с другими параметрами или с другими подмножествами данных, чтобы еще больше повысить производительность модели.

Примечание. Это общий процесс, который может различаться в зависимости от конкретного варианта использования, задачи и выбранной предварительно обученной модели.

Теперь давайте пройдем эти шаги, чтобы построить нашу модель. Для подробного объяснения и кода вы можете получить доступ к блокноту проекта здесь.

Выберите предварительно обученную модель: мы будем обучать 2 модели. Модель DistilBERT и базовая модель roBERTa. Эти модели были предварительно обучены для выполнения задачи, которую мы собираемся выполнить. Вы можете изучить хаб моделей на Huggingface для получения списка предварительно обученных моделей и задач, которые они обучены выполнять.

Подготовьте свои данные. Как мы уже говорили ранее, наши данные получены из твитов о вакцинах, собранных и классифицированных на Crowdbreaks.org. Твиты представляют собой смесь сообщений в Твиттере, связанных с прививками, которые являются положительными, нейтральными и отрицательными. Сначала мы разделили наши данные о поездах на данные обучения и оценки. Затем мы передали его через токенизатор для разбиения данных или последовательности твитов на более мелкие фрагменты, называемые токенами.

Настройка модели. Мы настраиваем наши модели, вызывая функцию AutoModelForSequenceClassification и передавая необходимые параметры. Для наших моделей мы использовали параметры по умолчанию.

Обучение модели. Сначала мы определили аргументы обучения, такие как num_train_epochs и Assessment_strategy. Мы также устанавливаем для аргумента push_to_hub значение True, чтобы наша обученная модель была отправлена в наш репозиторий с обнимающим лицом. Затем мы вызываем метод .train(), чтобы начать обучение. Обучение может занять некоторое время в зависимости от количества эпох и вашей вычислительной мощности.

Оцените модель. Для оценки мы устанавливаем для нашего параметра оценки load_metric() значение точности. Это означает, что в процессе обучения производительность модели будет измеряться тем, насколько хорошо она правильно классифицировала или предсказала результат.

После обучения наши модели показали себя неплохо. Модель DistilBERT имела показатель точности 0,753000, тогда как базовая модель roBERTa имела показатель точности 0,664000.

Важность НЛП и анализа настроений заключается в способности обрабатывать и понимать большие объемы неструктурированных текстовых данных, что является наиболее распространенным форматом, в котором доступна информация. Это позволяет организациям получать информацию из отзывов клиентов, социальных сетей и других источников для улучшения продуктов, услуг и взаимодействия с клиентами. Анализ настроений также можно использовать в различных приложениях, таких как маркетинг, обслуживание клиентов и политические кампании.

Модели Huggingface предварительно обучены, просты в использовании и обеспечивают высококачественные результаты. Они имеют большое разнообразие моделей для разных задач и регулярно пополняются новыми версиями. Они совместимы с другими библиотеками НЛП и имеют простой API для загрузки и использования моделей. Использование моделей Huggingface может сэкономить время и усилия для задач НЛП. Они обучены работе с большими наборами данных и продемонстрировали самые современные результаты в решении различных задач НЛП.

В следующем посте мы рассмотрим, как развернуть наши модели с помощью gradio, а также как сравнить результаты двух моделей с использованием одного интерфейса gradio.

смотрите также:

Новые материалы

Как проанализировать работу вашего классификатора?

Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)

Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]

Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter

Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js

Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!

Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

ИИ в аэрокосмической отрасли

Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Typescript Computer Science Data Algorithms Development NLP Tech Programming Languages CSS ChatGPT HTML Python Programming Javascript Tips Angular Computer Vision Data Visualization Neural Networks Startup Tutorial Statistics Productivity Reactjs Learning