WedX - журнал о программировании и компьютерных науках

Публикации по теме 'naturallanguageprocessing'


Классификатор заголовков новостей
Здесь нам дан набор данных, содержащий газетные заголовки и их категорию. Здесь существует 4 категории, а именно: бизнес, образование, медицина и технологии. Здесь вы увидите, что я использовал модуль Pickle для сохранения обученной модели для последующего использования, а также векторизатор подсчета. import pickle import pandas as pd dataset = pd.read_csv(“uci-news-aggregator.csv”) import re import nltk from nltk.corpus import stopwords from nltk.stem.porter import PorterStemmer..

Анализ информационного потока в сообществе Twitter (эго)
Тематическое моделирование для понимания информационных тем и ролей пользователей в сообществах Twitter Важное примечание: Загрузите этот файл записной книжки и откройте его в своем браузере. Это поможет вам следить за своими действиями, поскольку многие диаграммы ИНТЕРАКТИВНЫ. (Это означает, что вы можете поиграть с ними, увеличивать, уменьшать панораму, сохранять, более четко видеть надписи и т. Д.) На первом этапе этого проекта я начал с мотивации лучше понять мир..

Обработка естественного языка в действии: 10 реальных приложений НЛП
Обработка естественного языка (NLP) — это область изучения искусственного интеллекта (ИИ), которая фокусируется на взаимодействии между человеческим языком и компьютерами. Цель НЛП — научить машины понимать, интерпретировать и генерировать человеческий язык. NLP используется в самых разных приложениях, от анализа настроений в социальных сетях до чат-ботов и машинного перевода. В этой статье мы рассмотрим 10 реальных приложений НЛП и то, как они используются сегодня. 1. Анализ..

Демистификация больших языковых моделей: руководство для начинающих по пониманию ChatGPT и друзей
Начальные заметки С возвращением, Посвященный. - Если вы начинаете наше путешествие отсюда, мы ценим ваше желание отправиться в мир искусственного интеллекта. Однако для более глубокого понимания и начала вашего посвящения мы настоятельно рекомендуем вам углубиться в информацию, представленную в следующей статье: Нажмите здесь – Если вы оказались здесь после приема красной таблетки , значит, вы отправились в путь знаний и открытий. Мир ИИ и генеративного ИИ таит в себе..

Как автоматически маркировать ваши данные с помощью моделей Transformer
В то время как многие приложения используют готовые предварительно обученные модели для различных задач, таких как создание контента, ответы на вопросы или распознавание общих именованных объектов, меньше внимания уделяется созданию наборов данных для обучения, специфичных для бизнеса, которые позволяют точно настраивать большие модели для решать конкретные бизнес-задачи. Чтобы ИИ оказал реальное и долгосрочное влияние, его необходимо внедрить …

НЛП-день 4: нормализация словарного запаса может быть плохой идеей
#30DaysOfNLP НЛП-день 4: нормализация словарного запаса может быть плохой идеей Что такое сворачивание регистра, стемминг и лемматизация? Вчера мы улучшили наш словарный запас, улучшив наш токенизатор. Мы извлекли более значимые токены, учитывая знаки препинания, сокращения и даже небрежную лексику.

Команда Tax-I успешно выступила в международном конкурсе Legal-Tech
Команда Tax-I успешно приняла участие в международном конкурсе юридических и технических специалистов Команда «Налог-I» заняла третье место во втором задании международного юридико-технического конкурса по извлечению правовой информации/Entailment 2020 (COLIEE). Tax-I принял участие в конкурсе как немного аутсайдер, как один из немногих участников из частного сектора, конкурирующих с университетскими факультетами компьютерных наук из Канады, Японии и других стран. Несмотря на это, наши..

Новые материалы

Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..


Для любых предложений по сайту: wedx@cp9.ru