WedX - журнал о программировании и компьютерных науках

Публикации по теме 'data-science'


Токсичность при создании текста AI
Токсичность при создании текста AI Почему языковые модели генерируют токсичные результаты и что с этим можно сделать Недавно я реализовал небольшой проект НЛП, в котором я задал двум чат-ботам с открытым доменом 36 вопросов, чтобы влюбиться . То, что начиналось как развлечение, привлекло мое внимание к проблеме токсичности при создании текста ИИ . Сначала я задал языковой модели (LM) GPT-2 36 вопросов. Но я был шокирован некоторыми ответами модели, которые содержали ненавистные и..

Использование науки о данных и машинного обучения для личного и делового роста
С развитием технологий компании разрабатывают способы использования данных для увеличения своего бизнеса и личного роста. Цифровизация сделала нашу жизнь более удобной, чем когда-либо прежде. Наличие онлайн-информации дало нам доступ к огромному количеству данных, которые компании могут использовать по-новому для стимулирования роста бизнеса. В этом сообщении блога вы узнаете о важности использования науки о данных и машинного обучения для личного и делового развития. Наука о данных —..

Прогнозирование временных рядов с экспоненциальным сглаживанием линейного тренда Холта
Компенсация тренда в моделях экспоненциального сглаживания Фон В моем предыдущем посте мы представили идею экспоненциального сглаживания для построения моделей прогнозирования. Суть экспоненциального сглаживания заключается в том, чтобы придать больший вес недавним наблюдениям и меньший вес, экспоненциально, более историческим. Первой моделью, которую мы представили, было простое экспоненциальное сглаживание. Простая часть относится к модели, не учитывающей тренд или..

Четыре политических класса обучения с подкреплением
Четыре политических класса обучения с подкреплением Исчерпывающая классификация стратегий решения для обучения с подкреплением Политика обучения с подкреплением (RL) окутана определенной мистикой. Проще говоря, политика π: s → a - это любая функция, которая возвращает возможное действие для проблемы. Ни меньше, ни больше. Например, вы можете просто выполнить первое действие, которое придет в голову, выбрать действие наугад или запустить эвристику. Однако то, что делает RL..

6 инструментов для парсинга, которые упрощают сбор данных
Первый шаг любого проекта в области науки о данных - это сбор данных. Ни один проект по науке о данных не обходится без данных; Я даже могу утверждать, что вы не можете сказать «наука о данных» без данных. Часто в большинстве проектов по науке о данных данные, которые необходимо анализировать и использовать для построения моделей машинного обучения, хранятся где-то в базе данных. Иногда это где-то бывает в Интернете. Вы можете собирать данные с определенной веб-страницы об..

Криминальные хроники: изучение закономерностей и тенденций в Сан-Франциско | Картик Маханкали
Введение Сан-Франциско, оживленный коммерческий и финансовый центр, столкнулся с серьезными проблемами из-за тревожного роста числа бездомных. С 2017 года к ним присоединилось почти 7000 человек, и проблемы с психическими заболеваниями и зависимостью способствовали эскалации преступной деятельности. Пандемия еще больше усугубила бедность и безработицу, что может повлиять на уровень преступности в городе. Современный сценарий преступления в Сан-Франциско — сложная и многогранная тема,..

Как машинное обучение и глубокое обучение облегчают обнаружение болезни Альцгеймера, часть 2 (нейронаука…
Сеть кодировщиков мозга, встроенная в Behavior Score, для улучшенной классификации болезни Альцгеймера с использованием фМРТ в состоянии покоя (arXiv) Автор: Вань-Тин Се , Джереми Лефорт-Беснард , Хао-Чунь Ян , Ли-Вэй Куо , Чи-Чунь Ли . Резюме: Возможность точного выявления начала деменции имеет важное значение в лечении заболевания. Клинически диагноз пациентов с болезнью Альцгеймера (БА) и легкими когнитивными нарушениями (УКН) основан на комплексной оценке психологических..

Новые материалы

Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..


Для любых предложений по сайту: [email protected]