Публикации по теме 'data-science'
Токсичность при создании текста AI
Токсичность при создании текста AI
Почему языковые модели генерируют токсичные результаты и что с этим можно сделать
Недавно я реализовал небольшой проект НЛП, в котором я задал двум чат-ботам с открытым доменом 36 вопросов, чтобы влюбиться . То, что начиналось как развлечение, привлекло мое внимание к проблеме токсичности при создании текста ИИ . Сначала я задал языковой модели (LM) GPT-2 36 вопросов. Но я был шокирован некоторыми ответами модели, которые содержали ненавистные и..
Использование науки о данных и машинного обучения для личного и делового роста
С развитием технологий компании разрабатывают способы использования данных для увеличения своего бизнеса и личного роста. Цифровизация сделала нашу жизнь более удобной, чем когда-либо прежде. Наличие онлайн-информации дало нам доступ к огромному количеству данных, которые компании могут использовать по-новому для стимулирования роста бизнеса. В этом сообщении блога вы узнаете о важности использования науки о данных и машинного обучения для личного и делового развития. Наука о данных —..
Прогнозирование временных рядов с экспоненциальным сглаживанием линейного тренда Холта
Компенсация тренда в моделях экспоненциального сглаживания
Фон
В моем предыдущем посте мы представили идею экспоненциального сглаживания для построения моделей прогнозирования. Суть экспоненциального сглаживания заключается в том, чтобы придать больший вес недавним наблюдениям и меньший вес, экспоненциально, более историческим.
Первой моделью, которую мы представили, было простое экспоненциальное сглаживание. Простая часть относится к модели, не учитывающей тренд или..
Четыре политических класса обучения с подкреплением
Четыре политических класса обучения с подкреплением
Исчерпывающая классификация стратегий решения для обучения с подкреплением
Политика обучения с подкреплением (RL) окутана определенной мистикой. Проще говоря, политика π: s → a - это любая функция, которая возвращает возможное действие для проблемы. Ни меньше, ни больше. Например, вы можете просто выполнить первое действие, которое придет в голову, выбрать действие наугад или запустить эвристику. Однако то, что делает RL..
6 инструментов для парсинга, которые упрощают сбор данных
Первый шаг любого проекта в области науки о данных - это сбор данных.
Ни один проект по науке о данных не обходится без данных; Я даже могу утверждать, что вы не можете сказать «наука о данных» без данных. Часто в большинстве проектов по науке о данных данные, которые необходимо анализировать и использовать для построения моделей машинного обучения, хранятся где-то в базе данных. Иногда это где-то бывает в Интернете.
Вы можете собирать данные с определенной веб-страницы об..
Криминальные хроники: изучение закономерностей и тенденций в Сан-Франциско | Картик Маханкали
Введение
Сан-Франциско, оживленный коммерческий и финансовый центр, столкнулся с серьезными проблемами из-за тревожного роста числа бездомных. С 2017 года к ним присоединилось почти 7000 человек, и проблемы с психическими заболеваниями и зависимостью способствовали эскалации преступной деятельности. Пандемия еще больше усугубила бедность и безработицу, что может повлиять на уровень преступности в городе.
Современный сценарий преступления в Сан-Франциско — сложная и многогранная тема,..
Как машинное обучение и глубокое обучение облегчают обнаружение болезни Альцгеймера, часть 2 (нейронаука…
Сеть кодировщиков мозга, встроенная в Behavior Score, для улучшенной классификации болезни Альцгеймера с использованием фМРТ в состоянии покоя (arXiv)
Автор: Вань-Тин Се , Джереми Лефорт-Беснард , Хао-Чунь Ян , Ли-Вэй Куо , Чи-Чунь Ли .
Резюме: Возможность точного выявления начала деменции имеет важное значение в лечении заболевания. Клинически диагноз пациентов с болезнью Альцгеймера (БА) и легкими когнитивными нарушениями (УКН) основан на комплексной оценке психологических..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..