Публикации по теме 'machine-learning'
randomforest в rpart — часть 2: простое дерево решений
Итак, мне есть с чем сравнить мой случайный лес rpart, я собираюсь построить простое дерево решений с помощью пакета rpart. В конце концов, если я не могу победить ни одно дерево rpart, то вся моя работа была бессмысленной!
set.seed(20) # predictable randomness
# split the data into training and test data (arbitrarily!)
training_data <- data[1:52000,]
test_data <- data[52001:nrow(data),]
# set the target variable
targ <- "is.premium"
# set the predictors
preds <-..
4 важные вещи, которые я узнал из своего первого проекта по науке о больших данных, и как они могут вас спасти…
Выглянув в окно, я увидел оранжевое солнце и ощутил тяжесть красного неба — я чувствовал конец лета сейчас сильнее, чем когда-либо — Как это так быстро пролетело?
Я взглянул на экран компьютера и тяжело вздохнул. Закончено. Месяцы ежедневной работы и исследований привели к тому, чем я действительно горжусь. Но дорога к этому моменту была усеяна испытаниями и трудностями, о которых мне хотелось бы, чтобы кто-нибудь предупредил меня заранее .
В этом посте я постараюсь быть таким..
Ведущие компании, занимающиеся решениями для умных заводов
Автоматизация не является термином замены в сфере производства. Интеллектуальные технологии, такие как искусственный интеллект, машинное обучение и анализ данных, начали революционизировать отрасли, поскольку эксперты осознают большой потенциал, который должны предложить эти инновации. Внедрение цифровых технологий для переделки заводских операций стало обязательным для каждой организации, будь то автомобилестроение или высокотехнологичное производство. прогнозируется, что в..
Справедливость? Этика? Почему разнообразные данные важны для вашего ИИ? Модели?
Введение
В этом руководстве мы обсудим важность наличия разнообразия в ваших наборах данных машинного обучения (ML) или искусственного интеллекта (AI). Мы все прекрасно понимаем, что для эффективного использования модели машинного обучения или искусственного интеллекта для решения конкретной задачи крайне важно иметь качественные обучающие данные для самой модели. Независимо от того, насколько эффективна или точна модель, если она снабжена набором данных низкого качества и обучена на нем,..
Некоторые полезные материалы для обработки отсутствующих переменных — слайд «Стратегия вменения» и веб-сайт…
Это короткий пост, содержащий информацию о двух полезных материалах для обсуждения работы с отсутствующими переменными, предназначенный для публичного обмена моими быстрыми исследованиями и, прежде всего, для меня в будущем!
1. Слайд «Стратегия вменения»
Вот ссылка на презентацию.
Эта презентация была создана Юдзи Хирамацу, одним из авторов книги Методы анализа данных для победы в Kaggle , о которой я сейчас пишу серию постов на Medium . Слайд был представлен на мероприятии Kaggle..
Как спрогнозировать потребление электроэнергии в здании?
Потребление электроэнергии зданиями является важным фактором в использовании энергии и управлении затратами. Прогнозирование потребления электроэнергии может помочь оптимизировать использование энергии и минимизировать затраты. Это также может помочь выявить потенциальные проблемы с использованием энергии и дать возможность управляющим зданиями принять корректирующие меры.
I. Сбор данных:
Сбор данных является важным шагом в прогнозировании потребления электроэнергии в здании. Цель..
Surviving the Storm (I): сравнительный анализ моделей выживания с помощью машинного обучения для прогнозирования…
В последние недели я много читал, анализировал и исследовал динамику финансового сектора, особенно коммерческих банков. Хотя я не эксперт в этой области, я пытался понять это за пределами новостей. И если человек хочет понять экономическую реальность за пределами новостей, он должен обратиться к данным. И да, я пошел к данным. До этого у меня был небольшой прорыв в экономической теории (и истории).
Так как время от времени, не очень часто, я играю в роль академика/исследователя (мне..
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..