WedX - журнал о программировании и компьютерных науках

Публикации по теме 'statistics'


О тщательном ведении записей
Уважаемые специалисты по данным! Я инженер, ставший специалистом по данным. Я чувствую, что те, кто идет по тому же пути, могут найти отклик в этой статье. Если вы инженер или были инженером, эта статья для вас! В течение долгого времени у нас была привычка и мышление, что реализация является сложной частью. Поэтому нашей целью была реализация. Но это меняется, как только мы входим в область науки. Наука о данных называется наукой, потому что это не только практическое применение..

Вопросы для интервью с Quant Investment & Machine Learning (2)
Quant Investment & Machine Learning — действительно очень большая и разнообразная область. Поэтому трудно быть мастером по всем предметам. Ниже приведены несколько вопросов, которые я считаю весьма полезными для подготовки. Если вам интересна эта тема, вы также можете найти предыдущую статью ниже:

«Освоение кривой ROC AUC: полное руководство для специалистов по данным»
«Раскрытие возможностей кривой ROC AUC: практический подход» Почему кривая ROC? В контролируемом машинном обучении мы сталкиваемся с двумя типами проблем: регрессией и классификацией. В задаче регрессии мы стремимся предсказать числовое значение, например, предсказать зарплату (LPA) на основе таких характеристик, как CGPA и IQ. С другой стороны, в задаче классификации мы стремимся предсказать класс или категорию, к которой принадлежит точка данных. Например, определение того, помещен..

Объяснение повторяющихся перевзвешенных методов наименьших квадратов и GLM
С подробной реализацией на Python Обобщенные линейные модели (GLM) – это регрессионные модели, в которых мы обобщаем линейное предположение обычной модели линейной регрессии. Из-за этой нелинейности оценка параметра регрессии будет не такой простой, как оценка параметра линейной регрессии. Алгоритм Повторяющиеся взвешенные наименьшие квадраты (IRLS) или иногда также Повторяющиеся взвешенные наименьшие квадраты (IWLS) — это метод нахождения оценок максимального правдоподобия..

Алгоритм случайного леса
Случайный лес — это популярный метод «обучения по ансамблю» (объединяет несколько небольших моделей посредством голосования/усреднения для получения прогноза) для задач классификации и регрессии. Он работает путем построения большого количества деревьев решений во время обучения и вывода класса с большинством голосов среди деревьев решений (классификация) или среднего прогноза (регрессия) отдельных деревьев. Деревья решений построены таким образом, что каждое дерево немного отличается..

Статистика для машинного обучения (базовая)
Все основные инструменты статистики, необходимые для начала работы с Data Science / Machine Learning. Прошли те времена, когда каждому требовались глубокие знания в области статистики, чтобы действительно преуспеть в науке о данных. С автоматизацией множества техник машинного обучения многие новички сразу переходят к коду, даже не зная, что происходит внутри! Однако статистика присутствует во всех сферах науки о данных, будь то визуализация данных, очистка данных или построение модели..

Упрощенная регуляризация: Ridge, Lasso и Elastic Net (с кодом Python!)
Наша работа инженера по машинному обучению в основном связана с настройкой моделей. Именно гиперпараметры, которые мы можем корректировать, действительно дают нам власть над нашими моделями и делают наш опыт таким ценным. При этом одним из самых важных инструментов, которыми владеет инженер по машинному обучению, является регуляризация . В этой статье я дам определение регуляризации простыми словами и расскажу о трех основных методах регуляризации, о том, когда их использовать и как..

Новые материалы

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..

ИИ в аэрокосмической отрасли
Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..


Для любых предложений по сайту: [email protected]