Публикации по теме 'data-science'
Концепции обработки данных № 1 — «Медленно меняющиеся измерения»
Введение
Поскольку мы постоянно загружаем данные в хранилище данных, нам неизбежно придется иметь дело с изменениями в исторических данных.
Хранилища данных по определению содержат исторические данные. Что нам делать, когда приходит новый пакет данных и некоторые атрибуты в таблицах изменились? Это распространенная проблема в хранилищах данных, которая называется Медленно меняющиеся измерения (SCD) .
Методы работы с SCD применяются к таблицам измерений, а не к таблицам фактов ...
Введение в программирование на Python. Часть 5. Функции, самоанализ объектов и модули.
Функции
Вы можете определить свои собственные функции, которые выполняют определенную задачу. Вы также можете передать входные параметры своим функциям. Вы определяете функцию, используя ключевое слово def , за которым следует имя функции и любые входные параметры, которые у вас могут быть. Если хотите, вы можете определить значения по умолчанию для ваших параметров. Функции могут возвращать значение с помощью команды return() . Если оператор возврата отсутствует, функция неявно..
Почему ваша модель машинного обучения может не работать в производственной среде?
Большинство моделей машинного обучения никогда не поступают в производство, но еще хуже, когда модели в производстве довольно скоро становятся бесполезными. Это не должно иметь значения для вас, если вы применяете машинное обучение только для обучения или развлечения. Однако на этот вопрос следует ответить, если вы когда-нибудь мечтали о развертывании моделей в производственной среде. Это связано с тем, что точность моделей снижается, как только они внедряются в реальный мир.
Я не..
Обзор дрейфа модели в машинном обучении
Дрейф данных, дрейф концепций и переобучение модели Зачем это нужно?
Изменения постоянны:
Мир динамичен, и данные постоянно меняются, будь то объем, качество, целостность или масштаб. Модели машинного обучения, обученные на сегодняшних данных, могут оказаться непригодными для завтрашнего дня.
Модели машинного обучения создаются или обучаются на основе заданных или исторических данных. Производительность модели ML так же хороша, как и данные, на которых она обучается, но эти..
Использование LIME для объяснения моделей машинного обучения для числовых данных
В этом блоге я попытаюсь продемонстрировать, как объяснить модели машинного обучения черного ящика (с использованием числовых данных в качестве набора поездов) с помощью LIME . Я использовал этот пакет Python, и большинство примеров, которые я нашел для использования этого пакета, относились к данным изображений. Вот почему я хотел поделиться своим опытом объяснения числовых данных с помощью LIME.
Что в этом руководстве
Справочная информация о LIME Обучение и использование..
Население и выборка в науке о данных и статистике
Мягкое введение в популяцию, выборку и их характеристики в статистике.
«Факты упрямые, но статистика надежна» - Марк Твен
Роль населения играет важную роль в статистике и науке о данных. Более того, без составления совокупности и выборки весь мир строительной статистики и науки о данных мог бы исчезнуть.
Данные являются основным строительным блоком всего анализа. Важно знать, как данные разделяются, собираются и отбираются выборки, прежде чем приступить к статистическому..
2 способа создания собственных трансформеров Scikit Learn
Как вы можете (и почему вы должны) создавать собственные трансформеры
Преобразователи Scikit Learn (не путать с преобразователями глубокого обучения) — это классы в пакете Scikit Learn, которые облегчают преобразования в заданных наборах данных.
Эти преобразователи могут выполнять различные операции, такие как нормализация и анализ основных компонентов. Однако в некоторых ситуациях могут потребоваться операции, которые невозможно выполнить с помощью предоставленных инструментов.
В..
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..