Публикации по теме 'data-analysis'
Выбросы-аномалии в данных.
Что такое выбросы?
По сути, выбросы — это точки данных, отклоняющиеся от тренда, шаблона или где-либо еще, где висят другие точки данных.
Проще говоря, выброс — это чрезвычайно высокая или чрезвычайно низкая точка данных по отношению к ближайшей точке данных и остальным соседним сосуществующим значениям на графике данных или наборе данных, с которыми вы работаете.
Выбросы — это экстремальные значения, которые сильно выделяются из общего набора значений в наборе данных или на..
Объяснение и практическое описание машин опорных векторов с ядрами
С помощью Scikit-Learn и Google Colab
Машина опорных векторов — это алгоритм, используемый для регрессии и классификации на основе уникальной линейной модели, что означает фиксированную линию или фиксированную плоскость для различения или прогнозирования меток. Это приводит к строгой модели, которая не может классифицировать данные определенного типа, особенно если данные перекрываются в двух или более категориях. Подробнее о SVM можно прочитать в моих предыдущих статьях:
и..
Введение в Regex
Пошаговое введение в регулярное выражение с использованием Python
Что такое регулярное выражение?
Regex означает регулярное выражение и по сути является простым способом определения шаблона символов. Регулярное выражение в основном используется для идентификации шаблонов, интеллектуального анализа текста или проверки ввода.
Regex отталкивает многих, потому что на первый взгляд это кажется тарабарщиной. Но те, кто умеет им пользоваться, не могут остановиться! Это мощный..
Моделирование Power BI — Наследование беспорядочной модели.
Что делать в этих ситуациях
Вы когда-нибудь получали в наследство неряшливую модель? Это как попасть в паутину и быть съеденным целиком.
Что я подразумеваю под съеденным целиком?
Это означает, что если вы не зададите правильных вопросов, вы можете потратить весь день на разработку мер, запросов, так ничего и не добившись!
Я был там.
Картинки стоят тысячи слов.
Взгляните на этот тип модели. Каждый «квадрат» здесь — это стол.
Я помню, как кто-то в шутку назвал этот стиль..
О тщательном ведении записей
Уважаемые специалисты по данным!
Я инженер, ставший специалистом по данным. Я чувствую, что те, кто идет по тому же пути, могут найти отклик в этой статье. Если вы инженер или были инженером, эта статья для вас!
В течение долгого времени у нас была привычка и мышление, что реализация является сложной частью. Поэтому нашей целью была реализация. Но это меняется, как только мы входим в область науки. Наука о данных называется наукой, потому что это не только практическое применение..
Выявление предвзятости в машинном обучении: подробное руководство по измерению справедливости с помощью Python
Как использовать равные возможности, равные шансы и несоизмеримое влияние для анализа и смягчения предвзятости в ваших моделях машинного обучения
Введение:
Поскольку машинное обучение продолжает революционизировать отрасли и нашу повседневную жизнь, очень важно, чтобы мы создавали эти системы с учетом принципа справедливости и равноправия. К сожалению, без тщательного рассмотрения алгоритмы машинного обучения могут увековечить и даже усилить существующие социальные предубеждения, что..
Аналитики данных будут автоматизированы? Нет, мы создаем автоматизированные процессы
За последние два месяца я получил несколько задач по созданию новых отчетов для автоматического предоставления некоторой информации. Например, один маркирует магазины с аномальными или снижающимися тенденциями продаж, а другой выделяет магазины, в которых после продвижения не произошло никаких улучшений. Конечно, эти задачи кажутся очевидными в крупных корпорациях и давно автоматизированы. Но кто-то…
Новые материалы
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..
ИИ в аэрокосмической отрасли
Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..