Публикации по теме 'statistics'
Типы и масштабы данных в описательной статистике
Описательная статистика помогает вам понять данные, но прежде чем мы поймем, что такое данные, мы должны знать различные типы данных в описательном статистическом анализе. Приведенный ниже экран поможет вам получить общее представление об этом.
Набор данных — это группа информации, которая связана друг с другом. Набор данных может быть качественным или количественным. Набор качественных данных состоит из слов, которые можно наблюдать, а не измерять. Набор количественных данных..
GE 2020: идеи энтузиаста данных (часть I)
В этой серии из трех частей я стремлюсь проанализировать события недавних всеобщих выборов в Сингапуре 2020 года с точки зрения энтузиаста данных.
По мере того, как пыль от всеобщих выборов начинает оседать, я нашел время на выходных, чтобы взглянуть на несколько аспектов общенационального события, которое было такой горячей темой в последние несколько дней.
Во-первых, немного контекста - будучи впервые голосующим на всеобщих выборах в Сингапуре 2020 года, я был чрезвычайно взволнован..
t-SNE — техника визуализации данных
t-SNE или t распределенное встраивание стохастических соседей — это прежде всего метод визуализации данных, родственный анализу основных компонентов (по крайней мере, его применение). Причина, по которой я использовал PCA в качестве примера, заключается в том, что их часто сравнивают и спорят о том, какая из них лучше. В то время как PCA, безусловно, находит свое применение в разработке признаков и определении важных признаков, с точки зрения визуализации данных более высокого измерения в..
Когда выбросы значительны: взвешенная линейная регрессия
Когда выбросы значительны: взвешенная линейная регрессия
Методы взвешенной регрессии, включающие значительные выбросы
Выбросы часто бывают озорными. У них есть потенциал нарушить простой в остальном процесс регрессии, представляя себя данными, столь же важными, как и все остальное, часто искажая подобранную модель. Прямой подход заключается в использовании методов обнаружения выбросов для их удаления из набора данных перед подгонкой модели. Но в этом есть свои оговорки. Иногда..
10 лучших книг по науке о данных, которые вам нужно прочитать
Наука о данных быстро становится одной из самых важных и прибыльных областей в мире. Просеивание и создание ощущения от больших наборов данных может изменить жизнь, помогая людям делать все, от лучшего понимания потребительских тенденций до повышения их производительности. Если вы только начинаете свой путь к тому, чтобы стать специалистом по данным, или хотите освежить последние отраслевые знания, следующие 10 книг необходимы для тех, кто интересуется наукой о данных.
Книга № 1 — Что..
Понимание центральной предельной теоремы для науки о данных
Центральная предельная теорема - одна из самых важных и очень фундаментальных теорем в статистике, которая широко используется в науке о данных и других связанных задачах. В этом блоге мы шаг за шагом разберемся с центральной предельной теоремой с некоторыми фрагментами кода Python.
Прежде чем перейти к основной идее центральной предельной теоремы, давайте обсудим некоторые самые базовые идеи статистики.
Что такое население в статистике?
В вероятности и статистике популяция..
Если вы хотите изучать статистику без скуки, прочтите это
Упрощение статистики для науки о данных и машинного обучения с помощью Python: увлекательное руководство для любознательных
Считаете ли вы себя ошеломленным сложностями статистики как начинающего специалиста по данным?
Вы когда-нибудь мечтали о формуле, которая сделает обучение не только легким, но и приятным?
По правде говоря, эту формулу можно применить к любому понятию, с которым вы боретесь, а не только к статистике.
Если вы заинтригованы идеей окончательно понять эти..
Новые материалы
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..
ИИ в аэрокосмической отрасли
Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..