Публикации по теме 'data-analysis'
Упрощение выбора и извлечения признаков: подробное руководство
Введение
В области машинного обучения и анализа данных работа с многомерными данными может быть сложной задачей. Выбор признаков и извлечение признаков — два основных метода, которые помогают упростить сложные наборы данных и повысить производительность алгоритмов обучения. В этом блоге я стремлюсь объяснить разницу между выбором признаков и извлечением признаков, изучить различные методы для каждого из них и дать упрощенное представление об анализе основных компонентов (PCA)...
Обзор группы данных: понимание ролей инженера данных, специалиста по данным и данных…
Введение
Привет!! Меня зовут Санджай, мне 18 лет, и я учусь на первом курсе компьютерных наук. Я работаю в технике уже почти два года. Ранее я работал UI/UX дизайнером и Front-end разработчиком (в основном удаленная работа).
Это мой первый блог, связанный со специализацией/работой с данными. В течение нескольких месяцев я был в кроличьей норе, как крупные технологические компании и стартапы используют большие данные для облегчения принятия решений и улучшения качества продуктов или..
Разница между специалистом по данным и аналитиком данных
Специалисты по данным и аналитики данных — это профессионалы в области науки о данных , обладающие некоторыми общими навыками и разными обязанностями. Итак, если вы не знаете, чем Data Scientist отличается от Data Analyst, эта статья для вас. В этой статье я расскажу о разнице между специалистом по данным и аналитиком данных в зависимости от роли и обязанностей, набора навыков, образования и заработной платы.
Разница между специалистом по данным и аналитиком данных
Data Scientist..
Исследование и анализ данных для прогнозирования цен на жилье с использованием методов машинного обучения
Зачем исследовать данные перед моделированием?
Исследование данных важно, потому что оно помогает глубже понять данные, выявить закономерности и взаимосвязи, раскрыть скрытые идеи, обнаружить выбросы и аномалии, а также предоставить информацию для разработки моделей и алгоритмов. Выполняя исследование данных, ученые и аналитики данных могут принимать обоснованные решения относительно данных и их потенциального использования, снижая риск разработки моделей, которые являются предвзятыми..
Машинное обучение
Машинное обучение
Специализация по машинному обучению — это базовая онлайн-программа, созданная в сотрудничестве между DeepLearning.AI и Stanford Online. Эта программа для начинающих научит вас основам машинного обучения и тому, как использовать эти методы для создания реальных приложений ИИ.\n\nЭту специализацию преподает Эндрю Нг, провидец ИИ, который руководил критическими исследованиями в Стэнфордском университете и новаторская работа в Google Brain, Baidu и Landing.AI для продвижения..
Путь GitHub к 128 миллионам публичных репозиториев
С твердыми цифрами
В Simiotics мы пишем много кода, который анализирует код. GitHub - это крупнейшее в мире хранилище исходного кода. Это означает, что мы тратим много времени на анализ данных с GitHub. зеркало - это проект с открытым исходным кодом, в котором используются некоторые из наших поисковых роботов.
Хронология GitHub документирует рост доминирования GitHub как бизнеса. Мы будем использовать данные, собранные зеркалом , чтобы дополнить эту временную шкалу статистикой..
Анализ данных Disney+ с использованием Python
Что стоит посмотреть на Disney+? Какой месяц идеально подходит для добавления подписки Disney+? Рейтинги фильмов и шоу Disney и многое другое.
Здравствуйте, дата-сайентисты!
Если вы следите за мной с самого начала, мы сделали несколько проектов по визуализации данных на разные темы. Marvel vs DC, анализ данных Spotify, анализ Zomato, анализ данных Cars и многие другие темы. Если вы пропустили, вот полный список проектов по науке о данных. Теперь в статье мы собираемся провести..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..