Публикации по теме 'data-analysis'
Краткое (но исчерпывающее) введение в SQL-соединения
Что означает соединение SQL?
Соединение SQL описывает процесс объединения строк в двух разных таблицах или файлах.
Строки данных объединяются на основе значений в выбранном столбце.
В приведенном выше примере это столбец Элемент .
У I tem Apple указаны и цена, и количество, но в разных таблицах.
Используя соединение SQL, эти значения объединяются в одну строку!
Так зачем мне об этом целая статья?
В большинстве случаев объединить данные не так просто, как в предыдущем..
Проект данных: авиакатастрофы — Часть 2
Очистка, обработка и анализ данных
Привет, как дела? Во второй части проекта данных я расскажу об очистке и обработке данных, собранных с помощью парсинга, как показано в первой статье.
Для выполнения этой задачи мы будем использовать библиотеку Pandas в блокноте JupyterLab. Стоит отметить, что все три этапа данной работы разрабатывались в JupyterLab.
Понимание данных
Импорт данных и Dataframe.
2. Проверка количества и разнообразия данных в каждом столбце...
Зарплата, удовлетворенность, тенденция работы с данными
Что мы можем узнать из данных опроса Stack Overflow
Сейчас мы в курсе данных, и в последние несколько лет на рынке труда наблюдается постоянный спрос на рабочие места, связанные с данными. Data Scientist, Data Analyst и Data Engineer — три основных направления работы, связанной с данными. Для всех, кто заинтересован в выходе на поле или кто уже находится в поле, будет полезно понять текущую ситуацию на рынке труда данных. Такая информация, как требования к работе, зарплата и..
Вы принимаете данные или принимаете решения?
сборщики билетов данных — это группы данных, которые реагируют на пожелания организации, а лица, принимающие решения по данным, — это группы данных, которые активно ведут организацию к ее потребностям. Первый рассматривается как центр затрат, а второй — как генератор стоимости.
Вот некоторые аргументы в пользу этого различия:
Сборщики данных могут сосредоточить свое время и ресурсы на том, у кого больше шума или какие домены требуют больше всего, а не на доходах, клиентах и..
2 разных функции замены Python Pandas
И когда использовать какой
Pandas — это высокоэффективная библиотека для анализа данных и анализа манипуляций для Python. Учитывая доминирование Python в науке о данных и объем работы по очистке, обработке и анализу данных, Pandas является одним из наиболее широко используемых инструментов в области науки о данных.
Я использую Pandas для выполнения своей работы и создания контента. Прошло почти 3 года с тех пор, как я впервые написал код Pandas, и я все еще продолжаю изучать новые..
Введение в машинное обучение
Предположим, вам была дана простая задача распознавать разные формы.
Вы легко можете сказать, что одна из этих фигур - квадрат, одна из них - круг, а другая - треугольник. Вы когда-нибудь задумывались о том, как узнать, какая форма какая? С детства вас учили называть определенную фигуру определенным именем, и точно так же ваш компьютер можно обучать аналогичным образом, обучая его выполнять определенную задачу. Это обучение компьютера называется машинным обучением.
Начиная с..
85% проектов по науке о данных терпят неудачу. Как этого избежать?
Наука о данных сейчас в моде, но знаете ли вы, что колоссальные 85% проектов по науке о данных не приносят ожидаемых результатов? Это верно. Несмотря на ажиотаж вокруг науки о данных, реальность такова, что многие компании изо всех сил пытаются превратить данные в ценную информацию.
Так почему же так много проектов по науке о данных терпят неудачу? Вот некоторые из наиболее распространенных причин:
Неясные бизнес-цели. Без четких бизнес-целей сложно разработать модель обработки..
Новые материалы
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..
ИИ в аэрокосмической отрасли
Каждый полет – это шаг вперед к великой мечте. Чтобы это происходило в их собственном темпе, необходима команда астронавтов для погони за космосом и команда технического обслуживания..