Публикации по теме 'data-science'
Комплексное интерактивное исследование данных и обучение моделированию в Машинном обучении Azure (часть 1)
Комплексное интерактивное исследование данных и обучение моделированию в Машинном обучении Azure (часть 1)
Прежде чем приступать к обучению моделей, необходимо получить четкое представление о данных. Реальные наборы данных часто зашумлены, содержат пропущенные значения или имеют множество других несоответствий. Вы можете использовать обобщение и визуализацию данных, чтобы проверить качество ваших данных и предоставить информацию, необходимую для обработки данных, прежде чем они будут..
6 советов по работе с нулевыми значениями
6 советов по работе с нулевыми значениями
Включает итерационный метод, среднее и медианное заполнение с групповым, средним и медианным заполнением
Нулевые значения — большая проблема в машинном обучении и глубоком обучении. Если вы используете sklearn, TensorFlow или любые другие пакеты машинного обучения или глубокого обучения, необходимо очищать нулевые значения перед передачей данных в среду машинного обучения или глубокого обучения. В противном случае это даст вам длинное и..
Анализ цен на жилье и прогноз GTA
1. Введение: бизнес-задача
Как житель района Большого Торонто (GTA) более 10 лет, я хотел бы выбрать данные GTA в качестве основного проекта прикладной науки о данных. Основная идея заключается в использовании данных о местах проведения и рейтинге школ для прогнозирования цены на жилье . Кроме того, обратите внимание на некоторые взаимосвязи или схемы между различными факторами.
Торонто — крупнейший город Канады, однако, по сравнению с этими крупнейшими городами мира, у нас в..
Реальные примеры использования науки о данных в страховой отрасли
Изучение примеров применения науки о данных в цепочке создания стоимости страхования
Страховой сектор является одной из крупнейших отраслей в мире по величине валовых премий , масштабам инвестиций и его повсеместной роли в обществе в покрытии личных и коммерческих рисков.
Огромный размер отрасли приносит множество данных и возможностей для бизнеса, прокладывая путь для науки о данных, чтобы приносить огромную пользу.
Хотя использование данных не является чем-то новым в страховой..
Обнаружение мошенничества, несбалансированная классификация и управление экспериментами с машинным обучением с использованием…
Полное руководство по созданию и управлению системой обнаружения мошенничества на основе машинного обучения.
Краткая история мошенничества
Самая ранняя зарегистрированная попытка мошенничества была обнаружена еще в 300 году до нашей эры в Греции.
Греческий морской торговец по имени Гегестратос хотел застраховать свой корабль и груз, поэтому застраховал их. В то время этот полис был известен как «нижний» и работал на том основании, что купец занимал деньги в размере стоимости..
Преобразование XML в CSV с помощью Python
Руководство по преобразованию XML в CSV с помощью Python.
В отличие от HTML файлы XML имеют собственные теги. На основе этих тегов мы можем выбрать необходимые столбцы для создания CSV.
Этот процесс имеет два преобразования: XML → DICT → CSV .
Пример XML:
<employees>
<employee>
<name>Carolina</name>
<role>Data Engineer</role>
<age>24</age>
</employee>
<employee>..
6 библиотек, которые должен знать каждый разработчик Python
Отборная коллекция лучших библиотек Python
Библиотеки призваны облегчить нашу жизнь. А в экосистеме Python их тысячи.
Но с чего начать?
Что ж, именно поэтому мы здесь сегодня. Я расскажу о 6 лучших библиотеках, о которых должен знать каждый разработчик Python.
Неважно, являетесь ли вы новичком или экспертом в Python, знание этих библиотек всегда будет держать вас впереди остальных.
Давайте начнем!
Инструментарий естественного языка (NLTK)
Если вам нужно работать с..
Новые материалы
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..