Публикации по теме 'data-science'
Анализ настроений в Twitter с пространственной визуализацией и анализом
Недавно у меня появилась возможность пройти стажировку в UST Software (India) Pvt. Ltd. Это был замечательный опыт, и я многому научился. Во время стажировки моей команде был поручен проект «Анализ настроений в Twitter», но основная часть нашего проекта заключалась в анализе пространственных данных, а также в их визуализации.
В этом блоге я расскажу о подходах, которым мы следовали, а также о проблемах, с которыми мы столкнулись при этом. Если вы хотите присоединиться к нашему..
Веб-скрапинг (Scrapy)
Scrapy — это платформа с открытым исходным кодом для веб-сканирования и веб-скрейпинга, которая используется для сканирования веб-сайтов и извлечения структурированных данных с их страниц. Помимо интеллектуального анализа данных, его также можно использовать для мониторинга и автоматизированного тестирования.
Scrapy — это метод извлечения данных с разных веб-сайтов. Scrapy помогает собирать данные с разных сайтов в формате CSV и JSON. Используя Scrapy, мы создаем собственный набор..
Дерево решений — Алгоритм машинного обучения (ключевые моменты)
Алгоритм контролируемого машинного обучения. Используется для регрессии и классификации. Получите лучший результат в наборе данных классификации по сравнению с регрессией. DT — это древовидный алгоритм, который нам нужен для выбора лучшего корневого узла.
DT-поток
Корневой узел → Узел ответвления → Узел-лист Основная цель - найти листовой узел
Мера выбора основного атрибута DT
Энтропия. Примесь Джини. Получение информации
Получение информации
Это решает, какой атрибут..
Лучший онлайн-курс по науке о данных и искусственному интеллекту в мире: Digicrome
Digicrome является поставщиком профессиональных Онлайн-курсов , профессиональных сертификационных тренингов, подготовки к экзаменам, языковых курсов и других программ повышения квалификации для людей всех возрастов. Мы предлагаем комплексное онлайн-обучение по различным предметам, включая науку о данных, кибербезопасность и многие другие. мы уделяем особое внимание секторам, в которых технологии и лучшие практики быстро развиваются и где спрос на квалифицированный персонал намного..
Как развивается область имитационного обучения, часть 1 (искусственный интеллект)
Обучение и извлечение из предыдущих данных для имитационного обучения на основе навыков ( arXiv )
Автор: Соруш Насириани , Тянь Гао , Аджай Мандлекар , Юкэ Чжу
Аннотация . Имитационное обучение предлагает многообещающий путь для обучения роботов общецелевому поведению, но традиционно демонстрировал ограниченную масштабируемость из-за высоких требований к контролю данных и неустойчивого обобщения. Вдохновленные недавними достижениями в многозадачном имитационном обучении,..
Сбор данных фильмов (часть 2): создание набора данных фильмов с помощью Python
В этом сообщении показано, как создать набор данных о фильмах с помощью Python и API OMDb. Это будет сделано с использованием списка извлеченных названий фильмов, показанных в предыдущем посте «movie-data-collection-part-1-web-scraping-using-python ».
Во-первых, в нем представлены различные методы сбора или парсинга данных. Во-вторых, будет кратко рассмотрен API OMDb. Наконец, показано, как создается набор данных с помощью Python.
Сбор онлайн-данных
Сбор онлайн-данных, также..
5 основных тенденций в области технологий
01. Наука о данных
Что такое наука о данных?
Наука о данных — это область исследования, которая сочетает в себе опыт предметной области, навыки программирования и знания математики и статистики для извлечения осмысленной информации из данных. Специалисты по науке о данных применяют алгоритмы машинного обучения к числам, тексту, изображениям, видео, аудио и многому другому для создания систем искусственного интеллекта (ИИ) для выполнения задач, которые обычно требуют..
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..