Публикации по теме 'data-science'
Один день из жизни Data Scientist
Спойлер: я не создаю никаких причудливых моделей машинного обучения.
В последнее время я встречал много людей, которые заинтересованы в карьере в науке о данных. Одна из первых вещей, которые они всегда спрашивают меня: «Как выглядит обычный день?». Я видел много статей, в которых дается обзор навыков и инструментов, которые используют специалисты по обработке и анализу данных, но не так много статей, в которых приводятся реальные примеры повседневных задач.
Хотя каждый день разный,..
Бард против ChatGPT: битва ИИ-титанов
Какая модель большого языка подходит именно вам?
Bard и ChatGPT — две самые популярные модели больших языков (LLM), доступные сегодня. Обе модели обучены на больших наборах данных текста и кода, и они могут генерировать текст, переводить языки, писать различные виды творческого контента и информативно отвечать на ваши вопросы.
Скрытые ошибки SQL, допущенные опытными аналитиками данных, часть 2
#P1# #P2# случаи +------------+----------------+-----------------------+ | client_id | имя_клиента | случай | +-----------+----------------+-----------------------+ | 1 | Майк Джонсон | Запуск нового продукта | | 1 | Майк Джонсон | Рекламное предложение | | 2 | Сара Уильямс| Запуск нового продукта | | 2 | Сара Уильямс| Рекламное предложение | +-----------+----------------+------------------------+ статус +------------+-----------+-----------+ | client_id | повод |..
Как работают закрытые рекуррентные единицы, часть 1 (машинное обучение)
Алгоритм субтитров к изображениям на основе гибридного метода глубокого обучения (CNN+GRU) (arXiv)
Автор: : Рана Аднан Ахмад , Мухаммад Азхар , Хина Саттар
Аннотация . Подпись изображений с помощью структуры кодировщик-декодер продемонстрировала огромный прогресс за последнее десятилетие, когда CNN в основном используется в качестве кодировщика, а LSTM - в качестве декодера. Несмотря на такое впечатляющее достижение с точки зрения точности простых изображений, ему не хватает..
Мартовское безумие Bracket Post Mortem
Как работал алгоритм машинного обучения?
Как и у многих из вас, у меня сломался кронштейн. Но это не обязательно вина машины! Ему по-прежнему нужен человек, чтобы просматривать бегущую ленту и принимать решения на основе совпадений. Я виню себя, правда. Для справки, вот команды, которые действительно вышли в «Финал 4» в этом году:
Северная Каролина, Южная Каролина, Гонзага, Орегон
Вот команды, которые понравились машине из моего поста от 04.02.17:
Я считаю, что все эти..
Что такое наука о данных?
При широком использовании Интернета и социальных сетей и систематизации деятельности организаций и компаний ежедневно производится огромное количество новых данных, что требует применения сложных методов и инструментов для управления ими и их обработки. Это создало платформу, которая сегодня является областью «Науки о данных». «Наука о данных» стала одной из самых горячих тем в сфере информационных технологий. В этой статье я отвечу на вопрос, что такое наука о данных и каковы ее..
Создание масштабируемых конвейеров NLP с использованием PySpark и Nlphose
В этой статье мы увидим, как мы можем использовать Nlphose вместе с Pyspark для выполнения конвейера NLP и собрать информацию о знаменитом путешествии из книги Жюля Верна Вокруг света за 80 дней . Вот ссылка на ⬇️ Блокнот Pyspark, использованный в этой статье .
Из моего личного опыта я обнаружил, что интеллектуальный анализ данных из неструктурированных данных требует использования нескольких методов. Не существует единой модели или библиотеки, которая обычно предлагала бы все,..
Новые материалы
Как создать диаграмму градиентной кисти с помощью D3.js
Резюме:
Из этого туториала Вы узнаете, как добавить градиентную кисть к диаграмме с областями в D3.js. Мы добавим градиент к значениям SVG и применим градиент в качестве заливки к диаграмме с..
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что это выглядит сложно…
Просто начните и учитесь самостоятельно
Я хотел выучить язык программирования MVC4, но не мог выучить его раньше, потому что он кажется мне сложным, и я бросил его. Это в основном инструмент..
Лицензии с открытым исходным кодом: руководство для разработчиков и создателей
В динамичном мире разработки программного обеспечения открытый исходный код стал мощной парадигмой, способствующей сотрудничеству, инновациям и прогрессу, движимому сообществом. В основе..
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..