Публикации по теме 'data-engineering'
MLOps-Советы и хитрости-75 фрагментов кода
MLOps-Советы и хитрости-75 фрагментов кода
MLOps и обработка данных
Введение:
MLOps, или операции машинного обучения, относятся к набору методов, которые оптимизируют разработку, развертывание и обслуживание моделей машинного обучения, устраняя разрыв между наукой о данных и разработкой программного обеспечения. Эта статья призвана предоставить ценные советы и рекомендации по MLOps и обработке данных, охватывая широкий круг тем, таких как обучение моделей, предварительная обработка..
Соображения безопасности при использовании перечислений в схемах Avro
EXPEDIA GROUP ТЕХНОЛОГИИ — ДАННЫЕ
Соображения безопасности при использовании перечислений в схемах Avro
Использование перечислений обычно является хорошей практикой, но это не всегда так при использовании Apache Avro.
Apache Avro обычно используется как в пакетных системах, так и в системах данных реального времени для описания расширяемых и защищаемых схем данных. Avro позволяет создавать системы данных, в которых типы данных можно изменять, не затрагивая производителей или..
Информационный бюллетень ITNEXT.io за октябрь
Месяц, которого мы все ждали; Саммит ITNEXT!
Надеюсь, у вас был замечательный день. Чтобы немного оживить ваш день, у нас есть много статей для вас в магазине 😊 Однако перед этим мы хотели бы упомянуть две вещи:
Саммит ITNEXT состоится 30-го числа этого месяца! Есть три параллельных пути; JavaScript, DevOps и инженерия данных. Мероприятие ориентировано на IT-специалистов, которые хотят углубить свои знания и познакомиться с единомышленниками. ITNEXT основана компанией LINKIT ...
Технологии искусственного интеллекта становятся все доступнее и доступнее, а значит, больше https://www.quer
Технологии искусственного интеллекта становятся все более доступными и доступными, а это значит, что больше https://www.querykiller.in/2023/03/how-ai-will-increase-unemployment-rate.html
10 трюков для параллелизма и параллелизма в Python
Понимание параллелизма и параллелизма
Отказ от ответственности. Мнения, выраженные в этом сообщении в блоге, являются исключительно моими. Эти приемы основаны на моем личном опыте и на том, что я считаю эффективным в использовании параллелизма и параллелизма в программировании на Python.
Привет, коллеги-энтузиасты Python! Сегодня я хочу поделиться с вами некоторыми из моих любимых приемов для достижения параллелизма и параллелизма в Python. Будучи страстным аналитиком данных с..
15 вопросов по инженерии данных (ETL, DATA, на основе сценариев) — часть I
Посмотрим, сможешь ли ты на них ответить
Вопросы по ETL
Можете ли вы объяснить процесс ETL и его значение в инженерии данных? Приведите пример реального сценария, в котором ETL имеет решающее значение для успешной миграции данных. Каковы различия между пакетной обработкой и потоковой обработкой в ETL? Приведите пример варианта использования каждого подхода. Как бы вы спроектировали конвейер ETL для перемещения данных из PubSub в Google BigQuery? Как бы вы справились с..
Понимание различий : наука о данных, машинное обучение и искусственный интеллект
В мире технологий термины «наука о данных», «машинное обучение» и «искусственный интеллект» часто используются как синонимы. Однако эти термины относятся к отдельным и специализированным областям в более широкой сфере принятия решений на основе данных.
В этом блоге мы рассмотрим различия между наукой о данных, машинным обучением и искусственным интеллектом, а также то, как они используются для решения различных типов задач.
Что такое наука о данных?
Наука о данных — это..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..