WedX - журнал о программировании и компьютерных науках

Публикации по теме 'data-engineering'


MLOps-Советы и хитрости-75 фрагментов кода
MLOps-Советы и хитрости-75 фрагментов кода MLOps и обработка данных Введение: MLOps, или операции машинного обучения, относятся к набору методов, которые оптимизируют разработку, развертывание и обслуживание моделей машинного обучения, устраняя разрыв между наукой о данных и разработкой программного обеспечения. Эта статья призвана предоставить ценные советы и рекомендации по MLOps и обработке данных, охватывая широкий круг тем, таких как обучение моделей, предварительная обработка..

Соображения безопасности при использовании перечислений в схемах Avro
EXPEDIA GROUP ТЕХНОЛОГИИ — ДАННЫЕ Соображения безопасности при использовании перечислений в схемах Avro Использование перечислений обычно является хорошей практикой, но это не всегда так при использовании Apache Avro. Apache Avro обычно используется как в пакетных системах, так и в системах данных реального времени для описания расширяемых и защищаемых схем данных. Avro позволяет создавать системы данных, в которых типы данных можно изменять, не затрагивая производителей или..

Информационный бюллетень ITNEXT.io за октябрь
Месяц, которого мы все ждали; Саммит ITNEXT! Надеюсь, у вас был замечательный день. Чтобы немного оживить ваш день, у нас есть много статей для вас в магазине 😊 Однако перед этим мы хотели бы упомянуть две вещи: Саммит ITNEXT состоится 30-го числа этого месяца! Есть три параллельных пути; JavaScript, DevOps и инженерия данных. Мероприятие ориентировано на IT-специалистов, которые хотят углубить свои знания и познакомиться с единомышленниками. ITNEXT основана компанией LINKIT ...

Технологии искусственного интеллекта становятся все доступнее и доступнее, а значит, больше https://www.quer
Технологии искусственного интеллекта становятся все более доступными и доступными, а это значит, что больше https://www.querykiller.in/2023/03/how-ai-will-increase-unemployment-rate.html

10 трюков для параллелизма и параллелизма в Python
Понимание параллелизма и параллелизма Отказ от ответственности. Мнения, выраженные в этом сообщении в блоге, являются исключительно моими. Эти приемы основаны на моем личном опыте и на том, что я считаю эффективным в использовании параллелизма и параллелизма в программировании на Python. Привет, коллеги-энтузиасты Python! Сегодня я хочу поделиться с вами некоторыми из моих любимых приемов для достижения параллелизма и параллелизма в Python. Будучи страстным аналитиком данных с..

15 вопросов по инженерии данных (ETL, DATA, на основе сценариев) — часть I
Посмотрим, сможешь ли ты на них ответить Вопросы по ETL Можете ли вы объяснить процесс ETL и его значение в инженерии данных? Приведите пример реального сценария, в котором ETL имеет решающее значение для успешной миграции данных. Каковы различия между пакетной обработкой и потоковой обработкой в ​​ETL? Приведите пример варианта использования каждого подхода. Как бы вы спроектировали конвейер ETL для перемещения данных из PubSub в Google BigQuery? Как бы вы справились с..

Понимание различий : наука о данных, машинное обучение и искусственный интеллект
В мире технологий термины «наука о данных», «машинное обучение» и «искусственный интеллект» часто используются как синонимы. Однако эти термины относятся к отдельным и специализированным областям в более широкой сфере принятия решений на основе данных. В этом блоге мы рассмотрим различия между наукой о данных, машинным обучением и искусственным интеллектом, а также то, как они используются для решения различных типов задач. Что такое наука о данных? Наука о данных — это..

Новые материалы

Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка. Во время предварительного обучения модель обучается на неразмеченных данных с помощью..

Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..

Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv) Автор : Бар Лайт Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..

Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята? В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..

Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение. В этом процессе мы будем использовать неконтролируемое обучение, чтобы..

Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm. Оглавление Глоссарий I. Новый пакет 1.1 советы по инициализации..

Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных. Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..


Для любых предложений по сайту: [email protected]