Публикации по теме 'big-data'
15 вопросов по инженерии данных (ETL, DATA, на основе сценариев) — часть I
Посмотрим, сможешь ли ты на них ответить
Вопросы по ETL
Можете ли вы объяснить процесс ETL и его значение в инженерии данных? Приведите пример реального сценария, в котором ETL имеет решающее значение для успешной миграции данных. Каковы различия между пакетной обработкой и потоковой обработкой в ETL? Приведите пример варианта использования каждого подхода. Как бы вы спроектировали конвейер ETL для перемещения данных из PubSub в Google BigQuery? Как бы вы справились с..
ITSM для инженеров данных: что такое ИТ-поддержка L1, L2 и L3 и их значение?
ITSM для инженеров данных: что такое ИТ-поддержка L1, L2 и L3 и их значение?
Поддержка ИТ-инфраструктуры направлена на поддержание производительности и стабильности локальной, облачной или гибридной ИТ-среды. Вместо обычного обучения ИТ-поддержка помогает решить определенную проблему или проблему пользователя, и это похоже на общее обслуживание клиентов, которое предоставляет организация.
Группа технической поддержки может состоять из одного человека или нескольких подразделений и..
«Эксперты взвешивают: взгляды на развивающийся ландшафт науки о данных и аналитики»
Область аналитики данных и науки о данных быстро развивается, и специалистам по данным и аналитикам может быть сложно оставаться в курсе последних технологий и методологий. Однако по мере того, как объем данных продолжает расти, а потребность в принятии решений на основе данных возрастает, для специалистов по данным и аналитиков как никогда важно быть готовыми к будущему.
«Наука о данных — это не зрелищный вид спорта. Важно постоянно узнавать о последних…
От берегов Тихого океана до небоскребов Джакарты: размышления офицера ГИС
Майкл Дайер является частью нашей семьи Pulse Lab в Джакарте. Он присоединился к команде в качестве сотрудника по географической информационной системе (ГИС) в 2019 году, где участвовал в нескольких гуманитарных проектах и проектах в области развития, направленных на использование нетрадиционных данных для повышения пространственно-временного охвата. Майки, как он более известен, поделился здесь некоторыми личными размышлениями о своей работе в Индонезии и Тихоокеанском регионе.
Я..
СКАЗКА О ТРЕХ УЧЕНЫХ ДАННЫХ
СКАЗКА О ТРЕХ УЧЕНЫХ ДАННЫХ
Автор: Кришна Гопалуни , Хариш Дашика , Манджур Рахаман , Нитин Мишра
Мне нравятся хорошие истории, и мне также нравится смотреть на море - мне нужно выбирать между двумя? - Дэвид Бирн, Как работает музыка
Если вы специалист по данным, ответ - нет! Вы можете иметь и то, и другое; до тех пор, пока ваши истории, основанные на данных, построены на прочной исследовательской базе. Специалист по анализу данных использует методы и инструменты,..
Наука о данных 101 - Деревья решений и почему они полезны для бизнеса
Как компании могут извлечь выгоду из алгоритмов дерева решений?
Автор Ань Ле . Следуйте за ней в Medium и LinkedIn , чтобы узнать больше. Пожалуйста, также следите за Desa Analytics на Medium, чтобы получать уведомления о публикации новых блогов.
Введение
В повседневной жизни мы все принимаем решения в зависимости от обстоятельств и событий. Чтобы принять решение, мы выбираем между множеством альтернатив, которые ведут нас разными путями к достижению ожидаемых результатов этого..
Пересечение ИИ, машинного обучения и больших данных: симфония прогресса
В великом оркестре технического прогресса три мощных инструмента играют в гармонии, создавая симфонию прогресса, который меняет наш мир. Этими инструментами являются искусственный интеллект (ИИ), машинное обучение (МО) и большие данные. Каждая из них впечатляет сама по себе, но когда они пересекаются, они создают поистине преображающую мелодию.
Представьте себе мир, в котором болезни предсказывают до того, как они проявятся, где дорожно-транспортные происшествия предотвращаются до..
Новые материалы
Объяснение документов 02: BERT
BERT представил двухступенчатую структуру обучения: предварительное обучение и тонкая настройка.
Во время предварительного обучения модель обучается на неразмеченных данных с помощью..
Как проанализировать работу вашего классификатора?
Не всегда просто знать, какие показатели использовать
С развитием глубокого обучения все больше и больше людей учатся обучать свой первый классификатор. Но как только вы закончите..
Работа с цепями Маркова, часть 4 (Машинное обучение)
Нелинейные цепи Маркова с агрегатором и их приложения (arXiv)
Автор : Бар Лайт
Аннотация: Изучаются свойства подкласса случайных процессов, называемых дискретными нелинейными цепями Маркова..
Crazy Laravel Livewire упростил мне создание электронной коммерции (панель администратора и API) [Часть 3]
Как вы сегодня, ребята?
В этой части мы создадим CRUD для данных о продукте. Думаю, в этой части я не буду слишком много делиться теорией, но чаще буду делиться своим кодом. Потому что..
Использование машинного обучения и Python для классификации 1000 сезонов новичков MLB Hitter
Чему может научиться машина, глядя на сезоны новичков 1000 игроков MLB? Это то, что исследует это приложение.
В этом процессе мы будем использовать неконтролируемое обучение, чтобы..
Учебные заметки: создание моего первого пакета Node.js
Это мои обучающие заметки, когда я научился создавать свой самый первый пакет Node.js, распространяемый через npm.
Оглавление
Глоссарий
I. Новый пакет
1.1 советы по инициализации..
Забудьте о Matplotlib: улучшите визуализацию данных с помощью умопомрачительных функций Seaborn!
Примечание. Эта запись в блоге предполагает базовое знакомство с Python и концепциями анализа данных.
Привет, энтузиасты данных! Добро пожаловать в мой блог, где я расскажу о невероятных..