Далее Airbyte предлагает CDK, Querybook имеет открытый исходный код, и как выбрать платформу для обнаружения данных.
В ближайшем будущем данные станут основой каждой части нашего существования. Я собираю точки данных, чтобы помочь понять и сформировать это будущее.
Если вы хотите поддержать это, поделитесь этим в Twitter, LinkedIn или Facebook.
(1) 🎁 Airbytes CDK
Я думаю, что за интеграцией данных с открытым исходным кодом будущее интеграции данных. Оба нынешних новичка в этой сфере, meltano и Airbyte, сталкиваются с некоторыми препятствиями. Одна из самых важных - это легкость участия в их проектах. В прошлом месяце meltano запустила свой SDK для создания соединителей, и всего через месяц после этого их примеру последовала Airbyte.
Они действительно обеспечивают скорость прохождения CDK, что мне очень нравится. Конечно, чем проще добавить к существующему решению для интеграции данных, тем лучше будет его принятие, потому что независимо от компании, ей всегда будут нужны какие-то настраиваемые источники. Инструмент, который упрощает разработку пользовательских исходных текстов, был бы в верхней части моего списка инструментов, из которых можно было бы выбирать.
Я действительно рекомендую вам проверить скорость пробега через CDK, если вы хотите прочувствовать это.
Ресурсы
(2) 📣 Выбор платформы для обнаружения данных
Современным архитектурам данных действительно нужна платформа для обнаружения данных. В противном случае аналитика самообслуживания не сработает. Поскольку самообслуживание аналитика обычно является ключом к масштабированию любой архитектуры данных с точки зрения вариантов использования, людей и исходных систем, это кажется важным недостающим и обычно игнорируемым фрагментом головоломки.
Так что мне очень понравилась статья Юджина Яна о платформах обнаружения данных, которая дает как конкретные рекомендации по инструментам, так и структуру оценки для выбора или даже построения системы.
Есть ли у вашей организации проблемы с обнаружением данных? Если да, взгляните на Amundsen, Atlas и DataHub. Или, если вы пытаетесь разработать его самостоятельно, подумайте, как ваши «функции помогут пользователям ответить на их вопросы ».
Ресурсы
(3) ☀️ Книга запросов
Некоторое время назад я написал статью о разных« артефактах BI и включил Истории как один артефакт. Истории в основном представляют собой графики, таблицы и текст, соединенные вместе, чтобы глубже погрузиться в набор данных и добавить контекст. Мне очень нравится идея записных книжек в качестве дополнения к стеку бизнес-аналитики компании, поэтому мне очень понравилось, когда я прочитал, что Pinterest - это просто книга запросов с открытым исходным кодом, которая является отличным механизмом для создания блокнотов / историй для SQL.
По сути, в книге запросов вы можете объединить текст, графики и SQL-запросы, задокументировать книгу и поделиться ею с другими. Он поддерживает множество источников данных и может быть расширен в большинстве измерений. Приятно видеть еще один шаг в будущее бизнес-аналитики с открытым исходным кодом.
🎄 В других новостях и благодарностях
На этой неделе мне удалось опубликовать одну забавную статью и одну глубокую статью, мне бы очень хотелось, если вы посмотрите на них:
- Данные как код - принципы, что это такое и почему сейчас?
- Как следствие Конвейса разрушает вашу организацию данных
Спасибо, что дочитали до этого места! Мне также было бы приятно, если бы вы поделились этим информационным бюллетенем с людьми, которым, по вашему мнению, он может быть интересен.
P.S .: Я делюсь важными вещами, а не самыми свежими. Я делюсь книгами, исследовательскими работами и инструментами. Я пытаюсь дать простой способ понять все эти вещи. Я склонен быть самоуверенным. Вы всегда можете нажать кнопку отказа от подписки!
P.P.S: Ага! Мы добрались до 20-го выпуска!