Tableau и PowerBI: визуализация данных когда и что, часть I

автор Джейми Грин

В Когда и что? мы расскажем об основных инструментах и ​​методах решения общей задачи, а также обсудим плюсы, минусы и возможные варианты использования каждого варианта.

Наша первая важная тема - визуализация данных, и у нас столько возможностей для анализа, что два блога кажутся более подходящими, чем втискивать все это в один.

В первой части представлена ​​структура для анализа инструментов визуализации, а затем рассматриваются два часто используемых компонента программного обеспечения для визуализации: Tableau и PowerBI.

Итак, вы хотите вывести визуализацию данных на новый уровень - с чего начать? Существует ряд различных инструментов, каждый из которых претендует на звание лучших, поэтому мы собираемся глубоко погрузиться в некоторые из самых популярных инструментов, чтобы разбить их плюсы и минусы.

Face / Off: две категории инструментов

Есть две основные категории инструментов визуализации. С одной стороны, у вас есть инструменты перетаскивания, которые для разработки полагаются на графический интерфейс пользователя (GUI). Эти инструменты позволяют быстро приступить к работе, делая предположения о том, что вы делаете. Например, вы можете перетащить ПРОДАЖИ на ось Y и ДАТУ на ось X, и инструмент может предположить, что вы хотите построить график общих продаж за месяц. Если предположения верны, то все готово! Некоторыми примерами такого рода инструментов являются Tableau, PowerBI и QlikView.

С другой стороны, некоторые инструменты созданы с использованием языков сценариев. Языками, наиболее часто используемыми для разработки высококачественной визуализации данных, являются JavaScript (с использованием библиотеки D3.js) и R (с использованием пакета R Shiny). Для этих инструментов вам нужно гораздо более четко указывать, что вы хотите видеть, но в результате вы получаете гораздо больший контроль.

Иметь и не иметь: что искать в инструменте

Ниже приведены семь качеств, которые вы можете изучить при взвешивании решений для визуализации данных. Это всего лишь несколько объективов, через которые вы можете рассматривать инструмент - прокомментируйте ниже с другими идеями!

Кривая обучения для начинающих. Если вы раньше не использовали какой-либо инструмент визуализации, вы, вероятно, сначала не поймете, что делаете. Тем не менее, некоторые инструменты созданы для того, чтобы их было легко использовать сразу же - откройте программу, загрузите данные, создайте диаграммы. Другие, однако, могут потребовать, чтобы вы узнали о языке программирования инструмента, прежде чем вы сможете начать работу.

Кривая продвинутого обучения. Когда вы разберетесь с основами инструмента, вы, вероятно, захотите начать играть с более продвинутыми функциями. В зависимости от требований вашего проекта визуализации или от того, планируете ли вы изучать инструмент помимо одного или двух проектов, вы можете обнаружить, что с некоторыми инструментами добиться значительного прогресса легче, чем с другими.

Время разработки. Некоторые инструменты созданы для быстрой разработки, в то время как другие требуют более целенаправленного подхода, особенно если требуется кодирование. Даже после освоения инструмента вы можете столкнуться с жесткими сроками с большими ожиданиями. В этом случае вам нужно будет подумать, как быстро вы сможете перейти от начала проекта к прототипу.

Гибкость. Бывают случаи, когда вы хотите добавить функциональность, выходящую за рамки базовых вариантов использования инструмента. Здесь подход с графическим интерфейсом может быть скорее помехой, чем помощью - для того, чтобы сделать графический интерфейс гладким и функциональным, разработчики должны ограничить контроль пользователей. Если интерфейс просто не создан для решения данной задачи, мало что можно сделать. С другой стороны, подходы к программированию передают весь контроль в руки практикующего.

Интеграция с анализом / машинным обучением - некоторые инструменты имеют встроенные функции анализа данных, в то время как другие предназначены для представления только окончательных результатов уже завершенного анализа. Если ваша цель - предоставить пользователям возможность настраивать свои собственные параметры и видеть результаты в режиме реального времени, убедитесь, что выбранный вами инструмент может с этим справиться.

Хостинг сервера - большую часть времени вы создаете визуализацию, на которую другие люди могут смотреть. Зачастую архивирование визуализации и отправка ее конечным пользователям по электронной почте не является идеальным решением, поскольку это означает потерю возможности автоматически отправлять обновления, обновлять данные или предоставлять подробные инструкции. Вместо этого вы захотите найти способы разместить свое приложение в Интернете или на внутреннем сервере, чтобы пользователи могли просто щелкнуть ссылку, чтобы увидеть вашу панель управления. Вы можете найти варианты хостинга инструмента, более или менее подходящие для вашего случая использования.

Стоимость. Нам всем нужно беспокоиться о бюджете. Некоторые варианты являются бесплатными и имеют открытый исходный код (обычно это параметры языка сценариев), тогда как другие являются проприетарными, с вариантами оплаты «программное обеспечение как услуга» (SaaS). Не позволяйте стоимости удерживать вас от рассмотрения решения - просто будьте готовы объяснить начальнику отдела, почему на это стоит потратить немного. (Используйте это руководство как отправную точку!)

Имея это в виду, давайте рассмотрим два распространенных варианта визуализации.

Обычные подозреваемые: инструменты визуализации часто обсуждаемых данных

Таблица

Tableau - это программный инструмент № 1 для бизнес-аналитики, и тому есть причина - он выполняет именно то, что должно делать программное обеспечение бизнес-аналитики. Хотя Tableau может разочаровать специалистов по работе с данными, которые привыкли к структурированному подходу к программированию, для базовой визуализации он позволяет практически любому почувствовать себя способным разработчиком.

Плюсы:

Кривая обучения для начинающих: использовать Tableau просто. Сначала подключитесь к источнику данных, будь то файл Excel, подключение к базе данных или любой из десятков других вариантов подключения. Во-вторых, перетащите нужные имена переменных на объект графика (лист) и настройте по своему усмотрению. Вы даже можете объединить листы в панель управления в любой конфигурации, которая вам нравится, и проявить творческий подход, используя параметры, фильтры или другие параметры настройки.

Хостинг сервера. После завершения настройки панелей мониторинга, если в вашей организации есть сервер Tableau, вы можете мгновенно опубликовать его на своем сервере. Затем он становится доступным для всех, у кого есть логин для этого сервера.

Минусы:

Кривая продвинутого обучения - Tableau воплощает лозунг классической игры Милтона Брэдли, Отелло: Минута, чтобы научиться, целая жизнь, чтобы стать мастером! Как только вы достигнете точки, в которой вы хотите выйти за рамки того, что Tableau пытается упростить, вам придется перепрыгивать через обручи, чтобы попасть туда. Вот пример того, что вам нужно сделать, чтобы создать радарную диаграмму в Табло . Вы можете видеть, что это было несколько взломано, и, возможно, среднестатистический пользователь Tableau дважды подумал, прежде чем возиться с ним.

Гибкость. Иногда вы просто не можете что-то сделать в Tableau, и вы ничего не можете с этим поделать. Недавно я пытался создать параметр на основе списка с интеллектуальной панелью поиска вверху, которая доступна для списков фильтров. Оказывается, просто нельзя. Поскольку код Tableau не является открытым исходным кодом, я не мог взломать его сам; все, что я могу сделать сейчас, это подождать, пока разработчики Tableau решат добавить эту функцию (если они когда-нибудь это сделают).

Интеграция с анализом - Tableau не предназначен для реального выполнения машинного обучения. Он не предназначен для продвинутой аналитики; он предназначен для того, чтобы превратить ваш анализ в красивые интерактивные картинки. При этом Tableau действительно обеспечивает интеграцию R и Python, которую вы можете использовать для некоторых типов анализа, но вам, вероятно, будет лучше выполнить анализ заранее.

Стоимость. Когда некоторые из инструментов в этом списке стоят 0 долларов, может быть сложно оправдать фактическую оплату чего-либо. На данный момент лицензия Tableau Creator стоит 70 долларов за пользователя в месяц, а лицензия Viewer - 12 долларов в месяц. (Актуальную информацию о ценах см. Здесь.) Но учитывая, что средний специалист по обработке данных обходится организации в 117 000 долларов в год только на зарплату (около 56 долларов в час), лицензия окупится сама, если сэкономит вам час и половина времени разработки в месяц. (У Tableau также есть бесплатные лицензии для студентов.)

Microsoft Power BI

Microsoft Power BI захватывает сообщество бизнес-аналитики штурмом, и это неудивительно - недавно Gartner выбрала Power BI как самую успешную платформу для аналитики и бизнес-аналитики в своей оценке Magic Quadrant за 2019 год. Хотя у него немного более крутая кривая обучения по сравнению с Tableau, он лучше справляется с процессом загрузки данных, предоставляя больше гибкости в руки практикующего специалиста.

Плюсы:

Гибкость. Самым большим преимуществом Power BI перед Tableau, вероятно, является его способность извлекать, преобразовывать и загружать данные внутри инструмента (задачи предварительной обработки науки о данных, которые обычно сгруппированы и называются ETL ). Power BI использует звездообразную структуру хранилища данных, которая дает пользователю возможность манипулировать данными по мере необходимости, чего Tableau Desktop не может делать должным образом. Это означает, что если способ хранения ваших данных не способствует визуализации, которую вы хотите создать, вы можете легко внести необходимые изменения.

Кривая обучения для начинающих. Как и в Tableau, новый пользователь Power BI может сразу перейти к инструменту, загрузить источник данных и перенести некоторые графики на панель мониторинга. Это позволяет пользователю перейти от ничего к чему-то за очень короткое время.

Интеграция с анализом. Если вы новичок в машинном обучении и хотите добавить немного искусственного интеллекта в свои информационные панели, вам поможет Power BI. Вы можете использовать одну из предварительно обученных моделей или даже создать свою собственную. Узнайте больше о выпуске функциональности AI здесь. Однако возможность интеграции вашего собственного кода Python или R все еще находится на начальной стадии разработки и может быть не готова к тому, что вы хотите делать.

Хостинг сервера. Поскольку Power BI встроен в набор продуктов Microsoft, очень легко интегрировать ваш сервер Power BI с остальной частью вашей работы. Фактически, если ваши данные размещаются в среде Azure, вы можете легко перенести их в Power BI.

Минусы:

Время разработки. Если вы хотите воспользоваться преимуществами инструментов управления данными Power BI, вам может показаться, что вы проводите больше времени в Power BI, чем в Tableau. Однако это дополнительное время, потраченное на разработку Power BI, - это работа, которую невозможно выполнить в Tableau Desktop. Скорее всего, вы сэкономите время, не переключаясь между инструментами для выполнения этих двух задач.

Стоимость. Power BI Premium взимает плату за узел, когда каждый узел имеет от 8 до 32 виртуальных ядер. Затраты могут быть довольно высокими в зависимости от размера вашей организации и ваших общих потребностей. Ознакомьтесь с их калькулятором цен.

Ознакомьтесь со второй частью!

_________________________________________________________________

Если вам понравился этот пост в блоге, узнайте больше о нашей работе, подпишитесь на нас в социальных сетях (Twitter, LinkedIn и Facebook) или присоединяйтесь к нам на наших бесплатных ежемесячных вебинарах Академии .