Машинное обучение для аналитиков

Как аналитик, вы хотите получить максимальную отдачу от своих данных. Вы хотите иметь доступ к лучшим методам, чтобы действительно понять, что происходит в вашем бизнесе. Эти возможности у вас под рукой благодаря Smart Discovery в SAP Analytics Cloud. Smart Discovery предлагает вам эффективный способ использования автоматизированного машинного обучения поверх ваших данных бизнес-аналитики, не теряя драгоценного времени на анализ при подготовке данных. Просто решите бизнес-вопрос, который вы хотите задать своим данным, и позвольте Smart Discovery проанализировать его для вас, запустив алгоритм машинного обучения. Затем вы можете изучить сгенерированные результаты, чтобы получить представление о ваших данных.

Умное обнаружение

В первом квартале 2021 года было выпущено значительное обновление Smart Discovery, которое может лучше ответить на ваш бизнес-вопрос, помогая вам более четко определить контекст вашего вопроса. Возможность определить лучший вопрос означает, что Smart Discovery может автоматически подготовить данные для вас и создать лучшие результаты анализа для изучения. Чтобы убедиться, что вы довольны бизнес-вопросом, который вы определили, Smart Discovery теперь предлагает вам предварительный просмотр вашего вопроса, прежде чем он начнет его анализ. Три основных преимущества Smart Discovery:

  1. Сокращает разрыв в знаниях между машинным обучением и BI и позволяет аналитикам легко использовать машинное обучение в BI.
  2. Автоматически использует данные, содержащиеся в существующих моделях бизнес-аналитики, исключая необходимость ручной подготовки.
  3. Сопоставляет выходные данные с бизнес-вопросом, что упрощает последующую доработку и улучшение.

В этой статье объясняется, как использовать Smart Discovery для изучения ваших данных и ответов на реальные вопросы бизнеса.

Укажите бизнес-вопрос

Настройки Smart Discovery

Smart Discovery поможет вам понять процесс, который он использует для анализа ваших данных. Это поможет вам указать правильный вопрос и быстро понять сгенерированные результаты. Вы можете уточнить вопрос, изменив цель или объект, отфильтровав наборы данных или исключив переменные для анализа. Цель – это мера или параметр, о которых вы хотели бы узнать больше, например о доходах или движениях клиентов. Сущность определяет параметр или параметры, которые описывают объект в данных, о которых вы хотели бы узнать больше, например о клиенте или продукте. Сущность описывает ключ, который идентифицирует каждый экземпляр этого объекта. Smart Discovery агрегирует данные до уровня, описанного объектом.

Аналитикам обычно требуются специальные знания в области науки о данных, чтобы эффективно применять методы машинного обучения к бизнес-данным. Вот некоторые из проблем, с которыми они сталкиваются:

  • Выбор правильной техники машинного обучения для конкретной задачи.
  • Выбор и подготовка данных.
  • Правильная интерпретация результатов.

Smart Discovery позволяет аналитику просто указать бизнес-вопрос. На основе этого вопроса выбирается правильный алгоритм прогнозирования, и данные BI автоматически подготавливаются для применения алгоритма прогнозирования. Затем Smart Discovery выдает результаты, которые легко понять. Поскольку автоматическая подготовка данных позволяет применять машинное обучение непосредственно к данным BI, можно просто уточнить вопрос, или вы всегда можете задать более одного бизнес-вопроса. Исследуйте свои данные с разных сторон, попросив Smart Discovery проанализировать одну и ту же цель по отношению к разным объектам, и это даст разные результаты.

Подтвердите деловой вопрос

Smart Discovery проанализирует данные и создаст контент, чтобы получить представление о том, как базовые переменные влияют на цель по отношению к объекту в наборе данных. Smart Discovery автоматически подготавливает данные и строит прогностическую модель для прогнозирования валовой прибыли для имени клиента. Из этой прогностической модели он извлекает и генерирует контент, который помогает аналитику понять валовую прибыль.

Ключевая проблема при применении машинного обучения к данным BI заключается в том, что данные не имеют естественной структуры, позволяющей применять машинное обучение. Это может означать, что результаты, полученные с помощью машинного обучения, не соответствуют ожиданиям пользователя и могут ввести в заблуждение. При настройке Smart Discovery вы указываете вопрос, выбирая цель и сущность. Сущность определяет объект в данных, которые вы хотите исследовать. Сущность определяется измерением или несколькими измерениями. По сути, это формирует ключ сгенерированного набора данных. Указав и то, и другое, данные могут быть подготовлены в соответствии с вопросом, гарантируя, что сгенерированный вывод будет безопасным и понятным.

В этом примере вы указываете цель как валовую прибыль, а сущность — как имя клиента. Другие измерения в данных могут играть важную роль для объяснения цели и должны быть представлены в сглаженном наборе данных. Показатели агрегируются на основе их типа агрегирования на уровне объекта.

То, как измерение представлено в наборе данных, зависит от отношения, которое оно имеет к объекту; на основе следующего:

  1. Если измерение имеет одно значение для каждой сущности, оно будет включено в набор данных как есть с исходным именем. Отношение в этом случае будет много к 1 (m:1).
  2. Если для каждого значения ключа есть уникальное значение измерения, измерение не будет включено. В данном случае соотношение 1 к 1 (1:1).
  3. Если измерение имеет несколько значений для объекта, число уникальных значений будет включено с префиксом «Число». Отношения в этом случае могут быть многие ко многим (м:м) или один ко многим (1:м).

Smart Discovery автоматически подготавливает набор данных, содержащий одну строку данных для каждого экземпляра объекта. Например, если выбранным параметром был идентификатор клиента, набор данных будет содержать 1 строку данных для каждого уникального идентификатора клиента. Идентификация объекта позволяет автоматизированному машинному обучению обеспечивать гораздо более целенаправленный анализ.

Автоматически созданная история

Smart Discovery автоматически подготавливает данные для бизнес-вопроса, анализирует данные и создает контент для вас. Процесс автоматически строит прогностическую модель для прогнозирования цели. Информация, представленная на страницах «Ключевые факторы влияния», «Неожиданные ценности» и «Моделирование», основана на этой модели.

Важно отметить, что анализ выполняется на снимке данных во время запуска Smart Discovery и что анализ не обновляется автоматически в ответ на обновления данных. Весь контент, создаваемый Smart Discovery, является динамическим и изменяется в зависимости от исходных данных.

Страница «Обзор» предоставляет визуализации для обобщения результатов вашего целевого измерения или меры по отношению к вашей сущности.

Страница ключевых влиятельных лиц создается на основе прогностической модели. На странице «Ключевые факторы влияния» перечислены (в порядке убывания) до 10 параметров и показателей, которые существенно влияют на цель. Для каждого фактора влияния предоставляются визуализации, которые показывают среднее целевое значение и распределение целевого значения для каждого значения в измерении или для каждого объединенного значения для мер.

В этом случае в данных есть запись для каждого имени клиента. Эта запись содержит данные на уровне клиента, такие как совокупная валовая прибыль для этого клиента и любые значения параметров, которые являются уникальными для этого клиента.

Страница "Непредвиденные значения" содержит записи в данных, в которых значение, предсказанное прогностической моделью, сильно отличается от фактического значения в данных. Эти значения важны, поскольку прогнозируемые значения основаны на шаблонах, обычно встречающихся в данных, поэтому эти значения являются исключениями из общего правила. В этом примере значение валовой прибыли для этих имен клиентов отличается от предсказанного поведением других клиентов. Эти клиенты могут быть интересны аналитику, поскольку они могут выявить особые случаи, требующие расследования, или могут выявить проблемы с качеством исходных данных.

Факторы влияния перечислены с указанием относительного влияния выбранных значений на ожидаемое значение. В этом примере мы видим, что ожидаемая стоимость для клиента с этими свойствами имеет ожидаемую валовую прибыль 2 278 419.

Сводка

С помощью Smart Discovery пользователи могут легко использовать автоматизированное машинное обучение, чтобы быстро анализировать свои BI-данные непосредственно в SAP Analytics Cloud без необходимости в каких-либо знаниях в области обработки данных или машинного обучения. Просто указав свой бизнес-вопрос, вы можете извлечь выгоду из информации, полученной с помощью автоматизированного машинного обучения. Отказ от подготовки данных может изменить правила игры, поскольку возможность быстро выполнить анализ, понять простые результаты, затем изменить настройки и выполнить дальнейший анализ, позволяет итеративно лучше понять ваши бизнес-данные. Этот простой процесс позволяет вам лучше принимать решения и создавать истории, создавая полезный контент.