Вы можете ничего не думать о том, чтобы зайти в Интернет и выполнить несколько поисковых запросов в Интернете для вещей, которые вас интересуют, но знаете ли вы, что вас активно отслеживают почти на каждом посещаемом вами сайте? Крупные компании в США отслеживают потребителей, которые взаимодействуют с их веб-сайтами, чтобы лучше понять их. Этот процесс называется интеллектуальным анализом данных, и он коренным образом изменил наше представление о данных в больших масштабах.
Что такое интеллектуальный анализ данных?
Интеллектуальный анализ данных существовал в той или иной форме с момента появления Интернета, но только недавно компьютеры обладали достаточной вычислительной мощностью, чтобы в полной мере использовать интеллектуальный анализ данных. Интеллектуальный анализ данных включает в себя три отдельных принципа, включая сбор статистики, использование искусственного интеллекта для сопоставления закономерностей в этой статистике и машинное обучение для обучения используемых алгоритмов тому, какие данные имеют отношение к сборщику.
Вы можете подумать, что этот тип сбора данных ограничен онлайн-сайтами, такими как Facebook и Google, но крупные розничные сети, банки и другие онлайн-продавцы используют интеллектуальный анализ данных, чтобы найти больше информации о своих потребителях, чтобы помочь ориентировать рекламные акции и другие предложения, которые будут генерировать лид или продажа для компании.
Зачем они это делают?
Большая часть интеллектуального анализа данных делится на три категории, включая описательное моделирование, прогнозное моделирование и предписывающее моделирование. Описательное моделирование использует такие методы, как кластеризация и группировка по сходству, чтобы определить, могут ли группы, которым нравится одно, нравиться другое.
Прогнозное моделирование использует регрессию, деревья решений и нейронные сети, чтобы предсказать, как группа людей может реагировать на определенные вещи. Например, считается, что прогностическое моделирование использовалось обеими кампаниями на выборах 2016 года для определения колеблющихся штатов, на которые следует ориентироваться, и для построения психологического профиля активных избирателей.
Предписывающее моделирование может анализировать набор данных и предлагать оптимизации, которые маркетинговая команда может внести, чтобы повысить рентабельность инвестиций для этого набора данных.
Как защитить себя
Стоит отметить, что вы не можете оставаться на 100% в безопасности и отказаться от интеллектуального анализа данных, потому что процесс сбора данных выполняется с вашего согласия, когда вы подписываетесь на приложение или соглашаетесь использовать онлайн-сервис. Однако есть несколько расширений, таких как Privacy Badger и Ghostery, которые усложняют сбор данных для этих компаний, блокируя наиболее часто используемые методы сбора данных.
Первоначально опубликовано на сайте premhirubalan.com 10 мая 2018 г.