Достаточно сказать, что понятие человека - чрезвычайно сложная тема. Множество правовых, социальных, культурных, биологических и метафизических аспектов личности подробно исследуются в недавней книге Кристиана Смита Что такое личность?: Переосмысление человечности, социальной жизни и морального блага от человека. В этой книге Смит перечисляет пять уровней отчетливо человеческих способностей, связанных с понятием личности. К ним относятся формирование интереса, осознание, моральные ценности, творчество, саморефлексия, формирование идентичности, поиск истины, использование языка, долговременная память, межсубъективное понимание, использование технологий, формирование повествования, волеизъявление, эмоциональный опыт и многое другое. еще десять уникальных способностей лиц.

Итак, мы знаем, что концепция человека многогранна, и ее трудно уловить в содержательном определении или утверждении. Любое данное определение, кажется, отражает идеологическую предвзятость его определяющего. Как заявила философ Мария Шехтман, это слово может по-разному означать человеческое животное, моральный агент, рациональный, самосознательный субъект, обладатель определенных прав и «существо с определенной личностью или характером. ” Например, дебаты о правах на аборт - яркий пример того, насколько сложно определить личность.

Тем не менее, я считаю, что остается еще один важный аспект личности, которому писатели и мыслители уделяли гораздо меньше внимания по этой теме. Я имею в виду то, как технологии формируют наше восприятие самих себя. В наш цифровой век, когда разрыв между реальностью и цифровой реальностью все больше стирается, уже не ясно, где одно начинается, а другое заканчивается. Это размытие между мирами онлайн и офлайн заставляет нас задавать следующие вопросы:

Как связаны люди и их цифровые представления? Как именно наши физический и цифровой миры, личности, события и т. Д. Соотносятся друг с другом?

Оксфордский философ технологий Лучано Флориди назвал это явление Onlife. Мы живем в пограничном пространстве между реальным и тем, что социолог постмодерна Жан Бодрийяр назвал бы гиперреальным. Пьер Бурдье сказал бы, что наши личные данные перемещаются в символических пространствах, и топология этих цифровых, символических пространств может влиять на виды предлагаемых нам вакансий, рекомендуемые фильмы и даты, на которые мы продолжать. Мишель Фуко сказал бы, что наше местоположение и классификация в этих цифровых пространствах являются выражением власти ученых, занимающихся данными в современном обществе.

Далее я изложу одну из возможных интерпретаций взаимосвязи людей, их личных данных и персонализации машинного обучения.

Это откровенно спекулятивная интерпретация, основанная на идеях теории информации, которые, на мой взгляд, полезны для понимания того, что делает нас уникальными как личности. Я буду утверждать, что учетная запись, которую я представляю здесь, имеет еще одну приятную особенность, поскольку она может помочь нам разобраться в опасениях по поводу того, как персонализация машинного обучения может подорвать наше понимание свободы воли, как утверждают недавние авторы, такие как Шошана Зубофф »Заявили.

Вы, возможно, задавались вопросом, что означает, когда Google или Facebook говорят, например, что «эта реклама была персонализирована на основе ваших предпочтений при просмотре».

Некоторые из представленных ниже идей являются новыми, а некоторые из них были вдохновлены работами Лучано Флориди и других, таких как Мирей Хильдебрандт. И если вы думаете, что эти идеи - простая софистика или философствование ради философствования, вопросы, касающиеся отношений между людьми и их цифровыми представлениями, активно формируют Цифровую повестку дня ЕС. Например, в 2013 году Европейская комиссия опубликовала Онлайн-манифест: быть человеком в гиперсвязанном мире. В какой-то момент, вероятно, раньше, чем позже, мы должны ответить на эти сложные вопросы о том, как соотносятся цифровой и физический миры.

Вы - фундаментально несжимаемая структура информации

Персональные данные в форме информации являются представлениями лиц, раскрывающими их истинную сущность.

Человек - это принципиально несжимаемая информационная структура, некое информационное единство. Таким образом, количество информации, содержащейся в человеке, можно количественно оценить с помощью энтропии Шеннона. Давайте потратим некоторое время на то, чтобы раскрыть это утверждение различными способами.

Философ из Гарварда Кристин Корсгаард на протяжении своей карьеры пропагандировала и распространяла кантовские взгляды на личность и свободу действий. Она утверждает, что своего рода единое агентство необходимо для того, чтобы действовать в соответствии с практическими соображениями и, таким образом, конституировать себя как личность, единое целое с определенным набором ценностей. которые побуждают к действию. Эти наборы ценностей отличают нас как уникальных личностей и могут рассматриваться в более общем плане как образцы. Паттерны, как мы знаем от Шеннона и других, могут быть закодированы и переданы как сообщения, которые будут декодированы и интерпретированы восприимчивыми наблюдателями или инструментами.

Норберт Винер, отец-основатель теории информации и кибернетики, придерживается аналогичной точки зрения. Винер в своей книге 1954 года Кибернетика и общество пишет, что Организм противостоит хаосу, распаду, смерти, как сообщение - шуму… описать организм… означает ответить на определенные вопросы о то, что раскрывает свой образец . Для Винера люди - это объединенные организмы, которые посредством своего рода гомеостаза изо всех сил пытаются сохранить свое единство перед лицом слепого марша Вселенной к все возрастающей энтропии. Он пишет: Это образец, поддерживаемый этим гомеостазом, который является пробным камнем нашей личности (стр. 96). Мы, как личности, являемся образцами, образцами, которые могут быть закодированы и переданы в виде сообщений.

Винер поразительно опередил Neuralink Илона Маска примерно на 70 лет:

«Интересно и поучительно подумать о том, что произошло бы, если бы мы передали всю модель человеческого тела, человеческого мозга с его воспоминаниями и перекрестными связями, чтобы гипотетический принимающий инструмент мог повторно воплотить эти сообщения в соответствующем материале, способном продолжать процессы, уже существующие в теле и уме, и поддерживать целостность, необходимую для этого продолжения, посредством процесса гомеостаза ».

Ваше инвариантное (цифровое) представление

На языке глубокого обучения и вычислительной нейробиологии мы могли бы назвать это базовое единство информации инвариантным представлением человека, если разговоры о сущностях или единствах звучат для вас слишком банально. При распознавании изображений инвариантное представление объекта - это некоторое скрытое представление (кодирование с потерями) объекта, которое позволяет идентифицировать объект при произвольно меняющихся условиях, таких как освещение или угол. Например, в приложениях видеонаблюдения с использованием системы видеонаблюдения цель состоит в том, чтобы найти надежное функциональное представление человека, позволяющее идентифицировать его при различных ракурсах камеры. Говоря языком цифрового маркетинга и брокеров данных, цель состоит в том, чтобы создать многоканальное представление о клиенте, которое может идентифицировать человека как по его физическому поведению в розничной торговле, так и в сети. Надеюсь, вы уловили картину.

Цифровая жизнь дезинтегрирует человека

Возможно, менее абстрактно, в нашем повседневном языке мы распознаем единство людей, называя людей в индивидуумами: однажды разделившись, вы теряете свою идентичность как личность. Делез и другие были первыми, кто обратил на это внимание. Теоретики культуры ухватились за эту характеристику людей через личные данные. В широко цитируемой статье Джона Чейни-Липпольда под названием Новая алгоритмическая идентичность: мягкая биополитика и модуляция контроля говорится: Эти индивидуумы становятся аксиомой контроля, получателями, через которые течет власть, когда субъективность принимает деконструируемый погружение в цифровую эру . Я не уверен, что такое аксиома контроля, но эти теоретики культуры правы, рассматривая людей как неделимые единства. Вопрос в том, что именно, когда вас отнимают, делает вас не вами?

Повседневный эссенциализм

Наконец, и прежде чем мы перейдем к тому, как этот основанный на информации взгляд на человека связан с беспокойством по поводу эрозии свободы воли, я думаю, стоит указать на еще одну интересную связь с эссентализмом. Независимо от того, как мы относимся к метафизическому утверждению, в повседневном опыте и в социальной психологии имеется множество свидетельств того, что люди действительно действуют так, как будто что-то вроде сущности действительно существует. Люди будут платить гораздо большие суммы денег за такой же свитер, если они считают, что его носил Джордж Клуни. Люди будут дорожить бейсбольным мячом с автографом своего любимого игрока, как если бы по волшебству мастерство игрока могло быть сохранено внутри объекта. Родители часто считают, что обувь их ребенка незаменима, и так далее. Как Пол Блум и Сьюзен Гельман продемонстрировали во многих экспериментах, часть того, что значит быть человеком, - это испытать это чувство психологического эссенциализма. Кажется, мы не можем избежать этого.

Энтропийная интерпретация свободы воли

Если люди действительно обладают свободой воли, то по определению они могут выбрать совершить какое-либо действие или поведение или поступить иначе; что делать дальше, полностью зависит от них. Если вы полностью свободны действовать, то знание чего-либо о вашем окружении или текущем состоянии ума не уменьшит никакой неуверенности в том, что вы можете делать дальше. В терминологии теории информации взаимная информация между вашим поведением, вашим окружением или текущим психическим состоянием фактически равна нулю.

Максимально свободного человека можно представить как своего рода массовое многомерное совместное однородное распределение по всем возможным дискретным поведениям, мыслям, событиям и т. Д. Поскольку это распределение не содержит избыточности (помните, мы говорили, что вы можете делать что угодно с равной вероятностью), Среднее количество битов, необходимых для кодирования этого распределения событий, равно энтропии Шеннона. Поскольку вы - человек, предположительно обладающий свободой воли - несжимаемы, нет лучшего и более эффективного способа кодировать эту информацию, не жертвуя некоторыми аспектами своей сущности как личности. В качестве примечания, я думаю, что определенно существуют проблемы с просмотром свободы воли таким образом, но мне придется сохранить их для другого сообщения (например, поведение всегда должно интерпретироваться под каким-то описанием. Но чье описание: исполнителя или толкователя?)

Как ваши поведенческие данные уменьшают неопределенность в отношении вас

Теперь предположим, что мы наблюдаем, как вы действуете определенным образом. Может быть, вы купили какой-то товар, например, на Amazon. Может, это был веганский корм для кошек. Теперь мы получили информацию о вас. Степень информативности может быть определена количественно по степени, в которой владение этой информацией (личными данными) позволяет мне уменьшить мою неуверенность в вашей основной природе как личности. Оказывается, знание того, что вы покупаете веганский корм для кошек, многое говорит о том, какой вы человек, какой может быть ваша домашняя обстановка и так далее. Как однажды сказал часто цитируемый и недооцененный философ и основатель Bubba Gump Shrimp Co., Форрест Гамп: «Моя мама всегда говорила, что вы можете многое сказать о человеке по его обуви, куда они идут, где они были». Действительно, Форрест. Это действительно так.

Однако может оказаться, что наблюдение за вашим поведением ничего не делает для уменьшения неуверенности в вашей истинной сущности. В таком случае мы могли бы считать это просто «шумом». Но часть вашей фундаментальной природы или сущности включает вашу предрасположенность к определенному поведению. Таким образом, персонализация машинного обучения (MLP) направлена ​​на сбор как можно большего количества личных данных, чтобы уменьшить неопределенность в отношении того, какое поведение вы будете проявлять, будь то клик по рекламе или покупка продукта. Теперь вы можете понять, почему некоторые беспокоятся об опасностях, исходящих от MLP и AI по нашей доброй воле.

Представляем энтропию Шеннона

Позвольте мне проанализировать эти утверждения, которые я только что сделал. Во-первых, мое представление опирается на понятие энтропии Шеннона, которое явно формализует связь между предсказуемостью событий и вероятностью их возникновения. Вот пример для пояснения. Таким образом, набор из n событий, в котором каждое событие происходит с вероятностью 1 / n, является наиболее непредсказуемым (с точки зрения предсказания результата любого эксперимента). По словам Шеннона, это означает, что его энтропия максимальна. Мы можем рассматривать энтропию распределения как теоретический предел скорости сжатия информации. Когда энтропия находится на пике, мы максимально не уверены в исходе любого события, происходящего в данном эксперименте. По мере того, как вероятность событий отклоняется от этой однородности 1 / n, мы становимся более уверенными в том, что события происходят. Гений Шеннона заключался в том, чтобы формально выразить, как мы можем использовать эту избыточность для более эффективного кодирования информации. Другое важное значение заключалось в осознании того, что энтропия в некотором смысле является количественной оценкой предсказуемости.

Энтропия может быть связана с обновлением байесовских убеждений

Это понятие неопределенности также может быть выражено в контексте обновления байесовских убеждений. Прежде чем мы наблюдаем какое-то событие или поведение - в терминах Хайдеггера, до явления присутствия - у нас есть предварительные убеждения о вероятности того, что какое-то событие произойдет. Эти убеждения могут быть основаны на предыдущем опыте или культурном или научном понимании какого-либо явления. Но после того, как мы наблюдаем это событие, мы собрали информацию, информацию в том смысле, что теперь мы можем обновить распределение вероятностей, представленное нашими предыдущими убеждениями. Разница между априорным распределением вероятностей и апостериорным (обновленным) распределением - это то, что мы могли бы назвать «информационным» или «информационным выигрышем» наблюдения. (В байесовском машинном обучении мы часто используем дивергенцию KL для количественной оценки изменения неопределенности, связанной с нашими оценками параметров, при обновлении от нашего до апостериорного распределения).

По сути, теперь мы более уверены в том, какие события или поведение будет демонстрировать этот объект после того, как мы наблюдаем данное событие или поведение. Поведение, которое снижает неопределенность больше, чем другие, содержит больше информации о вашей основной природе. Эта идея проиллюстрирована ниже и взята из книги Джорджа Клира Неопределенность и информация.

Крупные технологии хотят уменьшить неопределенность в отношении вашего будущего поведения

Это наконец возвращает нас к вопросу о том, почему маркетологам и компаниям, работающим в социальных сетях, нужны ваши личные данные и почему персонализация является словом года Ассоциации национальных рекламодателей. Рискуя заявить здесь очевидное, я все равно сделаю это.

Facebook, Google, Amazon и Apple (в меньшей степени) хотят точно предсказать ваше будущее поведение. И что позволило бы им предсказать ваше поведение с минимально возможной неопределенностью? Больше личных данных. Конечно, разные виды личных данных, очевидно, будут более полезными для уменьшения неопределенности вашей истинной природы. Например, для прогнозирования будущего поведения знание вашего прошлого поведения может уменьшить неопределенность. В повседневной жизни мы бы сказали, что знание того, что у вас есть сигарета или зависимость, снижает неопределенность наших прогнозов относительно того, закурите ли вы завтра. Понятие Б. Ф. Скиннера об «изучении истории» более формально отражает эту идею.

Подталкивания и манипуляции: игра с системой

Помимо всего этого, также можно манипулировать веб-приложением или устройством, чтобы «подтолкнуть» пользователей к определенному предполагаемому поведению, как еще один способ минимизировать ошибки прогнозирования, как указала Галит Шмуэли. A / B-тестирование и push-уведомления могут быть примерами методов «настройки» или «стада», которые могут искусственно повысить точность прогнозирования MLP. Приложение, которое записывает данные об использовании на вашем телефоне, в некотором смысле представляет собой карманный цифровой ящик Скиннера с элегантным дизайном и хорошо подобранной цветовой палитрой. Следовательно, мы не должны удивляться тому, что прагматический бихевиоризм Скиннера так хорошо сочетается с типом прогнозного моделирования, который доминирует в отрасли. Помните, как Цукерберг сказал своим сотрудникам: «Двигайтесь быстрее и ломайте вещи»? Это прагматизм.

Научные и прагматические представления о личности

Мы также должны понимать кое-что еще. Цель отраслевого MLP не в том, чтобы построить наиболее точную с научной точки зрения модель, а в том, чтобы спрогнозировать очень конкретное и узко определенное поведение в рамках и без того узких поведенческих границ приложения или веб-сайта. Основной принцип теории выборки состоит в том, что ваша выборка измерений должным образом репрезентативна для системы, о которой вы делаете выводы. Промышленный MLP не заботится о принципах теории выборки. В конце концов, ваше поведение - лишь одна из сторон вашей личности. Это не вся история. Кристофер Рив все еще вел осмысленную жизнь после того, как несчастный случай оставил его парализованным. Ваше поведение в приложении не отражает вас как личность.

Наши моральные и юридические кодексы признают это различие, когда мы наказываем тех, кто убивает mens rea более сурово, чем тех, кто случайно убивает кого-то . То, что происходит в вашей голове, имеет значение для определения вас как уникальной личности . Я предполагаю, что у вас также есть убеждения, желания, краткосрочные и долгосрочные планы и различные моральные ценности. У вас также есть тело, вы живете в каком-то социальном сообществе (если только вы не тренируетесь, чтобы стать следующим Тедом Качински) и говорите на каком-то языке. Как показали мысленные эксперименты, проведенные Локком, а затем намного позже Дэниелом Деннетом и другими, мы могли иметь ментальные представления с противоположным содержанием, но при этом проявлять неотличимое поведение. Это так называемый аргумент «инверсии спектра» против бихевиоризма.

Более того, приложения и устройства, которые измеряют поведение, на самом деле представляют собой лишь небольшую часть всего поведения, которое вы можете продемонстрировать. Хуже того, при сборе большинства данных не проводится различие между сознательным и бессознательным поведением. Большая часть того, что вы делаете за компьютером, подпадает под бессознательное целенаправленное поведение. Подумайте о перемещении мыши к кнопке или нажатии на ссылку. Вам приходилось это планировать до того, как это сделать? Существует так много вашего поведения, которое исключается из рассмотрения, что многие комментаторы, опасаясь, что MLP подрывает нашу свободную волю, не смогли понять. Например, Instagram не знает, что вы прокручиваете страницу Instagram Explore с двойной дрянной оберткой Gordita в левой руке; такое поведение не подлежит измерению и поэтому не может использоваться для уменьшения неопределенности вашей истинной природы как человека, который любит есть теплый корм для собак со вкусом начо. Теперь вы можете медленно вздохнуть с облегчением.

Не попадитесь в ловушку радикального бихевиоризма

Хотя специалисты по данным и исследователи могут утверждать, что он работает, предсказывая ваши предпочтения, интересы или потребности, я могу привести очень простой аргумент, чтобы показать, что это не может быть правильным. В предпочтениях нельзя покупать вещи. Не требует щелчка. Интересы не добавляют вещей в тележку. Ошибка, которую обычно демонстрируют исследователи в литературе по рекомендательным системам, заключается в том, что они, возможно, бессознательно приравнивают предпочтения к поведению. Они попали в ловушку радикального бихевиоризма, осознают они это или нет. Они, должно быть, не слышали об аргументе об инвертированном спектре. Я могу сказать вам по опыту, когда вы прогнозируете результат для человека в своем наборе данных, нет столбца результатов с пометкой предпочтения или потребности. Вместо этого он просто скажет Купить, Добавить или Отбросить. Все это очень узко определенные формы поведения, которые являются результатом почти бесконечного количества предшествующих психических состояний. Чтобы убедиться в этом, вот отрывок из цитируемой статьи Basu et al. (1998):

В этом документе представлен индуктивный обучающий подход к рекомендации, который позволяет использовать как рейтинговую информацию, так и другие формы информации о каждом артефакте при прогнозировании пользовательских предпочтений.

Итак, Industry MLP немного запутано, но полностью прагматично. Нет необходимости строить теоретические построения о том, что на самом деле вами движет. Его не волнует ваше настоящее "я". Ему не нужно заботиться. Технологические компании Большой четверки пришли к осознанию того, что простого измерения и записи того, что вы делаете, а также когда и где вы это делаете (в контексте приложения или устройства), как-то достаточно, чтобы предсказать ваши действия на их платформах соответствуют их стандартам .

Просто «достаточно хорошо», чтобы получить от вас то, что мне нужно

Другими словами, прогнозы не должны быть идеальными, они просто должны быть достаточно хорошими. Что такое «достаточно хорошо»? Что ж, скорее всего, все, что связано с ключевыми бизнес-метриками или ключевыми показателями эффективности, такими как рентабельность инвестиций, пожизненная ценность клиента, коэффициент конверсии и, возможно, наиболее широко на уровне генерального директора, максимизация акционерной стоимости. Неважно, есть ли у вас эти убеждения или интересы на самом деле или эти убеждения или интересы на самом деле причинно ответственны за ваше поведение. К сожалению, для дальнейшего изучения этого момента потребовалось бы еще одно слишком длинное и бессвязное сообщение в блоге.

Проницательный читатель на этом этапе может понять, что ваша социальная, моральная и гендерная идентичность также может помочь уменьшить неопределенность в отношении вашего будущего поведения, мыслей, убеждений, желаний и планов. Знание вашего полного генома или личности Большой пятерки также уменьшит неопределенность в отношении того, будете ли вы поддерживать взгляды этого политического кандидата, будете ли открыты для нового опыта или усваиваете кофеин быстрее, чем обычно (факт, который может стоить того, Redbull или Monster, например).

К счастью, GDPR и другие будущие нормативные акты, как правило, ставят высокие барьеры для явного согласия, позволяющего компаниям получить доступ к подобного рода конфиденциальным личным данным. Однако имейте в виду, что исследователи уже начали внедрять рекомендательные системы, которые используют психологические и эмоциональные состояния для персонализации рекомендаций для вас (ссылка на патент Google). Я не вижу причин, по которым такие исследования замедлялись бы.

Что вы можете сделать, чтобы добавить энтропии?

Короче говоря, персональные данные - это средство, с помощью которого контроллеры данных могут уменьшить неопределенность в отношении вашего будущего поведения. Это снижение неопределенности имеет очевидную денежную ценность для рекламодателей и маркетологов. К счастью, вы можете сохранить свою непредсказуемость и, следовательно, свою автономию в кантианском смысле способности определять для себя, какое поведение проявлять. Существуют различные методы повышения конфиденциальности (ПЭТ), которые работают путем введения точных количеств статистического шума в поведенческие данные или путем сворачивания конкретных категорий в более общие, например, заменяя город Нью-Йорк штатом Нью-Йорк. Фактически, существуют такие показатели, как потеря информации на основе энтропии (EBIL), которые определяются с использованием формулы для условной энтропии. Такие меры по сути говорят нам, сколько энтропии остается в некоторой целевой переменной при некотором преобразовании или агрегировании в другой связанной переменной. Мы могли бы сосредоточиться на преобразованиях, которые устанавливают баланс между добавлением искажений в исходный набор данных, достаточных для защиты конфиденциальности субъектов данных, но которые достаточно малы, чтобы все же позволять полезный анализ набора данных.

Осуществление своих прав в качестве субъекта данных

Наконец, самый простой и самый прямой способ ввести энтропию в ваши личные данные - это осуществление основных прав, предоставленных субъектам данных из ЕС в соответствии с GDPR. Здесь субъекты данных имеют право на доступ, удаление и исправление хранимых и собранных о них личных данных. Удаляя или изменяя эти личные данные, они могут добавить больше неопределенности к прогнозам своего будущего поведения в приложении. Если вы не на территории ЕС, вам, к сожалению, не повезло. Но вас может заинтересовать книга Финна Брантона и Хелен Ниссенбаум под названием Обфускация: руководство пользователя по конфиденциальности и протесту, в которой подробно описаны некоторые альтернативные подходы .