Статья 1. Что такое причинно-следственный вывод и почему причинно-следственная связь — это скользкая рыба?
Причинно-следственные связи установить трудно, ускользает из рук, как извивающаяся мокрая рыба. Почему это? Установление корреляции между событиями позволяет нам предсказывать будущее, но установление того, что одно событие вызывает другое, дает нам возможность вмешиваться в мир, активно меняя его, а не пассивно реагируя на него. В этом разница между выявлением болезни путем наблюдения за симптомами и лечением болезни путем выявления и лечения причины.
Причинный вывод формализует предположение о причинно-следственных отношениях, проверяя вероятность истинности этих отношений и предсказывая детали, которые в противном случае могли бы остаться скрытыми. Например. вывод деталей иначе ненаблюдаемых состояний или относительных вкладов различных движущих сил действия/события.
Я познакомился с каузальным выводом, прочитав «Книгу почему», написанную в соавторстве с Джудеей Перл, разработчиком многих идей в области каузального вывода, в первую очередь do-оператора и do-исчисления, которые обеспечивают формальный язык для символическое представление каузальных вмешательств и манипулирование этими представлениями; аналогично обычным алгебраическим манипуляциям. Эти идеи исследуются в «Книге почему» вместе с разработкой причинно-следственных диаграмм. Вместе эти инструменты можно использовать для вывода причин и следствий из наблюдений за миром.
Это первая из серии статей, перечисленных ниже, которые предназначены для введения в эту область для полных новичков и как ступенька к более глубокому пониманию для тех, кто уже читал «Книгу почему». Они написаны с точки зрения работающего ученого и сопровождаются кодом Python для создания причинно-следственных сетей и анализа полученных данных. После приведенного ниже списка мы рассмотрим, почему причинно-следственная связь — такая скользкая рыба.
Статья 1. Что такое причинно-следственный вывод и почему причинно-следственная связь — скользкая рыба?
Статья 2. Борьба за мокрую рыбу причинности: причинно-следственные диаграммы и До-оператор.
Статья 3. Пощекотать скользкую рыбку причинности: до-исчисление и устранение путаницы.
Статья 4. Попадание в статистику причинно-следственных связей. Методы анализа причинно-следственных сетей.
Статья 6. Еще несколько каузальных рыб, которых я поймал ранее: числовые примеры работы с коллайдером и вилочными соединениями каузальной сети.
Скрипты и данные, использованные в серии статей. GitHub: https://github.com/PeterJamesWinn/CausalNetworkGenerator.git
Проблема познания причинно-следственной связи.
Если мы хотим манипулировать окружающим миром в свою пользу, как индивидуумы или как вид, нам нужно понять, как одно вызывает другое. Какие инструменты есть в нашем распоряжении для установления такого механистического понимания?
В сложной системе, как вы определяете, что делают различные компоненты? Например, если мы хотим вмешаться, чтобы вылечить болезнь, понимание механизмов человеческого организма явно полезно. Это помогает нам выдвигать гипотезы о разумных вмешательствах. Но понять механизмы сложной системы сложно. Повышает ли увеличение концентрации сахара в клетке ее общий уровень активности? Или он подавляет одни клеточные механизмы, но стимулирует другие? Мы могли бы наблюдать за клеткой и увидеть, немного ли увеличивается концентрация сахара перед определенным клеточным поведением, но это только установило бы относительное время событий, а не причинно-следственную связь. Чтобы установить причинно-следственную связь, нам нужно было бы намеренно манипулировать уровнями сахара (например, вводить его в клетку, выращивать клетку в среде без сахара и т. д.), сохраняя при этом все остальное постоянным, тем самым показывая, что единственное, что изменяется ( концентрация сахара) должны отвечать за любые другие наблюдаемые изменения. Нам нужно различать вещи, изменяющиеся одновременно, но без прямой причинной связи, и компоненты, напрямую зависящие друг от друга.
Однако эксперименты, необходимые для установления причинно-следственной связи, могут быть чрезвычайно трудными или даже невозможными. В приведенном выше примере вам нужно сравнить две абсолютно одинаковые ячейки, за исключением одной модификации, проверяющей причинно-следственную связь. Как еще вы могли бы знать, что именно ваше вмешательство вызывает изменение в системе, а не какое-то другое событие? Но интересующая нас система может потребовать манипулирования двумя компонентами, чтобы получить желаемый эффект. Или три. Или четыре. Для сложной системы, такой как человеческое тело, человеческая клетка, человеческое общество и т. д., невозможно манипулировать всеми возможными комбинациями компонентов, чтобы увидеть их причинные эффекты или их отсутствие. Таким образом, кажется почти невозможным полностью понять, как работают рычаги и шкивы в сложной системе.
Наблюдая за системами в их естественном состоянии, можно установить, какие компоненты движутся согласованным образом. Однако корреляция может происходить без прямого причинно-следственного взаимодействия, что обсуждается далее в этой статье. Тем не менее причинность кажется невозможной без корреляции. Например, автомобиль должен быть включен, прежде чем он сможет двигаться. Соотношение этих событий всегда одинаково, потому что одно ведет (т. е. вызывает) другое. Исторически сложилось так, что статистический анализ позволяет нам смотреть на эти корреляции, но статистики избегают декларировать причинно-следственную связь, поскольку ее трудно доказать. Однако установление корреляции между компонентами является отправной точкой для экспериментов по установлению причинно-следственной связи, таких как эксперименты, описанные в предыдущем абзаце, и делает выполнимой задачей, по крайней мере, установить механизмы в сложной системе, которые имеют наибольшие эффекты. Причинный вывод выходит за рамки статистики наблюдений, вводя идеи причинности в статистический анализ, что позволяет лучше понять, почему возникают ложные (то есть не причинные) статистические ассоциации, и обеспечивает основу для ответов на вопросы о причинности.
Краткое введение в статистическую связь и причинно-следственную связь.
Книга «Почему» обобщает мотивацию и разработку причинно-следственных диаграмм и до-исчисления, которые используются для вывода причинно-следственных связей в отсутствие прямых лабораторных экспериментов или крупномасштабных рандомизированных контролируемых испытаний. Чтобы понять это, вы должны немного разобраться в статистических методах, прежде чем вводить вычисления и причинно-следственные диаграммы.
Обычно статистика сообщает о корреляциях между наблюдениями. Например, продажи шляп от солнца увеличиваются по мере того, как дни становятся более солнечными. Для нас это логично, поскольку мы знаем, почему люди покупают шляпы от солнца — солнечные дни стимулируют продажи шляп, а не наоборот. Но данные о продажах и солнечном свете могут только сказать нам, что и солнечный свет, и продажи растут одновременно, но не более того.
Джуда Перл и соавтор Дана Маккензи углубляются в историю статистики, чтобы заявить, что статистики и ученые не желают делать такие заявления о причинно-следственных связях, а скорее говорят только о том, что существует связь между продажей шляп от солнца и солнечной погодой. Если вы, как и я, присутствовали на многочисленных научных конференциях и исследовательских семинарах, вы знаете, что ученые часто заявляют о причинно-следственных связях, используя тщательно спланированные интервенционные эксперименты. Тем не менее, существует постоянное противоречие между наблюдением корреляции и проведением достаточного количества экспериментов и анализа, чтобы объявить причинно-следственную связь. Зачем нужна такая осторожность?
Как мы можем интерпретировать корреляцию между ростом ребенка и его способностью читать? Что, если вы посмотрите исключительно на девятилетних детей, и корреляция исчезнет? Глядя на детей всех возрастов, мы ожидаем корреляции между ростом ребенка и способностями к чтению, потому что оба этих показателя увеличиваются с возрастом. В этом примере мы можем видеть, как течение времени приводит к тому, что дети становятся выше и улучшаются их способности к чтению. Таким образом, корреляция между ростом и способностью к чтению является ложной, поскольку улучшение обоих показателей связано с течением времени. Однако не только течение времени приводит к улучшению способности к чтению. Количество уроков чтения и объем практики чтения, которую ребенок имеет, увеличивается с течением времени, и дети будут иметь разный доступ к таким возможностям. Если вы посмотрите исключительно на, например. У девятилетних детей разница в росте больше связана с питанием и генетикой, чем с течением времени, поскольку все они прожили более или менее одинаковое количество времени. Различия в их способностях к чтению в большей степени связаны с их социальным окружением, генетикой и временем, затрачиваемым на чтение, а не с возрастом как таковым. Время — несовершенный показатель практики чтения, а рост — несовершенный показатель течения времени. Следовательно, не может быть семантически правильным утверждение, что течение времени заставляет ребенка лучше читать или становиться выше. И ни в коей мере не правильно говорить, что чем выше рост, тем лучше ребенок читает. Таким образом, мы видим проблемы приписывания причинности наблюдениям корреляции. Но в том же примере мы также видим проблемы полного игнорирования причинно-следственной связи — мы можем в конечном итоге сделать ложное утверждение о том, что рост ребенка и его способность к чтению связаны.
(Обратите внимание: на самом деле я просто предполагаю, что корреляция между способностью к чтению и ростом существует, поскольку она хорошо иллюстрирует проблему. В качестве похожего примера Джуда Перл использовала размер обуви и способность к чтению, так что вы можете посмотреть в Книге почему. если вы хотите еще один пример).
Применяя наши знания о вероятных причинно-следственных связях в системе, мы можем объяснить наблюдаемые корреляции. Действительно, Книга Почему утверждает, что если представления о причинных механизмах в нашей системе согласуются с наблюдаемыми корреляциями, это может поддержать наше причинное представление об этой системе. Это может привести к более тонкому пониманию системы или опровергнуть нашу текущую причинно-следственную модель системы.
Споры о значении причинности в сложном мире, т. е. о том, можно ли когда-либо установить причинность, и о возможности установления только статистических отношений, ведутся уже много десятилетий. В Книге почему статистические и научные учреждения представлены как те, которые отвергли понятие причинной связи исключительно в пользу статистической связи, но ясно, что история не так односторонняя, например, в 1960 году Дж. О. Уиздом размышляет о причинности и статистической связи. рецензируя книгу Марио Бунге Причинность: место причинного принципа в современной науке (1959). Действительно, мантра о том, что корреляция не является причинно-следственной связью, существует потому, что корреляция так часто ошибочно использовалась как достаточное наблюдение, чтобы подразумевать причинно-следственную связь (см. раздел Научная ошибка и ошибочная методология в: https://en.wikipedia.org/wiki/ Causal_inference (по состоянию на 2 ноября 2022 г.)).
Книга «Почему» представляет некоторую историю области, структуру причинно-следственных диаграмм и исчисления, чтобы помочь в причинном выводе, надежную защиту необходимости причинного мышления и примеры причинного мышления в действии, например, обсуждение причинной связи между курение и рак легких. Ясно лишь то, что установить причинно-следственную связь сложно.
Джуда Перл также представляет историю смешения, то есть существования ложных корреляций, и представляет свое собственное строгое определение смешения. Смешение подразумевает, что два наблюдения коррелируют из-за их связи с одним или несколькими последующими наблюдениями, т. Е. Наблюдаемая корреляция сбивает с толку, поскольку два коррелированных наблюдения не влияют друг на друга напрямую. Мы уже видели путаницу в приведенном выше примере, коррелируя способность читать и рост. Способность к чтению и рост смешиваются в результате того, что они оба имеют тенденцию увеличиваться по мере увеличения возраста ребенка.
Чтобы скорректировать смешанные эффекты, вы можете управлять смешанной переменной, в данном случае возрастом. Для контроля возраста вы фиксируете его значение в узком диапазоне и пересчитываете корреляцию. Например, если мы выберем только детей в возрасте от девяти до девяти с половиной лет, корреляция между способностью к чтению и возрастом исчезнет или, по крайней мере, значительно уменьшится. Если вы мне не верите, я проработал некоторые числовые примеры в одной из последующих статей, или вы можете пойти и проверить это самостоятельно с помощью написанного мной кода Python, ссылки на который приведены выше. В идеале вы рассчитываете корреляцию для каждого возраста, а затем среднюю корреляцию.
Проблема смешения становится еще сложнее в задачах реального мира, где может быть множество измерений и смешанных переменных. Если мы заранее не знаем связи между наблюдениями, как мы решаем, какие наблюдения контролировать? Одно из предложений состоит в том, чтобы контролировать каждое наблюдение по очереди и смотреть, влияет ли это на корреляцию между любыми другими переменными, хотя Джуда Перл дает хороший пример того, где эта процедура также может привести к ложной корреляции и почему размышления о причинно-следственной связи — единственный способ избежать этого. это, как обсуждается в следующей статье. Смешение мешает нам обнаружить возможные причинно-следственные связи, поскольку оно может привести к корреляциям между событиями, которые не имеют прямого отношения друг к другу.
Также в следующей статье мы видим, что вклад причинно-следственных диаграмм и до-исчисления заключается в формализации причинно-следственного способа мышления. Его формализация обеспечивает основу для его расширения, так что вопросы причинно-следственной связи могут быть более легко решены. Вопросы, которые необходимо решить, включают: что вызывает что? Согласуется ли причинно-следственная модель с наблюдаемыми данными? Каков относительный вклад различных факторов в причинную сеть?
Более того, do-calculus позволяет решать некоторые причинно-следственные вопросы, наблюдая за системой без необходимости манипулировать ею в лаборатории. Оператор do допускает формальное выражение каузального вмешательства. Действие, которое делает что-то с системой. Do-исчисление формализует набор правил, которые позволяют манипулировать выражением с помощью do-оператора, так что эффект вмешательства может быть выведен путем пассивного наблюдения за системой, то есть из наблюдения без вмешательства.
Выводы
В конечном счете, причинно-следственный вывод заключается в создании модели причинно-следственных связей в интересующей системе, а не только статистических взаимосвязей. Это должно создать модель, которая точно предсказывает условия, не наблюдаемые в наблюдаемых данных, что может, таким образом, ответить на такие вопросы, как, что произойдет, если я сделаю это? Что было бы, если бы я поступил иначе?
Статистические отношения алгебраически взаимозаменяемы, причинно-следственные связи — нет. Если Y = X + 2, то X = Y — 2. Если X вызывает Y, то Y обычно не вызывает X. По сути, причинно-следственный вывод — это процесс научной деятельности, но ключевыми моментами Judea Pearl, по-видимому, являются: 1. если мы хотим Чтобы компьютер мог «мыслить» каузально, нам нужен формальный язык, способный описывать каузальные идеи. 2. Такой формальный язык причинности также дает ясность научному и статистическому мышлению людей.
Одно предложение из «Книги почему», в котором я не уверен, состоит в том, что люди от природы хорошо понимают причинно-следственные связи. Мое собственное наблюдение за миром состоит в том, что люди плохо определяют причинно-следственные связи, поэтому нам нужно было разработать научный метод.
Доказательства ошибочного понимания причины обнаружены на автоматах по продаже билетов на железнодорожных платформах вокруг Бирмингема (Великобритания), покрытых царапинами. Пассажиры железной дороги царапают свои монеты на автомате после того, как автомат их отбрасывает. Обычно монета принимается. Тем не менее, простое ожидание того же времени, которое требуется, чтобы поцарапать монету на машине, также работает, поскольку это время необходимо машине для подготовки к приему второй монеты. Таким образом, царапание автомата монетой не оказывает прямого влияния на то, принимается ли монета. Люди могут выявлять причинно-следственные связи, но они часто гораздо сильнее склонны к простым временным ассоциациям. Легкости, с которой мы смешиваем корреляцию и причинность, достаточно, чтобы нуждаться в формальном языке для причинности и формальном исчислении для написания причинных вопросов и манипулирования ими.
Цитаты и дальнейшее обучение
Дж. Перл и Д. Маккензи; Книга «Почему: Новая наука о причине и следствии». 2018, Пингвин Великобритания
Б. Нил, Краткое введение в причинно-следственный вывод (предварительный просмотр курса), 2020, YouTube, https://youtu.be/DXBPtpBhGqo
Дж. О. Уиздом, Причинность и современная наука, 1960, Nature, том 187, стр. 92; https://www.nature.com/articles/187092a0.pdf
Статьи со 2 по 6 этой серии о причинно-следственных связях.