Классический пример корреляции без причинно-следственной связи — это одновременный рост продаж мороженого и количества убийств. Неочевидно, но факт: частота совершения этого преступления резко повышается тогда же, когда заметно подскакивают продажи мороженого. «Теории и практики» перевели статью, которая объясняет, как предубеждения, скрытые переменные и ложные посылки заставляют нас верить в самые неочевидные вещи.

Вопрос причинно-следственных связей, который сопровождал науку и философию с незапамятных времен, по сей день не оставляет ученых в покое, и тому есть множество причин. Эволюция научила человека видеть и распознавать закономерности, но психологически люди склонны замечать и запоминать то, что подтверждает их же собственные, ранее существовавшие взгляды. Это свойство известно как склонность к подтверждению своей точки зрения. Именно этому соблазну мы часто не можем противостоять и путаем совпадение с корреляцией, а корреляцию — с причинностью.

По распространенному убеждению, чтобы заявить, что А вызывает Б, должны быть удовлетворены как минимум несколько условий: А предшествует Б, они ковариантны (то есть оба показателя изменяются вместе), и не существует ни одной другой теории, которая бы объяснила их ковариантность лучше. Однако по отдельности ни одно из этих условий не может доказать причинность; они, как сказал бы философ, необходимы, но недостаточны. Во всяком случае, не все с ними согласны.

К слову, о философах: Дэвид Юм, например, считал, что каузации не существует ни в каком доказуемом смысле. Карл Поппер и приверженцы фальсификационизма утверждали, что невозможно доказать существование отношений, а можно его только опровергнуть. Это объясняет, почему статистический анализ не пытается доказывать корреляцию, а, напротив, использует двойное отрицание и опровергает ее отсутствие. Этот процесс известен как отвержение нулевой гипотезы.

Исходя из этих соображений, ученые должны тщательно продумывать и контролировать свои эксперименты, чтобы избежать предубеждений, рекурсии в доказательстве, самоисполняющихся пророчеств и скрытых переменных. Они должны осознавать необходимые условия и ограничения используемых методов, извлекать данные только из репрезентативных выборок, а также не переоценивать свои результаты.

Эффект Генри и Хоторна

Ученые, исследовавшие производительность труда рабочих в заводском цеху в начале XX века, обнаружили эффект Хоторна: осведомленность участников об эксперименте напрямую повлияла на его результаты. Люди — наихудший предмет для исследования. Они реагируют не только на раздражитель, который вы изучаете, но и на сам эксперимент. Сегодня ученые стараются конструировать опыты так, чтобы этот фактор поддавался контролю, но так было не всегда.

Джон Генри — мифологический народный герой США, темнокожий путевой рабочий, победивший в соревновании с паровым молотом. История сражения Джона Генри с машиной легла в основу песен и мультфильмов, упоминается в рассказах и романах. Легенда зародилась в XIX веке, в годы активного развития железнодорожных путей. Неизвестно, существовал ли настоящий Джон Генри. В разных изложениях он то занимается прокладкой путевых костылей, то вручную выбивает породу при прокладке туннеля внутри скалы.

Возьмем, например, Хоторнский эксперимент в городе Сисеро (штат Иллинойс, США). В ходе ряда экспериментов 1924–1932 годов ученые анализировали эффективность труда рабочих в зависимости от переменных условий среды, таких как уровень освещенности в цеху, порядок в помещении, расположение рабочего места. Когда они решили, что наконец выявили что-то стоящее, обнаружилась проблема: в ходе наблюдений продуктивность повышалась, но как только ученые покидали завод, показатели снижались. Это означало, что подъему способствовало само знание рабочих о проведении эксперимента, а вовсе не изменения окружающих условий. По сей день этот феномен ученые называют эффектом Хоторна.

Похожая поведенческая тенденция — эффект Джона Генри — обнаруживается, когда члены контрольной группы прилагают сверхчеловеческие усилия, чтобы превзойти результат экспериментальной группы. Им достаточно просто увидеть, как другой группе выдают новое оборудование или дополнительные инструкции. Как и мифический рабочий Джон Генри, победивший в состязании с паровым молотом, члены второй группы испытывают страстное желание доказать, на что они способны, и заслужить уважение.

Ложный вывод Монте-Карло

Главные персонажи пьесы Тома Стоппарда «Розенкранц и Гильденстерн мертвы» в самом начале действия подбрасывали монету и были озадачены, сконфужены и в конце концов даже напуганы тем, что 157 раз подряд она упала вверх орлом. Гильденстерн, пытаясь объяснить этот феномен, делал самые разные предположения: от существования временной петли до «эффектного подтверждения принципа, согласно которому каждая отдельная монета, подброшенная в отдельности, с той же вероятностью упадет как орлом, так и решкой».

Эволюция научила людей видеть закономерности, но когда дело доходит до азартных игр, чем дольше мы играем, тем чаще эта способность дает сбой. Рационально мы можем допустить, что непредсказуемые события — такие, как, например, падение монеты — сохраняют вероятность успешного исхода, сколько бы раз они ни произошли. Но, помимо этого, мы склонны, чуть ослабляя рациональную хватку, видеть такие события как последовательность, так называемую полосу удачи. Таким образом мы проводим ложную мысленную корреляцию между случаями, которые никак не связаны между собой и непредсказуемы. Мы думаем, что в следующий раз уж точно выпадет решка, воспринимая предшествующие броски как своеобразную прелюдию к следующим событиям.

В статистике это свойство получило название ошибка игрока, или ложный вывод Монте-Карло, — в честь особо показательного случая, произошедшего в этом знаменитом курортном городе. Летом 1913 года изумленные игроки наблюдали за шариком рулетки, который приземлился на черное 26 раз подряд. Пребывая в возбуждении, профессионалы все повышали и повышали ставки, так как были уверены, что в какой-то момент «просто обязано» выпасть красное. В тот вечер казино сделало грандиозную кассу.

Полоса удачи и кроличья лапка

Когда речь заходит о полосе удачи, магическом мышлении и ложной каузации, невозможно обойтись без обсуждения спортивных состязаний. Для звезд спорта сезон складывается из такого непостижимого сочетания факторов — природные способности, натренированность, уверенность в себе, случайность, — что мы силимся находить паттерны в их выступлениях, хотя исследования неустанно доказывают, что волна удачи и даже счастливые приметы — не что иное, как плод человеческого воображения.

Вера в существование полос удачи и полос невезения подразумевает, что успех влечет за собой последующий успех, а провал притягивает такой же провал. Или, что более разумно, изменения одного общего фактора (например, уверенности в себе) могут привести и к победе, и к поражению. Но ученым никак не удается это подтвердить. Это относится и к приметам, что, впрочем, не останавливает их приверженцев от совершения своих причудливых ритуалов.

Бейсболист Кевин Ромберг из «Кливленд Индианс» во время игры никогда не поворачивался по часовой стрелке, а Брюс Гардинер, центральный нападающий «Оттава Сенаторз», окунал свою клюшку в унитаз, чтобы прервать полосу неудач.

Кстати, «кризис второкурсника» существует не только в педагогике, но и в спорте: чаще всего у успешного новичка за удачным первым годом соревнований следует серьезный спад. Дело в том, что перепады результатов склонны уравновешивать друг друга в долгосрочной перспективе — этот феномен в науке называют регрессией к среднему значению. В спорте этому способствуют соперники, которые уже знакомы с сильными сторонами новенького, берут их в расчет и учатся им противостоять.

Гормональный дисбаланс

Рандомизированные контролируемые испытания — золотой стандарт статистики, но иногда (например, в эпидемиологии) этические и практические соображения вынуждают исследователей анализировать только доступные, уже имевшие место случаи. К сожалению, такие наблюдательные (обсервационные) исследования грозят отклонениями, наличием скрытых переменных и, что хуже всего, подбором клинической группы, которая не может быть репрезентативным отражением всего населения. А ведь именно последний фактор необходим, чтобы ученые могли использовать полученные результаты для пользы людей, которые в исследовании не участвовали, то есть для нас с вами.

Показательный пример — гормонозаместительная терапия (ГЗТ). Благодаря нашумевшему обсервационному исследованию 1991 года одно время считалось, что, помимо облегчения симптомов менопаузы, ГЗТ потенциально снижает риск ишемической болезни сердца. Но позже рандомизированные контролируемые испытания, в том числе крупномасштабное исследование Women’s Health Initiative, показали, что корреляция между ГЗТ и возникновением ишемической болезни негативная или статистически незначительная.

В чем же причина? Прежде всего в том, что ГЗТ используют женщины относительно высокого социально-экономического положения: они употребляют продукты лучшего качества, следят за собой и чаще занимаются спортом — эти не самые очевидные факторы тоже влияют на риск возникновения коронарной недостаточности, чего обсервационное исследование никак не учитывало.

Между Супербоулом и фондовым рынком

Когда Джон Элвей и его товарищи по «Денвер Бронкос» два раза подряд выиграли Супербоул в 1998 и 1999 годах, это разрушило миф о многолетней взаимосвязи результатов чемпионата с индексами фондового рынка.

В 1978 году спортивный журналист и комментатор Леонард Коппетт внес свою лепту в путаницу между корреляцией и причинностью, не без иронии предложив предсказывать индексы фондового рынка по результатам Супербоула. Последствия были поразительны: Коппетту поверили тысячи людей, и, что самое интересное, схема действительно работала, причем пугающе надежно.

Предположение Коппетта заключалось в следующем: если Супербоул выигрывает одна из 16 исконных команд Национальной футбольной лиги (тех, которые существовали еще до того, как она объединилась с Американской футбольной лигой в 1966 году), то фондовый рынок в текущем году закроется выше, чем 31 декабря года прошлого. Если же выиграет команда, которая до объединения входила в АФЛ, то индексы упадут.

С 1967-го по 1978 год система Коппетта оказывалась верна в 12 случаях из 12. Вплоть до 1997 года она могла похвастаться 95-процентной точностью. Мощный сбой случился в 1998 и 1999 годах, когда два раза подряд выиграли выходцы из АФЛ «Денвер Бронкос», а рынок подрос.

Кто-то, однако, продолжает настаивать на правильности схемы, не в силах проститься с мифом. «Это работает, — говорят они, — потому что инвесторы в это верят или, может быть, они просто убеждены, что все остальные инвесторы в это верят». Такие спорщики сильны задним умом, но их рассуждения никак не объясняют, почему корреляция сохранялась в течение 12 лет еще до выхода знаменитой статьи Коппетта. Другие участники дискуссии утверждают, что у паттерна есть вполне осязаемые причины: с одной стороны, фондовый рынок в целом показывает устойчивую крупномасштабную тенденцию к росту, на которую не оказывают серьезного влияния никакие кратковременные колебания, а с другой — выходцы из НФЛ выигрывали Супербоул каждый год с 1984-го по 1998-й.

Больше данных — меньше ясности

Big data — процесс поиска закономерностей в данных такого большого объема, который не поддается традиционным методам анализа — сейчас постоянный предмет обсуждения в переговорках современных крупных компаний. Но всегда ли больше значит лучше?

Есть правило, о котором любому ученому известно со времен самой первой лекции по статистике: видя море информации, следует бороться с соблазном нырнуть за крупной рыбой. Имея на руках достаточно данных, терпения и свободы действий, ты неизбежно найдешь желанную корреляцию, хотя это будет непрофессиональный и совершенно бесполезный результат. В конце концов, простая корреляция между двумя переменными далеко не всегда предполагает, что между ними есть причинно-следственная связь и даже просто хоть какие-то отношения.

Прежде всего ученые не могут использовать методы статистического измерения корреляции без определенной цели. Каждый из методов изначально подчинен какой-то гипотезе и имеет ограничения, которые участники «рыболовной экспедиции» слишком часто упускают из виду. Не говоря уже о скрытых переменных, нерепрезентативной выборке и других недочетах, которые могут запросто погубить плохо подготовленное исследование.

Минимальная зарплата = максимальная безработица

Любой социально значимый финансовый вопрос неизбежно связан с политикой и вызывает глубокие разногласия в обществе. Повышение минимального размера оплаты труда не исключение. Аргументы приводятся самые разные, но, как правило, одна сторона заявляет: повышение МРОТ навредит бизнесу, это уменьшит количество доступных рабочих мест, от чего, в свою очередь, пострадают беднейшие слои населения. Другая сторона утверждает, что доказательств этой причинно-следственной теории крайне мало и поэтому потери от повышения МРОТ эфемерны — в отличие от тех улучшений, которые могли бы почувствовать на себе 3 600 000 американцев, получающих зарплату минимального уровня (не дотягивающего, по мнению многих, до прожиточного минимума) или даже ниже. Сторонники этого подхода считают, что с учетом инфляции минимальный размер оплаты труда ($7,25 в час на декабрь 2013 года) скатился за последние 40 лет до неприличного показателя.

На каждого аналитика, убежденного, что эта мера приведет к снижению количества рабочих мест, приходится оппонент, доказывающий обратное.

Однако у обеих сторон есть как минимум одна общая проблема, а именно смехотворность доказательств, на которые опираются их спикеры. Истории из третьих рук и пристрастно выбранные факты — весьма неубедительные доводы, даже если они упакованы в презентабельные таблицы и диаграммы.

Завтрак против ожирения, ужин против наркотиков

Если учитывать продажи книг, медикаментов и проведение хирургических операций, в американскую индустрию снижения веса ежегодно вливается 20 миллиардов долларов, а число сидящих на диете ежегодно увеличивается на 108 миллионов человек. Неудивительно, что соответствующим исследованиям — не всегда самым качественным — в прессе уделяется очень много внимания.

Взять, например, популярную идею о том, что завтрак помогает бороться с ожирением. Это научное сокровище с привкусом мюсли и злаков появилось главным образом благодаря двум научным работам: первое рандомизированное контролируемое испытание, проведенное в Университете Вандербильта в 1992 году, показало, что изменение пищевого поведения утром (будь то употребление завтрака или отказ от него) коррелирует с потерей веса. Второе — обсервационное — исследование провел Национальный реестр контроля веса в 2002 году. Оно выявило корреляцию, согласно которой успешно худеющим людям действительно свойственно завтракать. Хотя это и не означало, что именно наличие завтрака в их рационе приводит к такому результату.

К сожалению, во втором исследовании не было уделено должного внимания контролю за внешними факторами и, конечно, не были установлены границы между корреляцией и причинностью. К примеру, человек, стремящийся похудеть, может не только есть завтрак, но и больше тренироваться, сидеть на белковой диете и т. п. А если в эксперименте не продумана схема выявления каузальной связи, все эти факторы будут не более чем часто совпадающими параметрами.

Похожая ошибка погубила множество исследований, утверждавших, что в семьях, которые традиционно собираются вместе во время ужина, подростки реже становятся наркоманами. Несмотря на свою простоту и привлекательную идею, эти эксперименты не позволяли контролировать смежные факторы, такие как крепкие семейные узы, глубокая вовлеченность родителей в жизнь ребенка и т. п.

Пол: склонен к самоубийству

Часто приходится слышать, что мужчины, особенно молодые, более склонны к совершению самоубийств, чем женщины. На самом деле такие заявления маскируют множество смешанных факторов, а также вносят свою лепту в большое эмпирическое обобщение — обобщенное утверждение о какой-нибудь часто встречающейся закономерности, сделанное без попытки хоть как-то эту закономерность объяснить.

Факты же противоречат этому и утверждают, что женщины предпринимают втрое больше попыток самоубийства, чем мужчины. Как же тогда возможна описанная выше корреляция? Ответ кроется в успешности попыток, на что сильно влияют способы их осуществления. Женщины чаще прибегают к таблеткам, в то время как мужчины склонны отдавать предпочтение огнестрельному оружию.

Но даже если бы мы могли устранить эти смешанные факторы, результат остался бы прежним: сама по себе принадлежность к мужскому полу не является причиной. Чтобы заявить о существовании тенденции, нам нужно найти общие факторы, которым подвержены все мужчины — или, по крайней мере, все суицидальные мужчины. Это относится также и к относительно высокому уровню суицида среди разведенных мужчин. Развод как таковой не заставляет их совершать самоубийство. Если какая-то причинно-следственная связь и существует, то ее следует искать среди подспудных факторов, таких как одиночество, депрессия, чувство бессилия, финансовые трудности или утрата родительских прав.

Все беды — от вакцины

Наш список будет неполным, если мы не затронем родительские опасения по поводу прививок. Эти страхи основаны на том, что вакцинация MMR якобы каузально связана с расстройствами аутистического спектра, — идея, которую популяризировали некоторые знаменитости, в частности актриса Дженни Маккарти. Инспирировала эти предположения статья Эндрю Уэйкфилда 1998 года. Медицинское сообщество полностью разоблачило ее, а последующие испытания не обнаружили никакой причинно-следственной связи даже в случаях многократной вакцинации. Несмотря на все это, многие родители до сих пор боятся, что прививки могут вызвать развитие аутизма или подвергнуть ребенка другим опасностям.

Что ж, ни одна вакцина действительно не бывает на 100% безвредна, однако это конкретное убеждение стало популярно главным образом из-за естественного родительского волнения, подогретого непроверенными данными, и склонности человека к подтверждению своей точки зрения, о которой мы уже говорили выше: «Если бы я в это не верил, я бы этого не замечал». Популярности мифа способствует и тот факт, что родители и врачи чаще всего распознают симптомы аутизма относительно поздно — в том возрасте, когда ребенок уже успел перенести несколько вакцинаций. Первые признаки аутизма заметить не так просто, это факт, но все же самые актуальные исследования показывают, что они могут проявляться уже в возрасте 6–12 месяцев.

Может показаться, что это безобидное заблуждение, но это не так. В 2011 году журнал Time опубликовал данные, согласно которым 13% детей не прошли вакцинацию (или она была отложена) по инициативе родителей, а в сельской местности этот показатель доходил до 20–50%. Спустя 15 лет после возникновения этой паники медицинские центры зарегистрировали вспышки заболеваемости коклюшем и корью. Что это такое — совпадение, корреляция или причинность — вопрос, заслуживающий серьезного рассмотрения.

Иллюстрации: iStock