Симулятор ошибки выжившего: почему истории победителей вводят в заблуждение

simulator intermediate ~8 min
Загрузка симуляции...
Ошибка выжившего: выжившие кажутся зарабатывающими на ~5–8% больше в год, чем на самом деле

При 200 компаниях за 10 лет и 85% годовой выживаемости примерно 40 компаний доживают до конца. Эти выжившие демонстрируют значительно более высокую среднюю доходность, чем вся популяция, потому что компании с плохими результатами чаще банкротятся и исчезают из данных. Именно так ошибка выжившего искажает статистику инвестфондов, истории бизнес-успехов и исторический анализ.

Формула

P(survive all years) = survival_rate^years
Survivor return = mean(annualized returns | survived)
True return = mean(annualized returns | all companies)
Bias gap = survivor return - true return

Что такое ошибка выжившего?

Ошибка выжившего — одна из наиболее коварных форм систематической ошибки отбора. Она возникает, когда мы делаем выводы из набора данных, включающего только объекты, которые «выжили» в каком-то процессе — компании, не обанкротившиеся, фонды, не закрытые, люди, добившиеся успеха, — игнорируя куда большее число провалившихся и ставших невидимыми.

Задача Вальда о самолётах

Самая знаменитая иллюстрация — из Второй мировой войны. Американские военные обследовали возвращающиеся бомбардировщики и обнаружили пробоины, сконцентрированные в определённых зонах. Интуитивная рекомендация — бронировать эти зоны. Но статистик Абрахам Вальд распознал критический изъян: данные представляли лишь выжившие самолёты. Зоны без пробоин — места, куда самолёты получали попадания и не возвращались. Вальд рекомендовал бронировать неповреждённые зоны — блестящая инверсия, ставшая каноническим примером мышления с учётом ошибки выжившего.

Как работает симуляция

Симулятор создаёт когорту компаний, каждая из которых начинает со стоимости 100. Ежегодно каждая выжившая компания получает случайную доходность из нормального распределения и сталкивается с вероятностью банкротства. Обанкротившиеся компании перестают учитываться в статистике «только выживших», но остаются в данных полной популяции. Веерная диаграмма показывает все траектории: выжившие выделены голубым, а обанкротившиеся затухают в темноте — отражая, как обанкротившиеся компании исчезают из реальных баз данных и медиа.

Разрыв смещения

Нижняя столбчатая диаграмма раскрывает ключевой инсайт: средняя доходность выживших существенно выше истинной средней доходности всех компаний. Этот разрыв — ошибка выжившего — возникает потому, что компании с неудачной последовательностью доходностей чаще банкротятся. Когда вы изучаете только победителей, вы систематически переоцениваете, насколько хорош типичный результат. Та же логика применима к изучению успешных предпринимателей, прибыльных торговых стратегий или звёздных управляющих фондами.

Частые вопросы

Что такое ошибка выжившего?

Ошибка выжившего — форма систематической ошибки отбора, возникающая, когда мы анализируем только объекты, прошедшие какой-то отбор (выжившие, преуспевшие, оставшиеся на виду), игнорируя тех, кто не прошёл. Это создаёт систематически искажённую картину, потому что провалы — которых может быть большинство — невидимы. Термин был популяризирован благодаря анализу Абрахама Вальда по бронированию самолётов во Второй мировой войне.

Что за история с самолётами Абрахама Вальда?

Во время Второй мировой войны статистик Абрахам Вальд анализировал, куда добавить броню на бомбардировщики. Военные собрали данные о попаданиях на возвращающихся самолётах. Тогда как другие предлагали бронировать повреждённые зоны, Вальд понял критический изъян: данные представляли только выжившие самолёты. Зоны без пробоин — места, куда попадания оказывались фатальными, и самолёты не возвращались. Он рекомендовал бронировать неповреждённые зоны — блестящая инверсия, спасшая жизни.

Как ошибка выжившего влияет на инвестиции?

Статистика эффективности инвестфондов обычно включает только действующие фонды. Фонды с плохими результатами часто закрываются или поглощаются, удаляя плохую статистику из истории. Исследования показывают, что ошибка выжившего завышает заявленную доходность фондов на 1–2% в год. Аналогично доходность фондовых индексов выглядит выше, поскольку индексы исключают обанкротившиеся компании и включают успешные.

Как скорректировать ошибку выжившего?

Чтобы скорректировать ошибку: (1) включайте данные о провалившихся и выбывших, а не только о текущих выживших; (2) используйте когортный анализ — отслеживайте все объекты от начала; (3) скептически относитесь к «урокам успешных компаний/людей» без изучения провалов; (4) ищите базовые частоты — сколько попыток проваливается на каждую историю успеха.

Источники

Встроить

<iframe src="https://homo-deus.com/lab/cognitive-biases/survivorship-bias/embed" width="100%" height="400" frameborder="0"></iframe>
View source on GitHub