Дилемма заключённого
Дилемма заключённого — самая изученная модель в теории игр. Два игрока одновременно выбирают: сотрудничать (C) или предать (D). Если оба сотрудничают, каждый получает награду R=3. Если оба предают — наказание P=1. Но если один предаёт, а другой сотрудничает, предатель получает искушение T=5, а кооператор — проигрыш простака S=0. В чём дилемма: рациональный эгоизм толкает обоих предать, хотя взаимное сотрудничество лучше для обоих.
Турнир Аксельрода
В 1980 году политолог Роберт Аксельрод пригласил теоретиков игр прислать стратегии для компьютерного турнира по итерированной дилемме заключённого. Победила «Око за око» (TFT), присланная Анатолем Рапопортом — простейшая из присланных стратегий. TFT сотрудничает в первом ходе, затем копирует предыдущий ход оппонента. Она победила не за счёт выигрыша у конкретного оппонента, а за счёт накопления высоких результатов против широкого спектра стратегий.
Почему взаимность работает
TFT воплощает четыре принципа, которые Аксельрод определил как ключевые: доброта (никогда не предавай первым), возмездие (немедленно реагируй на предательство), прощение (возвращайся к сотрудничеству, если оппонент тоже) и ясность (будь достаточно предсказуемым, чтобы оппоненты научились с тобой сотрудничать). Эти принципы имеют глубокие импликации далеко за пределами теории игр — они проливают свет на эволюцию кооперации в биологии, дипломатии и повседневном социальном взаимодействии.
Роль шума
В реальных взаимодействиях сигналы несовершенны. Параметр «шум» моделирует случайные предательства или ошибочно интерпретированное сотрудничество. При высоком шуме строгая TFT может застрять в циклах взаимного возмездия, запущенных единственной ошибкой. Это привело исследователей Новака и Зигмунда к открытию стратегий вроде «Выиграл — остайся, проиграл — меняй» (Павлов), более устойчивых к шуму. Увеличьте ползунок шума, чтобы увидеть, как ошибки подрывают кооперативные стратегии.
Интерпретация симуляции
Меняйте доли популяций, чтобы увидеть, как различный экологический состав влияет на результат. В мире, где доминируют предатели, даже TFT проигрывает. Но когда достаточно кооперативных или взаимных стратегий, они образуют кластеры взаимного сотрудничества, превосходящие чистое предательство. В этом суть прозрения Аксельрода: кооперация может возникнуть и поддерживаться даже среди эгоистичных агентов при наличии повторения и возможности взаимности.