Das Gefangenendilemma
Das Gefangenendilemma ist das meistuntersuchte Modell der Spieltheorie. Zwei Spieler wählen gleichzeitig zwischen Kooperieren (K) und Defektieren (D). Kooperieren beide, erhält jeder eine Belohnung R=3. Defektieren beide, erhält jeder eine Strafe P=1. Defektiert aber einer, während der andere kooperiert, bekommt der Defekteur die Versuchungsauszahlung T=5, während der Kooperierende die Naivenauszahlung S=0 erhält. Das Dilemma: Rationales Eigeninteresse treibt beide zur Defektion, obwohl gegenseitige Kooperation für beide besser wäre.
Axelrods Turnier
1980 lud der Politikwissenschaftler Robert Axelrod Spieltheoretiker ein, Strategien für ein Computerturnier des iterierten Gefangenendilemmas einzureichen. Der Gewinner war Tit-for-Tat (TFT), eingereicht von Anatol Rapoport — die einfachste aller eingereichten Strategien. TFT kooperiert im ersten Zug und kopiert dann den letzten Zug des Gegners. Es gewann nicht, indem es einen einzelnen Gegner schlug, sondern indem es gegen eine breite Palette von Strategien hohe Punktzahlen erzielte.
Warum Reziprozität funktioniert
TFT verkörpert vier Prinzipien, die Axelrod als Schlüssel zum Erfolg identifizierte: Freundlichkeit (nie zuerst defektieren), Vergeltung (sofort auf Defektion reagieren), Vergebung (nach Bestrafung zur Kooperation zurückkehren) und Transparenz (vorhersagbar genug sein, damit Gegner lernen können, mit einem zu kooperieren). Diese Prinzipien haben tiefgreifende Implikationen weit über die Spieltheorie hinaus — sie erhellen die Evolution der Kooperation in Biologie, Diplomatie und alltäglichen sozialen Interaktionen.
Die Rolle des Rauschens
In realen Interaktionen sind Signale unvollkommen. Der «Rausch»-Parameter modelliert versehentliche Defektionen oder missverstandene Kooperationen. Unter Rauschen kann strenges TFT in Zyklen gegenseitiger Vergeltung gefangen werden, ausgelöst durch einen einzigen Fehler. Dies führte Forscher wie Nowak und Sigmund zur Entdeckung von Strategien wie Win-Stay Lose-Shift (Pavlov), die robuster gegenüber Rauschen sind. Erhöhen Sie den Rausch-Regler, um zu sehen, wie Fehler kooperative Strategien beeinträchtigen.
Die Simulation verstehen
Passen Sie die Populationsanteile an, um zu sehen, wie verschiedene ökologische Zusammensetzungen die Ergebnisse verändern. In einer von Defekteuren dominierten Welt hat selbst TFT Schwierigkeiten. Aber wenn genügend kooperative oder reziproke Strategien vorhanden sind, bilden sie Cluster gegenseitiger Kooperation, die reine Defektion übertreffen. Das ist der Kern von Axelrods Erkenntnis: Kooperation kann sich entwickeln und aufrechterhalten — selbst unter eigennützigen Akteuren, sofern ausreichend Wiederholung und die Möglichkeit zur Reziprozität bestehen.