El Dilema del Prisionero
El Dilema del Prisionero es el modelo más estudiado de la teoría de juegos. Dos jugadores eligen simultáneamente cooperar (C) o desertar (D). Si ambos cooperan, cada uno recibe una recompensa R=3. Si ambos desertan, cada uno obtiene un castigo P=1. Pero si uno deserta mientras el otro coopera, el desertor obtiene la tentación T=5 mientras el cooperador recibe el pago del engañado S=0. El dilema: el interés racional individual empuja a ambos a desertar, aunque la cooperación mutua sería mejor para los dos.
El torneo de Axelrod
En 1980, el politólogo Robert Axelrod invitó a teóricos de juegos a presentar estrategias para un torneo informático del Dilema del Prisionero Iterado. El ganador fue Tit-for-Tat (TFT), presentado por Anatol Rapoport, la estrategia más simple de todas las inscritas. TFT coopera en el primer movimiento y luego copia lo que hizo el oponente en el movimiento anterior. Ganó no derrotando a ningún oponente individual, sino acumulando puntuaciones altas contra una amplia gama de estrategias.
Por qué funciona la reciprocidad
TFT encarna cuatro principios que Axelrod identificó como claves del éxito: amabilidad (nunca ser el primero en desertar), represalia (responder a la deserción inmediatamente), indulgencia (volver a cooperar si el oponente lo hace) y claridad (ser lo suficientemente predecible para que los oponentes aprendan a cooperar contigo). Estos principios tienen implicaciones profundas mucho más allá de la teoría de juegos: iluminan la evolución de la cooperación en biología, diplomacia e interacción social cotidiana.
El papel del ruido
En las interacciones del mundo real, las señales son imperfectas. El parámetro «ruido» modela deserciones accidentales o cooperaciones malinterpretadas. Con ruido, el TFT estricto puede quedar atrapado en ciclos de represalia mutua desencadenados por un solo error. Esto llevó a investigadores como Nowak y Sigmund a descubrir estrategias como Ganar-Quedarse Perder-Cambiar (Pavlov) que son más robustas frente al ruido. Aumenta el control de ruido para ver cómo los errores degradan las estrategias cooperativas.
Interpretación de la simulación
Ajusta las proporciones de población para ver cómo diferentes composiciones ecológicas cambian los resultados. En un mundo dominado por desertores, incluso TFT lo tiene difícil. Pero cuando hay suficientes estrategias cooperativas o recíprocas, estas forman grupos de cooperación mutua que superan a la deserción pura. Esta es la esencia del hallazgo de Axelrod: la cooperación puede evolucionar y sostenerse incluso entre agentes egoístas, siempre que haya suficiente repetición y posibilidad de reciprocidad.