19 abril 2021 21:31

El dilema del prisionero iterado

¿Cuál es el dilema del prisionero iterado?

El dilema del prisionero repetido es una extensión de la forma general, excepto que el juego es jugado repetidamente por los mismos participantes. El dilema del prisionero repetido difiere del concepto original del dilema del prisionero porque los participantes pueden aprender sobre las tendencias de comportamiento de su contraparte.

El dilema del prisionero repetido a veces se ha llamado el juego de la Guerra de la Paz.

Comprender el dilema del prisionero iterado

Dado que el juego se repite, una persona puede formular una estrategia que no siga la convención lógica habitual de una ronda aislada. El ojo por ojo es una estrategia común de dilema del prisionero.

El juego repetido del dilema del prisionero es fundamental para muchas teorías sobre la cooperación y la confianza humanas. Partiendo del supuesto de que el juego puede modelar transacciones entre dos personas que requieren confianza, el comportamiento cooperativo en las poblaciones puede ser modelado por una versión repetida de múltiples jugadores del juego.

La teoría detrás del juego ha cautivado a muchos estudiosos a lo largo de los años. Más recientemente, los investigadores de diseño organizacional han utilizado el juego para modelar estrategias corporativas. El dilema del prisionero también es ahora un lugar común para las teorías de juegos que se vuelven populares entre los estrategas de inversiones. La globalización y el comercio integrado han impulsado aún más la demanda de modelos financieros y operativos que puedan describir problemas geopolíticos.

Ejemplo del juego del dilema del prisionero iterado

Por ejemplo, usted y un colega están en la cárcel y se sospecha que han cometido un delito. Están aislados el uno del otro y no saben cómo responderá el otro a las preguntas. La policía los invita a ambos a implicar al otro en el crimen (defecto). Lo que suceda depende de lo que ambos hagan, pero ninguno de los dos sabe cómo responderá el otro.

Si su colega lo traiciona (cede a la tentación de desertar) mientras permanece en silencio, entonces recibirá la pena de cárcel más larga mientras su colega sale libre (y viceversa). Si ambos eligen cooperar entre sí (no con la policía) permaneciendo en silencio, no hay pruebas suficientes para condenarlos a ambos, por lo que ambos reciben una sentencia leve por un delito menor. Si ambos deciden desertar, entonces se han condenado el uno al otro a sentencias levemente reducidas pero aún severas.

La recompensa en este juego es una reducción en la sentencia de prisión de muy buena, bastante buena, bastante mala o muy mala, que se traduce en un sistema de puntuación de la siguiente manera:

El juego se juega de forma iterativa durante varias rondas hasta que finaliza (como si lo interrogaran repetidamente por delitos separados). Las puntuaciones de cada ronda se acumulan, por lo que el objetivo es optimizar la puntuación antes de llegar al final del juego. El fin del juego se determina aleatoriamente en cualquier lugar entre 1 y 100 rondas. Al final del juego, las puntuaciones se traducen en porcentajes de las mejores puntuaciones posibles.