You are on page 1of 17

Juegos Repetidos Los individuos muchas veces interactan de forma repetida: Juegos repetidos. Ejemplo: trabajador-empleado, vendedor-comprador, etc.

En estos ejemplos se puede observar que la decisin de cada jugador sobre cmo comportarse en el presente tiene en cuenta el comportamiento futuro del resto de jugadores (y el pasado). La gente algunas veces est dispuesta a no obtener ganancias inmediatas porque construir reputacin les es beneficioso. A menudo, las personas que poseen reputacin son compensadas y las que no, son castigadas. Principal conclusin: Las personas que no son muy impacientes encuentran beneficioso construir reputacin cooperando. Existen mltiples SPE.

I.

Modelo General

El mismo juego se juega en perodos discretos de tiempo, t = 1,2,..., T En cada momento de tiempo t , todos los jugadores han observado la historia del juego (la secuencia del perfil de acciones) hasta el momento t 1 . Los pagos del juego completo se definen como la suma de los pagos de cada etapa del juego (stage-game) desde el perodo 1 hasta el T (o sus pagos descontados).

Etapa del juego (Stage-game): Es el juego que se juega en cada perodo t .

II. Modelo de 2 periodos (T=2) Ejemplo 1: El jugador 1 y 2 interactan en dos perodos de tiempo t = 1,2 . En cada perodo juegan el stage-game descrito a continuacin.
1 A B 2 X 4,3 0,0 Y 0,0 2,1 Z 1,4 0,0

La tasa de descuento de cada jugador es = 1. Ver representacin extensiva en el tablero! Existen 7 sub-juegos: El juego completo y los 6 del segundo periodo.

Por ejemplo, si en t = 1 los jugadores escogieron ( A, Z ) , los pagos finales en el sub-juego conformado en este nodo son: 1 A B 2 X 5,7 1,4 Y 1,4 3,5 Z 2,8 1,4

En trminos ms generales, si en t = 1 los jugadores escogieron la accin ( a1, a2 ) con payoffs (b, c ), los pagos finales sern: 1 A B 2 X 4+b , 3+c 0+b , 0+c Y 0+b , 0+c 2+b , 1+c Z 1+b , 4+c 0+b , 0+c

Miremos los equilibrios en este juego: Backward induction Ya sabemos que para obtener un SPE requerimos que la estrategia sea un EN para cada sub-juego. En nuestro caso, esto incluye cada stage-game. El sub-juego que empieza despus de que en t = 1 los jugadores escogieran ( A, Z ) posee dos EN: ( A, Z ) y (B, Y ).
Se puede demostrar que, independientemente del sub-juego en el que estemos, los nicos EN en el perodo 2 son ( A, Z ) y ( B, Y ) (Los llamaremos tambin Perfil de Estado de Nash): 1 A B 2 X 4+b , 3+c 0+b , 0+c Y 0+b , 0+c 2+b , 1+c Z 1+b , 4+c 0+b , 0+c

Qu ocurre en el perodo 1? Claim 1: jugar ( A, Z ) en t = 1 y ( A, Z ) en t = 2 , es un SPE (con payoffs (2,8)):

Ya sabemos que jugar ( A, Z ) en el sub-juego (stage-game) definido en t = 2 es EN: Nadie tiene incentivos a desviar. Suponga que 1 desva en t = 1 y escoge B: su payoff final ser 0+1=1, lo cual no es estratgico. Suponga que 2 desva en t = 1 y escoge X: su payoff final ser 3+4=7, lo cual no es estratgico. Suponga que 2 desva en t = 1 y escoge Y (lo cual no tiene mucho sentido!): su payoff final ser 0+4=4, lo cual no es estratgico.
Claim 2: jugar ( A, Z ) en t = 1 y ( B, Y ) en t = 2 , es un SPE (con payoffs (3,5)): Prueba igual que la anterior Esta conclusin se puede generalizar:

Teorema (parcial): Considere un juego repetido. Cualquier secuencia de Perfiles de Estado de Nash puede ser soportada como un SPE. Existen SPE que no contenga una secuencia de PEN? SI! Claim 3: Un equilibrio en el ejemplo 1 es: Se juega ( A, X ) en t = 1 y: Si 2 no desva en t = 1 de X, ( A, Z ) en t = 2 , Sin 2 desva en t = 1 (escoge Y o Z), entonces ( B, Y ) en t = 2 Note que ( A, X ) no pertenece al conjunto de EN encontrado en el stage-game que se juega en t = 2 . Sin embargo, en t = 2 siempre se juega uno de los EN. En este caso, la estrategia para t = 2 depende de lo que pase en t = 1: Si 2 coopera (crea reputacin) jugando X en t = 1, existir una recompensa jugando un EN del sub-juego en t = 2 . Si 2 no crea reputacin jugando Y o Z en t = 1, este es castigado en t = 2 . Este SPE es fcil de soportar:

De nuevo, ( A, Z ) o ( B, Y ) son EN del sub-juego en t = 2 . Nos queda probar que ( A, X ) en t = 1 hace parte del equilibrio: Note que si ( A, X ) es jugado en t = 1, los payoffs finales so (5, 7).

Suponga que 1 juega la estrategia anunciada. Note que si 2 desva en t = 1, sera por Z (con Y no consigue nada). En total obtendra 5<7. As no posee incentivos a desviar. Suponga que 2 juega la estrategia anunciada. Si 1 juega B en t = 1, obtendr 0 en este perodo y como 2 no desvi en t = 1, obtendr 1 en t = 2 : 1<5. As no posee incentivos a desviar.

Conclusin:

Solo un EN del stage-game jugado en t = 2 puede ser jugado en el perodo 2. Sin embargo, pueden existir equilibrios con reputacin donde los jugadores no escogen un Perfil de Estado de Nash en el perodo 1.

III. Juegos Repetidos Infinitamente Ahora supongamos que T = . Aunque la gente no vive un perodo de tiempo infinito, estos tipos de juegos son tiles en muchas situaciones: Relaciones entre pases, entre empresas, etc. El elemento crucial es la tasa de descuento: (0,1). Suponga que usted recibe un pago de 1 unidad en cada perodo de forma infinita. Aplicando la tasa de descuento tenemos que el pago descontado es:
u = 1 + + 2 + 3 + ...

Se puede demostrar (hgalo usted mismo) que esta serie converge a: u=


1 1

As, recibir un pago de a unidades cada perodo converge a: u =

a 1

Tenga en cuenta que las estrategias en un juego infinito son complejas ya que existen infinitos conjuntos de informacin. Sin embargo, veremos que con algunas pocas estrategias sencillas podremos hacer el anlisis. Un tipo de estrategia muy comn es la estrategia del disparador (trigger strategy). Estrategia del disparador: Posee un perfil de estrategias cooperativo, pero si algunos de los jugadores desva (pierde la reputacin), el otro jugador juega un perfil de estrategias de castigo por el resto de su vida (la cual usualmente es un EN del stage-game).

Ejemplo 2: Juego del prisionero jugado infinitas veces

1
I C

I 1, 1 0, 3

C 3, 0 2, 2

El nico equilibrio en cada stage-game es ( I , I ) . Considere la siguiente trigger strategy: Jugar (C , C ) en cada perodo, si este perfil ha sido jugado siempre en el pasado. Jugar ( I , I ) en cualquier otro caso. Demostraremos que esta estrategia puede ser un SPE.

Suponga que el jugador 2 sigue esta estrategia. Considere al jugador 1: Si 1 juega C siempre, entonces obtendr: 2 . 1

Si 1 desva en t = 1, entonces obtendr: 3 +


2 3

1
2 3

Note que: + + + ... = 1 + + + + ... =

Tenemos que:

2 3+ 1 1

1 2

As, si 1 2 (1 es suficientemente paciente), 1 no tendr incentivos a desviar. De hecho, para cualquier perodo t en el cual 1 decida desviar, esto no ser racional si 1 2 . El mismo anlisis aplica al jugador 2.

Conclusin: En juegos repetidos, si los jugadores son lo suficientemente pacientes, una estrategia cooperativa puede ser soportada como equilibrio. Claramente, suficientemente paciente depende de los payoffs del juego. Ejemplo 3:

1
I C

I -10, -10 -11, 0

C 0, -11 -1, -1

En este juego del prisionero, una trigger strategy se puede soporta para cualquier . prubelo usted mismo.

La estrategia jugada en el ejemplo 2 es tan solo un SPE de los muchos SPE que pueden existir en este juego. Por ejemplo, ya sabemos que el EN en cada stage-game ( I , I ) , es un SPE. De hecho, el teorema ms conocido en este tipo de juegos (Teorema Popular Folk Theorem) nos dice que hay mucho payoffs que pueden ser obtenidos mediante perfiles de estrategia que son SPE. Usemos el ejemplo 2 para ver esos payoffs.

Ejemplo 2:

1
I C

I 1, 1 0, 3

C 3, 0 2, 2

Los posibles payoffs de equilibrio (rea sombreada) pertenecen al diamante formado por los payoffs de cada perfil de estrategia (Se grafica el payoff promedio, multiplicando por (1 ) ). V2 3

1 1 3 V1

Teorema de Folk: Considere cualquier juego repetido infinitamente. Suponga que existe un perfil de estado de Nash con un vector de payoffs wi = (w1,..., wn ) . Llamemos v , cualquier vector factible de pagos promedio por periodo tal que vi > wi para cada jugador i. El vector v puede ser soportado por un SPNE si es suficientemente cercano a 1.

You might also like