You are on page 1of 16

Teoria dos Jogos 2

3. Jogos na Forma Extensiva


A melhor maneira de entender o que a representao de um jogo na forma extensiva atravs da discusso de exemplos. Comecemos pelo jogo chamado de hawk-dove (Maynard Smith and Price, 1973). Dois jogadores (animais) disputam um recurso (uma presa, por exemplo) e podem escolher uma de duas estratgias, escalar (e) o conflito ou apresentar (d) suas armas (como dentes e chifres). Se os dois animais escolherem e o conflito continuar at que um deles fique seriamente ferido, ficando ento o recurso com o vencedor. Se os dois escolherem d ento um mecanismo aleatrio (com chance para cada animal) determinar com quem fica com o recurso. Finalmente, se um deles escolher e e o outro d ento o ltimo fugir do conflito e o recurso ficar com o primeiro. O valor do recurso V e o dano causado por uma ferida sria igual a W, onde supe-se que W > V . Essas informaes podem ser sistematizadas na tabela abaixo, conhecida como forma normal ou estratgica do jogo.

e e d
1 1 (V W ) , (V W ) 2 2

(V , 0)
1 1 V, V 2 2

( 0,V )

Vamos agora sofisticar um pouco o jogo e coloc-lo na chamada forma extensiva, que descreve quem joga quando, que aes esto disponveis para cada jogador, quais so as informaes em poder de um jogador quando a sua vez de jogar, qual o resultado de uma srie de aes seguidas pelos jogadores, e quais so os payoffs associados a cada resultado possvel. Suponha agora que um dos animais seja o dono do territrio e que o outro seja um intruso que quer conquist-lo. Alm disso, o territrio pode ser bom ou ruim (para a caa, por exemplo) e o valor do territrio depende do seu tipo. O valor de um territrio bom 8, enquanto o de um territrio ruim 4. O dono do territrio conhece o seu valor mas o intruso no, sendo o dono do territrio escolhido aleatoriamente 1

(com chances iguais para cada um). Para a rvore que ser apresentada a seguir, usaremos W = 16 . Finalmente, a probabilidade de o territrio ser ruim igual a 0.6, e essa probababilidade conhecida pelos participantes. Esse jogo pode ser representado pela rvore a seguir: e e 1 0,4 N 0,6 1 d N d e e d 0,5 2 0,4 N 0,6 2 d d d 1 e d e d e e e d e d d 2 e d e

( 4, 4 ) (8, 0 ) ( 0,8) ( 4, 4 )
( 6, 6 )

0,5

( 4, 0) ( 0, 4)
( 2, 2 ) ( 4, 4 )

( 0,8) ( 8, 0 ) ( 4, 4 )
( 6, 6 )

( 0, 4) ( 4, 0)

( 2, 2 )

Outro exemplo de jogo na forma extensiva o matching pennies.

Criana 1 Cara Criana 2 Coroa Criana 2

Cara

Coroa

Cara

Coroa

O jogo hawk-dove representado acima um exemplo de jogo de informao imperfeita, enquanto o de matching pennies um de informao perfeita, onde esses termos seguem a seguinte definio:

Definio: Um jogo de informao perfeita se cada conjunto informao contm um nico ndulo de deciso. Caso isso no ocorra, um jogo de informao imperfeita

Outro exemplo de jogo com informao imperfeita o de matching pennies com moeda encoberta ou movimentos simultneos: Criana 1 Cara Criana 2 Coroa

Cara

Coroa

Cara

Coroa

Os dois ndulos do jogador 2 esto no mesmo conjunto-informao. Formalmente, um conjunto-informao um subconjunto especial dos ndulos de deciso de um determinado jogador, como ser discutido adiante.

importante notar que as aes disponveis para o jogador 2 em cada um dos ndulos do seu conjunto-informao so as mesmas. Caso isto no acontecesse, ela poderia distinguir os dois ndulos de seu conjunto-informao. Outra categorizao importante a seguinte:

Definio: Um jogo de informao incompleta aquele em que a Natureza joga primeiro e esse movimento no observado por pelo menos um dos jogadores. Caso contrrio, o jogo de informao completa.

Observe que um jogo de informao incompleta tambm de informao imperfeita, porque pelo menos um conjunto informao de algum jogador inclui mais de um ndulo. Esse o caso do jogo hawk-dove. Dois tipos de jogo so de informao completa mas imperfeita: jogos com movimentos simultneos e jogos onde, mais para o final do jogo, a Natureza faz um movimento que no imediatamente revelado a todos os jogadores. Em um jogo de informao incompleta, a Natureza joga primeiro e seleciona o tipo do jogador, definido como o seu conjunto de estratgias adicionado de sua partio de informao e sua funo payoff. Isso diferente de um jogo com incerteza, onde ocorrem movimentos da natureza aps algum jogador j ter jogado. Em particular, um jogo pode no ter incerteza (no h movimentos da Natureza aps algum jogador j ter jogado) mesmo que haja um movimento inicial da Natureza. Outra restrio que podemos impor estrutura do jogo a de memria perfeita, que significa, grosso modo, que um jogador no esquece o que ele j soube outrora, incluindo as suas prprias aes. A figura a seguir ilustra um jogo onde essa propriedade de memria perfeita no satisfeita.

1 l 2 L R 1 x y 2 a b a b x 1 y L r 2 R

Um postulado bsico da teoria dos jogos que adotaremos aqui o de que todos os jogadores conhecem a estrutura do jogo, todos sabem que os outros conhecem essa estrutura, todos sabem que os outros sabem que eles sabem, e assim por diante. Isso conhecido como conhecimento comum. O conceito fundamental para fazer a conexo entre jogos na forma extensiva e jogos na forma normal o de estratgia. Uma estratgia de um jogador uma especificao de como ele planeja jogar em cada um dos seus conjuntos-informao. Seja H i a coleo de conjuntos-informao do jogador i e A o conjunto de aes possveis. Temos ento a seguinte definio: Definio: Uma estratgia para o jogador i uma funo si : H i A tal que si ( H )

pertence ao conjunto de escolhas possveis a partir do conjunto-informao H (denotado por C ( H ) ) H H i .

Uma estratgia nada mais do que um plano de contingncia completo. Exemplos: 1) No jogo matching pennies com movimentos seqenciais, o jogador 1 tem duas estratgias possveis : cara ou coroa. J o jogador 2 tem 4 estratgias, quais sejam:

e1 : jogar Ca se 1 joga Ca; jogar Ca se 1 joga Co e2 : jogar Ca se 1 joga Ca; jogar Co se 1 joga Co e3 : jogar Co se 1 joga Ca; jogar Ca se 1 joga Co e4 : jogar Co se 1 joga Ca; jogar Co se 1 joga Co

2) No jogo matching pennies com movimentos simultneos, o jogador 2 passa a ter apenas duas estratgias possveis, cara ou coroa.

Para qualquer jogo na forma extensiva existe uma nica representao normal do jogo. A recproca, no entanto, no verdadeira. Por exemplo, a forma normal do jogo matching pennies com movimentos seqenciais representa no apenas a forma extensiva daquele jogo j apresentada como tambm a da figura abaixo:
2

4. Estratgias mistas
O conceito de estratgia mista transforma os espaos de estratgias dos jogadores em um contnuo de escolhas possveis:

Definio: Dado o conjunto Si de estratgias puras do jogador i, uma estratgia mista desse jogador i : Si [ 0,1] associa a cada estratgia pura si Si uma probabilidade i ( si ) 0 , onde
si Si

( s ) = 1.
i i

O conjunto de estratgias mistas possveis do jogador i, chamado de extenso mista de Si , representado pelo simplex
( Si ) = ( 1i , , Mi )
M M : mi 0 m = 1, , M e mi = 1 , m =1

onde estamos supondo que o jogador i tem M estratgias puras, ou seja,


Si = s1i ,..., s Mi . Dado o perfil de estratgias mistas = 1 ,..., I , o payoff do jogador i dado

por
{ui ( s )} = 1 ( s1 ) 2 ( s2 ) ... I ( sI ) ui ( s ) ,
sS

onde S = S1

S I . Denotamos esse payoff por ui . importante notar tambm

bg

que estamos supondo que as randomizaes dos jogadores so independentes entre si. Ou seja, o payoff do jogador i a sua utilidade esperada, onde a probabilidade de que a utilidade associada a um certo perfil de estratgias (puras) ser obtida igual ao produto das probabilidades com que cada jogador joga a sua respectiva estratgia naquele perfil. Quando as estratgias so mistas, um jogo na forma normal representado por
N = I , { ( Si )} , {ui ( )} . Quando o jogo est na sua forma extensiva, os jogadores tambm podem randomizar separadamente sobre as aes possveis em cada conjunto-informao H H i , ao invs de sobre o conjunto de todas as estratgias puras em Si . Isso d origem seguinte definio: Def.: Dado um jogo na forma extensiva E , uma estratgia comportamental para o jogador i associa a cada conjunto informao H H i e cada ao a C ( H ) uma probabilidade i ( a, H ) 0 , com
aC ( H )

i ( a, H ) = 1 para todo H H i .

Para jogos com memria perfeita os dois tipos de randomizao so equivalentes (Kuhn, 1953).

4.1. Equilbrio de Nash com estratgias mistas

Podemos facilmente modificar a noo de equilbrio de Nash de forma a permitir estratgias mistas. Definio: Uma lista de estratgias mistas = 1 ,... I um equilbrio de Nash do jogo = , { ( Si )} , {ui ( )} se, para todo i = 1,..., I ,
ui ( i , i ) ui ( i, i ) i ( Si ) .

Exemplo:

B B A

100, 50 50, 220

75, 100 200, 200

O jogo acima no possui equilbrios de Nash com estratgias puras. Vamos agora procurar equilbrios com estratgias mistas. Sejam p1 a probabilidade de o jogador 1 jogar B e p2 a probabilidade de o jogador 2 jogar B. Temos ento os seguintes payoffs esperados:
E ( 1 ) = p1 p2 (100 ) + p1 (1 p2 )( 75 ) + (1 p1 ) p2 ( 50 ) + (1 p1 )(1 p2 )( 200 ) = ( 200 150 p2 ) (125 175 p2 ) p1 e
E ( 2 ) = ( 200 100 p1 ) + ( 20 70 p1 ) p2 .

Se 1 acredita que 2 acredite que ele escolher B com uma probabilidade p1e , ento 2 se p1e < , ento 20 70 p1e > 0 e, portanto, p2 = 1; 7 2 se p1e > , ento p2 = 0. 7 No primeiro caso, o jogador 1 deve jogar B com probabilidade 1, o que inconsistente. No segundo caso, ele nunca deve jogar B, o que tambm inconsistente. Portanto, somente quando p1e =

2 os comportamentos dos jogadores 7

so consistentes, e esses comportamentos so imprevisveis. Um raciocnio anlogo

vale para o jogador 2. Podemos resumir nossas concluses at o momento na tabela abaixo:

Jogador 1

0 p2 <

5 7

Jogar A sempre Jogar B sempre Imprevisvel

5 < p2 1 7 p2 = 5 7

Jogador 2 0 p1 < 2 7 Jogar B sempre Jogar A sempre Imprevisvel

2 < p1 1 7 p1 = 2 7

O nico equilbrio de Nash , portanto,

FG 2 , 5 IJ . H 7 7K

Existe uma maneira mais simples de encontrar equilbrios de Nash com estratgias mistas, chamada de o mtodo da equivalncia de payoffs. A idia desse mtodo que quando um jogador usa uma estratgia mista em equilbrio, ele obtm o mesmo payoff quando joga cada uma de suas estratgias puras que fazem parte (probabilidade positiva) da estratgia mista, dadas as estratgias mistas dos demais jogadores. Se uma dessas estratgias puras gerasse um payoff mais alto, esse jogador deveria jog-la ao invs da estratgia mista. Se uma delas gerasse um payoff mais baixo, ele deveria descart-la da sua estratgia mista, ou seja, jog-la com probabilidade zero.

Esse resultado pode ser visto mais facilmente se usarmos uma frmula
alternativa para o payoff esperado do jogador i. Como ui ( ) = j ( s j ) ui ( s ) , sS j

temos ui ( si , i ) =

s i S i

( s ) u ( s , s ) e, portanto,

j j j i

ui ( ) =

s u s , s s ( ) ( ) j j i i i i( i) si Si s i S i j i = i ( si ) ui ( si , i ).
si Si

Na verdade, podemos mostrar que uma condio necessria e suficiente para que o perfil de estratgias mistas seja um equilbrio de Nash a seguinte: Cada jogador, dada a distribuio de estratgias dos demais jogadores, indiferente entre todas as estratgias puras que ele joga com probabilidade positiva de acordo com o perfil , e aquelas estratgias puras geram um payoff pelo menos to alto quanto qualquer outra estratgia pura jogada com probabilidade zero de acordo com . Uma implicao desse resultado a de que basta testar desvios em estratgias puras (isto , mudar de i para uma estratgia pura si ) para determinar se um equilbrio de Nash ou no. (Tente provar isso!) Vejamos agora uma aplicao do mtodo da equivalncia dos payoffs.

Exemplo: Considere a Batalha dos Sexos descrita antes

F F S

2, 1 0, 0

0, 0 1, 2

e suponha que 1 , 2 seja um equilbrio de Nash com estratgias mistas.


1

b g Se b F g = 0 ou 1, temos os equilbrios de Nash puros. Se


2 2 ( F ) = 2 ( S ) ,

0 < 1 F < 1,

bg

ento, dado 2 , as duas estratgias do jogador 1 tem que produzir o mesmo payoff, ou seja,

10

1 de maneira que 2 ( F ) = . 3 Como 0 < 1 F < 1 , as duas estratgias do jogador 2 tm que produzir o mesmo payoff, ou seja, 1 F = 2 1 S 1 F =

bg

bg

bg

bg

2 . 3

Portanto, o nico equilbrio de Nash com estratgias mistas no degeneradas desse jogo

FG FG 2 , 1IJ , FG 1 , 2 IJ IJ . H H 3 3K H 3 3 K K

2 (F )

Funo melhorresposta do jogador 2 1

1/3

Funo melhorresposta do jogador 1

2/3

1 ( F )

Duas objees so geralmente associadas ao conceito de equilbrio de Nash com estratgias mistas. A primeira a de que no mundo real raramente as pessoas fazem aes aleatrias. Essa crtica pode ser facilmente rebatida se lembrarmos que tudo o que um modelo com estratgias mistas exige que as aes de um jogador paream aleatrias para os demais jogadores e para observadores externos. Os jogadores podem estar tomando decises determinsticas baseados em sinais privados que recebem, o que faz com que paream aleatrias para os outros. Em um jogo de futebol, por exemplo, o jogador escalado para bater um pnalti tem que decidir se chutar a bola no canto esquerdo por baixo, no centro do gol pelo alto, ou em outra direo, com que fora bater na bola etc. Essa deciso, do ponto de vista do goleiro, aleatria, embora para o batedor de pnalti seja determinstica, dependendo de variveis como a reao do jogador ao vento, posio do goleiro, ao estado do

11

gramado, alm de outras coisas. Tambm no podemos esquecer que h jogos em que as estratgias so de fato aleatrias. Por exemplo, a Receita Federal seleciona aleatoriamente as declaraes de imposto de renda que sero conferidas, enquanto companhias telefnicas e outras empresas realizam um controle por amostragem das conversas de seus operadores. A segunda objeo a de um jogador que joga uma estratgia mista sempre indiferente entre duas estratgias puras, dadas as estratgias mistas dos demais jogadores. Sendo assim, ele no deveria se dar ao trabalho de randomizar. Em outras palavras, o equilbrio com estratgia mistas fraco, no sentido de que um jogador que indiferente entre estratgias tem que escolher uma estratgia em particular dentre um conjunto de estratgias. Uma maneira de superar essa objeo pensar em um jogo onde um dos jogadores, digamos Coluna, joga uma estratgia com probabilidade em equilbrio e outra com probabilidade 1 , como um jogo onde h uma populao de jogadores com preferncias e funes payoff idnticas s de Coluna. Nesse caso, o equilbrio com estratgias mistas pode ser reinterpretado como um equilbrio em que % da populao joga uma das estratgias puras e (1 ) % joga a outra estratgia pura. Permanece o problema de como indivduos indiferentes entre estratgias puras escolhem uma ou outra, mas isso pode ser atribudo a idiossincrasias no modeladas. Outra interpretao (devida a Harsanyi [1973]) funciona em qualquer situao. Ela estipula que h dois tipos de jogador em uma populao e que cada tipo escolhe uma das estratgias puras quando seus oponentes esto jogando suas estratgias mistas de equilbrio. Nenhum jogador sabe que tipo de jogador est enfrentando. Esses tipos ocorrem com probabilidades e 1 , respectivamente. Passemos agora discusso de um jogo onde o equilbrio com estratgias mistas faz mais sentido do que o com estratgias puras.

Exemplo: O Jogo da Covardia (Game of Chicken) Os jogadores so dois adolescentes, Sandro e Beto, que esto dirigindo dois carros velozes em rota de coliso. Quando a coliso se aproxima, cada um tem que decidir se mantm a direo (M) ou se desvia o carro para o lado (D). Os payoffs so como a seguir:

12

M M D

-3,-3 0,2

2,0 1,1

H dois equilbrios de Nash assimtricos com estratgias puras: (D,M) e (M,D). A questo relevante como os jogadores conseguem determinar qual dos equilbrios ser jogado. Mesmo que eles possam conversar antes do jogo, no est claro como eles fariam suas escolhas. Sendo assim, talvez a melhor previso para o resultado desse jogo seja o equilbrio com estratgias mistas, pois a simetria desse equilbrio pode torn-lo um ponto focal. Aplicando o mtodo da equivalncia de payoffs, onde a probabilidade de escolher M, obtemos:

uBeto ( D ) = ( Sandro )( 0 ) + (1 Sandro )(1) = ( Sandro )( 3) + (1 Sandro )( 2 ) = Beto ( M ) Conseqentemente:


1 Sandro = 3 Sandro + 2 2 Sandro 1 4 Sandro = 1 Sandro = . 4

Como o jogo simtrico, obtemos um equilbrio simtrico com

Sandro = Beto = =

1 . 4

A probabilidade de que os dois adolescentes sobrevivam igual a

1 2 = 0.9375 .

4.2. Estratgias mistas com I jogadores

O jogo que estudaremos aqui se chama o Jogo do Dever Cvico (Civic Duty Game). Dois indivduos, Paulo e Marcelo, presenciam um roubo. Cada um gostaria que a polcia fosse avisada e impedisse o roubo, em cujo caso receberia um payoff de 10 unidades. Entretanto, nenhum deles quer fazer a ligao telefnica para a polcia, pois isso traz um custo igual a 3 unidades (devido ao esforo realizado, por exemplo). Se pudesse ter certeza de que o outro faria a ligao, o indivduo ignoraria o roubo.
13

A forma normal do jogo est representada pela tabela abaixo:

Marcelo Ignorar Telefonar Paulo Ignorar Telefonar 0,0 7,10 10,7 7,7

H dois equilbrios assimtricos com estratgias puras, (T,L) e (L,T), e um equilbrio simtrico com estratgias mistas. Nosso maior interesse est na anlise do caso com N jogadores. O payoff de Paulo 0 se ningum chama a polcia, 7 se ele faz a ligao e 10 se um ou mais dos outros N-1 indivduos faz a ligao. Esse jogo tambm tem equilbrios assimtricos com estratgias puras e um equilbrio simtrico com estratgias mistas. Nosso interesse est neste ltimo. Seja a probabilidade (comum) de jogar Ignorar usada por todos os jogadores. Ento a probabilidade de que os outros N-1 jogadores todos escolhem Ignorar N 1 e a probabilidade de que um ou mais deles escolhem Telefonar 1 N 1 . O mtodo da equivalncia dos payoffs nos diz que o payoff de Paulo quando ele joga Telefonar tem que ser o mesmo de jogar Ignorar, dadas as estratgias mistas dos demais jogadores. Sendo assim:

Paulo (Telefonar ) = 7 = Paulo ( Ignorar ) = N 1 ( 0 ) + (1 N 1 ) (10 )


Resolvendo para , obtemos
10 10
N 1

=7

N 1

3 3 N 1 = * = . 10 10

Se N = 2 , por exemplo, Paulo escolhe Ignorar com probabilidade 0,3. medida que N aumenta, a probabilidade de Ignorar aumenta. Quando N = 38 , por exemplo, * = 0.97 . A interpretao de que quando h mais jogadores cada jogador acredita que h uma chance maior de alguma outra pessoa fazer a ligao.

14

A probabilidade de que ningum faa a ligao ( * ) . Como ( * )


N

N 1

= 0,3 ,

temos

( )

* N

= 0,3 * , que crescente em N. Por exemplo,

( )

* 2

= 0, 09 e

( )

* 38

= 0, 29 . Isso significa que quanto mais pessoas assistem a um crime, menos provvel

que esse crime seja denunciado. Esse resultado pode ser usado para explicar um crime muito famoso que ocorreu na cidade de Nova York em 1964, quando 38 pessoas assistiram a um assassino perseguir e esfaquear uma mulher (Kitty Genovese), mas nenhuma delas ligou para a polcia enquanto o crime ocorria. Uma testemunha ligou depois que a mulher j estava morta.

5. Estratgias contnuas: O jogo de Cournot


Cournot (1838) estudou um mercado de duoplio em que duas firmas concorrem entre si escolhendo seus nveis de produo. As firmas usam a mesma tecnologia de retornos constantes de escala para produzir um bem homogneo. O custo unitrio de produo o mesmo para as duas firmas e igual a c, e a funo de demanda inversa linear e dada por:
p ( q ) = a bq, a > c 0, b > 0 .

Cada firma quer maximizar o seu lucro. Sendo assim, o problema que a firma i
tem que resolver max i ( qi , q j ) = p ( qi + q j ) qi cqi = a b ( qi + q j ) qi cqi , qi

i = 1, 2 , j i . Para encontrar os equilbrios de Cournot-Nash desse jogo, usamos as


condies de primeira ordem 1 ( q1 , q2 ) 2 ( q1 , q2 ) = = 0 . Isso gera: q1 q2
a 2bq1 bq2 c = 0 q1 = a c q2 2b 2 a 2bq2 bq1 c = 0 a c q1 . 2b 2

q2 =

Observe que as condies de segunda ordem para um mximo so satisfeitas.

15

As funes obtidas a partir das condies de primeira ordem so chamadas de funes de reao ou melhor-resposta e podem ser expressas como q1 = b1 ( q2 ) e
q2 = b2 ( q1 ) . A figura abaixo traz uma representao grfica dessas funes:

q2

b1 ( q2 )

q1 = q2

ac 3b

Equilbrio de Cournot-Nash
b2 ( q1 )

ac 3b

q1

As duas funes de reao so negativamente inclinadas, o que implica que cada firma responde a um aumento de produo de sua rival com uma reduo de sua prpria produo. O equilbrio de Cournot-Nash o ponto onde as duas curvas de reao (nesse caso, retas) se interceptam. A soluo do sistema gerado pelas duas funes de reao : 1 ac * 1 * * * * q1 = q2 = , p = p ( q1 + q2 ) = ( a + 2c ) . 3 b 3 Podemos tambm calcular o lucro da firma i:

i = ( p* c ) qi* =

a + 2c a c c 3 3b

(a c) =
9b

, i = 1, 2, i j.

16

You might also like