7 Aula Teoria Dos Jogos

Universidade Federal do Cear Pro - Reitoria de Pesquisa e Ps-Graduao Mestrado em Logstica e Pesquisa Operacional Disciplina: VAP 719 Mtodos
s de Apoio Deciso Prof. : Joo Bosco Furtado Arruda
AULA: TEORIA DOS JOGOS Histrico: a) 1944: Von Neumann e Oskar Morgenstern lanam Theory of Games and Economic Behaviour => abordam jogos de soma zero; b) 1994: John Nash, John C. Harsanyi e Reinhard Selten recebem Prmio Nobel (por trabalhos em teoria no-cooperativa). Conceitos: Jogo: envolve a interdependncia de aes de seus jogadores; um jogador toma decises estratgicas no sentido de que suas decises contemplam no apenas seus objetivos e possibilidades de escolha, mas tambm os objetivos e possibilidades de escolha dos demais jogadores. Jogos de estratgia: situaes que envolvem interaes entre atores racionais em bases de ao de cunho estratgico. Jogo racional: tem a ver com os meios que emprega para alcanar os seus fins e no com os fins em si mesmos. Jogador racional: i) Extrai concluses, de forma coerente, a partir de premissas; ii) Escolhe as premissas nas quais se apia em raciocnio lgico, com base no emprego da razo; iii) Considera as evidncias de forma neutra, sem distorcer os fatos ou omitir evidncias. Exemplo de Jogo: A OPEP e o Mercado Internacional de Petrleo.
No basta conhecer a teoria; preciso tambm saber os limites dos conhecimentos proporcionado pela teoria. Teoria dos Jogos: utiliza regras preestabelecidas para apresentar e estudar um jogo; permite identificar a lgica do processo de interao estratgica estudado, desde que as hipteses dessa teoria sejam respeitadas e se aplique um modelo adequado s circunstncias especficas do caso. A Teoria dos Jogos ajuda a desenvolver a capacidade de raciocinar estrategicamente, explorando as possibilidades de interao dos agentes, as quais nem sempre correspondem intuio. Exemplo: interaes estratgicas envolvendo votaes. Teoria da Escolha Racional: diz de que maneira os tomadores de deciso faro suas escolhas, em funo dos objetivos que perseguem. Relaes: i) ii) iii) de Preferncia X>~Y (ao menos to bom quanto) de Preferncia Estrita - (X>Y X>=Y mas no Y>=X) de Indiferena - (X~Y X>~Y e Y >~X)
Preferncias ordinais = preferncias (completas mais transitivas): so caractersticas intrnsecas dos jogadores racionais. Paradoxo de Condorcet: fato de que as preferncias dos indivduos, quando tomados isoladamente, serem transitivas, mas no implicam que o sero quando tomadas em grupo. Questes complicadoras da deciso racional: i) Quando os jogadores no dispem de informaes necessrias antes do incio do processo de interaes estratgicas, so obrigados a algum procedimento de busca de informaes; ii) Existe um dado contexto de regras sociais ou valores culturais. Exemplo: fechamento de negcios em campos de golfe pelos empresrios americanos.
Teorema de Bayes:
P (A j /B )=
S= (A1, A2, ..., An)
prob( A j ) prob( B / A j )
prob( A ) prob( B / A )
1 i i
Aj eventos mutuamente excludentes; Prob (Aj) 0 B S / Prob (B) 0
Representao de uma Interao Estratgica: Jogador: qualquer indivduo ou organizao envolvido em um processo de interao estratgica (PIE) que tenha autonomia para tomar decises. Estratgia: plano de aes de um jogador que especifica qual ao tomar em um dado momento em que ele instado a decidir. Como modelar os PIEs e como analis-los buscando determinar as conseqncias dessas interaes? a) Como se modela? Modelar um jogo representar uma situao de interao estratgica, focalizando apenas os elementos considerados mais importantes, para explicar como os atores interagem. b) Quais os elementos fundamentais de um modelo de jogo? O objetivo de todo jogador obter o melhor resultado possvel do PIE, dadas as suas preferncias. Uma ao de um jogador = escolha feita em um dado momento do jogo. Ai = {ai} inclusive do nothing
Possibilidades de interao estratgica = funo de todas as aes relevantes disponveis para os jogadores.
Recompensa: as funes de recompensa so diferentes para cada jogador => devemos empreg-las apenas para ordenar as preferncias de um mesmo jogador; jamais para ordenar as preferncias de jogadores diferentes. Espao de estratgias: conjunto das j-simas estratgias disponveis ao jogador i. Sji = {sij} Combinao de estratgias: cada uma produz diferentes recompensas para os jogadores Sji = {s1, ..., si, ..., sn} Funo de Recompensa de um jogador i: Ui = (s1, ..., si, ..., sn) Quais tipos de modelos podem ser construdos? => c) modelos bsicos: simultneos e seqenciais => os jogadores conhecem antecipadamente, ou no, as decises dos outros jogadores, antes de tomar suas prprias decises. Jogos simultneos cada jogador ignora as decises dos demais ao tomar sua deciso e no se preocupa com as conseqncias de sua escolha. Jogos sequenciais jogadores realizam seus movimentos em uma ordem pr-determinada. A escolha de modelar um PIE como simultneo ou seqencial dependem das informaes que os jogadores dispem no momento de escolher suas aes (e no da distribuio de suas aes no tempo) => noo de tempo em jogos seqenciais tem sentido mais lgico que cronolgico! Conjunto de Informaes: conjunto de ns que o jogador acredita poder ter alcanado em uma dada etapa do jogo, quando a sua vez de jogar.
Classificao dos PIEs em relao s informaes que os jogadores dispem: a) Jogo de Informao Perfeita quando todos os jogadores conhecem toda a histria do jogo antes de fazerem sua escolha; b) Jogo de Informao Imperfeita quando algum jogador, em algum momento do jogo, tem de fazer suas escolhas sem conhecer exatamente a histria do jogo at ali. Formas de apresentao dos jogos: estendida e estratgica. Regras da rvore de Jogos (essencial para a preservao da coerncia e inteligibilidade do modelo em forma estendida): a) S existe um n precedente; b) No h circularidade de trajetrias; c) S h um nico e mesmo n predecessor a qualquer n (unicidade do sucessor). Exemplo: Caso de uma empresa entrando em um mercado monopolizado (lucro de mercado= R$ 10,0 milhes/ms) Forma estendida:
0,10
Desafiante
-1,2 Luta
Dominante Acomoda
3,7
Forma estratgica: Dominante Desafiante Entra No Entra Luta -1, 2 0,10 Acomoda 3,7 0,10
A forma estendida mais interessante como representao de jogos seqenciais, especialmente se forem jogos de informao perfeita => nela pode-se visualizar a seqncia em que os jogadores fazem as suas escolhas, o que no possvel em jogos da forma estratgica. Como se analisa um jogo? Ou seja: Como determinar a melhor forma dos jogadores se comportarem e que recompensas eles podem obter em conseqncia das estratgias que adotam? Relaes entre estratgias: i) Estratgia estritamente dominante:
i (si* , s-i ) > i (si** , s-i ) => si* estritamente dominante a si**
ii) Estratgia fracamente dominante:

i (si* , s-i ) i (si** , s-i ) => si* para todo s-i i (si* , s-i ) > i (si** , s-i ) => si* para algum s-i
=> si* fracamente dominante a si**
Jogo simultneo: mtodo simples para determinar resultado eliminar iterativamente as estratgias estritamente dominadas. Exemplo: Revendedora Honda ameaando mercado da Revendedora Toyota (tomam decises ao mesmo tempo, sem conhecer as decises uma da outra) TOYOTA HONDA Lanar modelo Importar da Matriz No competir Lanar nova verso 1,4 2,2 1,1 4,1 2,1 0,6 TOYOTA HONDA Lanar modelo Importar da Matriz No competir Lanar nova verso 1,4 2,2 1,1 4,1 2,1 0,6 1,3 2,3 1,0 Manter preo Reduzir preo 1,3 2,3 1,0 Manter preo Reduzir preo
TOYOTA HONDA Lanar modelo Importar da Matriz No competir Lanar nova verso 1,4 2,2 1,1 4,1 2,1 0,6 1,3 2,3 1,0 Manter preo Reduzir preo
=> Resultado: equilbrio de estratgias ED (jogo solucionvel por dominncia) => estratgias que no eram ED para um jogador no jogo original podem ir se tornando ED medida que estratgias ED de outros jogadores so eliminadas. Estratgias racionalizveis: aquelas (uma ou mais) que resultam da eliminao iterativa de estratgias ED. Hiptese CCR (Conhecimento Comum da Racionalidade): quando se supe que a racionalidade dos jogadores de conhecimento comum (significa que todos os jogadores sabem do fato, todos os jogadores sabem que todos os jogadores sabem do fato, etc.). Melhor resposta (estratgia si*):
i (si* , s-i ) i (si , s-i ) para algum s-i e todo si si*
onde s-i representa a combinao de estratgias dos demais jogadores e si { s-i } Nunca a melhor resposta (si**), qualquer que seja a estratgia que os demais jogadores desejem jogar:
i (si* , s-i ) > i (si** , s-i ) para algum si* si** e todo s-i
=> exemplo: estratgia estritamente dominada (EED) Equilbrio de Nash (EN): combinao de estratgias onde cada estratgia a melhor resposta possvel s estratgias dos demais jogadores, e isto verdade para todos os jogadores.
8
Para que uma dada combinao de estratgias seja um EN, preciso que cada estratgia pertencente combinao (si) satisfaa a:
i (si, s-i ) i (si , s-i ) para todo si e todo i
onde o sinal () indica que a estratgia faz parte de um EN. Exemplo: Jogo de preveno da entrada da China Oil Company no mercado nacional (no possui equilbrio em estratgias ED).
China Oil Company Petrobras No Exporta Investe No Investe 2,1 1,0 Exporta em Exporta em pequena escala grande escala 1,0 2,1 0, -1 -1, 2
Dica para encontrar um equilbrio de Nash => indicar com (l) ou (c) a estratgia que resulta na maior recompensa ao jogador que est nas linhas ou colunas, para cada uma das colunas/linhas da forma estratgica. Equilbrio em estratgias ED versus equilbrio de Nash: exemplo do Comrcio Internacional. EUA Brasil Tarifa alta Tarifa baixa Tarifa alta 900,900 (600), 3300 Tarifa baixa 3300,(600) 1500,1500
Resultado do problema anterior pode ser generalizado: Se um jogo apresenta um equilbrio em estratgias ED => esse equilbrio , necessariamente, um equilbrio de Nash estrito. Ou seja:
i (si*, s-i* ) > i (si , s-i* ) para todo si e todo i
Ou seja, uma dada estratgia de um jogador (si*) deve resultar em uma recompensa estritamente maior do que qualquer outra estratgia desse jogador (si), dadas as estratgias dos demais jogadores (s-i*) e isso deve ser verdade para todos os jogadores. timo de Pareto: tem-se uma situao em que no mais possvel melhorar a situao de um agente sem piorar a situao de outro(s). O conceito de equilbrio de Nash exige que cada jogador adote individualmente a melhor resposta s estratgias dos demais, mas isso no implica que a situao resultante das decises conjuntas dos jogadores ser a melhor possvel => o equilbrio de Nash no tem nada a ver com o timo de Pareto.
10
Jogos clssicos so usados para resumir as caractersticas de alguma situao em que se d interao estratgica:
Jogo A Batalha dos Sexos
Caractersticas
Homem Mulher Futebol Show Futebol 1,2 -1,-1

O Dilema dos Prisioneiros
Coordenao -1,-1 2,1
com
vrias
Opes
serve
como
Show
representao geral das situaes de IE em que os jogadores ganham sempre que coordenam suas decises, mas tem preferncia distintas sobre que tipo de coordenao adotar Cooperao versus Interesse Prprio . Prisioneiros no podem se comunicar; . Jogo no cooperativo: quando os jogadores no podem estabelecer compromissos garantidos; . Exemplifica o fato de que, em determinados processos de IE, o fato de cada jogador buscar o melhor para si leva a uma situao que no a melhor para todos. 0,-4 -1,-1
Ladro 1 Ladro 2 Confessa No confessa Confessa -2,-2 -4,0 No confessa
11
Jogo O Jogo dos Safados
Caractersticas
Poltico PSDB Poltico DEM Confronta No confronta Confronta -2,-2 -1,2

O Jogo da Caa ao Veado
. Competio destrutiva 2,-1 0,0
No confronta
Caador 2 Caador 1 Veado Lebre Veado 3,3 1,0 Lebre 0,1 1,1
. Dilema do Contrato Social; . Representa situaes de IE em que: i) O melhor resultado = (cooperao); ii) Se algum busca um resultado mais imediato => prejudica o que foi fiel aos compromissos iniciais.
12
Exemplo de jogo simultneo com estratgias continuas: jogo de localizao sem e com custos de transporte. JSEC sem CT => Teorema do eleitor mediano JSEC com CT => escolha estratgica das empresas pela diferenciao de seus produtos Modelo de Cournout => determinao simultnea de quantidades Modelo de Bertrand => determinao simultnea de preos Jogos estritamente competitivos e estratgias mistas: Condio necessria ao JEC:
Ua (sia , sjb) Ua (sja , sib) se, e somente se, Ub (sja , sib) Ub (sia , sjb)
=> uma combinao de estratgias fornece uma recompensa maior ou igual outra combinao de estratgias para um dos jogadores se o inverso acontecer com o outro jogador; e => no existe combinao de estratgias prefervel a qualquer outra para os dois jogadores simultaneamente. Minimax = Min t { max s U (s,t)} Maximin = Max s { min t U (s,t)} (1) (2)
Quando (1) = (2) => combinao de estratgias um ponto de sela.
13
JOGOS ESTRITAMENTE COMPETITIVOS E ESTRATGIAS MISTAS
Qual a melhor forma de enfrentar uma situao de interao estratgica em que o conflito de interesses no concilivel? JEC = jogo de soma zero => recompensa dos jogadores esto relacionados de forma inversa. Condies de um JEC - jogadores a e b: Ua (sia , sjb ) Ua (sja , sib ) se e somente se Ub (sja , sib ) Ub (sia , sjb ) Ou seja, uma combinao de estratgias fornece uma recompensa maior ou igual a outra combinao de estratgias para um dos jogadores se o inverso ocorrer com o outro jogador. Tambm: Ua (sia , sjb ) = Ua (sja , sib ) se e somente se Ub (sia , sjb ) = Ub (sja , sib ) Ou seja, um dos jogadores s indiferente entre os resultados de duas combinaes de estratgias se o outro jogador tambm o for. Da mesma forma: Ua (sia , sjb ) > Ua (sja , sib ) se e somente se Ub (sja , sib ) > Ub (sia , sjb ) Ou seja, se um dos jogadores prefere estritamente uma combinao de resultados de estratgias a outra, o outro jogador prefere esta 2 combinao de estratgias 1. Em geral: Ua (sia , sjb ) = - Ub (sia , sjb ) Ou seja, o resultado que um jogador mais prefere o resultado que um jogador menos prefere. Condies de um JEC: no pode haver combinao de estratgias prefervel a qualquer outra para um jogador e os demais simultaneamente.
14
Ponto de sela - combinao de estratgias em um JEC satisfaz a:
Min Max
t s
U ( s, t ) = Max Min U ( s, t )
s t
Nem sempre ocorre um equilbrio de Nash em JEC. Algumas vezes, um jogo pode apresentar mais de um equilbrio quando se aplica o mtodo Minimax. Estratgias mistas ocorre quando um jogador, ao invs de escolher uma dada estratgia dentre suas opes para jog-la com certeza, escolhe alternar entre suas estratgias de forma aleatria, atribuindo uma probabilidade a cada estratgia escolhida. Exemplo: jogador de futebol batendo penalty com baralho de cartas. Recompensa esperada de um jogador pela adoo de uma dada estratgia: recompensa que ele pode vir a obter, em mdia, dadas as probabilidades com que os outros jogadores escolhem suas estratgias. Exemplo: Jogo de preveno de ataque. EUA Pearl Harbour Norfolk Recompensa esperada do Japo em cada estratgia Pearl Harbour 1, -1 -1, 1 1-2p JAPO Norfolk -1, 1 1, -1 2p-1
15

7 Aula Teoria Dos Jogos

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

7 Aula Teoria Dos Jogos

Uploaded by

Copyright:

Available Formats

Universidade Federal do Cear Pro - Reitoria de Pesquisa e Ps-Graduao Mestrado em Logstica e Pesquisa Operacional Disciplina: VAP 719 Mtodos

s de Apoio Deciso Prof. : Joo Bosco Furtado Arruda

Aj eventos mutuamente excludentes; Prob (Aj) 0 B S / Prob (B) 0

ii) Estratgia fracamente dominante:

=> si* fracamente dominante a si**

Jogo A Batalha dos Sexos

Homem Mulher Futebol Show Futebol 1,2 -1,-1

Coordenao -1,-1 2,1

Ladro 1 Ladro 2 Confessa No confessa Confessa -2,-2 -4,0 No confessa

Jogo O Jogo dos Safados

Poltico PSDB Poltico DEM Confronta No confronta Confronta -2,-2 -1,2

. Competio destrutiva 2,-1 0,0

Quando (1) = (2) => combinao de estratgias um ponto de sela.

JOGOS ESTRITAMENTE COMPETITIVOS E ESTRATGIAS MISTAS

Ponto de sela - combinao de estratgias em um JEC satisfaz a:

You might also like