Parte 14 Teoria Dos Jogos

Teoria dos Jogos
Disciplina: PRO708 - Pesquisa Operacional II

Prof: Lásara Rodrigues
Departamento de Engenharia de Produção, Administração e Economia

Escola de Minas
Universidade Federal de Ouro Preto
14ª Parte
1
Jogos
• Conflitos e competições são comuns.
• Ex. campanhas políticas e publicitárias, jogos
de mesa, batalhas militares.
• Resultado final depende basicamente da
combinação de estratégias selecionadas pelos
adversários.
2
Teoria dos Jogos
• Teoria matemática que trata das características
gerais de situações competitivas de maneira
formal e abstrata.
• Coloca ênfase nos processos de tomada de
decisão dos adversários.
3
Jogo
• Situação de confronto entre partes, com uma
solução óbvia ou não, envolvendo barganha
ou não.
4
Jogos podem ser classificados em:
• Cooperativos ou competitivos
• Competitivos envolvem conflitos entre
jogadores.
• Cooperativos exibem problemas em que se
pode combinar jogadas de forma a maximizar

o resultado de ambos os jogadores.
• Os jogos de soma zero são o extremo da
competição.
5
• Simultâneos ou em turno
• Simultâneos: os jogadores atuam ao mesmo
tempo. Ex. leilões de blocos exploratórios de
petróleo e gás natural, em que as propostas
são colocadas em uma urna e abertas
simultaneamente.
• Em turnos: envolvem jogadas sequencias com
jogadores alternando-se. Ex. xadrez.
6
• Jogos em uma ou múltiplas etapas
• Jogos em uma etapa: envolvem apenas uma
jogada. Ex. jogos de lançamento de moeda.
• Jogos em turnos: se dão em mais de uma
etapa. Ex. xadrez, damas.
7
• Jogos de duas ou mais pessoas
• O conflito polarizado entre dois elementos é
bem mais fácil de se tratar que os jogos de
múltiplos jogadores.
8
• Jogos com ou sem comunicação
• Jogos com comunicação: aqueles em que a
cooperação (ou competição) pode ser
verbalizada.
• Jogos sem comunicação: aqueles em que os
jogadores são perfeitamente isolados.
9
Jogos entre dois participantes de
soma zero
• Envolvem apenas dois jogadores.
• Jogador ganha independente de quanto o
outro perca, de forma que a soma de suas
vitórias líquidas seja zero.
• Exemplo: jogo de par ou ímpar (cada um dos
participantes mostra simultaneamente um ou
dois dedos).
10
soma zero
• Se o número de dedos for igual, de modo que
o número total para ambos os jogadores seja
par, então o jogador que disse par ganha a
aposta do jogador que optou por ímpar.
• Se o número não for igual, o jogador que disse
impar ganha.
• Cada jogador possui duas estratégias: mostrar
um ou dois dedos.
11
soma zero
Jogador 2
Estratégia 1 2
Jogador 1 1 1 -1
2 -1 1
Tabela de Prêmios para o jogo par ou ímpar
• Antes do jogo começar cada jogador conhece as
estratégias de que dispõe, aquelas que o
oponente dispõe e a tabela de prêmios.
• O jogo consiste em cada jogador escolher
simultaneamente uma estratégia sem conhecer a
escolha do oponente. 12
soma zero
• Em jogos mais complexos envolvendo uma
série de jogadas, uma estratégia é uma regra
predeterminada que especifica
completamente como alguém pretende
responder a cada possível circunstância em
cada estágio do jogo.
• Ex. uma estratégia em um jogo de xadrez 
como fazer a próxima jogada, de modo que o
número total de estratégias possíveis seria
astronômico. 13
soma zero
• Um objetivo primário da teoria dos jogos é o
desenvolvimento de critérios racionais para a
seleção de uma estratégia. Duas hipóteses
fundamentais são feitas:
– Ambos os jogadores são racionais.
– Ambos os jogadores escolhem suas estratégias
única e exclusivamente para promoverem seu
próprio bem-estar (nenhuma compaixão pelo
oponente).
14
soma zero
• A teoria dos jogos contrasta com a análise de
decisão, na qual a hipótese é a de que o
tomador de decisão esteja participando de um
jogo com um oponente passivo – natureza –
que escolhe suas estratégias de algum modo
aleatório.
15
Exemplo
• Dois políticos estão disputando entre si uma
cadeira no senado.
• Os planos de campanha precisam ser feitos
agora para os dois dias finais.
• Os dois políticos querem gastar esses dias
fazendo campanha nas cidades de Bigtown e
Megalópolis.
• Eles pretender viajar a noite e passar um dia
inteiro em cada cidade ou então dois dias
inteiros em apenas um das cidades. 16
Exemplo
• Os políticos não saberão da programação do
oponente até ter terminado sua programação.
• Cada político solicitou levantamento do
impacto (votos ganhos e perdidos) das
diversas combinações possíveis de dias
passados lá por ele próprio e pelo seu
oponente.
17
Exemplo
Político 2
Estratégia 1 2 3
1 1000 2000 4000
Político 1 2 1000 0 5000
3 0 1000 -1000
Total de votos líquidos ganhos pelo político 1
Estratégia
1  passar um dia em cada cidade.
2  passar ambos os dias em Bigtown.
3  passar ambos os dias em Megalópolis
18
Variante 1 do Exemplo
• Qual estratégia deveria ser selecionada para
cada um dos dois jogadores?
• Situação especial  aplica-se o conceito de
estratégias dominadas para descartar uma
sucessão de estratégias inferiores até que
reste somente uma escolha.
19
• Um estratégia é dominada por uma segunda
estratégia se esta sempre for pelo menos tão
boa quanto a primeira (e algumas vezes
melhor), independentemente do que faz o
oponente.
• Uma estratégia dominada pode ser eliminada
imediatamente de considerações ulteriores.
20
Político 2
Estratégia 1 2 3
1 1000 2000 4000
Político 1 2 1000 0 5000
3 0 1000 -1000
• Político 2  não inclui nenhuma estratégia

dominada.
• Político 1  a estratégia 3 é dominada pela
estratégia 1.
21
• Eliminar estratégia 3
Político 2
Estratégia 1 2 3
1 1000 2000 4000
Político 1 2 1000 0 5000
Político 2  a estratégia 3 é dominada pela estratégia 1

e pela 2, pois elas representam menores perdas para o
jogador 2 (prêmio para o jogador 1).
22
• Eliminar estratégia 3
Político 2
Estratégia 1 2
Político 1 1 1000 2000
2 1000 0
• Político 1  a estratégia 2 se torna dominada pela
estratégia 1.
Político 2
Estratégia 1 2
Político 1 1 1000 2000
• Político 2  a estratégia 2 se torna dominada pela
estratégia 1. 23
• Ambos os jogadores devem selecionar suas
estratégias 1.
• O político 1 receberá um prêmio igual a 1000
do político 2, ou seja, o político 1 ganhará
1000 votos do político 2.
24
• Jogo não possui estratégias dominadas.
• Qual linha de raciocínio a teoria dos jogos diz
que eles iriam usar?
• Tabela de Prêmios do Político 1
Político 2
Estratégia 1 2 3 Mínimo:
1 -3000 -2000 6000 -3000
Político 1 2 2000 0 2000 0 Valor mínimo máximo
3 5000 -2000 -4000 -4000
Máximo: 5000 0 6000
25
Valor máximo mínimo
• Cada jogador deve jogar de tal maneira a
minimizar suas perdas máximas toda vez que
a escolha da estratégia resultante não puder
ser explorada pelo oponente para então
melhorar sua própria posição  critério do
máximo mínimo
26
• Político 1 deve selecionar a estratégia 2
(estratégia de mínimo máximo).
• Político 2 deve selecionar a estratégia 2
(estratégia de máximo mínimo).
• Prêmio resultante igual a 0 é o valor do jogo,
de modo que este seja um jogo limpo.
• Nenhum jogador pode tirar proveito da
estratégia do oponente para melhorar sua
própria estratégia.
27
• Ponto de sela  a entrada é tanto o mínimo
em sua linha quanto o máximo de sua coluna.
• Solução estável ou de equilíbrio  jogadores
devem usar, respectiva e exclusivamente, suas
estratégias de mínimo máximo e de máximo
mínimo.
28
• Acontecimentos recentes da campanha
mudaram a tabela de prêmios para o Político 1.
• Como esse jogo deve ser jogado?
Político 2
1 0 -2000 2000 -2000 Valor mínimo máximo
Político 1 2 5000 4000 -3000 -3000
3 2000 3000 -4000 -4000
Máximo: 5000 4000 2000
29
• Suponha que ambos os jogadores tentem a
aplicar o critério de máximo mínimo da
mesma forma que na variante 2.
• Político 1 pode garantir que terá uma perda
não maior que 2000 ao adotar a estratégia 1.
• Político 2 pode garantir que terá uma perda
não maior que 2000 ao adotar a estratégia 3.
• Ou seja, o valor mínimo máximo (-2000) e o
valor máximo mínimo (2000) não coincidem
 não existe nenhum ponto de sela. 30
• Quais as consequências resultantes se ambos
os jogadores planejarem adotar as estratégias
que acabamos de obter?
• Qualquer tentativa de escolha de uma
estratégia deixa esse jogador com motivos
para considerar a mudança de estratégia.
• Solução é instável (Político 1 adota estratégia
1 e Político 2 adota a estratégia 3).
31
• Toda vez que a estratégia de um jogador for
previsível, o oponente poderá tirar proveito
dessa informação para melhorar sua posição.
• Para participar de um jogo como este é
essencial que nenhum dos jogadores seja
capaz de deduzir qual estratégia o outro
adotará.
32
• Em vez de aplicar algum critério conhecido para
determinar uma única estratégia que será
efetivamente usada, é necessário escolher entre
estratégias alternativas aceitáveis algum tipo de
aleatoriedade.
• Nenhum dos jogadores saberá antecipadamente
qual de suas estratégias próprias será adotada,
quanto mais o que o seu oponente vai fazer.
• Como lidar com jogos desprovidos de ponto de
sela? 33
Jogos com estratégias mistas
• Toda vez que um jogo não tiver um ponto de
sela, a teoria dos jogos recomenda que cada
jogador atribua uma distribuição probabilística
ao seu conjunto de estratégias.
• Xi = probabilidade de que o jogador 1 usará a
estratégia i (i = 1, 2,...., m).
• Yj = probabilidade de que o jogador 2 usará a
estratégia j (j = 1, 2,...., n).
• Xi, Yj >=0
• X1+X2+...+Xm = 1 e Y1 + Y2 +.....+Yn = 1 34
• Os plano (x1, x2,...,xm) e (y1, y2,..., yn) são
conhecidos como estratégias mistas e as
estratégias originais como estratégias puras.
• Ao se jogar efetivamente, é necessário para
cada jogador usar uma de suas estratégias
puras.
35
• Exemplo
• Supor: estratégias mistas (x1, x2, x3) = (½, ½,0)
e (y1,y2,y3) = (0, ½, ½)
Político 2
1 0 -2000 2000 -2000 Valor mínimo máximo
Político 1 2 5000 4000 -3000 -3000
3 2000 3000 -4000 -4000
Máximo: 5000 4000 2000
36
• Para participar do jogo, cada jogador jogaria
então uma moeda para cima para determinar
qual das suas duas estratégias puras aceitáveis
ele realmente adotará.
• Embora não haja nenhuma medida de
desempenho completamente satisfatória
disponível para avaliar estratégias mistas, uma
muito útil é a do prêmio esperado.
37
m n
Prêmio esperado para o jogador 1   pijxiyj
i 1 j 1
pij : prêmio caso o jogador 1 opte pela estratégia pura i

e o jogador 2 use a estratégia pura j.
• Exemplo:
• Existem 4 prêmios possíveis (-2000, +2000,
+4000, -3000), cada um dos quais com uma
probabilidade de ¼ (½ * ½)
• Prêmio esperado = ¼*(-2000+2000+4000-
3000) = 250 38
• Essa medida de desempenho não revela nada
sobre os riscos envolvidos em participar do
jogo, mas indica efetivamente qual será a
tendência do prêmio médio caso esse jogo
seja jogado várias vezes.
• Adotando-se essa medida, a teoria dos jogos
estende o conceito do critério do máximo
mínimo a jogos nos quais não existe um ponto
de sela e, por isso, precisam de estratégias
mistas. 39
• Nesse contexto, o critério de máximo mínimo
diz que dado jogador deveria selecionar a
estratégia mista que minimiza a perda
esperada máxima para ele próprio.
• Quando nos concentramos nos prêmios
(jogador 1) em vez das perdas (jogador 2),
esse critério passa a ser mínimo máximo, isto
é, maximizar o prêmio esperado mínimo
(menor prêmio esperado possível) para o
jogador. 40
• Estratégia para o jogador 1 que é ótima de
acordo com esse critério é aquela que fornece
a garantia (prêmio esperado mínimo) que é
melhor (máxima). O valor dessa garantia é o
valor mínimo máximo (v).
• Estratégia para o jogador 2  fornece a melhor
(mínima) garantia (perda esperada máxima)
que pode ser administrada pela estratégia
mista de qualquer um dos oponentes. Essa
melhor garantia é o valor máximo mínimo (w). 41
• Quando foram usadas apenas estratégias puras,
os jogos sem um ponto de sela acabaram se
tornando instáveis. Os jogadores iriam mudar
suas estratégias para melhorar suas posições.
• Para jogos com estratégias mistas, é necessários
que v=w para a solução ótima ser estável.
• De acordo com o teorema do máximo mínimo da
teoria de jogos, essa condição é sempre válida
para tais jogos.
42
• Teorema do máximo mínimo: se forem
permitidas estratégias mistas, o par de
estratégias mistas que é ótimo de acordo com
o critério do máximo mínimo fornece uma
solução está com v = w (valor do jogo), de
maneira que nenhum dos jogadores pode se
dar melhor mudando unilateralmente sua
estratégia.
43
• Jogador não deve permitir que oponente
deduza qual será sua estratégia.
• Consequentemente, a única maneira de se
garantir que o prêmio esperado ótimo v será
alcançado é selecionar aleatoriamente a
estratégia pura a ser adotada proveniente da
distribuição probabilística para a estratégia
mista ótima.
44
• Existem diversos métodos para encontrar a
estratégia mista ótima para cada jogador.
• Um desses métodos é o procedimento gráfico.
• Esse procedimento pode ser usado toda vez
que um dos jogadores tiver duas estratégias
puras (não dominadas).
• Quando se tratar de jogos maiores, o método
usual é o de transformar o problema em um
problema de programação linear e resolver
por meio do método simplex. 45
Procedimento Gráfico
• Considere um jogo qualquer com estratégias
mistas tais que, após as estratégias dominadas
serem eliminadas, um dos jogadores terá
apenas duas estratégias puras.
• Faça para o Jogador 1:
– Estratégias mista (x1,x2) e x2=1-x1
46
• Político 1  Estratégia pura 3 é dominada pela estratégia 2.

Político 2
Estratégia Y1 Y2 y3
Probabilidade Estratégia Pura 1 2 3
X1 1 0 -2000 2000
Político 1 1 – x1 2 5000 4000 -3000
47
• Para cada uma das estratégias puras disponíveis
para o jogador 2, o prêmio esperado para o
jogador 1 será:
(y1, y2, y3) Prêmio Esperado

(1, 0, 0) 0x1 +5(1-x1) = 5 – 5x1
(0, 1, 0) -2x1 +4(1-x1) = 4 – 6x1
(0, 0, 1) 2x1 - 3(1-x1) = -3 + 5x1
48
• Para quaisquer valores dados de x1 e (y1, y2,
y3), o prêmio esperado será a média
ponderada apropriada dos pontos
correspondentes nessas três linhas.
• Prêmio esperado para o jogador 1 =
y1(5-5x1) + y2(4-6x1) + y3(-3+5x1)
49
50
• De acordo com o critério do máximo mínimo
(ou mínimo máximo), o jogador 1 quer
maximizar esse prêmio esperado mínimo.
• Jogador 1  selecionar x1 no qual a reta
inferior atinge o pico, isto é, onde as retas (-
3+5x1) e (4-6x1) se interceptam.
• Para encontrar esses pontos :
-3+5x1=4-6x1  x1 = 7/11
• (x1,x2) = (7/11,4/11)  estratégia mista ótima
para o jogador 1. 51
• Valor do jogo (v) = -3 +5(7/11) = 2/11
• Estratégia mista ótima para o jogador 2: v = w
(teorema do máximo mínimo).
• O prêmio esperado resultante da estratégia
ótima (y1,y2,y3)=(y1*,y2*,y3*) vai satisfazer a
condição:
y1*(5-5x1) + y2*(4-6x1) + y3*(-3+5x1) <= w = v =
2/11
para todos os valores de x1(0<=x1<=1)
52
• Quanto jogador 1 estiver jogando otimamente
x1 = 7/11, essa desigualdade será uma
igualdade (teorema do máximo mínimo):
20/11y1* + 2/11y2* + 2/11y3* = v = 2/11
• Como (y1,y2,y3) é uma distribuição de
probabilidade  y1*+ y2* + y3* = 1
• Y1* = 0  se y1*>0 o prêmio esperado no
gráfico com x1 = 7/11 estaria acima do ponto
mínimo máximo.
53
• Em geral, qualquer reta que não passe pelo
ponto mínimo máximo deve receber um peso
zero para impedir o aumento do prêmio
esperado acima desse ponto.
• Portanto:
• y2*(4-6x1) + y3*(-3+5x1) <= 2/11 para 0<=x1<=1
= 2/11 para x1 = 7/11
• y2* e y3* são números, de modo que o lado
esquerdo seja a equação de uma linha reta.
54
• Pelo fato de a ordenada dessa reta ser igual a
2/11 em x1=7/11, e como ela jamais excederá
2/11, a reta é necessariamente horizontal.
• Essa conclusão é sempre verdadeira, a menos
que o valor ótimo de x1 seja 0 ou 1 (jogador 2
deveria usar uma única estratégia pura).
• Y2*(4-6x1) + y3*(-3+5x1) = 2/11 para 0<=x1<=1
• Y2* = 5/11 e y3*=6/11
• (y1,y2,y3) = (0,5/11,6/11)  estratégia mista
ótima para o jogador 2. 55
Resolução pela Programação Linear
• Qualquer jogo com estratégias mistas pode
ser resolvido transformando-se o problema
em um problema de programação linear.
• Essa transformação requer aplicar o teorema
do minimax e usar as definições de valor
maximin w e valor minimax v.
56
• Considerando, como encontrar a estratégia
mista ótima para o jogador 1
m n
Prêmio esperado para o jogador 1   pijxiyj
i 1 j 1
pij : prêmio caso o jogador 1 opte pela estratégia pura i

e o jogador 2 use a estratégia pura j.
• e a estratégia (x1, x2, …., xm) é ótima se
m n
 p x y
i 1 j 1
ij i j
wv
para todas as estratégias oponetes (y1, y2, …., ym). 57

• Essa desigualdade precisará ser respeitada, por
exemplo, para cada uma das estratégias puras do
jogador 2, isto é, para cada uma das estratégias
(y1, y2, …., ym) em que yj = 1 e o restante é igual a 0.
• Substituindo esses vlores na desigualdade, tem-se:
m
 p x  v, j  1,2,..., n
i 1
ij i
• De modo que a desigualdade implique esse

conjunto de n desigualdades.
58
• Esse consunto de n desigualdades implica a
desigualdade original (reescrita):
n
 m  n

j 1
y j   pij xi    y jv  v
 i 1  j 1
n
• Já que 
j 1
yj 1
• Como a implicação se reflete em ambas as
direções, impor esse conjunto de n desigualdades
lineares equivale a exigir que a desigualdade
original seja válida para todas as estratégias (y1, y2,
…., ym). 59
• Porém, essas n desigualdades são rstrições de
programação linear legítimas, como as demias
restrições: x1  x2  .....  xn  1
x  0, i  1,2,..., m
i
• que são necessárias para garantir que xi sejam

probabilidades.
• Por essa razão, qualquer solução (x1, x2, …., xm)
que satisfaça esse conjunto completo de
restrições de programação linear, é a estratégia
mista ótima desejada. 60
• O problema de encontrar uma estratégia
mista ótima foi reduzido a encontrar uma
solução viável para um problema de
programação linear.
• As duas dificuldades remanescentes são:
– v não é conhecido.
– o problema de programação linear não tem
nenhuma função objetivo.
61
• Essas dificulades podem ser resolvidas:
– substituindo-se a constante v desconhecida pela
variável xm+1.
– maximizando xm+1, de modo que xm+1 será,
automaticamente, igual a v (por definição) na
solução ótima para o problema de programação
linear.
62
Aplicação à Variante 3 do problema
da campanha política
• Após eliminar a estratégia dominada 3 para o
jogador 1, tem-se:
Político 2
Estratégia Y1 Y2 y3
Probabilidade Estratégia Pura 1 2 3
X1 1 0 -2000 2000
Político 1 1 – x1 2 5000 4000 -3000
• Como algumas entradas são negativas na tabela,

não está claro se o valor v do jogo é não negativo.
• Vamos assumir (a princípio) que v>=0. 63
• Modelo de PL para o jogador 1.
max x3
• Resolvendo pelo método
5 x 2  x3  0
simplex (após acrescentar a
 2 x1  4 x2  x3  0
restrição x1  0 ) tem-se:
2 x1  3 x2  x3  0 7 * 4 * 2
x1  11 , x2  11 , x3  11
*
x x
1 2
1
• Mesmo resultado encontrado
x 0
1
usando procedimento gráfico.
x 0
2
64
• A estratégia mista ótima para o jogador 1, de
acordo com o critério do minimax é  ,    7 , 4 
2 x1 x2  11 11
• E o valor do jogo é v  x3 
*
11
• O método simplex também conduz à solução ótima
para o dual desse problema y*  0, y*  5 , y*  6 , y*  2
1 2 11 3 11 4 11
• de modo que a estratégia ótima para o jogador 2
seja
y , y , y    0, 11, 11
1 2
 5 6
3
65
Referência
• Hillier, F. S.; Lieberman, G. J. Introdução à
Pesquisa Operacional. 9 ed. São Paulo:
McGraw Hill, 2013.
66

Parte 14 Teoria Dos Jogos

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Parte 14 Teoria Dos Jogos

Uploaded by

Copyright:

Available Formats

Teoria dos Jogos

Disciplina: PRO708 - Pesquisa Operacional II

Departamento de Engenharia de Produção, Administração e Economia

pode combinar jogadas de forma a maximizar

jogadores alternando-se. Ex. xadrez.

etapa. Ex. xadrez, damas.

• Político 2  não inclui nenhuma estratégia

Político 2  a estratégia 3 é dominada pela estratégia 1

pij : prêmio caso o jogador 1 opte pela estratégia pura i

• Político 1  Estratégia pura 3 é dominada pela estratégia 2.

(y1, y2, y3) Prêmio Esperado

pij : prêmio caso o jogador 1 opte pela estratégia pura i

para todas as estratégias oponetes (y1, y2, …., ym). 57

• De modo que a desigualdade implique esse

• que são necessárias para garantir que xi sejam

• Como algumas entradas são negativas na tabela,

You might also like