Professional Documents
Culture Documents
14ª Parte
1
Jogos
• Conflitos e competições são comuns.
• Ex. campanhas políticas e publicitárias, jogos
de mesa, batalhas militares.
• Resultado final depende basicamente da
combinação de estratégias selecionadas pelos
adversários.
2
Teoria dos Jogos
• Teoria matemática que trata das características
gerais de situações competitivas de maneira
formal e abstrata.
• Coloca ênfase nos processos de tomada de
decisão dos adversários.
3
Jogo
• Situação de confronto entre partes, com uma
solução óbvia ou não, envolvendo barganha
ou não.
4
Jogos podem ser classificados em:
• Cooperativos ou competitivos
• Competitivos envolvem conflitos entre
jogadores.
• Cooperativos exibem problemas em que se
competição.
5
Jogos podem ser classificados em:
• Simultâneos ou em turno
• Simultâneos: os jogadores atuam ao mesmo
tempo. Ex. leilões de blocos exploratórios de
petróleo e gás natural, em que as propostas
são colocadas em uma urna e abertas
simultaneamente.
• Em turnos: envolvem jogadas sequencias com
6
Jogos podem ser classificados em:
• Jogos em uma ou múltiplas etapas
• Jogos em uma etapa: envolvem apenas uma
jogada. Ex. jogos de lançamento de moeda.
• Jogos em turnos: se dão em mais de uma
7
Jogos podem ser classificados em:
• Jogos de duas ou mais pessoas
• O conflito polarizado entre dois elementos é
bem mais fácil de se tratar que os jogos de
múltiplos jogadores.
8
Jogos podem ser classificados em:
• Jogos com ou sem comunicação
• Jogos com comunicação: aqueles em que a
cooperação (ou competição) pode ser
verbalizada.
• Jogos sem comunicação: aqueles em que os
jogadores são perfeitamente isolados.
9
Jogos entre dois participantes de
soma zero
• Envolvem apenas dois jogadores.
• Jogador ganha independente de quanto o
outro perca, de forma que a soma de suas
vitórias líquidas seja zero.
• Exemplo: jogo de par ou ímpar (cada um dos
participantes mostra simultaneamente um ou
dois dedos).
10
Jogos entre dois participantes de
soma zero
• Se o número de dedos for igual, de modo que
o número total para ambos os jogadores seja
par, então o jogador que disse par ganha a
aposta do jogador que optou por ímpar.
• Se o número não for igual, o jogador que disse
impar ganha.
• Cada jogador possui duas estratégias: mostrar
um ou dois dedos.
11
Jogos entre dois participantes de
soma zero
Jogador 2
Estratégia 1 2
Jogador 1 1 1 -1
2 -1 1
Tabela de Prêmios para o jogo par ou ímpar
• Antes do jogo começar cada jogador conhece as
estratégias de que dispõe, aquelas que o
oponente dispõe e a tabela de prêmios.
• O jogo consiste em cada jogador escolher
simultaneamente uma estratégia sem conhecer a
escolha do oponente. 12
Jogos entre dois participantes de
soma zero
• Em jogos mais complexos envolvendo uma
série de jogadas, uma estratégia é uma regra
predeterminada que especifica
completamente como alguém pretende
responder a cada possível circunstância em
cada estágio do jogo.
• Ex. uma estratégia em um jogo de xadrez
como fazer a próxima jogada, de modo que o
número total de estratégias possíveis seria
astronômico. 13
Jogos entre dois participantes de
soma zero
• Um objetivo primário da teoria dos jogos é o
desenvolvimento de critérios racionais para a
seleção de uma estratégia. Duas hipóteses
fundamentais são feitas:
– Ambos os jogadores são racionais.
– Ambos os jogadores escolhem suas estratégias
única e exclusivamente para promoverem seu
próprio bem-estar (nenhuma compaixão pelo
oponente).
14
Jogos entre dois participantes de
soma zero
• A teoria dos jogos contrasta com a análise de
decisão, na qual a hipótese é a de que o
tomador de decisão esteja participando de um
jogo com um oponente passivo – natureza –
que escolhe suas estratégias de algum modo
aleatório.
15
Exemplo
• Dois políticos estão disputando entre si uma
cadeira no senado.
• Os planos de campanha precisam ser feitos
agora para os dois dias finais.
• Os dois políticos querem gastar esses dias
fazendo campanha nas cidades de Bigtown e
Megalópolis.
• Eles pretender viajar a noite e passar um dia
inteiro em cada cidade ou então dois dias
inteiros em apenas um das cidades. 16
Exemplo
• Os políticos não saberão da programação do
oponente até ter terminado sua programação.
• Cada político solicitou levantamento do
impacto (votos ganhos e perdidos) das
diversas combinações possíveis de dias
passados lá por ele próprio e pelo seu
oponente.
17
Exemplo
Político 2
Estratégia 1 2 3
1 1000 2000 4000
Político 1 2 1000 0 5000
3 0 1000 -1000
Total de votos líquidos ganhos pelo político 1
Estratégia
1 passar um dia em cada cidade.
2 passar ambos os dias em Bigtown.
3 passar ambos os dias em Megalópolis
18
Variante 1 do Exemplo
• Qual estratégia deveria ser selecionada para
cada um dos dois jogadores?
• Situação especial aplica-se o conceito de
estratégias dominadas para descartar uma
sucessão de estratégias inferiores até que
reste somente uma escolha.
19
Variante 1 do Exemplo
• Um estratégia é dominada por uma segunda
estratégia se esta sempre for pelo menos tão
boa quanto a primeira (e algumas vezes
melhor), independentemente do que faz o
oponente.
• Uma estratégia dominada pode ser eliminada
imediatamente de considerações ulteriores.
20
Variante 1 do Exemplo
Político 2
Estratégia 1 2 3
1 1000 2000 4000
Político 1 2 1000 0 5000
3 0 1000 -1000
Político 2
Estratégia 1 2 3
1 1000 2000 4000
Político 1 2 1000 0 5000
22
Variante 1 do Exemplo
• Eliminar estratégia 3
Político 2
Estratégia 1 2
Político 1 1 1000 2000
2 1000 0
• Político 1 a estratégia 2 se torna dominada pela
estratégia 1.
Político 2
Estratégia 1 2
Político 1 1 1000 2000
• Político 2 a estratégia 2 se torna dominada pela
estratégia 1. 23
Variante 1 do Exemplo
• Ambos os jogadores devem selecionar suas
estratégias 1.
• O político 1 receberá um prêmio igual a 1000
do político 2, ou seja, o político 1 ganhará
1000 votos do político 2.
24
Variante 2 do Exemplo
• Jogo não possui estratégias dominadas.
• Qual linha de raciocínio a teoria dos jogos diz
que eles iriam usar?
• Tabela de Prêmios do Político 1
Político 2
Estratégia 1 2 3 Mínimo:
1 -3000 -2000 6000 -3000
Político 1 2 2000 0 2000 0 Valor mínimo máximo
3 5000 -2000 -4000 -4000
Máximo: 5000 0 6000
25
Valor máximo mínimo
Variante 2 do Exemplo
• Cada jogador deve jogar de tal maneira a
minimizar suas perdas máximas toda vez que
a escolha da estratégia resultante não puder
ser explorada pelo oponente para então
melhorar sua própria posição critério do
máximo mínimo
26
Variante 2 do Exemplo
• Político 1 deve selecionar a estratégia 2
(estratégia de mínimo máximo).
• Político 2 deve selecionar a estratégia 2
(estratégia de máximo mínimo).
• Prêmio resultante igual a 0 é o valor do jogo,
de modo que este seja um jogo limpo.
• Nenhum jogador pode tirar proveito da
estratégia do oponente para melhorar sua
própria estratégia.
27
Variante 2 do Exemplo
• Ponto de sela a entrada é tanto o mínimo
em sua linha quanto o máximo de sua coluna.
• Solução estável ou de equilíbrio jogadores
devem usar, respectiva e exclusivamente, suas
estratégias de mínimo máximo e de máximo
mínimo.
28
Variante 3 do Exemplo
• Acontecimentos recentes da campanha
mudaram a tabela de prêmios para o Político 1.
• Como esse jogo deve ser jogado?
Político 2
Estratégia 1 2 3 Mínimo:
1 0 -2000 2000 -2000 Valor mínimo máximo
Político 1 2 5000 4000 -3000 -3000
3 2000 3000 -4000 -4000
Máximo: 5000 4000 2000
29
Valor máximo mínimo
Variante 3 do Exemplo
• Suponha que ambos os jogadores tentem a
aplicar o critério de máximo mínimo da
mesma forma que na variante 2.
• Político 1 pode garantir que terá uma perda
não maior que 2000 ao adotar a estratégia 1.
• Político 2 pode garantir que terá uma perda
não maior que 2000 ao adotar a estratégia 3.
• Ou seja, o valor mínimo máximo (-2000) e o
valor máximo mínimo (2000) não coincidem
não existe nenhum ponto de sela. 30
Variante 3 do Exemplo
• Quais as consequências resultantes se ambos
os jogadores planejarem adotar as estratégias
que acabamos de obter?
• Qualquer tentativa de escolha de uma
estratégia deixa esse jogador com motivos
para considerar a mudança de estratégia.
• Solução é instável (Político 1 adota estratégia
1 e Político 2 adota a estratégia 3).
31
Variante 3 do Exemplo
• Toda vez que a estratégia de um jogador for
previsível, o oponente poderá tirar proveito
dessa informação para melhorar sua posição.
• Para participar de um jogo como este é
essencial que nenhum dos jogadores seja
capaz de deduzir qual estratégia o outro
adotará.
32
Variante 3 do Exemplo
• Em vez de aplicar algum critério conhecido para
determinar uma única estratégia que será
efetivamente usada, é necessário escolher entre
estratégias alternativas aceitáveis algum tipo de
aleatoriedade.
• Nenhum dos jogadores saberá antecipadamente
qual de suas estratégias próprias será adotada,
quanto mais o que o seu oponente vai fazer.
• Como lidar com jogos desprovidos de ponto de
sela? 33
Jogos com estratégias mistas
• Toda vez que um jogo não tiver um ponto de
sela, a teoria dos jogos recomenda que cada
jogador atribua uma distribuição probabilística
ao seu conjunto de estratégias.
• Xi = probabilidade de que o jogador 1 usará a
estratégia i (i = 1, 2,...., m).
• Yj = probabilidade de que o jogador 2 usará a
estratégia j (j = 1, 2,...., n).
• Xi, Yj >=0
• X1+X2+...+Xm = 1 e Y1 + Y2 +.....+Yn = 1 34
Jogos com estratégias mistas
• Os plano (x1, x2,...,xm) e (y1, y2,..., yn) são
conhecidos como estratégias mistas e as
estratégias originais como estratégias puras.
• Ao se jogar efetivamente, é necessário para
cada jogador usar uma de suas estratégias
puras.
35
Jogos com estratégias mistas
• Exemplo
• Supor: estratégias mistas (x1, x2, x3) = (½, ½,0)
e (y1,y2,y3) = (0, ½, ½)
Político 2
Estratégia 1 2 3 Mínimo:
1 0 -2000 2000 -2000 Valor mínimo máximo
Político 1 2 5000 4000 -3000 -3000
3 2000 3000 -4000 -4000
Máximo: 5000 4000 2000
36
Valor máximo mínimo
Jogos com estratégias mistas
• Para participar do jogo, cada jogador jogaria
então uma moeda para cima para determinar
qual das suas duas estratégias puras aceitáveis
ele realmente adotará.
• Embora não haja nenhuma medida de
desempenho completamente satisfatória
disponível para avaliar estratégias mistas, uma
muito útil é a do prêmio esperado.
37
Jogos com estratégias mistas
m n
Prêmio esperado para o jogador 1 pijxiyj
i 1 j 1
• Exemplo:
• Existem 4 prêmios possíveis (-2000, +2000,
+4000, -3000), cada um dos quais com uma
probabilidade de ¼ (½ * ½)
• Prêmio esperado = ¼*(-2000+2000+4000-
3000) = 250 38
Jogos com estratégias mistas
• Essa medida de desempenho não revela nada
sobre os riscos envolvidos em participar do
jogo, mas indica efetivamente qual será a
tendência do prêmio médio caso esse jogo
seja jogado várias vezes.
• Adotando-se essa medida, a teoria dos jogos
estende o conceito do critério do máximo
mínimo a jogos nos quais não existe um ponto
de sela e, por isso, precisam de estratégias
mistas. 39
Jogos com estratégias mistas
• Nesse contexto, o critério de máximo mínimo
diz que dado jogador deveria selecionar a
estratégia mista que minimiza a perda
esperada máxima para ele próprio.
• Quando nos concentramos nos prêmios
(jogador 1) em vez das perdas (jogador 2),
esse critério passa a ser mínimo máximo, isto
é, maximizar o prêmio esperado mínimo
(menor prêmio esperado possível) para o
jogador. 40
Jogos com estratégias mistas
• Estratégia para o jogador 1 que é ótima de
acordo com esse critério é aquela que fornece
a garantia (prêmio esperado mínimo) que é
melhor (máxima). O valor dessa garantia é o
valor mínimo máximo (v).
• Estratégia para o jogador 2 fornece a melhor
(mínima) garantia (perda esperada máxima)
que pode ser administrada pela estratégia
mista de qualquer um dos oponentes. Essa
melhor garantia é o valor máximo mínimo (w). 41
Jogos com estratégias mistas
• Quando foram usadas apenas estratégias puras,
os jogos sem um ponto de sela acabaram se
tornando instáveis. Os jogadores iriam mudar
suas estratégias para melhorar suas posições.
• Para jogos com estratégias mistas, é necessários
que v=w para a solução ótima ser estável.
• De acordo com o teorema do máximo mínimo da
teoria de jogos, essa condição é sempre válida
para tais jogos.
42
Jogos com estratégias mistas
• Teorema do máximo mínimo: se forem
permitidas estratégias mistas, o par de
estratégias mistas que é ótimo de acordo com
o critério do máximo mínimo fornece uma
solução está com v = w (valor do jogo), de
maneira que nenhum dos jogadores pode se
dar melhor mudando unilateralmente sua
estratégia.
43
Jogos com estratégias mistas
• Jogador não deve permitir que oponente
deduza qual será sua estratégia.
• Consequentemente, a única maneira de se
garantir que o prêmio esperado ótimo v será
alcançado é selecionar aleatoriamente a
estratégia pura a ser adotada proveniente da
distribuição probabilística para a estratégia
mista ótima.
44
Jogos com estratégias mistas
• Existem diversos métodos para encontrar a
estratégia mista ótima para cada jogador.
• Um desses métodos é o procedimento gráfico.
• Esse procedimento pode ser usado toda vez
que um dos jogadores tiver duas estratégias
puras (não dominadas).
• Quando se tratar de jogos maiores, o método
usual é o de transformar o problema em um
problema de programação linear e resolver
por meio do método simplex. 45
Procedimento Gráfico
• Considere um jogo qualquer com estratégias
mistas tais que, após as estratégias dominadas
serem eliminadas, um dos jogadores terá
apenas duas estratégias puras.
• Faça para o Jogador 1:
– Estratégias mista (x1,x2) e x2=1-x1
46
Procedimento Gráfico
48
Procedimento Gráfico
• Para quaisquer valores dados de x1 e (y1, y2,
y3), o prêmio esperado será a média
ponderada apropriada dos pontos
correspondentes nessas três linhas.
• Prêmio esperado para o jogador 1 =
y1(5-5x1) + y2(4-6x1) + y3(-3+5x1)
49
Procedimento Gráfico
50
Procedimento Gráfico
• De acordo com o critério do máximo mínimo
(ou mínimo máximo), o jogador 1 quer
maximizar esse prêmio esperado mínimo.
• Jogador 1 selecionar x1 no qual a reta
inferior atinge o pico, isto é, onde as retas (-
3+5x1) e (4-6x1) se interceptam.
• Para encontrar esses pontos :
-3+5x1=4-6x1 x1 = 7/11
• (x1,x2) = (7/11,4/11) estratégia mista ótima
para o jogador 1. 51
Procedimento Gráfico
• Valor do jogo (v) = -3 +5(7/11) = 2/11
• Estratégia mista ótima para o jogador 2: v = w
(teorema do máximo mínimo).
• O prêmio esperado resultante da estratégia
ótima (y1,y2,y3)=(y1*,y2*,y3*) vai satisfazer a
condição:
y1*(5-5x1) + y2*(4-6x1) + y3*(-3+5x1) <= w = v =
2/11
para todos os valores de x1(0<=x1<=1)
52
Procedimento Gráfico
• Quanto jogador 1 estiver jogando otimamente
x1 = 7/11, essa desigualdade será uma
igualdade (teorema do máximo mínimo):
20/11y1* + 2/11y2* + 2/11y3* = v = 2/11
• Como (y1,y2,y3) é uma distribuição de
probabilidade y1*+ y2* + y3* = 1
• Y1* = 0 se y1*>0 o prêmio esperado no
gráfico com x1 = 7/11 estaria acima do ponto
mínimo máximo.
53
Procedimento Gráfico
• Em geral, qualquer reta que não passe pelo
ponto mínimo máximo deve receber um peso
zero para impedir o aumento do prêmio
esperado acima desse ponto.
• Portanto:
• y2*(4-6x1) + y3*(-3+5x1) <= 2/11 para 0<=x1<=1
= 2/11 para x1 = 7/11
• y2* e y3* são números, de modo que o lado
esquerdo seja a equação de uma linha reta.
54
Procedimento Gráfico
• Pelo fato de a ordenada dessa reta ser igual a
2/11 em x1=7/11, e como ela jamais excederá
2/11, a reta é necessariamente horizontal.
• Essa conclusão é sempre verdadeira, a menos
que o valor ótimo de x1 seja 0 ou 1 (jogador 2
deveria usar uma única estratégia pura).
• Y2*(4-6x1) + y3*(-3+5x1) = 2/11 para 0<=x1<=1
• Y2* = 5/11 e y3*=6/11
• (y1,y2,y3) = (0,5/11,6/11) estratégia mista
ótima para o jogador 2. 55
Resolução pela Programação Linear
• Qualquer jogo com estratégias mistas pode
ser resolvido transformando-se o problema
em um problema de programação linear.
• Essa transformação requer aplicar o teorema
do minimax e usar as definições de valor
maximin w e valor minimax v.
56
Resolução pela Programação Linear
• Considerando, como encontrar a estratégia
mista ótima para o jogador 1
m n
Prêmio esperado para o jogador 1 pijxiyj
i 1 j 1
p x y
i 1 j 1
ij i j
wv
p x v, j 1,2,..., n
i 1
ij i
61
Resolução pela Programação Linear
• Essas dificulades podem ser resolvidas:
– substituindo-se a constante v desconhecida pela
variável xm+1.
– maximizando xm+1, de modo que xm+1 será,
automaticamente, igual a v (por definição) na
solução ótima para o problema de programação
linear.
62
Aplicação à Variante 3 do problema
da campanha política
• Após eliminar a estratégia dominada 3 para o
jogador 1, tem-se:
Político 2
Estratégia Y1 Y2 y3
Probabilidade Estratégia Pura 1 2 3
X1 1 0 -2000 2000
Político 1 1 – x1 2 5000 4000 -3000
x x
1 2
1
• Mesmo resultado encontrado
x 0
1
usando procedimento gráfico.
x 0
2
64
Aplicação à Variante 3 do problema
da campanha política
• A estratégia mista ótima para o jogador 1, de
acordo com o critério do minimax é , 7 , 4
2 x1 x2 11 11
• E o valor do jogo é v x3
*
11
• O método simplex também conduz à solução ótima
para o dual desse problema y* 0, y* 5 , y* 6 , y* 2
1 2 11 3 11 4 11
• de modo que a estratégia ótima para o jogador 2
seja
y , y , y 0, 11, 11
1 2
5 6
3
65
Referência
• Hillier, F. S.; Lieberman, G. J. Introdução à
Pesquisa Operacional. 9 ed. São Paulo:
McGraw Hill, 2013.
66