You are on page 1of 66

Teoria dos Jogos

Disciplina: PRO708 - Pesquisa Operacional II


Prof: Lásara Rodrigues

Departamento de Engenharia de Produção, Administração e Economia


Escola de Minas
Universidade Federal de Ouro Preto

14ª Parte

1
Jogos
• Conflitos e competições são comuns.
• Ex. campanhas políticas e publicitárias, jogos
de mesa, batalhas militares.
• Resultado final depende basicamente da
combinação de estratégias selecionadas pelos
adversários.

2
Teoria dos Jogos
• Teoria matemática que trata das características
gerais de situações competitivas de maneira
formal e abstrata.
• Coloca ênfase nos processos de tomada de
decisão dos adversários.

3
Jogo
• Situação de confronto entre partes, com uma
solução óbvia ou não, envolvendo barganha
ou não.

4
Jogos podem ser classificados em:
• Cooperativos ou competitivos
• Competitivos envolvem conflitos entre
jogadores.
• Cooperativos exibem problemas em que se

pode combinar jogadas de forma a maximizar


o resultado de ambos os jogadores.
• Os jogos de soma zero são o extremo da

competição.

5
Jogos podem ser classificados em:
• Simultâneos ou em turno
• Simultâneos: os jogadores atuam ao mesmo
tempo. Ex. leilões de blocos exploratórios de
petróleo e gás natural, em que as propostas
são colocadas em uma urna e abertas
simultaneamente.
• Em turnos: envolvem jogadas sequencias com

jogadores alternando-se. Ex. xadrez.

6
Jogos podem ser classificados em:
• Jogos em uma ou múltiplas etapas
• Jogos em uma etapa: envolvem apenas uma
jogada. Ex. jogos de lançamento de moeda.
• Jogos em turnos: se dão em mais de uma

etapa. Ex. xadrez, damas.

7
Jogos podem ser classificados em:
• Jogos de duas ou mais pessoas
• O conflito polarizado entre dois elementos é
bem mais fácil de se tratar que os jogos de
múltiplos jogadores.

8
Jogos podem ser classificados em:
• Jogos com ou sem comunicação
• Jogos com comunicação: aqueles em que a
cooperação (ou competição) pode ser
verbalizada.
• Jogos sem comunicação: aqueles em que os
jogadores são perfeitamente isolados.

9
Jogos entre dois participantes de
soma zero
• Envolvem apenas dois jogadores.
• Jogador ganha independente de quanto o
outro perca, de forma que a soma de suas
vitórias líquidas seja zero.
• Exemplo: jogo de par ou ímpar (cada um dos
participantes mostra simultaneamente um ou
dois dedos).

10
Jogos entre dois participantes de
soma zero
• Se o número de dedos for igual, de modo que
o número total para ambos os jogadores seja
par, então o jogador que disse par ganha a
aposta do jogador que optou por ímpar.
• Se o número não for igual, o jogador que disse
impar ganha.
• Cada jogador possui duas estratégias: mostrar
um ou dois dedos.

11
Jogos entre dois participantes de
soma zero
Jogador 2
Estratégia 1 2
Jogador 1 1 1 -1
2 -1 1
Tabela de Prêmios para o jogo par ou ímpar
• Antes do jogo começar cada jogador conhece as
estratégias de que dispõe, aquelas que o
oponente dispõe e a tabela de prêmios.
• O jogo consiste em cada jogador escolher
simultaneamente uma estratégia sem conhecer a
escolha do oponente. 12
Jogos entre dois participantes de
soma zero
• Em jogos mais complexos envolvendo uma
série de jogadas, uma estratégia é uma regra
predeterminada que especifica
completamente como alguém pretende
responder a cada possível circunstância em
cada estágio do jogo.
• Ex. uma estratégia em um jogo de xadrez 
como fazer a próxima jogada, de modo que o
número total de estratégias possíveis seria
astronômico. 13
Jogos entre dois participantes de
soma zero
• Um objetivo primário da teoria dos jogos é o
desenvolvimento de critérios racionais para a
seleção de uma estratégia. Duas hipóteses
fundamentais são feitas:
– Ambos os jogadores são racionais.
– Ambos os jogadores escolhem suas estratégias
única e exclusivamente para promoverem seu
próprio bem-estar (nenhuma compaixão pelo
oponente).

14
Jogos entre dois participantes de
soma zero
• A teoria dos jogos contrasta com a análise de
decisão, na qual a hipótese é a de que o
tomador de decisão esteja participando de um
jogo com um oponente passivo – natureza –
que escolhe suas estratégias de algum modo
aleatório.

15
Exemplo
• Dois políticos estão disputando entre si uma
cadeira no senado.
• Os planos de campanha precisam ser feitos
agora para os dois dias finais.
• Os dois políticos querem gastar esses dias
fazendo campanha nas cidades de Bigtown e
Megalópolis.
• Eles pretender viajar a noite e passar um dia
inteiro em cada cidade ou então dois dias
inteiros em apenas um das cidades. 16
Exemplo
• Os políticos não saberão da programação do
oponente até ter terminado sua programação.
• Cada político solicitou levantamento do
impacto (votos ganhos e perdidos) das
diversas combinações possíveis de dias
passados lá por ele próprio e pelo seu
oponente.

17
Exemplo
Político 2
Estratégia 1 2 3
1 1000 2000 4000
Político 1 2 1000 0 5000
3 0 1000 -1000
Total de votos líquidos ganhos pelo político 1

Estratégia
1  passar um dia em cada cidade.
2  passar ambos os dias em Bigtown.
3  passar ambos os dias em Megalópolis

18
Variante 1 do Exemplo
• Qual estratégia deveria ser selecionada para
cada um dos dois jogadores?
• Situação especial  aplica-se o conceito de
estratégias dominadas para descartar uma
sucessão de estratégias inferiores até que
reste somente uma escolha.

19
Variante 1 do Exemplo
• Um estratégia é dominada por uma segunda
estratégia se esta sempre for pelo menos tão
boa quanto a primeira (e algumas vezes
melhor), independentemente do que faz o
oponente.
• Uma estratégia dominada pode ser eliminada
imediatamente de considerações ulteriores.

20
Variante 1 do Exemplo
Político 2
Estratégia 1 2 3
1 1000 2000 4000
Político 1 2 1000 0 5000
3 0 1000 -1000

• Político 2  não inclui nenhuma estratégia


dominada.
• Político 1  a estratégia 3 é dominada pela
estratégia 1.
21
Variante 1 do Exemplo
• Eliminar estratégia 3

Político 2
Estratégia 1 2 3
1 1000 2000 4000
Político 1 2 1000 0 5000

Político 2  a estratégia 3 é dominada pela estratégia 1


e pela 2, pois elas representam menores perdas para o
jogador 2 (prêmio para o jogador 1).

22
Variante 1 do Exemplo
• Eliminar estratégia 3
Político 2
Estratégia 1 2
Político 1 1 1000 2000
2 1000 0
• Político 1  a estratégia 2 se torna dominada pela
estratégia 1.
Político 2
Estratégia 1 2
Político 1 1 1000 2000
• Político 2  a estratégia 2 se torna dominada pela
estratégia 1. 23
Variante 1 do Exemplo
• Ambos os jogadores devem selecionar suas
estratégias 1.
• O político 1 receberá um prêmio igual a 1000
do político 2, ou seja, o político 1 ganhará
1000 votos do político 2.

24
Variante 2 do Exemplo
• Jogo não possui estratégias dominadas.
• Qual linha de raciocínio a teoria dos jogos diz
que eles iriam usar?
• Tabela de Prêmios do Político 1
Político 2
Estratégia 1 2 3 Mínimo:
1 -3000 -2000 6000 -3000
Político 1 2 2000 0 2000 0 Valor mínimo máximo
3 5000 -2000 -4000 -4000
Máximo: 5000 0 6000
25
Valor máximo mínimo
Variante 2 do Exemplo
• Cada jogador deve jogar de tal maneira a
minimizar suas perdas máximas toda vez que
a escolha da estratégia resultante não puder
ser explorada pelo oponente para então
melhorar sua própria posição  critério do
máximo mínimo

26
Variante 2 do Exemplo
• Político 1 deve selecionar a estratégia 2
(estratégia de mínimo máximo).
• Político 2 deve selecionar a estratégia 2
(estratégia de máximo mínimo).
• Prêmio resultante igual a 0 é o valor do jogo,
de modo que este seja um jogo limpo.
• Nenhum jogador pode tirar proveito da
estratégia do oponente para melhorar sua
própria estratégia.
27
Variante 2 do Exemplo
• Ponto de sela  a entrada é tanto o mínimo
em sua linha quanto o máximo de sua coluna.
• Solução estável ou de equilíbrio  jogadores
devem usar, respectiva e exclusivamente, suas
estratégias de mínimo máximo e de máximo
mínimo.

28
Variante 3 do Exemplo
• Acontecimentos recentes da campanha
mudaram a tabela de prêmios para o Político 1.
• Como esse jogo deve ser jogado?

Político 2
Estratégia 1 2 3 Mínimo:
1 0 -2000 2000 -2000 Valor mínimo máximo
Político 1 2 5000 4000 -3000 -3000
3 2000 3000 -4000 -4000
Máximo: 5000 4000 2000
29
Valor máximo mínimo
Variante 3 do Exemplo
• Suponha que ambos os jogadores tentem a
aplicar o critério de máximo mínimo da
mesma forma que na variante 2.
• Político 1 pode garantir que terá uma perda
não maior que 2000 ao adotar a estratégia 1.
• Político 2 pode garantir que terá uma perda
não maior que 2000 ao adotar a estratégia 3.
• Ou seja, o valor mínimo máximo (-2000) e o
valor máximo mínimo (2000) não coincidem
 não existe nenhum ponto de sela. 30
Variante 3 do Exemplo
• Quais as consequências resultantes se ambos
os jogadores planejarem adotar as estratégias
que acabamos de obter?
• Qualquer tentativa de escolha de uma
estratégia deixa esse jogador com motivos
para considerar a mudança de estratégia.
• Solução é instável (Político 1 adota estratégia
1 e Político 2 adota a estratégia 3).

31
Variante 3 do Exemplo
• Toda vez que a estratégia de um jogador for
previsível, o oponente poderá tirar proveito
dessa informação para melhorar sua posição.
• Para participar de um jogo como este é
essencial que nenhum dos jogadores seja
capaz de deduzir qual estratégia o outro
adotará.

32
Variante 3 do Exemplo
• Em vez de aplicar algum critério conhecido para
determinar uma única estratégia que será
efetivamente usada, é necessário escolher entre
estratégias alternativas aceitáveis algum tipo de
aleatoriedade.
• Nenhum dos jogadores saberá antecipadamente
qual de suas estratégias próprias será adotada,
quanto mais o que o seu oponente vai fazer.
• Como lidar com jogos desprovidos de ponto de
sela? 33
Jogos com estratégias mistas
• Toda vez que um jogo não tiver um ponto de
sela, a teoria dos jogos recomenda que cada
jogador atribua uma distribuição probabilística
ao seu conjunto de estratégias.
• Xi = probabilidade de que o jogador 1 usará a
estratégia i (i = 1, 2,...., m).
• Yj = probabilidade de que o jogador 2 usará a
estratégia j (j = 1, 2,...., n).
• Xi, Yj >=0
• X1+X2+...+Xm = 1 e Y1 + Y2 +.....+Yn = 1 34
Jogos com estratégias mistas
• Os plano (x1, x2,...,xm) e (y1, y2,..., yn) são
conhecidos como estratégias mistas e as
estratégias originais como estratégias puras.
• Ao se jogar efetivamente, é necessário para
cada jogador usar uma de suas estratégias
puras.

35
Jogos com estratégias mistas
• Exemplo
• Supor: estratégias mistas (x1, x2, x3) = (½, ½,0)
e (y1,y2,y3) = (0, ½, ½)

Político 2
Estratégia 1 2 3 Mínimo:
1 0 -2000 2000 -2000 Valor mínimo máximo
Político 1 2 5000 4000 -3000 -3000
3 2000 3000 -4000 -4000
Máximo: 5000 4000 2000
36
Valor máximo mínimo
Jogos com estratégias mistas
• Para participar do jogo, cada jogador jogaria
então uma moeda para cima para determinar
qual das suas duas estratégias puras aceitáveis
ele realmente adotará.
• Embora não haja nenhuma medida de
desempenho completamente satisfatória
disponível para avaliar estratégias mistas, uma
muito útil é a do prêmio esperado.

37
Jogos com estratégias mistas
m n
Prêmio esperado para o jogador 1   pijxiyj
i 1 j 1

pij : prêmio caso o jogador 1 opte pela estratégia pura i


e o jogador 2 use a estratégia pura j.

• Exemplo:
• Existem 4 prêmios possíveis (-2000, +2000,
+4000, -3000), cada um dos quais com uma
probabilidade de ¼ (½ * ½)
• Prêmio esperado = ¼*(-2000+2000+4000-
3000) = 250 38
Jogos com estratégias mistas
• Essa medida de desempenho não revela nada
sobre os riscos envolvidos em participar do
jogo, mas indica efetivamente qual será a
tendência do prêmio médio caso esse jogo
seja jogado várias vezes.
• Adotando-se essa medida, a teoria dos jogos
estende o conceito do critério do máximo
mínimo a jogos nos quais não existe um ponto
de sela e, por isso, precisam de estratégias
mistas. 39
Jogos com estratégias mistas
• Nesse contexto, o critério de máximo mínimo
diz que dado jogador deveria selecionar a
estratégia mista que minimiza a perda
esperada máxima para ele próprio.
• Quando nos concentramos nos prêmios
(jogador 1) em vez das perdas (jogador 2),
esse critério passa a ser mínimo máximo, isto
é, maximizar o prêmio esperado mínimo
(menor prêmio esperado possível) para o
jogador. 40
Jogos com estratégias mistas
• Estratégia para o jogador 1 que é ótima de
acordo com esse critério é aquela que fornece
a garantia (prêmio esperado mínimo) que é
melhor (máxima). O valor dessa garantia é o
valor mínimo máximo (v).
• Estratégia para o jogador 2  fornece a melhor
(mínima) garantia (perda esperada máxima)
que pode ser administrada pela estratégia
mista de qualquer um dos oponentes. Essa
melhor garantia é o valor máximo mínimo (w). 41
Jogos com estratégias mistas
• Quando foram usadas apenas estratégias puras,
os jogos sem um ponto de sela acabaram se
tornando instáveis. Os jogadores iriam mudar
suas estratégias para melhorar suas posições.
• Para jogos com estratégias mistas, é necessários
que v=w para a solução ótima ser estável.
• De acordo com o teorema do máximo mínimo da
teoria de jogos, essa condição é sempre válida
para tais jogos.
42
Jogos com estratégias mistas
• Teorema do máximo mínimo: se forem
permitidas estratégias mistas, o par de
estratégias mistas que é ótimo de acordo com
o critério do máximo mínimo fornece uma
solução está com v = w (valor do jogo), de
maneira que nenhum dos jogadores pode se
dar melhor mudando unilateralmente sua
estratégia.

43
Jogos com estratégias mistas
• Jogador não deve permitir que oponente
deduza qual será sua estratégia.
• Consequentemente, a única maneira de se
garantir que o prêmio esperado ótimo v será
alcançado é selecionar aleatoriamente a
estratégia pura a ser adotada proveniente da
distribuição probabilística para a estratégia
mista ótima.

44
Jogos com estratégias mistas
• Existem diversos métodos para encontrar a
estratégia mista ótima para cada jogador.
• Um desses métodos é o procedimento gráfico.
• Esse procedimento pode ser usado toda vez
que um dos jogadores tiver duas estratégias
puras (não dominadas).
• Quando se tratar de jogos maiores, o método
usual é o de transformar o problema em um
problema de programação linear e resolver
por meio do método simplex. 45
Procedimento Gráfico
• Considere um jogo qualquer com estratégias
mistas tais que, após as estratégias dominadas
serem eliminadas, um dos jogadores terá
apenas duas estratégias puras.
• Faça para o Jogador 1:
– Estratégias mista (x1,x2) e x2=1-x1

46
Procedimento Gráfico

• Político 1  Estratégia pura 3 é dominada pela estratégia 2.


Político 2
Estratégia Y1 Y2 y3
Probabilidade Estratégia Pura 1 2 3
X1 1 0 -2000 2000
Político 1 1 – x1 2 5000 4000 -3000
47
Procedimento Gráfico
• Para cada uma das estratégias puras disponíveis
para o jogador 2, o prêmio esperado para o
jogador 1 será:

(y1, y2, y3) Prêmio Esperado


(1, 0, 0) 0x1 +5(1-x1) = 5 – 5x1
(0, 1, 0) -2x1 +4(1-x1) = 4 – 6x1
(0, 0, 1) 2x1 - 3(1-x1) = -3 + 5x1

48
Procedimento Gráfico
• Para quaisquer valores dados de x1 e (y1, y2,
y3), o prêmio esperado será a média
ponderada apropriada dos pontos
correspondentes nessas três linhas.
• Prêmio esperado para o jogador 1 =
y1(5-5x1) + y2(4-6x1) + y3(-3+5x1)

49
Procedimento Gráfico

50
Procedimento Gráfico
• De acordo com o critério do máximo mínimo
(ou mínimo máximo), o jogador 1 quer
maximizar esse prêmio esperado mínimo.
• Jogador 1  selecionar x1 no qual a reta
inferior atinge o pico, isto é, onde as retas (-
3+5x1) e (4-6x1) se interceptam.
• Para encontrar esses pontos :
-3+5x1=4-6x1  x1 = 7/11
• (x1,x2) = (7/11,4/11)  estratégia mista ótima
para o jogador 1. 51
Procedimento Gráfico
• Valor do jogo (v) = -3 +5(7/11) = 2/11
• Estratégia mista ótima para o jogador 2: v = w
(teorema do máximo mínimo).
• O prêmio esperado resultante da estratégia
ótima (y1,y2,y3)=(y1*,y2*,y3*) vai satisfazer a
condição:
y1*(5-5x1) + y2*(4-6x1) + y3*(-3+5x1) <= w = v =
2/11
para todos os valores de x1(0<=x1<=1)
52
Procedimento Gráfico
• Quanto jogador 1 estiver jogando otimamente
x1 = 7/11, essa desigualdade será uma
igualdade (teorema do máximo mínimo):
20/11y1* + 2/11y2* + 2/11y3* = v = 2/11
• Como (y1,y2,y3) é uma distribuição de
probabilidade  y1*+ y2* + y3* = 1
• Y1* = 0  se y1*>0 o prêmio esperado no
gráfico com x1 = 7/11 estaria acima do ponto
mínimo máximo.
53
Procedimento Gráfico
• Em geral, qualquer reta que não passe pelo
ponto mínimo máximo deve receber um peso
zero para impedir o aumento do prêmio
esperado acima desse ponto.
• Portanto:
• y2*(4-6x1) + y3*(-3+5x1) <= 2/11 para 0<=x1<=1
= 2/11 para x1 = 7/11
• y2* e y3* são números, de modo que o lado
esquerdo seja a equação de uma linha reta.
54
Procedimento Gráfico
• Pelo fato de a ordenada dessa reta ser igual a
2/11 em x1=7/11, e como ela jamais excederá
2/11, a reta é necessariamente horizontal.
• Essa conclusão é sempre verdadeira, a menos
que o valor ótimo de x1 seja 0 ou 1 (jogador 2
deveria usar uma única estratégia pura).
• Y2*(4-6x1) + y3*(-3+5x1) = 2/11 para 0<=x1<=1
• Y2* = 5/11 e y3*=6/11
• (y1,y2,y3) = (0,5/11,6/11)  estratégia mista
ótima para o jogador 2. 55
Resolução pela Programação Linear
• Qualquer jogo com estratégias mistas pode
ser resolvido transformando-se o problema
em um problema de programação linear.
• Essa transformação requer aplicar o teorema
do minimax e usar as definições de valor
maximin w e valor minimax v.

56
Resolução pela Programação Linear
• Considerando, como encontrar a estratégia
mista ótima para o jogador 1
m n
Prêmio esperado para o jogador 1   pijxiyj
i 1 j 1

pij : prêmio caso o jogador 1 opte pela estratégia pura i


e o jogador 2 use a estratégia pura j.
• e a estratégia (x1, x2, …., xm) é ótima se
m n

 p x y
i 1 j 1
ij i j
wv

para todas as estratégias oponetes (y1, y2, …., ym). 57


Resolução pela Programação Linear
• Essa desigualdade precisará ser respeitada, por
exemplo, para cada uma das estratégias puras do
jogador 2, isto é, para cada uma das estratégias
(y1, y2, …., ym) em que yj = 1 e o restante é igual a 0.
• Substituindo esses vlores na desigualdade, tem-se:
m

 p x  v, j  1,2,..., n
i 1
ij i

• De modo que a desigualdade implique esse


conjunto de n desigualdades.
58
Resolução pela Programação Linear
• Esse consunto de n desigualdades implica a
desigualdade original (reescrita):
n
 m  n

j 1
y j   pij xi    y jv  v
 i 1  j 1
n
• Já que 
j 1
yj 1
• Como a implicação se reflete em ambas as
direções, impor esse conjunto de n desigualdades
lineares equivale a exigir que a desigualdade
original seja válida para todas as estratégias (y1, y2,
…., ym). 59
Resolução pela Programação Linear
• Porém, essas n desigualdades são rstrições de
programação linear legítimas, como as demias
restrições: x1  x2  .....  xn  1
x  0, i  1,2,..., m
i

• que são necessárias para garantir que xi sejam


probabilidades.
• Por essa razão, qualquer solução (x1, x2, …., xm)
que satisfaça esse conjunto completo de
restrições de programação linear, é a estratégia
mista ótima desejada. 60
Resolução pela Programação Linear
• O problema de encontrar uma estratégia
mista ótima foi reduzido a encontrar uma
solução viável para um problema de
programação linear.
• As duas dificuldades remanescentes são:
– v não é conhecido.
– o problema de programação linear não tem
nenhuma função objetivo.

61
Resolução pela Programação Linear
• Essas dificulades podem ser resolvidas:
– substituindo-se a constante v desconhecida pela
variável xm+1.
– maximizando xm+1, de modo que xm+1 será,
automaticamente, igual a v (por definição) na
solução ótima para o problema de programação
linear.

62
Aplicação à Variante 3 do problema
da campanha política
• Após eliminar a estratégia dominada 3 para o
jogador 1, tem-se:
Político 2
Estratégia Y1 Y2 y3
Probabilidade Estratégia Pura 1 2 3
X1 1 0 -2000 2000
Político 1 1 – x1 2 5000 4000 -3000

• Como algumas entradas são negativas na tabela,


não está claro se o valor v do jogo é não negativo.
• Vamos assumir (a princípio) que v>=0. 63
Aplicação à Variante 3 do problema
da campanha política
• Modelo de PL para o jogador 1.
max x3
• Resolvendo pelo método
5 x 2  x3  0
simplex (após acrescentar a
 2 x1  4 x2  x3  0
restrição x1  0 ) tem-se:
2 x1  3 x2  x3  0 7 * 4 * 2
x1  11 , x2  11 , x3  11
*

x x
1 2
1
• Mesmo resultado encontrado
x 0
1
usando procedimento gráfico.
x 0
2

64
Aplicação à Variante 3 do problema
da campanha política
• A estratégia mista ótima para o jogador 1, de
acordo com o critério do minimax é  ,    7 , 4 
2 x1 x2  11 11
• E o valor do jogo é v  x3 
*

11
• O método simplex também conduz à solução ótima
para o dual desse problema y*  0, y*  5 , y*  6 , y*  2
1 2 11 3 11 4 11
• de modo que a estratégia ótima para o jogador 2
seja
y , y , y    0, 11, 11
1 2
 5 6
3

65
Referência
• Hillier, F. S.; Lieberman, G. J. Introdução à
Pesquisa Operacional. 9 ed. São Paulo:
McGraw Hill, 2013.

66

You might also like