Jogos de Estratégia
|
|
Nesta aplicação
vamos utilizar notação matricial e produto entre
matrizes para encontrar a melhor estratégia para cada
jogador em um jogo, no qual cada oponente tem que
escolher um de seus movimentos a cada jogada e,
dependendo das escolhas, cada um receberá um determinado
pagamento.
Definição: Um jogo de matriz de dois jogadores com soma zero é um tipo de jogo no qual cada jogador tem um número finito de possíveis movimentos, de modo que podemos arranjar os possíveis movimentos e os correspondentes ganhos ou perdas de cada jogador em uma tabela ou matriz de pagamentos, que é conhecida pelos dois jogadores. O termo soma zero significa que, a cada jogada, o ganho de um jogador é igual a perda do outro. Neste tipo de jogo, a cada rodada, cada um dos jogadores escolhe, aleatória ou estrategicamente, um entre seus possíveis movimentos, sem que o outro jogador saiba sua escolha. Uma vez tomadas as decisões, elas são anunciadas e a tabela de pagamentos é utilizada para determinar a compensação de um jogador ao outro. Essa compensação não precisa ser em dinheiro, mas em qualquer espécie de bem consumível que possa assumir um valor numérico. Exemplo: A tabela abaixo representa um jogo de matriz de dois jogadores com soma zero. Nesta notação, os valores da tabela representam os pagamentos do jogador Y para o jogador X. Se a entrada na tabela for negativa, o pagamento será do jogador X para o jogador Y.
Nesse caso,
a cada jogada, o jogador X pode escolher um entre os
movimentos A, B e C, e o jogador Y pode escolher um
entre os movimentos D, E, F e G. Por exemplo, se o
jogador X escolhe o movimento A e o jogador Y
escolhe o movimento G, então, pela tabela, o jogador
Y deverá pagar 8 unidades para o jogador X.
Estratégias para um jogo de matriz de dois jogadores com soma zeroConsidere um jogo de matriz de dois jogadores com soma zero. Seja m o número de possíveis movimentos do jogador X e o número de possíveis movimentos do jogador Y. Se o jogador X faz o movimento , para , e o jogador Y faz o movimento , para , então é o pagamento do jogador Y para o jogador X. Caso seja negativa, então o pagamento é do jogador X para o jogador Y. Podemos arranjar esses mn possíveis pagamentos em uma matriz . é denotada matriz de pagamento do jogo. Suponhamos que cada jogador tem uma certa probabilidade de fazer cada movimento. Sejam: = probabilidade do jogador X fazer o movimento . = probabilidade do jogador Y fazer o movimento . Com as probabilidades e nós formamos dois vetores: O vetor é a estratégia do jogador X e o vetor é a estratégia do jogador Y. Se é a probabilidade do jogador X fazer o movimento e a probabilidade do jogador Y fazer o movimento , então, da teoria de probabilidade, é a probabilidade, em uma rodada do jogo, de acontecer os movimentos e , dos jogadores X e Y, respectivamente. O pagamento recebido pelo jogador X para esse par de movimentos é . Multiplicando cada possível pagamento com a probabilidade associada e somando sobre todos os pagamentos possíveis, obtemos: Essa expressão é uma média ponderada dos pagamentos para o jogador X, chamada pagamento esperado. A denotação indica que seu valor depende tanto das estratégias do jogador X, quanto do jogador Y. Podemos mostrar que, se o jogo é jogado muitas vezes, o pagamento médio recebido pelo jogador X é . Da maneira como foi definido, temos: é o pagamento esperado para o jogador X e é o pagamento esperado para o jogador Y. Suponha agora, que cada jogador pode escolher suas estratégias, ou seja, alterar as probabilidades de cada um dos seus possíveis movimentos, sem que o outro jogador saiba a sua estratégia. Cada jogador irá tentar escolher a melhor estratégia, sabendo que o outro também o fará. Assim, o jogador X escolhe uma estratégia tal que é máximo, para a melhor estratégia escolhida pelo jogador Y. De mesmo modo, o jogador Y escolhe uma estratégia tal que é mínimo, para a melhor estratégia escolhida pelo jogador X. Teorema: Existem estratégias e tais que: para quaisquer estratégias e . As estratégias e são as melhores estratégias para os jogadores X e Y, respectivamente, chamadas estratégias ótimas. O pagamento esperado é chamado valor do jogo, obtido quando ambos os jogadores utilizam quaisquer estratégias ótimas. Definição: Seja A uma matriz. Uma entrada da matriz A é um ponto de sela, se é a menor entrada de sua linha e é a maior entrada de sua coluna. Um jogo em que a matriz de pagamento possui um ponto de sela é chamado estritamente determinado. Uma estratégia ótima para o jogador X seria escolher um movimento que maximize o seu menor ganho, caso o jogador Y faça uma estratégia ótima. Agora, uma estratégia ótima para o jogador Y é escolher o movimento que minimize sua maior perda, caso o jogador X faça uma estratégia ótima. Disso, vemos que um ponto de sela da matriz de pagamento de um jogo é um ponto ótimo, ou seja, se é um ponto de sela da matriz de pagamento do jogo, então, escolher sempre o movimento é uma estratégia ótima para o jogador X e escolher sempre o movimento é uma estratégia ótima para o jogador Y. Exemplo: Duas emissoras de televisão, X e Y, pretendem exibir programas em um mesmo horário. Elas podem escolher entre 4 programas cada uma, sendo que as emissora não sabem o que cada uma irá exibir. Uma pesquisa, feita por ambas as emissoras, revelou quais seriam as probabilidades de audiência para a emissora X, com cada uma das possíveis combinações dos dois programas exibidos. A seguinte matriz mostra o resultado da pesquisa, onde a entrada representa a porcentagem de audiência que a emissora X terá, caso ela exiba o programa e a emissora Y exiba o programa . Assim, por exemplo, se a emissora X decide exibir o programa 2 e a emissora Y decide exibir seu programa 1, então, 60% da audiência será da emissora X e 40% da emissora Y. Esse é um exemplo de um jogo de matriz de dois jogadores com soma zero, onde os jogadores são as emissoras de TV. Se esse jogo é estritamente determinado, então a matriz A de pagamento do jogo tem um ponto de sela. Observe que a entrada é um ponto de sela da matriz A, pois é o maior valor de sua coluna e o menor de sua linha. Assim, uma estratégia ótima para a emissora X é exibir o programa 3 e para a emissora Y é exibir o programa 3. Isso dará uma audiência de 30% para a emissora X e 70% para a emissora Y. É estranho que essa seja uma estratégia ótima para X, pois é claro que outras entradas da matriz dariam uma maior audiência para ela, mas observe que isso depende também da escolha da emissora Y. Se por acaso, a emissora X exibe seu programa 2, as possibilidades são que ela tenha 60%, 70%, 25% ou 30% de audiência, se Y exibir os programas 1, 2, 3 ou 4, respectivamente. Assim, o pior para a emissora X seria se a Y escolhesse o programa 3, o que daria apenas 25% de audiência para X. Agora, se a emissora X escolhe exibir seu programa 3, então o pior seria se a emissora Y escolhesse o programa 3, o que daria 30% de audiência para X. Observe que, a audiência no pior caso para a emissora X, se ela escolher um outro programa que não seja o 3, é sempre menor que 30%. A estratégia ótima da emissora X é analisar os possíveis casos, supondo que a Y vai escolher o que é mais vantajoso para ela. Ou seja, suponha que a emissora Y sempre escolhe o seu programa que dará a menor audiência para X. Analisando a matriz A, essas menores audiências serão 20%, 25%, 30% ou 25%, caso X escolha os programas 1,2,3 ou 4, respectivamente. Então, a melhor escolha para X é aquela em que a sua menor audiência é máxima, dentre as 4 menores audiências possíveis, ou seja, escolher o programa 3, que lhe dará 30% de audiência. Por outro lado, a emissora Y analisa suas escolhas, observando os maiores valores em cada coluna de A, ou seja, fixando a sua escolha e supondo que X escolherá o programa que lhe dará a maior audiência. Analisando a matriz A, os possíveis casos seriam 60%, 70%, 30% ou 60% de audiência para X, se Y escolher os programas 1,2,3 ou 4, respectivamente. O melhor caso para Y, então, é escolher o programa 3, que dará 30% de audiência para X e 70% para Y. Em resumo, a estratégia ótima para X é escolher a linha da matriz A, cuja menor entrada é a maior possível, dentre as menores entradas de cada linha e a estratégia ótima para Y é escolher a coluna, cuja maior entrada é a menor possível, dentre as maiores entradas de cada coluna. Por esse motivo, um ponto de sela da matriz A ocorre quando ambos os jogadores escolhem estratégias ótimas. Voltar ao Topo. Jogos de matrizesEste é um caso em que podemos encontrar estratégias ótimas, mesmo que o jogo não seja estritamente determinado, ou seja, que a matriz não tenha um ponto de sela. Vamos calcular o pagamento esperado para duas estratégias quaisquer p e q, dos jogadores X e Y, respectivamente. Sabemos que a soma de todas as probabilidades possíveis deve ser 1. Assim, e . Substituindo essas relações na expressão para , obtemos: Na última passagem, rearranjamos a equação para colocar em evidência os termos com . Se substituirmos: O coeficiente do termo com se anula e o pagamento esperado se reduz a: Esse pagamento esperado não depende da estratégia do jogador Y, e portanto, a estratégia é ótima para o jogador X. De mesma forma, podemos verificar que uma estratégia ótima para o jogador Y é determinada por: Que substituindo na equação para o pagamento esperado, resulta em: Isso mostra que , para quaisquer estratégias e . As estratégias e são ótimas para os jogadores X e Y, respectivamente. Neste caso, o valor do jogo é: Ou seja, cada jogador, se escolher uma estratégia ótima, pode forçar o valor do jogo a ser o pagamento esperado, qualquer que seja a estratégia escolhida pelo outro jogador. Isso só é valido para jogos em que a matriz de pagamento é . Exemplo: Considere um jogo de matriz com soma zero, em que dois jogadores X e Y devem escolher um entre dois de seus movimentos. O jogo tem a seguinte matriz de pagamento para o jogador X: A matriz não tem um ponto de sela, logo o jogo não é estritamente determinado. Como visto anteriormente, uma estratégia ótima para o jogador X é , onde: O valor do jogo nesse caso, para qualquer estratégia q do jogador Y, será: Ou seja, uma estratégia ótima para o jogador X é escolher em das jogadas o seu movimento 1 e das vezes o seu movimento 2, isso lhe garantirá uma média de em dinheiro, ou outra unidade de pagamento, por rodada do jogo, qualquer que seja a estratégia escolhida pelo jogador Y. Voltar ao Topo. |