Logo que tiveram notícia da
descoberta do conceito de ponto de equilíbrio, por John Nash, Merrill
Flood e Melvin Dresher elaboraram o experimento que ficou mundialmente famoso -
depois da história montada por Albert W. Tucker - como Dilema dos Prisioneiros.
O objetivo era saber se pessoas que
desconheciam a idéia de equilíbrio de Nash, ao se depararem com uma situação
semelhante à matriz do jogo, reagiriam conforme a previsão teórica, desertando
mutuamente. A experiência foi realizada nos laboratórios da corporação RAND,
com John Williams, chefe do departamento de matemática da empresa, e o
economista Armen Alchian, da universidade de Los Angeles (UCLA). O jogo foi
repetido em 100 rodadas e, ao contrário de estimular o uso da estratégia
dominante - a deserção -, acabou por gerar a cooperação entre os jogadores,
longe do ponto de equilíbrio.
Efetivamente, os participantes
tinham percebido que deveriam cooperar, caso quisessem maximizar seus ganhos,
usando a dominante somente quando o outro não tivesse cooperado, como punição
instantânea, e retomando a cooperação na rodada posterior - segundo o que se
chamou depois de estratégia OLHO POR OLHO. John Nash havia demonstrado a
existência de, ao menos, um ponto de equilíbrio em qualquer jogo
não-cooperativo finito com mais de um jogador e soma diferente de zero.
Essa teoria foi apresentada em sua
premiada tese de 1950 "Non-Cooperative Games", que propunha
uma solução mais abrangente do que os resultados do teorema minimax de Von
Neumann que se restringia a jogos cooperativos e de soma zero. De fato, Nash
logrou demonstrar a existência de ponto de equilíbrio para qualquer tipo de
situação finita: cooperativa ou não cooperativa; soma zero ou variante; dois ou
mais agentes. Todo seu esforço estava voltado para tornar mais úteis e práticas
as idéias lançadas em Theory of Games and Economic Behavior (1947), por
Von Neumann e Morgenstern. Ainda que as estratégias puras não mostrassem um
ponto de equilíbrio, sempre se poderia encontrá-lo por meio de mistura das
linhas de ação.
Os modelos de jogos, como o Dilema
dos Prisioneiros, surgiram, portanto, como uma maneira de testar as hipóteses
propostas para solucionar o conflito parcial de interesses entre agentes
racionais egoístas. Mais tarde o campo de aplicação de suas simulações se
estendeu a todo tipo de agente - racional ou não - que tivesse de tomar uma
decisão sobre que fazer diante de um ser semelhante que disputa os bens
disponíveis, mas que depende do outro para alcançá-lo. Dessa forma, a
construção de jogos como método de pesquisa permite pôr em prática os
tradicionais experimentos mentais que sempre foram produto da especulação
filosófica mais apurada. Só que agora, os jogos possibilitavam encontrar uma
resposta sobre os efeitos da proposta examinada.
No caso do Dilema dos Prisioneiros,
sua matriz jogada em uma só rodada punha em cheque o influente mecanismo da mão
invisível, anunciado por Adam Smith (1723-1790), em Teoria dos
Sentimentos Morais (1759) e depois reapresentado em A Riqueza das Nações
(1776). À medida que, sendo repetido várias vezes, o jogo permitia à cooperação
ser implementada, contra a orientação racional que era recomendada, no que diz
respeito à mão invisível, a noção apresentada por Smith não seria capaz
de fornecer a distribuição justa que se pensava poder realizar afinal. Ao
promover suas ações no sentido de obter "o máximo valor possível",
cada indivíduo não conseguiria elevar ao máximo a renda da sociedade de modo
que a distribuição desses bens, conduzida pela mão invisível, fosse a mais
igualitária e eficiente do que se fosse planejada. Os agentes racionais, na
situação do dilema, se seguirem as estratégias que maximizam seus ganhos
individuais, acabam por gerarem o pior resultado conjunto: a puniçao mútua.
Uma distribuição justa só surge
quando, aos jogadores, é dada a oportunidade de retaliar e tolerar os erros
cometidos pelos outros. O comportamento recíproco torna-se viável com a
repetição frequente das rodadas. Não obstante o fato da fuga da estratégia
dominante, no Dilema dos Prisioneiros Iterado, contradizer a previsão de que
seres racionais a seguem e se encontram em um ponto de equilíbrio de Nash.
O uso de experimentos por modelos de
jogos para formalizar as situações de conflito visa detectar os aspectos mais
importantes de cada circunstância e que influenciam as deliberações, bem como o
comportamento dos agentes. Desde o Dilema dos Prisioneiros, sua aplicação vem
sendo cada vez mais incrementada. Por conta disso, os elementos que permitem
prever as ações dos indivíduos, ou ao menos interpretar suas decisões, podem
ser descritos de forma mais precisa. Antes dos torneios de Axelrod, diversos
testes realizados em torno do Dilema dos Prisioneiros revelaram uma atitude
competitiva dos participantes, tal como aquelas adotadas pelos programadores
que tentaram bater a estratégia OPO, vitoriosa desde o início. Contudo, além da
capacidade de retaliar, Axelrod havia chamado atenção para a condição de
clemência (forgiving), que fazia OPO recuperar a cooperação, como
característica decisiva de seu êxito nos dois torneios que ele promoveu.
A complexa ação dos elementos
observados nos experimentos transformou a meta inicial de se construir uma
teoria que buscasse em primeiro lugar a predição de resultados. Agora, ao invés
de apontar soluções para todos os jogos, a investigação procura avaliar o grau
de participação de cada fator deliberativo e dos princípios do comportamento
estratégico. O conhecimento empírico adquirido pela prática dos jogos permitiu avançar
respostas para as questões problemáticas do comportamento estratégico, que as
suposições teóricas, por si só, não conseguiam solucionar.
Se antes a personalidade do jogador
era uma variável importante que estava longe do alcance do experimentador, hoje,
modelos como o Ultimato e o DPI procuram enfocar os diversos aspectos da
cognição humana - crenças, desejos e sentimentos - que interferem nas escolhas
de cada um. Nesse sentido, as simplificações praticadas pelas simulações
funcionam de modo similar aos experimentos avançados da física, que isolam as
partículas em ambiente artificial, a fim de estudar o comportamento entre elas
e as forças que atuam em situações específicas.
Cada modelo de jogo proporciona a
observação mais detalhada das características do comportamento que influenciam
as tomadas de decisão. O DPI aponta o papel fundamental da reciprocidade para o
estabelecimento da cooperação de um modo geral. Os Bens Públicos mostram o
papel de mecanismos como a punição na manutenção de um emprendimento comum.
Enquanto o Ultimato revela que as emoções e o ambiente cultural também exercem
pressão considerável na emersão de resultados equitativos.
Sentimentos morais, como indignação,
vergonha e vingança, foram incorporados ao repertório comportamental da espécie
humana à medida que suas manifestações provocavam restrições às escolhas
estratégicas que a longo prazo traziam resultados prejudiciais à sobrevivência
e reprodução dos indivíduos. Esses sentimentos proporcionariam as respostas
adaptativas a diversas situações sociais e ambientais que envolvessem outros
sujeitos e ameaçassem o bem estar do agente racional. Corresponderiam então
àquilo que António R. Damásio denominou de marcadores-somáticos.
A utilização de jogos como o
Ultimato permite avaliar até onde os sentimentos morais, adquiridos durante a
evolução, se manifestam de acordo com uma lista de preferências internas e a
compreensão dos contextos externos nos quais o agente deve decidir a maneira de
se comportar conforme normas sociais e éticas. Martin Nowak e Karl Sigmund
pressumem que essas respostas emocionais foram montadas graças à convivência
humana praticada por milhões de anos em pequenos grupos, nos quais cada um de
seus membros são conhecidos dos outros. Ao passo que, a superpopulação e o
crescimento desordenado das grandes cidades colocarariam o problema do
anonimato como fator perturbador das interações continuadas.
O conhecimento do tipo de agente com
o qual se interage favorece a manifestação das emoções, enquanto a recusa
sistemática de ofertas baixas restringem sua repetição no futuro, obrigando o
outro a aumentar os ganhos propostos e maximizar a utilidade de todos
participantes.
Todavia, quando a impossibilidade de
novos encontros entre agentes se torna constante, o anonimato acaba por
perturbar a cooperação e proporcionar o florescimento de desertores e a
insegurança das propostas e respostas. A reputação só é eficaz se novos
encontros puderem ocorrer no futuro. Coisa que se torna difícil entre estranhos
de uma megalópole. Pode-se saber com alguma precisão como se comportam
parentes, vizinhos, amigos e colegas. Mas o controle fica difícil quanto maior
for o número de conhecidos com os quais se interage. O efeito do anonimato é
mais uma consequência perturbadora das grandes cidades e da superpopulação
sobre o comportamento dos seus habitantes, diminuindo a confiança entre eles.
Por conta dessa desconfiança, a exigência de garantias, mecanismos de
identificação - cadastro de bons e maus pagadores - e aparelhos de repressão
tornam-se cada vez mais necessários.
A construção do modelo adequado de
jogo permite, então, avaliar com maior precisão os componentes relevantes de
interação. A partir disso, as decisões a serem adotadas no intuito de fomentar
ou restringir a cooperação podem ser sugeridas com maior probabilidade de
correção. Desse modo, o emprego de simulações e jogos entre agentes humanos
ajuda a compreender melhor os aspectos sutis que subjazem à interação. Com
isso, as hipóteses tecidas por teóricos que estudam o comportamento humano
podem ser testadas no sentido de fazer valer ou derrubar as conclusões tiradas
sobre a cooperação que acontece no mundo concreto.
A pesquisa realizada por esse método
deve atender alguns requisitos básicos acerca da maneira como a experiência será
modelada, da análise dos resultados e sua divulgação. Os modelos de jogos
funcionam como os experimentos mentais, bastante difundidos em textos
filosóficos, mas que podem ser reproduzido por meio eletrônico ou questionários
tradicionais, em papel. De um modo geral, parte-se de hipóteses simples que uma
vez implementadas geram conseqüências complexas ou paradoxais. Os efeitos
decorrentes da complexidade de interação entre agentes simples fazem emergir
propriedades que não eram observadas antes no comportamento individual. Tais propriedades
emergentes são temas comuns às pesquisas feitas na física contemporânea
sobre os sistemas complexos abordados sob a perspectiva da Teoria do Caos.
Nesse sentido, hipóteses fortes
sobre a racionalidade das escolhas podem ser enfraquecidas, no intuito de
abranger toda forma de atuação de indivíduos cujo processo de deliberação leva
a inferência de algum princípio dedutivo. Seres muito simples poderiam ser
incluídos nessa pesquisa, concebendo suas escolhas como geradas por meio de um
processamento de informações obtidas no meio ambiente que provocam uma resposta
do agente. Essas respostas dar-se-iam através de um conjunto de regras
incorporadas que produziriam uma maneira de extrair ações em função da entrada
de informações.
Quanto mais simples forem os testes
baseados no modelo de agente, maiores são as possibilidades de se perceber o
processo fundamental ascendente que se inicia com os elementos básicos da
interação e se eleva às conclusões gerais sobre o comportamento social. A
validade interna do procedimento que conduz esse tipo de pesquisa a resultados
consistentes depende do grau de precisão entre elementos que compõem o
experimento e a situação real analisada. Resultados contra-intuitivos causam
forte discussão sobre a possibilidade de algum erro ter sido cometido na
formulação ou execução dos modelos propostos. Nesses casos, deve-se proceder ao
reexame de todo método empregado, utilizando propostas alternativas, variantes
e contra-exemplos, a fim de se detectar possíveis falhas na aplicação dos
testes que devem também ser flexíveis o suficiente para permitir novas versões
aprimoradas e extensões a diversas circunstâncias.
Os modelos mais avançados de estudo
do comportamento de agentes incluem abordagens de redes neurais, algoritmos que
podem evoluir e técnicas de aprendizagem que se aplicam à maneira como os
indivíduos se adaptam nas interações cotidianas. O sistema de agentes é
modelado com base em informações sobre como os agentes tomam suas decisões de
modo autônomo. Assim, procura-se saber como são organizados os mercados, o
fluxo da população e a difusão das estratégias simuladas de um ponto de vista
"atômico" (partículas mínimas e indivisíveis) da sociedade como
alternativa à visão "macroscópica", que é descendente. A rigor, a
simplicidade dos modelos não deve diminuir a importância e a profundidade dos
conceitos trabalhados.
Nas ciências sociais, as simulações
dos contextos da sociedade têm estimulado a mudança de metas tradicionais que
antes buscavam uma ferramenta que produzisse resultados previsíveis, mas que
agora se restringem aos limites da tarefa de compreensão do modo como os
agentes atuam. Nas palavras de Eric Bonabeau - então, pesquisador da Icosystem
Corporation -, "prever o sucesso pode ser simples, mas coisa difícil de
fazê-lo; entender como o sucesso acontece é um uso melhor do modelo". Tais
modelos são úteis para mostrar o modo complexo de como o agente aprende e se
adapta a uma situação. Além disso, podem ser aplicados para avaliar a mobilidade
territorial e a resistência a invasões, sobretudo, quando o comportamento dos
indivíduos de uma população é heterogêneo e varia de região para região - nas
relações de convívio familiar, vizinhança, instituições públicas, trabalho etc.
Em geral, os temas de maior
interesse para essa área do conhecimento são as questões sociais, políticas e
econômicas, que devem aplicar modelos específicos para cada proposta de
investigação e não forçar o uso de um modelo de solução universal para todos os
problemas da humanidade. Como já se tentou destacar os DPI, os Bens Públicos e
o Ultimato, por exemplo, servem para tratar questões de reciprocidade direta,
indireta e de equidade, respectivamente, com maior precisão. Isso não implica
em soluções ad hoc, pois a formalização empregada segue os mesmos
procedimentos gerais da teoria dos jogos, variando apenas os elementos que têm
de ser mudados de modo realista. Para as ciências sociais, o modelo de jogos
talvez seja a única maneira viável, salvo melhor juízo, de abordar a inconsistência
do comportamento humano e seu complexo processo cognitivo de escolha.
Os jogos experimentados vêm
expandindo-se além dos domínios econômicos e se tornando um ambiente próprio
para troca de informações interdisciplinares. Mesmo quando são tratados por
economistas, suas conclusões dizem respeito a outras matérias pertinentes, como
no caso da avaliação da equidade nos modelos de jogos que interessam desde
áreas administrativas até as neurociências em suas mais recentes descobertas.
Fonte
SILVA,
Antônio Rogério. A construção de jogos e
sua utilização prática. Disponível em:
<http://www.discursus.oi.com.br/tjcf/241tjcfc.html>.
Nenhum comentário:
Postar um comentário