As cinco regras básicas para a evolução da cooperação

Mai 09, 2011

Durante muito tempo a cooperação foi um dos grandes mistérios para as abordagens evolutivas. A cooperação é algo tremendamente importante e não diz respeito exclusivamente aos animais com um certo nível de inteligência. De fato, está por trás da emergência de novos níveis de organização biológica que, assim como os casos de cooperação entre indivíduos, envolvem ganhos e perdas para os 'indivíduos' que 'ajudam' aos outros.

Moléculas auto-replicantes
Células
Células e suas organelas
Organismos multi-celulares
Eussocialidade em animais
Sociedades humanas.

O “Dilema do Prisioneiro” capta a essência do problema e é a porta de entrada de muitos dos sistemas de modelagem e investigação da evolução da cooperação e altruísmo. Nele dois jogadores podem cooperar ou desertar e a recompensa para cooperação mútua, R, é maior do que o retorno da deserção mútua, P. Mas um desertor versus um cooperador recebe a maior recompensa, T, enquanto que o cooperador obtém a menor recompensa, S. Desta forma, o Dilema do Prisioneiro é definido pelo seguinte ranking de recompensas T> R> P> S. Para uma população bem misturada, desertores sempre terão um maior retorno esperado do que os cooperadores. Assim, a seleção natural sempre, nestas condições, 'favorecerá' os desertores. Isso nos leva à conclusão de que a evolução da cooperação exige mecanismos específicos e condições particulares.
Em qualquer população mista desertores conseguem maiores recompensas do que os cooperadores. Este é um caso em que a seleção natural diminui a aptidão média de uma população, mostrando como este processo não é um 'agente' de melhora constante e muito menos tem alvos de longo prazo. Porém, então, como a cooperação pode surgir durante a evolução?

Martin Nowak e seu grupo tem explorado vários cenários e mecanismos em que a cooperação se torna adaptativa, portanto, podendo evoluir por seleção natural. Neste post são discutidos cinco destes mecanismos para a evolução da cooperação: a reciprocidade direta, reciprocidade indireta, seleção de parentesco, seleção de grupo, e reciprocidade de rede (ou a seleção do gráfico) e as regras que emergem da análise destes cenários e que mostram as condições necessárias para que a cooperação evolua. Cada um dos mecanismos transforma a matriz de recompensas do "Dilema do Prisioneiro". A partir dessas matrizes transformadas, cientistas obtiveram as condições fundamentais para a evolução da cooperação. Estas cinco formas podem ser expressas em cinco regras bem simples que ilustram as condições em que a cooperação emerge da dinâmica evolutiva.

Seleção de Parentesco (Kin selection)
Reciprocidade Direta
Reciprocidade Indireta
Reciprocidade em rede (Seleção de Grafos)
Seleção de Grupo (Seleção Multi-níveis)

Seleção de Parentesco (Kin selection):

A interação se dá entre indivíduos que partilham de certo nível de parentesco, ou seja, alguns dos mesmos alelos. Esse princípio é magnificamente ilustrado pela máxima de J.B.S. Haldane, "Eu pularei no rio para salvar dois irmãos ou oito primos" ("I will jump into the river to save 2 brothers or 8 cousins" como citado por Nowak). Este insight de Haldane foi mais tarde rigorosamente formulado por William Hamilton e é uma das principais explicações para a cooperação em insetos sociais com sistemas haplodiploides, como as abelhas, em que as operárias são 'superirmãs', partilhando mais de 50% de seu material genético, além de serem dependentes da rainha para poderem dar uma contribuição genética às próximas gerações.

Hamilton obteve uma regra muito simples que mostra em que situações a seleção de parentesco é eficiente e pode produzir a cooperação: r > c/b

Então, cooperar é evolutivamente vantajoso quando o coeficiente de parentesco (o grau de relação entre o individuo que coopera com o que se beneficia) for maior do que a razão entre o custo para o que coopera e o benefício para que recebe a cooperação. A seleção de parentesco envolve a idéia de aptidão inclusiva, pois a aptidão, o sucesso reprodutivo, é ampliado para englobar também o alcançado através da reprodução dos parentes. Esta idéia levou Richard Dawkins a propor a metáfora de "gene egoísta" e a postular que seriam os genes (compreendidos de uma forma um tanto idiossincrásica e abstrata) como os grandes beneficiários da seleção natural e, portanto, os 'verdadeiros objetos da evolução' já que o que realmente importaria seria a passagem de cópias gênicas `diante, seja isso feito através dos descendentes diretos ou dos descendentes de parentes. [Para maiores detalhes sobre o debate envolvendo os níveis e unidades de seleção leia o artigo da filósofa Elisabeth A. Lloyd]

Porém, esta regra, e a modalidade de seleção que ela encabeça, não nos diz muito sobre como a cooperação (e o altruísmo) entre indivíduos não aparentados pôde evoluir. A primeira pista para superar esta dificuldade inicial veio dos trabalhos do pesquisador, na época em Harward, Robert Trivers, na forma do chamado "altruísmo recíproco", aqui chamado de "reciprocidade direta", que pode ser 'traduzido' pela expressão "uma mão lava a outra".

Contudo, para entendermos este processo precisamos voltar ao dilema do prisioneiro, mas dessa vez jogá-lo repetidamente, como o teórico Robert Axelrod fez durante os anos 60 e 70, e observar que tipo de estratégia é a mais efetiva quando ocorrem repetidas rodadas deste tipo de interação. Neste caso o jogo torna-se muito mais complicado e fascinante.

Boa parte desta situação pode ser compreendida através de modelos de seleção dependente de freqüência, nos quais as estratégias mais bem sucedidas dependem do que os outros membros da população estão fazendo e qual a proporção de membros que as adotam. Esta virada teve como conseqüência a utilização de modelos baseados na teoria dos jogos ao invés de simples modelos de otimização [para maiores detalhes clique na figura ao lado]. Esta perspectiva teve John Maynard Smith (junto com George R. Price) como uma das figuras principais, especialmente ao propor as chamadas estratégias evolutivamente estáveis (ESS) que surgem da aplicação da teoria dos jogos a evolução. Uma ESS é uma estratégia tal que, se todos os membros da população a adotarem, nenhuma estratégia rival conseguirá instalar-se naquela população, definindo, assim, um estado de equilíbrio a partir do qual a população não se desviará sob a pressão de seleção [ver Okasha, 2006].

Nos ''campeonatos mundiais' do "Dilema do Prisioneiro repetido" organizados por Axelrod nos anos 80, em que diversos pesquisadores apresentaram programas de computador, o vencedor, para a surpresa de todos, foi a estratégia mais simples de todas que entraram na contenda, TFT ("Tit-for-tat"), apresentada pelo teórico dos jogos Anatol Rapoport. Mesmo no segundo campeonato, em que outros pesquisadores levaram estratégias para tentar vencer especificamente a TFT, o resultado foi o mesmo, a TFT de Rapoport - que seguiu a máxima futebolística (como lembra Nowak), “nunca mexa em um time que está ganhando” - ganhou de novo, de lavada.
Reciprocidade Direta e Indireta:

A chamada "Tit-for-tat" - que poderia ser traduzida como "toma lá da cá" - é uma estratégia verdadeiramente simples. Nesta estratégia começa-se cooperando. Caso o outro jogador cooperar continua-se cooperando, caso contrário, na próxima interação deserta-se, voltando a cooperar na outra. Apesar desta estratégia promover a cooperação e ser imbatível em condições ótimas, caso hajam falhas na comunicação (ou seja, se ocorrerem erros e um dos jogadores pensar que o outro jogador desertou, quando ele de fato cooperou) isso levaria os dois jogadores "Tit-for-tat" a descambarem em espiral de retaliação por deserção. Neste caso, na presença de erros em um jogo evolutivo estocástico, uma estratégia melhor seria a chamada "Tit-for-tat generosa", o que mostra que o perdão pode surgir a partir da seleção natural. Nesta estratégia, o cooperante frente a deserção, coopera ou não de acordo com uma certa probabilidade (1- c / b) no turno seguinte. Contudo, esta estratégia pode ser vencida por uma estratégia de sempre cooperar (ALLC) que apesar de ser mais vantajosa que a anterior, é facilmente invadida por 'mutantes' desertores (ALLD). Contra esta possibilidade outra estratégia se mostra mais adequada, a chamada "Ganho, eu continuo. Perco, eu mudo". Esta estratégia é capaz de corrigir os erros de comunicação que são fatais na TFT e é resistente a invasões de Desertores (ALLD), mantendo-se estável em situações em que b/c > 2.

A partir dessas informações, Nowak e seu orientador na época, Karl Sigmund, passaram a se interessar em calcular o vencedor em um torneio mais realistas, que segui-se uma dinâmica evolutiva na presença de erros (ao invés de de um torneio simples mata-mata). Nesta implementação uma população de estratégias evoluiria ao longo de muitas gerações com as estratégias mais bem sucedidas deixando mais descendentes para a próxima geração, seguindo implementações estocásticas (ou seja, como diz Nowak, “elas tinham "mãos trêmulas" na execução das suas regras.”).

Destes cenários emergem a reciprocidade direta e a reciprocidade indireta. No primeiro caso, as interações ocorrem entre os mesmos indivíduos e a cooperação pode evoluir seguindo-se outra regra simples: W > c/d, em que b é o benefício, c é o custo e W é a probabilidade de outro encontro ou 'rodada'. Já a reciprocidade indireta depende de interações entre indivíduos diferentes em ocasiões diferentes, portanto, se baseará na 'fama' destes indivíduos, ou seja, do que eles fizeram (cooperaram ou desertaram) com outros indivíduos em outras interações. Se na reciprocidade direta é preciso ter um 'rosto', no tipo indireto é o 'nome' que conta.
“For direct reciprocity you need a face. For indirect reciprocity you need a name.” (David Haig, como citado por Nowak*)

A partir deste tipo de interação outra regra simples emerge. Para que a reciprocidade indireta possa produzir a cooperação q > c / b, em que q é a probabilidade de conhecer a reputação de alguém, c, custo da cooperação e b, o benefício da cooperação.

Na reciprocidade indireta é a reputação do individuo que é o cerne do processo. Por isso a habilidade não só de reconhecer outros indivíduos, mas de se comunicar, torna-se fundamental. Este processo pode levar a evolução da inteligência social e da linguagem. A reputação passa a ser o ingrediente principal das interações e a habilidade de 'fofocar', portanto, de um linguagem complexa acaba por ser essencial neste contexto.

Reciprocidade em Rede:

O quarto processo é chamado de "reciprocidade em rede", baseado no processo de 'seleção de grafos'. Este mecanismo é um pouco menos intuitivo que os anteriormente mencionados. Para começar um grafo é um conjunto de vértices conectados por uma série de arestas que funcionam como uma representação matemática abstrata, podendo ser usados para modelar uma série de relações e processos entre diversos tipos de entidades. Existe toda uma teoria sobre os garfos [teoria dos grafos] que é extremamente utilizada nas ciências da computação e na matemática computacional.

Voltando ao começo do post, em situações em que as populações são misturadas, ou seja, em que os indivíduos têm basicamente a mesma chance de interagir uns com os outros, os desertores tendem a se proliferar mais do que os cooperadores, por que ganham benefícios sem arcar com os custos, sendo, desta forma, favorecidos pela seleção natural, e acabam por dominar a população, Contudo acabam por reduzir a aptidão média da mesma. Porém, a maioria das populações exibe certa estruturação que limita os tipos de interação e com quem cada um pode interagir. Esta estruturação pode ser espacial, no caso mais simples, mas também assumir a forma de uma rede de interações sociais.

Os indivíduos de uma população ocupam os vértices do grafo e as bordas determinam quem interage com quem. Considerando-se cooperadores simples e desertores, sem qualquer complexidade estratégica, um colaborador paga um custo, c, por cada vizinho que recebe um benefício, b. Desertores não pagam custos, e os seus vizinhos não recebem nenhum benefício. Nesse cenário, os cooperadores podem prevalecer, ao formarem clusters nesta rede, onde se ajudam mutuamente.

A "reciprocidade em rede" resultante é uma generalização de "reciprocidade espacial". A regra que emerge daí é b/c > k mostra as condições para que a cooperação possa evoluir. Onde k é o número médio de vizinhos e, claro, c é o custo da cooperação e b, o benefícios da cooperação. Isto é, a razão entre benefício e o custo (b/c) deve ultrapassar o número médio de vizinhos, k, por pessoa.
Seleção de grupo (ou seleção multi-níveis):

A seleção natural atua não apenas sobre indivíduos, mas também em grupos. Ainda que a seleção de grupo como proposta por V. C. Wynne-Edwards nos anos 60 não tenha resistido aos ataques de teóricos como Maynard Smith, G.C. Williams e do próprio William Hamilton, modelos diferentes sobreviveram e, nas últimas décadas, têm despertado (ainda com certa controvérsia) renovado interesse. Outros cenários e situações têm sido muito exploradas e muitos estudos teóricos e empíricos, sobre a seleção de grupo, tem sido conduzidos, em geral, sobre a alcunha de "seleção de multi-níveis". A ideia principal é que um grupo de cooperadores pode ser mais bem sucedido do que um grupo de desertores. Assim, um modelo simples de seleção de grupo funcionaria da seguinte maneira: A população é dividida em grupos e os cooperadores ajudam uns aos outros em seu próprio grupo. Desertores não ajudam. Os indivíduos reproduzem proporcionalmente à sua recompensa. A prole é adicionada a cada grupo. Se um grupo atinge um determinado tamanho, ela pode se dividir em dois. Neste caso, um outro grupo se extingue, a fim de restringir o tamanho total da população.

Perceba, porém, que apesar de só indivíduos se reproduzirem, a seleção acontece em dois níveis. Existe também concorrência entre os grupos, pois alguns grupos crescem mais rápido e dividem-se com maior freqüência do que outros. Em particular, os grupos de cooperadores puros crescem mais rapidamente do que os grupos desertor puros, que, mas em qualquer grupo misto, desertores reproduzem-se mais rápido do que os que colaboraram. Portanto, a seleção no nível mais baixo (dentro dos grupos) favorece desertores, enquanto a seleção no nível mais elevado (entre grupos) favorece cooperadores. Este modelo é baseado na "seleção de grupo por fecundidade", que significa que os grupos de cooperadores têm uma maior taxa de divisão em dois. No entanto, também é possível imaginar um modelo baseado na "seleção de viabilidade dos grupos", em que os grupos de colaboradores são menos propensos a se extinguir.

Nowak*, conclui: "no, matematicamente conveniente, limite da seleção fraca e separação rara entre grupos, obtemos um resultado simples: Se n é o tamanho máximo do grupo e m é o número de grupos, em seguida, a seleção de grupo permite a evolução da cooperação, desde que: b/c > 1+ n/m"

Outros modelos mais complexos e menos restritivos de seleção de grupo existem, como o "modelo do palheiro" de Maynard Smith e o de "grupos característicos" (trait-groups) de D.S. Wilson, bem como exemplos de organismos que apresentam as características adequadas para evoluir sobre esta forma.

Essas opções são ainda mais amplas se pensarmos em definições mais modernas de grupo - como as propostas por D. S. Wilson e Elliot Sober - que salientam as semelhanças entre a seleção de parentesco e a seleção de grupo, que, no caso, da abordagem de Wilson e Sober, seria um caso particular da seleção de grupo, no qual o parentesco genético diminuiria a variabilidade intra-grupal, assim como a clonalidade faria com seres multicelulares. Isso fica ainda mais claro com a apreciação da equação de Price (de George R. Price) que permite dividir os componentes da aptidão em (pelo menos) dois termos diferentes, um associado diretamente a características em evolução e outra a fidelidade com que ela é herdada a cada nova geração, o que ajuda a deixar mais claro os diversos níveis envolvidos no processo já que o primeiro termo pode ser encarado como 'o grupo' e o segundo como 'os indivíduos' [Veja Okasha, 2005 e 2006 para maiores detalhes sobre os debates envolvendo a seleção de grupo].

Sumário:

Cinco mecanismos de cooperação*:

Seleção de Parentesco: cooperar com parentes genéticos.
Reciprocidade Direta: 'eu te ajudo, você me ajuda.
Reciprocidade Indireta: 'se eu te ajudar, alguém me ajuda'.
Reciprocidade em rede (Seleção de Grafos) : clusters de cooperadores se dão bem.
Seleção de grupo: grupos de colaboradores ganham de outros grupos.

Esses mecanismos podem ser subdivididos em duas grandes categorias em função dos limites da cooperação e, portanto, do tipo de cooperação que pode surgir a partir destas estratégias evolutivas.

"Vencedores não punem":

Talvez uma surpresa advinda dos estudos da evolução da cooperação conduzidos pelo grupo de Nowak é que a punição não aparece como uma estratégia por ela mesma, apesar de ser claro que ela pode promover um comportamento cooperativo em algumas situações. A punição pode aumentar o nível de cooperação que é alcançado em tais modelos, mas como Nowak deixa bem claro, todos os modelos evolutivos que envolvem punição, até o momento, são formas de instanciamento particular de mecanismos mais amplos, tais como reciprocidade indireta, seleção de grupo ou reciprocidade em rede. Por exemplo, caso se puna alguém que tenha desertado (não cooperado com você), então, você está usando a reciprocidade direta; e caso você puna alguém que desertou com os outros, então você está usando reciprocidade indireta. Modelos usando punições custosas, em que um individuo paga um custo para que outro (um desertor) tenha que arcar também com um custo, realmente promovem a cooperação, mas comparados com grupos controles, reduzem a recompensa total dos participantes. Os jogadores que ganham o maior retorno total tendem a não usar a punição custosa: "os vencedores não punem". Por causa disso, Nowak, sugere que o comportamento de punição custosa é mal-adaptativo, pelo menos, nos jogos de cooperação investigados, portanto, devendo ter evoluído por outros processos.

Para Nowak a reciprocidade direta e indireta são os componentes chave para a compreensão da evolução de qualquer comportamento pró-social nos seres humanos. Mas o que realmente “nos fez humanos", segundo este pesquisador, teria sido a reciprocidade indireta, porque este tipo de mecanismo produz a pressão seletiva apropriada para a evolução da inteligência social e da linguagem humana.

O estudo da cooperação e do altruísmo é uma das áreas mais fascinantes da moderna biologia evolutiva, possuindo amplas interfaces que vão desde a origem da multicelularidade até implicações no estudo da economia e da ética. Estudar os processos por trás da evolução de sistemas cooperativos é não só intelectualmente instigante como necessário como parte da aquisição de conhecimento sobre quem somos e como agimos.
_______________________________

Referências:

Nowak, M. (2006). Five Rules for the Evolution of Cooperation Science, 314 (5805), 1560-1563 DOI: 10.1126/science.1133755
Taylor C, & Nowak MA (2007). Transforming the dilemma. Evolution; international journal of organic evolution, 61 (10), 2281-92 PMID: 17711471

--------------------------------

*Nowak, M Evolution of cooperation. - Boa parte das ilustrações e citações vem desta apresentação de Nowak.

Referências Adicionais:

Okasha, S. Maynard Smith on the Levels of Selection Question, Biology and Philosophy, 20, 5, 989-1010, 2005.
Okasha, S. The Levels of Selection Debate, Blackwell’s Philosophy Compass 1/1, 74-85, 2006
Nowak, M. (2008). Generosity: A winner's advice Nature, 456 (7222), 579-579 DOI: 10.1038/456579a
Nowak MA (2004). Prisoners of the dilemma. Nature, 427 (6974) PMID: 14765175
Traulsen A, & Nowak MA (2006). Evolution of cooperation by multilevel selection. Proceedings of the National Academy of Sciences of the United States of America, 103 (29), 10952-5 PMID: 16829575
Sigmund K, Nowak MA. Evolutionary game theory. Curr Biol. 1999 Jul 15;9(14):R503-5. PubMed PMID: 10576907.

Crédito das figuras:

JOTI/SCIENCE PHOTO LIBRARY

JAMES KING-HOLMES/SCIENCE PHOTO LIBRARY

CORBIN O'GRADY STUDIO/SCIENCE PHOTO LIBRARY

http://commons.wikimedia.org/wiki/File:J._B._S._Haldane.jpg

Evolucionismo

As cinco regras básicas para a evolução da cooperação