Die Evolution der Kooperation

In der Diskussion zu den egoistischen Genen tauchte noch einmal die Frage auf, wie sich dann Kooperation entwickeln konnte.

Ich zitiere dazu aus einem passenden Wikipediaartikel:

Axelrod geht von einem iterativen Gefangenendilemma aus. In diesem einfachen Zwei-Personen-Spiel haben beide Spieler den Anreiz, sich unkooperativ zu verhalten, wenn sie rational und egoistisch handeln – wenn keine weiteren Aspekte wie Moral oder gegenseitiges Vertrauen hinzu kommen, und wenn sie sich nur einmal und dann niemals wieder in dieser Situation begegnen. Das Dilemma des Gefangenendilemmas besteht darin, dass zwar Defektion für jeden Spieler aus seiner Sicht richtig (rational) wäre, es sich jedoch um ein Nichtnullsummen-Spiel handelt, bei dem nicht nur einer gewinnen kann, sondern beide den Gesamt-Gewinn durch Kooperation maximieren können.

Axelrod untersuchte, was sich ergibt, wenn sich diese Situation über viele Male wiederholt; wenn sich die beiden Spieler immer wieder begegnen, ohne zu wissen, wann sie zum letzten Mal zusammentreffen werden (iteriertes Gefangenendilemma). Von vornherein gibt es keine beste Strategie, da die Strategie immer von der Strategie des Gegners abhängt. In zwei Programmierwettbewerben ließ er verschiedene, zum Teil sehr ausgeklügelte Strategien zusammentreffen. Die Programme stammen von vielen Personen aus unterschiedlichen Fachbereichen, darunter Mathematiker, Informatiker, Sozialwissenschaftler, Wirtschaftswissenschaftler und Psychologen. Es zeigte sich, dass sich in einem iterierten Gefangenendilemma kooperative Strategien durchsetzen.

Es stellte sich heraus, dass eine sehr einfache Strategie beide Male am erfolgreichsten war: Tit for Tat, gewann beide Wettbewerbe und bekam insgesamt, summiert über alle Spiele eines Turniers, die meisten Punkte. Tit for Tat setzte sich gegen komplexe, teilweise stochastische Verfahren, darunter Strategien, die trickreich versuchten, die anderen zu übertölpeln, durch. Tit for Tat besteht darin, beim ersten Zusammentreffen mit einem anderen Spieler zu kooperieren und in allen weiteren Runden dann stets dessen Verhalten aus der Runde davor nachzuahmen.

Axelrods Experiment liegen idealisierende Annahmen zu Grunde:

  • Alle Spieler sind mit den gleichen Ressourcen ausgestattet. Abgesehen von der Möglichkeit, in den einzelnen Spielrunden zu kooperieren oder zu verweigern, haben sie keine Möglichkeit, anderen Mitspielern Belohnungen zukommen zu lassen oder Repressalien auszuüben.
  • Abgesehen von der bisherigen Geschichte ihrer Interaktion in den vorangegangenen Spielrunden wissen die Spieler nichts voneinander.

Diese Annahmen mögen weltfremd erscheinen. Es gibt jedoch eine ganze Reihe von realen Situationen, in denen sich dieses Mehrrunden-Gefangenendilemma wiederfindet. Im Kern tritt es immer dann auf, wenn eine Gruppe von Personen die Wahl hat, eine gemeinsame Ressource zum maximalen Eigennutz auszubeuten – oder sich zwecks Maximierung des gemeinsamen, nachhaltigen Nutzens zurückzuhalten. Axelrods Arbeit wurde deshalb zur Grundlage einer großen Anzahl weiterer Forschungsarbeiten in den Sozial-, Politik- und Rechtswissenschaften.

Die Analyse der beiden Wettbewerbe ergab folgende Bedingungen für eine erfolgreiche Strategie:

  1. Die Strategie muss freundlich sein, das heißt: Niemals als Erste nicht kooperieren (defektieren)! Alle Strategien, die niemals als Erste defektierten (nicht kooperierten), befanden sich auf den vorderen Plätzen.
  2. Die Strategie muss schlagkräftig sein und nicht nachtragend, das heißt, eine Defektion des Gegners mit einer eigenen Defektion zurückzahlen können und dann wieder kooperieren. Dies ist wichtig, um nicht ausgenutzt zu werden. Die Strategie muss aus den Handlungen des Gegners lernen und sich dessen Züge merken können. Um nicht in einem unendlichen Echo der gegenseitigen Defektion zu enden, sollte der Rückschlag deutlich, aber deeskalierend sein.
  3. Die Strategie darf nicht neidisch sein! Wenn die Strategie niemals zuerst defektiert, kann sie immer nur genauso gut wie der Gegner werden und niemals besser. Indem sie gegnerische Defektionen beantwortet, hinkt sie sogar immer einen Schritt hinterher und hat am Schluss ein paar Punkte weniger. Beim Versuch, diesen Rückstand aufzuholen, wird der Weg der besten Strategie verlassen, man schneidet insgesamt schlechter ab!
    Das heißt konkret, dass Tit for Tat den Wettbewerb nicht gewinnt, weil es eine hohe Zahl von Einzelsiegen erringt, sondern weil Tit for Tat zwar im Gegenteil im direkten Duell recht einfach zu besiegen ist und somit eher wenige Duelle gewinnt, dafür diese Niederlagen aber mit hohen Punktzahlen einhergehen.
  4. Sei nicht zu raffiniert, das heißt, die Strategie muss für den Gegner durchschaubar sein, damit er sich auf sie einstellen kann und nicht glaubt, es sei eine zufällige Strategie (Random hat nicht besonders gut abgeschnitten).
  5. Jede Strategie funktioniert nur, wenn die Wahrscheinlichkeit eines zukünftigen Spiels und damit von zukünftigem Gewinn ausreichend hoch ist. Ist diese Wahrscheinlichkeit zu klein, ist es immer besser zu defektieren und den jetzigen Gewinn zu sichern. Wer Kooperation mit seinem Gegner möchte, muss also für eine ausreichend häufige und ausreichend sichere Wiederkehr des Spiels sorgen.

Von allen zum Wettbewerb eingesandten Strategien erfüllte Tit for Tat diese Bedingungen am besten. Ein Nachteil ergibt sich aus den nicht deeskalierend ausgeführten Rückschlägen von Tit for Tat, wodurch diese Strategie nicht fehlerrobust ist. Interpretiert ein Spieler das kooperative Verhalten seines Mitspielers fälschlich als Defektion, dann dauert die gegenseitige Defektion an, obwohl beide Parteien im Grunde auf Kooperation ausgerichtet sind. In der Politik können solche Missverständnisse beispielsweise zum Wettrüsten wider Willen, zu wechselseitigen Handelsembargos oder anderen krisenhaften Entwicklungen führen. Aber nicht nur Missverständnisse, sondern auch das übertriebene Ausspielen von Tit for Tat kann dazu führen, dass auf Defektion immer wieder Defektion folgt, was zu einer kaum Gewinn bringenden Kette führen würde.

Abhilfe kann dadurch geschehen, dass nach zufälliger, d. h. für den Gegner nicht abschätzbarer Anzahl Wiederholungen spontan einseitig Kooperation gespielt wird, um den Kreislauf der Konfrontation zu durchbrechen, was Tit for Tat allerdings nicht vorsieht.

Natürlich ist die Wirklichkeit etwas komplizierter als das von Axelrod konzipierte Spiel. Die tatsächliche Welt muss auch einmalige Spiele beachten, mit Fremden, und hat gleichzeitig nicht nur das Ziel, eine bestimmte Ressource anzuhäufen, sondern benötigt eine Vielzahl verschiedener Ressourcen, die auch nicht gleichmäßig verteilt sind und bei denen Monopole bestehen. Es gibt wesentlich mehr Handlungsptionen, von Gewalt bis hin dazu andere mittels Kooperationen auszuschließen. Und dann kommen noch Verwandte dazu, dann der Wunsch als attraktiver Partner zu erscheinen und viele viele andere Punkte, nicht zuletzt

Dennoch gibt es denke ich ein gutes Grundmodell wieder, welches einem erlaubt die evolutionäre Entstehung nachzuvollziehen.

Vieles in unserem Verhalten lässt sich in diesem Licht verstehen, insbesondere viele unserer Emtionen und unser Sozialverhalten. Wir haben ein starkes Bedürfnis als jemand angesehen zu werden, der fair ist, der die Gruppe nicht ausnutzt, der sich auch nicht ausnutzen lässt, der Potential für eine Zusammenarbeit mit wichtigen Leuten hat. Wir sind entsetzt, wenn jemand, den wir zu unserem Freundeskreis zählen nicht gibt oder gar sich eigene Vorteile zuschustert, womöglich noch zu Lasten der Gruppe. Viele dieser Emotionen entstehen dabei nicht rational, sondern eben unterbewußt, als Teil unserer unterbewußten Programmierung.

 

Die Evolution der Fairness: Primaten und Fairness

Ein Spiegelartikel berichtet über Fairness bei Schimpansen:

Im Experiment saßen jeweils zwei Schimpansen oder Bonobos in benachbarten Käfigen. Zwischen ihnen lag in einer speziellen Apparatur ein Tablett mit Weintrauben, aufgeteilt in zwei faire Portionen. „Ein Affe konnte dem anderen einige Trauben klauen, indem er das Papier, auf dem die Trauben lagen, zu sich zog“, erklärt Ingrid Kaiser, Mitautorin der Studie. Anschließend musste der bestohlene Affe an einem Stab ziehen, damit beide Tiere mit den Fingern an die Trauben heran kamen. „Der stehlende Affe war also auf die Mithilfe seines Artgenossen angewiesen, um sein Diebesgut fressen zu können.“

Ergebnis: Die Affen ließen keine Chance aus, ihre Traubenration aufzubessern – und die benachteiligte Mitspieler gaben die ungerecht verteilten Rationen in der Regel frei. Weder Schimpansen noch Bonobos kümmert es offenbar, ob Futter in einer Gruppe fair aufgeteilt wird, solange sie denn überhaupt etwas bekamen.

Eigentlich durchaus logisch. Gibt der Affe das Essen nicht frei, dann erhält er gar nichts. Bestrafen erfordert dagegen ein etwas höheres Denkvermögen, das darauf abstellt, dass nur Strafe den anderen von einem solchen unfairen Verhalten abschreckt.

Menschen, so der Spiegelartikel, neigen eher dazu zu strafen.

Der Originalartikel fasst das ganze so:

Humans, but not chimpanzees, punish unfair offers in ultimatum games, suggesting that fairness concerns evolved sometime after the split between the lineages that gave rise to Homo and Pan. However, nothing is known about fairness concerns in the other Pan species, bonobos. Furthermore, apes do not typically offer food to others, but they do react against theft. We presented a novel game, the ultimatum theft game, to both of our closest living relatives. Bonobos and chimpanzee ‘proposers’ consistently stole food from the responders‘ portions, but the responders did not reject any non-zero offer. These results support the interpretation that the human sense of fairness is a derived trait.

Quelle: Theft in an ultimatum game: chimpanzees and bonobos are insensitive to unfairness

Es gibt jedoch auch andere Forschung, die anderen Affen einen gewissen Sinn für so etwas zubilligt:

In the game, each of a pair of monkeys would hand a small granite rock to a human in exchange for a reward, either a cucumber slice or the more preferable grape.

When both monkeys received cucumber rewards, all was fine in primate land. But when one monkey handed over the granite stone and landed a grape, while monkey No. 2 got a cucumber, madness ensued.

„They would literally take the cucumber from me and then drop it on the ground or throw it on the ground, or when I offered it to them they would simply turn around and refuse to accept it,“ Brosnan told LiveScience.

Further experiments ruled out greed or frustration as forces driving the capuchin monkeys to react negatively to a cucumber reward.

De Waal hat auch ein interessantes Video zu dem Experiment:

Und noch etwas ausführlicher zu der Evolution der Moral: