Nash-Gleichgewicht

Das Nash-Gleichgewicht (abgekürzt als NGG oder NGGW) ist ein zentraler Begriff der Spieltheorie. Es beschreibt in nicht-kooperativen Spielen eine Kombination von Strategien, wobei jeder Spieler genau eine Strategie wählt, von der aus es für keinen Spieler sinnvoll ist, von seiner gewählten Strategie als einziger abzuweichen. In einem Nash-Gleichgewicht ist daher jeder Spieler auch im Nachhinein mit seiner Strategiewahl einverstanden, er würde sie wieder genauso treffen. Die Strategien der Spieler sind demnach gegenseitig beste Antworten. Das Nash-Gleichgewicht ist ein elementares Lösungskonzept der Spieltheorie. Definition und Existenzbeweis des Nash-Gleichgewichts gehen auf die 1950 veröffentlichte Dissertation des Mathematikers John Forbes Nash Jr. zurück.^[1] Das Nash-Gleichgewicht hat u. a. eine zentrale Bedeutung in wirtschaftswissenschaftlichen Bereichen wie der Mikroökonomie, bei der Verteilung von Gütern und der Preisfindung.

Idee

Das wesentliche Ziel der mathematischen Spieltheorie ist es, für Konflikt-, aber auch für Kooperationssituationen rationale Entscheidungen zu charakterisieren und zu bestimmen. Die Schwierigkeit dabei ist, dass keiner der Entscheider („Spieler“) weiß, welche Pläne die anderen Spieler verfolgen und wie sie sich dementsprechend entscheiden werden. Damit ist es für einen einzelnen Spieler ungewiss, wie sich seine konkrete Entscheidung für einen Handlungsplan („Strategie“) auswirken wird. Er kann aber die Situation aus der Sicht der anderen Spieler durchdenken, um eine Erwartung zu bilden, was diese tun werden.

Dem Nash-Gleichgewicht liegt nun die folgende Idee zugrunde: Man geht von allen möglichen Kombinationen aus, die für jeden Spieler eine Strategie beinhalten. Eine solche Strategie-Kombination heißt Nash-Gleichgewicht, wenn ihr eine gewisse Stabilität unterstellt werden kann, aufgrund der Tatsache, dass kein einzelner Spieler einen Anreiz besitzt, von seiner Strategie abzuweichen. Formal bedeutet dies, dass sich die Auszahlung an denjenigen Spieler, der seine Strategie als Einzelner ändert, aufgrund dieser Änderung nicht erhöhen darf.

Definition

Ein Nash-Gleichgewicht ist ein Strategienpaar (bzw. bei mehr als zwei Spielern ein Strategien-Tupel), bei dem es sich für keinen Spieler auszahlt, einseitig (alleine) von seiner Strategie abzuweichen. Strategisch aus der Sicht eines Spielers betrachtet bedeutet dies: Ich tue das Beste, was ich kann, unter Berücksichtigung dessen, was du tust; du tust, unter Berücksichtigung dessen, was ich tue, das Beste, was du tun kannst.

Bei der Untersuchung von Nash-Gleichgewichten können drei Arten von Strategien unterschieden werden: dominante Strategien, reine Strategien und gemischte Strategien. Es ist zu beachten, dass bei einigen Spielen kein Nash-Gleichgewicht existiert, wenn nur reine Strategien zum Einsatz kommen. Beim Einsatz gemischter Strategien gibt es dagegen stets ein oder mehrere Gleichgewichte, wenn von endlich vielen reinen Strategien ausgegangen wird.

Dominante Strategien: Was ein Spieler tut, ist das Beste für ihn, ganz unabhängig davon, was die anderen tun. Solche dominanten Strategien existieren eher selten, da es meist von den Entscheidungen anderer abhängt, was für einen Spieler das Beste ist. Mitunter – etwa im Gefangenendilemma – hat aber jeder Spieler eine dominante Strategie, die dann ein sogenanntes Gleichgewicht in dominanten Strategien konstituieren.

Reine Strategien: Der Spieler trifft eine ganz bestimmte Entscheidung.

Gemischte Strategien: Der Spieler trifft eine zufällige Entscheidung zwischen zwei oder mehr möglichen Handlungsmöglichkeiten (den reinen Strategien), aber mit bestimmten Wahrscheinlichkeiten für die reinen Strategien.

Formale Definition bei unterschiedlichen Strategien

Nash-Gleichgewicht in reinen Strategien

Es bezeichne $\Sigma _{i}$ die Menge der Strategien (Handlungsalternativen) des $i$ -ten Spielers und $\Sigma :=\Sigma _{1}\times \dotsb \times \Sigma _{n}$ das kartesische Produkt dieser Strategienmengen.

Unter einem Nash-Gleichgewicht in reinen Strategien versteht man ein Strategieprofil $\sigma ^{*}=(\sigma _{1}^{*},\dotsc ,\sigma _{n}^{*})\in \Sigma$ , bei dem die Strategie jedes Spielers $i$ eine beste Antwort auf die gewählten Strategien der anderen Spieler ist. Wenn alle anderen Spieler an ihren gewählten Strategien festhalten, so ist das Nash-Gleichgewicht bei reinen Strategien formal dadurch gekennzeichnet, dass es für Spieler $i$ also kein $\sigma _{i}\neq \sigma _{i}^{*}$ gibt, das dem Spieler $i$ eine höhere Auszahlung verspricht:

\forall \sigma _{i}\in \Sigma _{i}:u_{i}(\sigma _{1}^{*},\dotsc ,\sigma _{i}^{*},\dotsc ,\sigma _{n}^{*})\geq u_{i}(\sigma _{1}^{*},\dotsc ,\sigma _{i},\dotsc ,\sigma _{n}^{*})

.

Man sagt auch, dass Spieler $i$ seine Auszahlung durch ein einseitiges Abweichen nicht verbessern kann. Ein Nash-Gleichgewicht zeichnet sich damit dadurch aus, dass sich kein Spieler durch eine einseitige Änderung seiner Strategie verbessern kann. Besteht ein Nash-Gleichgewicht nur aus dominanten Strategien, bezeichnet man es außerdem als striktes Gleichgewicht.

Nash-Gleichgewicht in gemischten Strategien

In manchen Fällen lässt man zu, dass die Spieler sich nicht auf eine bestimmte Strategie festlegen, sondern auf eine Wahrscheinlichkeitsverteilung, mit der die $\sigma _{i}$ aus $\Sigma _{i}$ zufällig gezogen werden. Ist $\Sigma _{i}$ endlich oder zumindest abzählbar, so kann die Wahrscheinlichkeitsverteilung durch einen Vektor $s_{i}$ beschrieben werden, wobei $s_{i,j}$ die Wahrscheinlichkeit ist, dass die Strategie $\sigma _{i,j}\in \Sigma _{i}$ gewählt wird.

Die gemischte Strategie $s=(s_{1}^{*},\dotsc ,s_{n}^{*})$ ist genau dann ein Nash-Gleichgewicht, wenn kein Spieler durch alleiniges Abweichen eine bessere Auszahlung erreichen kann, das heißt genau dann, wenn

\forall i\in \{1,\dotsc ,n\}\;\;\forall s_{i}\in S_{i}\;\;u_{i}(s_{1}^{*},\dotsc ,s_{i-1}^{*},s_{i},s_{i+1}^{*},\dotsc ,s_{n}^{*})\leq u_{i}(s_{1}^{*},\dotsc ,s_{i-1}^{*},s_{i}^{*},s_{i+1}^{*},\dotsc ,s_{n}^{*})

.

Ein Nash-Gleichgewicht in gemischten Strategien kennzeichnet sich dadurch, dass jede Strategie, die als Teil eines Gleichgewichtes gespielt wird, die gleiche erwartete Auszahlung aufweist.

Existenz

Mit Hilfe des Fixpunktsatzes von Kakutani kann man zeigen, dass mindestens ein Nash-Gleichgewicht existieren muss, wenn folgende Voraussetzungen erfüllt sind:

Die Auszahlungsfunktionen $H_{i}(\sigma _{1},\ldots ,\sigma _{n})$ sind stetig und quasikonkav in $\sigma _{i}$ .
Die Strategiemengen $\Sigma _{1},\ldots ,\Sigma _{n}$ sind konvex und kompakt.

Häufig werden Spiele so konstruiert, dass die $\Sigma _{i}$ endlich sind, endliche Mengen mit mehr als einem Element können jedoch nicht konvex sein. Allerdings ist in diesem Falle die Menge der gemischten Strategien $S_{i}$ über $\Sigma _{i}$ kompakt und konvex und die entsprechende Erweiterung von $H$ multilinear. Während die Existenz eines Nash-Gleichgewichtes in reinen Strategien also nicht garantiert werden kann, existiert mindestens ein Nash-Gleichgewicht bei einem Spiel in gemischten Strategien (wenn von endlich vielen reinen Strategien ausgegangen wird).

Ein einfacher Algorithmus zur Identifizierung von Nash-Gleichgewichten

Liegt ein Spiel in strategischer Form vor, so lassen sich alle Nash-Gleichgewichte in reinen Strategien durch folgenden Algorithmus bestimmen:

Optimiere die Entscheidung von Spieler $i=1,\dotsc ,n$ bei (beliebig) fixierten Strategien aller anderen Spieler: Markiere die unter diesen Umständen erreichbaren höchsten Auszahlungen für Spieler $i$ (die sog. „besten Antworten“ auf die Strategiekombination der anderen Spieler). Wiederhole dies für alle möglichen Strategiekombinationen der anderen Spieler.
Führe 1. für alle Spieler durch.

Dann sind genau die Strategiekombinationen Nash-Gleichgewichte, bei denen die Auszahlungen für alle Spieler markiert sind. Wenn es keine Strategiekombination gibt, die für alle Spieler markiert ist, hat das Spiel auch kein Nash-Gleichgewicht in reinen Strategien. - Diese Vorgehensweise eignet sich nur für eine geringe Anzahl von Spielern und Strategien.

Beispiel

Sei folgendes Spiel in Normalform gegeben:

	links	Mitte	rechts
oben	4, 2	1, 1	2, 0
Mitte	2, 3	1, 1	1, 4
unten	3, 0	0, 2	1, 3
Auszahlungbimatrix für Spieler 1 und Spieler 2

Dann funktioniert der Algorithmus wie folgt (Markierung durch Fetten):

$i=1:$
- gegeben Spieler 2 spielt Rechts: Für Spieler 1 ist oben optimal – markiere die 2 („Oben ist beste Antwort auf Rechts“)
- gegeben Spieler 2 spielt Mitte: oben und Mitte ist optimal – markiere die beiden 1en
- gegeben Spieler 2 spielt Links: oben ist optimal – markiere die 4

$i=2:$
- gegeben Spieler 1 spielt oben: Für Spieler 2 ist Links optimal – markiere die 2
- gegeben Spieler 1 spielt Mitte: Rechts ist optimal – markiere die 4
- gegeben Spieler 1 spielt unten: Rechts ist optimal – markiere die 3

Das einzige Nash-Gleichgewicht ist also das Strategiepaar (oben, links), das zur Auszahlung (4, 2) führt.

Falls zu überprüfen ist, ob ein Tupel von gemischten Strategien ein Nash-Gleichgewicht ist, funktioniert obiger Algorithmus nur bedingt, da eine unendliche Anzahl an gemischten Strategien überprüft werden müsste. Alternativ lässt sich das Spiel auch mit iterativer Eliminierung strikt dominierter Strategien lösen.

Ein Algorithmus zur Identifizierung von Nash-Gleichgewichten in gemischten Strategien

Bei der Identifizierung von Nash-Gleichgewichten in gemischten Strategien ist es hilfreich, diejenigen gemischten Strategien zu identifizieren, die den Gegenspieler indifferent zwischen seinen Handlungsalternativen machen. Ist solch eine Strategie gefunden, sind alle Handlungen des Gegners beste Antworten. Treffen solche gemischten Strategien aufeinander, so sind sie folglich wechselseitig beste Antworten, es besteht kein Grund zum einseitigen Abweichen, und die gemischten Strategien bilden ein Nash-Gleichgewicht.

Für beliebige Zwei-Personen-Nullsummenspiele mit endlicher Strategiemenge (Matrix-Spiel) kann die Bestimmung von Nash-Gleichgewichten in gemischten Strategien als lineares Optimierungsproblem dargestellt werden, das sich mit Hilfe des Simplex-Algorithmus lösen lässt.

Beispiel

Gegeben sei die folgende Bimatrix:

	Oper	Fußball
Oper	3, 2	2, 3
Fußball	1, 3	4, 1
Auszahlungsmatrix für Spieler 1 und Spieler 2

Dann funktioniert der Algorithmus wie folgt:

Spielt Spieler 2 mit einer Wahrscheinlichkeit von $q$ Oper und mit der Gegenwahrscheinlichkeit von $(1-q)$ Fußball, so ergeben sich für Spieler 1 folgende Erwartungsnutzen (Expected Utility):

\operatorname {E} [U_{1}(O)]=3q+2(1-q)

\operatorname {E} [U_{1}(F)]=1q+4(1-q)

Spieler 1 ist also indifferent zwischen seinen beiden Strategien, wenn

${\begin{array}{cl}&3q+2(1-q)\;=\;1q+4(1-q)\\\Leftrightarrow &3q+2-2q\;=\;1q+4-4q\\\Leftrightarrow &1q+2\;=\;4-3q\\\Leftrightarrow &4q\;=\;2\\\Leftrightarrow &q\;=\;1/2\end{array}}$

Für Spieler 2 lässt sich analog ermitteln, dass er indifferent ist, wenn Spieler 1 mit einer Wahrscheinlichkeit von $p=2/3$ Oper und mit $(1-p)=1/3$ Fußball spielt.

Da auf diese beiden Strategien alle Antworten des Gegenspielers beste Antworten sind, sind sie speziell jeweils auch wechselseitig beste Antworten. Somit kann $[(2/3;1/3),(1/2;1/2)]$ als Nash-Gleichgewicht in gemischten Strategien identifiziert werden.

Spezialfälle

Ein Spezialfall von Nashs Existenzsatz für Gleichgewichte ist das für Zwei-Personen-Nullsummenspiele gültige Min-Max-Theorem, das 1928 durch John von Neumann bewiesen wurde. Anders als im allgemeinen Fall entspricht dabei jedem Spiel ein eindeutiger Auszahlungsvektor $(v,-v)$ , wobei $v$ der Wert des Spieles heißt.

Für Zwei-Personen-Nullsummenspiele mit perfekter Information, zu denen Brettspiele wie Schach und Mühle gehören, existiert sogar immer ein Minimax-Gleichgewicht in reinen Strategien, das mit dem Minimax-Algorithmus rekursiv bestimmt werden kann. Dieser Satz wurde bereits 1912 von Ernst Zermelo bewiesen.

Praxisbeispiele

Marktwirtschaft

Strategiefindung basierend auf Nash-Gleichgewichten lassen sich auf Preise und Mengen gleichermaßen anwenden. In der Marktwirtschaft ist eine Situation denkbar, bei der mehrere Anbieter in einem Markt die Preise ihrer konkurrierenden Produkte so weit gesenkt haben, dass sie gerade noch wirtschaftlich arbeiten. Für den einzelnen Anbieter wäre eine ausweichende Strategie nicht möglich: Senkt er seinen Preis, um seinen Absatz zu erhöhen, fällt er unter die Wirtschaftlichkeit; erhöht er ihn, werden die Käufer auf die Konkurrenzprodukte ausweichen und sein Gewinn sinkt ebenfalls. Ein Ausweg kann nun etwa darin bestehen, (beinahe) gleichzeitig mit einem Konkurrenten eine Produktinnovation einzuführen, um damit einen höheren Preis zu begründen. Unter dem Begriff Coopetition wurden derartige Szenarien Mitte der 1990er breiter diskutiert, wobei vor allem die Auseinandersetzung zwischen den US-amerikanischen Fluglinien als markantes Beispiel zitiert wurde.

Gefangenendilemma

Ein weiteres Beispiel ist das Gefangenendilemma, ein spieltheoretisches Problem, bei dem genau ein Nash-Gleichgewicht existiert.

	gesteht	gesteht nicht
gesteht	-5, -5	-1, -10
gesteht nicht	-10, -1	-2, -2
Auszahlungsmatrix für Spieler 1 und Spieler 2

Hierzu stelle man sich folgende Situation vor: Zwei Gefangene werden verdächtigt, gemeinsam eine Straftat begangen zu haben. Die Höchststrafe für das Verbrechen beträgt 10 Jahre Haft. Beiden Gefangenen wird nun ein Handel angeboten, worüber auch beide informiert sind. Wenn einer allein gesteht (Kronzeuge) und somit seinen Partner mitbelastet, bekommt er eine milde Strafe von 1 Jahr Haft – der andere muss die vollen 10 Jahre absitzen. Entscheiden sich beide zu schweigen, bleiben nur Indizienbeweise, die aber ausreichen, um beide für 2 Jahre einzusperren. Gestehen aber beide die Tat, erwartet jeden eine Gefängnisstrafe von 5 Jahren. Nun werden die Gefangenen unabhängig voneinander befragt. Weder vor noch während der Befragung haben die beiden die Möglichkeit, sich untereinander abzusprechen.

Zwar ist es optimal für die beiden Gefangenen, wenn sie beide schweigen. Diese Strategie-Kombination ist aber nicht stabil, weil sich ein einzelner Gefangener durch ein Geständnis einen Vorteil für sich verschaffen kann. Stabil im Sinne eines Nash-Gleichgewichtes ist die Strategie-Kombination, bei der beide Gefangene gestehen: Dann kann sich kein einzelner durch ein Schweigen einen Vorteil verschaffen, so dass ein Nash-Gleichgewicht vorliegt. Dieses Nash-Gleichgewicht liefert aber für beide Gefangene schlechtere Ergebnisse als das beidseitige Schweigen, das nur durch Kooperation fixierbar ist. Anders gesagt: Das Nash-Gleichgewicht im Gefangenendilemma ist nicht Pareto-optimal, da sich beide Spieler zusammen dagegen verbessern können.

Siehe auch

Eine Vielzahl verwandter Konzepte finden sich unter Gleichgewicht (Spieltheorie)

Weblinks

Wiktionary: Nash-Gleichgewicht – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Minimax-Strategie in der Praxis: Einfaches Zwei-Personen-Bluffspiel gegen den Computer

Einzelnachweise

↑ John Forbes Nash: Non-cooperative games. Dissertation, Princeton University 1950 (Online-Version; PDF; 1,2 MB).

[1] John Forbes Nash: Non-cooperative games. Dissertation, Princeton University 1950 (Online-Version; PDF; 1,2 MB).

[1]