Arrow-Theorem

Satz der Sozialwahltheorie
(Weitergeleitet von Arrow-Paradox)

Das von dem Ökonomen Kenneth Arrow formulierte und nach ihm benannte Arrow-Theorem (auch Arrow-Paradoxon oder Allgemeines Unmöglichkeitstheorem (nach Arrow) genannt) ist ein Satz der Sozialwahltheorie. Er besagt, dass es keine vollständige und transitive gesellschaftliche Rangordnung gibt, die sich aus beliebigen individuellen Rangordnungen unter Einhaltung bestimmter – aus ethischen oder methodologischen Gründen naheliegender – Bedingungen zusammensetzt. Voraussetzung ist lediglich, dass die Präferenzordnung jedes Individuums mindestens drei Elemente (Objekte) enthält. Die vier Bedingungen, von denen in diesem Fall stets mindestens eine verletzt ist, sind üblicherweise unter den Bezeichnungen Universalität, schwaches Pareto-Prinzip, Unabhängigkeit von irrelevanten Alternativen und Nicht-Diktatur bekannt.

Das Theorem wurde von Arrow zuerst in seiner Dissertation formuliert, die 1951 unter dem Titel „Social Choice and Individual Values“ als Buch erschienen ist. Die Arbeit entstand aus den Diskussionen der an Pareto-Effizienz orientierten Wohlfahrtsökonomik (welfare economics), deren Begriffe und Methoden Arrow verwendet. In seiner ursprünglichen Fassung enthielt das Theorem allerdings einen Fehler, auf den 1957 erstmals Julian Blau hingewiesen hat,[1] was Arrow später zur Vorlage einer revidierten Version bewog. Im Folgenden wird das Theorem in seiner korrigierten Fassung dargestellt.

Darstellung

Bearbeiten

Grundlegend für das Arrow-Theorem ist die Annahme, dass Individuen aus einer Reihe von Alternativen wählen können; dabei kann es sich beispielsweise um verschiedene Parteien in einer politischen Wahl handeln. Hinsichtlich dieser Alternativen verfügen die Individuen über Präferenzrelationen, an die die (Minimal-)Voraussetzung zu stellen ist, dass sie jeweils i) vollständig und ii) transitiv sind. Eigenschaft i) bedeutet, dass für zwei Alternativen A und B jeder einzelne auch tatsächlich ein Ranking vornehmen können muss: Stets ist er in der Lage, zwischen zwei beliebigen Alternativen A und B zu entscheiden, ob A für ihn besser, schlechter oder gleichwertig mit B ist. Unter Eigenschaft ii) ist zu verstehen, dass ein Haushalt, der A mindestens so gut findet wie B und B wiederum mindestens so gut findet wie C, auch A mindestens so gut wie C findet. i) und ii) vorausgesetzt, muss die Wahl des Individuums dann auch tatsächlich auf Basis der Präferenzordnung erfolgen, sodass ein Individuum, das zwischen einer gewissen Menge an Alternativen entscheiden muss, auch tatsächlich diejenige vorzieht, die nach der Präferenzrelation „besser“ als die anderen bewertet wird.

Der Gegenstand des Theorems ist sodann das Verhältnis zwischen dem Wollen von Individuen und der gesellschaftlichen Entscheidung. Hierzu schreibt Arrow: „Wir fragen, ob es formal möglich ist, ein Verfahren zu entwerfen, um ausgehend von einer Menge gegebener individueller Präferenzen zu einer strukturierten sozialen Entscheidung zu gelangen, wobei von dem betreffenden Verfahren gefordert wird, dass es bestimmte naheliegende Bedingungen (natural conditions) erfüllt.“ Ein solches Verfahren, individuelle Präferenzordnungen in gesellschaftliche Rangordnungen zu transformieren, bezeichnet man als Gesellschaftliche Wohlfahrtsfunktion nach Arrow. Diese weist jedem Vektor von (vollständigen und transitiven) Präferenzordnungen von Individuen – in einer Gesellschaft aus zwei Personen kann dieser beispielsweise aus den Elementen „Person 1 präferiert A vor B und B vor C“ und „Person 2 präferiert B vor C und C vor A“ bestehen – eine (wiederum vollständige und transitive) gesellschaftliche Rangordnung zu.

Das Arrow-Theorem besagt, dass keine solche gesellschaftliche Wohlfahrtsfunktion existieren kann, die gleichzeitig alle folgenden Eigenschaften erfüllt:[2]

  • U (universality / Universalität): Die Wohlfahrtsfunktion ist für alle erdenklichen individuellen (vollständigen und transitiven) Präferenzordnungen geeignet.
  • I (independence / Unabhängigkeit): Für das gesellschaftliche Ranking von zwei Alternativen A und B sind ausschließlich die Präferenzen der Individuen bezüglich dieser beiden Alternativen relevant. (Anders ausgedrückt: Will man wissen, wie die Gesellschaft zwei Alternativen A und B bewertet, ist es nicht nötig, die kompletten Präferenzordnungen der Individuen zu betrachten, sondern es genügt, von jedem zu erfragen, wie er A und B bewertet.)
  • M (monotonicity / Monotonität): Wenn die Wohlfahrtsfunktion der Alternative A gesellschaftlich den Vorzug vor B gibt, dann darf sich diese Rangordnung nicht dadurch verändern, dass einige Individuen ihre Präferenzordnungen so modifizieren, dass sie nunmehr A noch besser als bislang bewerten, während gleichzeitig niemand A schlechter als bisher bewertet.
  • N (non-imposition, auch citizen sovereignty): Jede gesellschaftliche Rangordnung ist durch mindestens eine Menge von individuellen Rangordnungen erreichbar.
  • D (non-dictatorship / Nicht-Diktatur): Es gibt keinen Diktator, dessen individuelle Präferenzordnung zugleich die gesellschaftliche Rangordnung darstellt.

Liegen mindestens zwei Individuen und mindestens drei Entscheidungsvarianten vor, so existiert kein Mechanismus, der aus den individuellen Entscheidungen eine kollektive Entscheidung ableiten könnte, die allen fünf Axiomen genügt. Anders formuliert: Es verstößt jeder Mechanismus, der aus den individuellen Entscheidungen eine kollektive Entscheidung ableitet und vier der Axiome erfüllt, gegen das verbleibende Axiom. Für einen entsprechenden kollektiven Entscheidungsmechanismus muss also eine der Bedingungen verändert oder fallengelassen werden.

Die Bedingungen M und N können durch eine einzige Bedingung P ersetzt werden, ohne die Gültigkeit des Theorems einzuschränken:

  • P (schwaches Pareto-Prinzip): Wenn jede Person in ihrer Präferenzordnung die Alternative A strikt B vorzieht, so gilt dies auch auf gesellschaftlicher Ebene.

Formale Darstellung

Bearbeiten

Sei   die Menge aller möglichen gesellschaftlichen Allokationen, dann ist das kartesische Produkt   die Menge aller geordneten Tupel  ,  .   sei eine binäre Relation auf  , und es wird vereinbart, dass   alternativ   geschrieben werden kann. Voraussetzung an   ist dabei, dass die Relation

  1. vollständig ist, das heißt, dass   oder   (oder beides),
  2. und dass sie transitiv ist, also für alle   gilt, dass  .

In der resultierenden Ordnung interpretiert man   in der Schreibweise   nun salopp als „ist besser als oder gleich gut wie“ (Präferenz-Indifferenz-Relation). Zugleich induziere   die Relationen   („ist strikt besser als“; Präferenz-Relation), wobei   genau dann, wenn  , aber nicht  , sowie   („ist gleich gut wie“; Indifferenzrelation), wobei   genau dann, wenn   und zugleich  .

Sei  ,   eine individuelle Präferenzordnung einer Person   aus einer Gesellschaft von   Mitgliedern (  und   analog definiert). Sei weiter   die Menge aller möglichen gesellschaftlichen Rangordnungen und   die Menge aller möglichen individuellen Präferenzordnungen. Dann ist   eine gesellschaftliche Wohlfahrtsfunktion.

Theorem von Arrow (1951, 1963): Sei   endlich und  . Dann existiert keine Funktion  , die gleichzeitig die Eigenschaften i) U, I, M, N und D oder ii) U, I, P und D erfüllt.

Formaler Nachtrag zu den oben postulierten Eigenschaften:[3]

  • I: Seien   Alternativen. Wenn nun für alle   gilt, dass sich in keiner individuellen Präferenzordnung   das relative Ranking von   und   nach einer Abwandlung von   in   ändert, dann ändert sich das Ranking bezüglich   und   auch nicht beim Übergang von   zur neuen gesellschaftlichen Wohlfahrtsordnung  .
  • M: Für alle Tupel   und   gilt für eine gegebene Alternative  : Wenn für alle   und für alle   gilt, dass zum einen   und zum anderen   sowie  , dann  .
  • N: Es gibt keine zwei Alternativen  ,  , sodass für beliebige Präferenztupel  .
  • P: Seien  ,   Alternativen:  .[4]
  • D: Es gibt kein Individuum  , sodass für alle  ,   gilt, dass  , ungeachtet der Präferenzordnungen der anderen Individuen außer  .

Im Folgenden soll ein illustrativer Beweis des Theorems skizziert werden, der demjenigen von Geanakoplos (1996, 2005) und dessen Darstellung in Jehle/Reny (2011[5]) folgt.[6] Die Strategie ist dabei in der Grundidee identisch zu der im originalen Beweis von Arrow (1951): Es wird gezeigt, dass unter den Voraussetzungen des Theorems die Annahme von U, I und P unmittelbar dazu führt, dass die Wohlfahrtsfunktion gegen die Nicht-Diktatur-Annahme D verstößt. Folglich kann es keine Wohlfahrtsfunktion geben, die alle vier Bedingungen erfüllt.

Man geht zunächst von einer Alternative   aus, die von allen   Personen strikt am wenigsten präferiert wird, d. h.  . Aus P folgt, dass damit auch  . Dies ist in der nachfolgenden Tabelle anhand der beschriebenen Gesellschaft aus   Mitgliedern illustriert (man beachte, dass die dargestellten Präferenzordnungen auch schwach sein können):

(Tabelle 1:)
             
1. Präferenz              
                 
             
n-te Präferenz              

Daraufhin lässt man nacheinander Person   bis   das Ranking von   derart ändern, dass   für den Einzelnen nunmehr strikt vor allen anderen Alternativen präferiert wird (das heißt an die erste Position der Präferenzordnung gestellt wird). Dann gibt es einen Abstimmenden  , dessen Präferenzänderung als erstes dazu führt, dass sich auch das gesellschaftliche Ranking von   verbessert; auf welcher Position dieser Abstimmende ist, ist vom konkreten Wahlverfahren abhängig, spätestens aber muss wegen P gelten, dass die gesellschaftliche Rangordnung bei   umschlägt. Nachfolgend auch hierfür eine Illustration:

(Tabelle 2:)
             
1. Präferenz              
                 
             
n-te Präferenz              

Man zeigt nun, dass bei Person   sich das gesellschaftliche Ranking von   nicht nur verbessert, sondern   sogar notwendigerweise an die Spitze der Wohlfahrtsordnung tritt.

(Widerspruchsbeweis:) Unterstelle, dass bei Person   gilt:  , aber zugleich   für gewisses  ,   – es gebe also noch (mindestens) eine Alternative  , die zumindest schwach besser als   ist. Dann kann man jede individuelle Präferenzordnung dahingehend modifizieren, dass nunmehr  . Dies lässt die Position von   unverändert, denn es steht in jeder individuellen Präferenzordnung ja entweder an erster Stelle oder an letzter. Dies liefert jedoch einen Widerspruch, denn einerseits [1]:
  (wegen P),
aber andererseits [2] hat sich das Ranking von   bezüglich   und   bezüglich   bei keiner Person verändert, weshalb gemäß I auch das gesellschaftliche Ranking von   bezüglich   und   bezüglich   unverändert geblieben sein muss. Daraus folgt, dass weiterhin   und  , was wegen der Transitivitätseigenschaft auch   impliziert – im Widerspruch zu [1].

Man bezeichne zwei weitere Alternativen aus den Präferenzordnungen   und  ,  ,  ,  , wobei entsprechend wieder  . Es gelte nun für Person  , dass  , das heißt, dass sich nun   in der Präferenzordnung von   vor   an die erste Stelle schiebt. Die Präferenzordnungen der anderen Personen können hinsichtlich   und   beliebig umgestellt werden, solange die Position von   unverändert gelassen wird. Unterscheide zur Vereinfachung nun folgende, teilweise schon oben skizzierte Profile:

  • Profil 1 (Vorstufe zu Tabelle 2): Alle Personen bis (aber ohne) Person   präferieren   vor allen anderen Alternativen; für alle anderen (inklusive  ) ist   die schlechteste Alternative.
  • Profil 2 (siehe Tabelle 2): Alle Personen bis (einschließlich) Person   präferieren   vor allen anderen Alternativen; für alle anderen ist   die schlechteste Alternative.
  • Profil 3 (siehe Tabelle 3): Alle Personen bis zu (aber ohne) Person   präferieren   vor allen anderen Alternativen; Person   präferiert   strikt vor   und   strikt vor  ; für die Personen nach   ist   weiterhin die schlechteste Alternative. Jede Person   kann ihr Ranking von   und   beliebig wählen, solange nur die extremen Präferenzen für   (ganz unten oder ganz oben) unverändert gelassen werden.

Im Folgenden sei auch das dritte Profil grafisch visualisiert:

(Tabelle 3:)
             
1. Präferenz              
                 
                 
                 
                 
n-te Präferenz              

Man beachte nun, dass sich Profil 2 und 3 hinsichtlich des relativen Rankings von   und   nicht unterscheiden: Bis einschließlich   präferiert jeder  , alle anderen präferieren  . Da die Wohlfahrtsordnung aber gerade schon mit Person   umschlägt, folgt sowohl für Profil 2 als auch (wegen I) für Profil 3, dass  . Gleichzeitig unterscheiden sich Profil 1 und 3 nicht hinsichtlich des relativen Rankings von   und  : Bis (aber ohne)   präferiert jeder  , alle anderen (einschließlich  ) präferieren  . Da die Wohlfahrtsordnung erst mit Person   umschlägt, folgt sowohl für Profil 1 als auch (wegen I) für Profil 3, dass  .

Damit gilt zusammengefasst   (gem. Transitivitätseigenschaft). Nun wurde aber gezeigt, dass ungeachtet des Rankings aller anderen Personen das Ranking von Person   darüber entscheidet, wie auf gesellschaftlicher Ebene   und   bewertet werden (man könnte   und   ja auch austauschen), dass also mithin   – im Widerspruch zu D.

Beispiele

Bearbeiten

Anhand zweier Wahlverfahren sollen im Folgenden anhand verschiedener Definitionen der Wohlfahrtsfunktion Beispiele für die Anwendung des Arrow-Theorems gegeben werden.

  • Relative Mehrheitswahl: Gewählt ist diejenige Alternative, die von allen zur Abstimmung gestellten Alternativen die meisten Stimmen erhält, wobei jede der   Personen jeweils eine Stimme für ihre Präferenz abgibt.
Man nehme an, dass fünf Personen (1, 2, 3, 4 und 5) über vier Alternativen (A, B, C, D) abstimmen. Die Situation kann beispielsweise wie nachfolgend beschrieben notiert werden, wobei hier zur Vereinfachung unterstellt wird, dass jeder zwischen den vier Alternativen strikte Präferenzen aufweist:
1 2 3 4 5
1. Präferenz B B A D C
2. Präferenz D A C C A
3. Präferenz A D D A D
4. Präferenz C C B B B
Dabei handelt es sich um die Präferenzordnungen der fünf betrachteten Personen; rot unterlegt ist jeweils die Alternative, die der einzelne wählen wird. Daraus ist ersichtlich, dass B insgesamt gewählt werden wird, weil es eine Stimme mehr auf sich vereinen kann als die anderen drei Alternativen, die jeweils auf eine Stimme kommen. Das Wahlverfahren verstößt allerdings gegen die Indifferenzeigenschaft I, wie sofort ersichtlich wird, wenn man die Alternativen A und D aus dem Tableau nimmt; dann nämlich ändert sich – im Verstoß gegen die Bedingung – auch das relative Ranking zwischen B und C.
1 2 3 4 5
1. Präferenz B B C C C
2. Präferenz C C B B B
Die Bedingung U ist hingegen erfüllt, da jedes auf einem Scoring-Protokoll basierende Wahlverfahren eine vollständige und transitive Wohlfahrtsordnung liefert. D ist offensichtlich ebenfalls erfüllt. Das Verfahren verstößt allerdings auch gegen das schwache Pareto-Prinzip P, wie folgendes Szenario (zur Vereinfachung mit nur drei Entscheidungsalternativen) zeigt:
1 2 3 4 5
1. Präferenz A A A A A
2. Präferenz B B B B B
3. Präferenz C C C C C
Die Alternative B wird von allen fünf Personen strikt gegenüber C präferiert, erhält am Ende jedoch dieselbe Stimmenzahl (0) wie C.
  • Condorcet-Methode: Jede Person legt ihre vollständige Präferenzordnung vor. Von zwei bewerteten Alternativen gilt diejenige als gesellschaftlich präferiert, die gegenüber der jeweils anderen von einer größeren Zahl an Individuen vorgezogen wird. Wir unterstellen folgende Präferenzstruktur:
1 2 3
1. Präferenz A B C
2. Präferenz B C A
3. Präferenz C A B
Beim Vergleich von A und B zeigt sich, dass A gesellschaftlich B überlegen ist (wird von Person 1 und 3 bevorzugt). Zugleich ist B besser als C (wird von Person 1 und 2 bevorzugt). C ist wiederum besser als A (wird von Person 2 und 3 bevorzugt).
Erneut handelt es sich offensichtlich nicht um eine Diktatur, sodass D erfüllt ist. Aus dem Verfahren, das auf einem paarweisen Vergleich basiert, wird auch deutlich, dass I erfüllt ist. Dasselbe gilt für P. Wenn jeder eine Alternative A strikt gegenüber B vorzöge, dann stellt der paarweise Vergleich auch sicher, dass A ceteris paribus gewiss B vorgezogen wird. Allerdings verletzt die beschriebene Methode die Universalitätsannahme U. Im oben gewählten Beispiel ist bereits A besser als B, B besser als C, woraus nach der Transitivitätsvoraussetzung folgen müsste, dass A auch besser als C ist. Dies ist aber gerade nicht der Fall (Condorcet-Paradoxon). Damit ist die Relation intransitiv, was der Universalitätsannahme widerspricht.

Erweiterungen und Beurteilung

Bearbeiten

Arrows „General Impossibility Theorem“ stellt ein grundsätzliches Problem für alle sozialwissenschaftlichen Theorien dar, die versuchen, Regeln für soziale Entscheidungen auf Basis individueller Präferenzen zu beschreiben. Praktisch stellt das Theorem die Möglichkeit einer eindeutigen Bestimmung eines „Gemeinwohls“ mit Hilfe abstrakter Regeln, zum Beispiel in Form von Abstimmungsregeln o. ä. in Frage. Das Problem trifft jedoch auch kollektivistisch argumentierende Theorien und Ideologien, insofern es darauf verweist, dass – unterstellte – Kollektivinteressen immer im Widerspruch zu anderen Interessen selbst der Mehrheit der Mitglieder des Kollektivs stehen können. Das Arrow-Theorem ist mit dem Gibbard-Satterthwaite-Theorem verwandt.[7]

Das Arrow-Theorem basiert auf einem ordinalen Nutzenkonzept, wie dies in der neueren Ökonomik üblicherweise zugrunde gelegt wird. Dies führt nach Ansicht einiger Kritiker zu signifikanten praktischen Problemen; das ordinale Konzept unterscheidet nicht, ob zwei Alternativen nur marginal unterschiedlich sind oder ob zwischen ihnen erhebliche Unterschiede bestehen. Amartya Sen (1970) modifizierte Arrows Theorem, um es auch kardinalen Präferenzen zugänglich zu machen, und begründete mit dem resultierenden Framework das Paradox des Liberalismus mit veränderten Bedingungen.

Wilson (1972) generalisiert das Theorem, indem er vorschlägt, das schwache Pareto-Kriterium zugunsten einer schwachen Non-Imposition-Bedingung aufzugeben, deren Erfüllung bei gleichzeitiger Gültigkeit der anderen Bedingungen außer D impliziert, dass es entweder einen Diktator oder einen umgekehrten Diktator (inverse dictator) gibt.[8]

Literatur

Bearbeiten
Bearbeiten
Wiktionary: Arrow-Theorem – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Einzelnachweise

Bearbeiten
  1. Julian H. Blau: The Existence of Social Welfare Functions. In: Econometrica. 25, Nr. 2, 1957, S. 302–313 (JSTOR:1910256).
  2. Vgl. Arrow 2008.
  3. Vgl. in der Regel Sen 1986, S. 1075 ff.
  4. Im Gegensatz zum starken Pareto-Prinzip P*, wonach  . Natürlich impliziert P* auch P.
  5. Geoffrey A. Jehle, Philip J. Reny: Advanced Microeconomic Theory. 3. Aufl. Financial Times / Prentice Hall, Harlow 2011, ISBN 978-0-273-73191-7, S. 288–291.
  6. Eine formalisierte Version desselben Beweises findet sich bei Tobias Nipkow: Social Choice Theory in HOL. Arrow and Gibbard-Satterthwaite. In: Journal of Automated Reasoning. 43, Nr. 3, 2009, S. 289–304, doi:10.1007/s10817-009-9147-4.
  7. Vazirani, Vijay V.; Nisan, Noam; Roughgarden, Tim; Tardos, Éva (2007). Algorithmic Game Theory (PDF; 5,2 MB). Cambridge, UK: Cambridge University Press. ISBN 0-521-87282-0
  8. Robert Wilson: Social choice theory without the Pareto Principle. In: Journal of Economic Theory. 5, Nr. 3, 1972, S. 478–486, doi:10.1016/0022-0531(72)90051-8.