Lorenz-Kurve

grafische Darstellung von Ungleichheit einer Verteilung

Die Lorenz-Kurve (auch: Lorenzkurve) wurde 1905 vom US-amerikanischen Statistiker und Ökonomen Max Otto Lorenz (1876–1959) entwickelt. Sie stellt statistische Verteilungen grafisch dar und veranschaulicht dabei das Ausmaß an Disparität (Ungleichheit) beziehungsweise relativer Konzentration innerhalb der Verteilung. Deshalb wird sie auch als Disparitätskurve bezeichnet. Amtliche Statistiken nutzen die Lorenz-Kurve, um die Einkommensverteilung in einem Land zu verdeutlichen.[1] Grundlage dieser Berechnungen ist eine Liste der von links nach rechts aufsteigend sortierten Einzeleinkommen oder Einzelvermögen (siehe auch: Pen’s Parade).

Anwendung der Lorenz-Kurve zur Veranschaulichung der Einkommensverteilung: Beispielsweise verfügen (in der durchgezogenen Kurve) die ärmsten 50 % der Haushalte über zirka 27 % des gesamten Einkommens; die ärmsten 80 % verfügen hier dementsprechend über etwa 60 % des Einkommens. Natürlich lässt sich daraus auch ablesen, dass die restlichen 40 % des Einkommens auf die reichsten 20 % der Haushalte entfallen. Die gestrichelte Kurve stellt eine noch ungleichere Einkommensverteilung dar. Hier verfügen die ärmeren 50 % nur über ca. 15 % des Einkommens.

Aufbau und Erläuterung

Bearbeiten

Die Lorenz-Kurve ist eine Funktion im Einheitsquadrat des 1. Quadranten. Sie stellt dar, welche Anteile der gesamten Merkmalssumme auf welche Anteile der Grundmenge mit   Merkmalsträgern entfallen. So werden auf der  -Achse (Abszisse) die Anteile an der Gesamtheit der Merkmalsträger (zum Beispiel Bevölkerung), auf der  -Achse (Ordinate) die Anteile an der gesamten Merkmalssumme (beispielsweise Einkommen) abgetragen. Zunächst werden die Daten dafür aufsteigend sortiert – beginnend mit dem geringsten Anteil an der Merkmalssumme – und dann kumuliert (summiert). Dadurch entsteht der charakteristische „Bauch“ der Lorenz-Kurve unterhalb der Diagonalen, welcher das Maß der Ungleichverteilung wiedergibt. Jeder Punkt auf der Lorenz-Kurve steht für eine Aussage wie „die unteren 20 % aller Haushalte beziehen 10 % des Gesamteinkommens“ (siehe: Paretoprinzip). Eine perfekte Einkommensgleichverteilung wäre eine Einkommensverteilung, bei der alle Personen das gleiche Einkommen besitzen. In diesem Falle würden stets die unteren   der Gesellschaft   des Einkommens haben. Dies lässt sich anschaulich durch eine Gerade   darstellen. Man nennt sie perfekte Gleichverteilungsgerade (line of perfect equality). Dagegen wäre die perfekte Ungleichverteilung eine Verteilung, bei der eine Person über das gesamte Einkommen verfügt und alle anderen Personen kein Einkommen beziehen. In diesem Fall wäre die Kurve   für alle   und   bei  . Diese Kurve wird als perfekte Ungleichverteilungsgerade (line of perfect inequality) bezeichnet.

Der Gini-Koeffizient ist der Anteil der Fläche zwischen der perfekten Gleichverteilungsgerade und der beobachteten Lorenz-Kurve an der Fläche unter der Gleichverteilungsgerade. Der Gini-Koeffizient ist damit eine Zahl zwischen 0 und 1, je höher er ist, desto ungleicher ist die Verteilung.

Berechnung

Bearbeiten

Diskreter Fall

Bearbeiten

Die Lorenz-Kurve ist als abschnittsweise lineare Kurve (d. h. als Polygonzug) durch die Punkte   definiert. Sind die   Anteile an der Gesamtheit der Merkmalsträger und die   Anteile an der gesamten Merkmalssumme, so sind die Koordinaten der Punkte für   definiert mit:

 

und

 

Stetiger/Kontinuierlicher Fall

Bearbeiten

Generell

Bearbeiten

Die Lorenz-Kurve kann häufig durch eine Funktion   dargestellt werden, wobei   auf der Abszisse und   auf der Ordinate abgetragen wird.

Für eine Population der Größe   mit einer Folge von Werten  ,  , die nach aufsteigender Reihenfolge indiziert werden  , ist die Lorenz-Kurve die stetige, abschnittsweise lineare Funktion, die die Punkte ( ,  ),   verbindet, wobei  ,   ist und für  :

 
 
 

Dabei nennt man   auch Lorenz-Asymmetrie-Koeffizient.

Für eine diskrete Wahrscheinlichkeitsfunktion   seien  ,  , die Punkte mit Non-/Nicht-Null-Wahrscheinlichkeiten nach steigender Reihenfolge indiziert  . Die Lorenz-Kurve ist die stetige, abschnittsweise definierte, lineare Funktion, welche die Punkte ( ,  ),  , miteinander verbindet, wobei  ,   ist und für   gilt:

 
 
 

Für die Laplace-Verteilung, das heißt   für alle  , erhält man genau die oben genannten Formeln für   und  .

Für eine Wahrscheinlichkeitsdichtefunktion   mit der kumulierten Wahrscheinlichkeitsverteilungsfunktion   ist die Lorenz-Kurve   definiert durch:

 

wobei μ der Erwartungswert der Verteilung ist. Für eine kumulierte Verteilungsfunktion   mit der Umkehrfunktion   ist die Lorenz-Kurve   gegeben durch:

 

Die Umkehrfunktion   könnte nicht existieren, da die kumulierte Verteilungsfunktion Sprungstellen (Unstetigkeitsstellen) oder Intervalle konstanter Werte aufweist. Die vorherige Gleichung behält ihre Gültigkeit, wenn man allgemeiner   durch folgende Formel definiert:[2]

 

Gastwirths Definition

Bearbeiten

Betrachtet werde eine nichtnegative Zufallsvariable   mit der dazugehörigen normierten Quantilsfunktion  . Nach Joseph Lewis Gastwirth wird die Abbildung

 

als (stetige) Lorenz-Kurve von   oder zur Verteilung von   bezeichnet.[3][2]

Eigenschaften

Bearbeiten

Die Lorenz-Kurve hat folgende Eigenschaften:[4]

  • Sie beginnt stets im Koordinatenursprung   und endet im Punkt  .
  • Die Ableitung der Kurve ist monoton steigend, weshalb die Kurve selber konvex ist und unterhalb der Diagonalen liegt.
  • Die Lorenzkurve ist stetig auf dem offenen Intervall  , im diskreten Fall sogar stückweise linear.

Die Lorenz-Kurve ist für einen Mittelwert der Wahrscheinlichkeitsverteilung von null oder unendlich nicht definiert.

Die Lorenz-Kurve für eine Wahrscheinlichkeitsverteilung ist eine stetige Funktion. Aber Lorenz-Kurven unstetiger Funktionen können als Grenzwert (Limes) der Lorenz-Kurven der Wahrscheinlichkeitsverteilungen formuliert werden – wie beispielsweise die perfekte Ungleichheitsgerade (line of perfect inequality).

Die Daten einer Lorenz-Kurve können durch den Gini-Koeffizienten und den Lorenz-Asymmetrie-Koeffizienten zusammengefasst werden.[5]

Die Lorenz-Kurve ist invariant unter positiver Skalierung. Falls   eine Zufallsvariable ist, so besitzt die Zufallsvariable   für jede positive Zahl   die gleiche Lorenz-Kurve wie  , wobei man unter der Lorenzkurve einer Zufallsvariablen natürlich diejenige der zugehörigen Verteilung versteht.

Die Lorenz-Kurve ist nicht invariant unter Translationen, das heißt unter einer konstanten Verschiebung der Werte. Ist   eine Zufallsvariable mit einer Lorenz-Kurve   und dem Mittel   ist, dann erhält man für die Lorenz-Kurve   der verschobenen Zufallsvariablen  , wobei   eine feste Konstante sei, folgende Formel:

 

Für eine kumulierte Verteilungsfunktion   mit dem Mittelwert   und der (verallgemeinerten) Umkehrfunktion   gilt für jedes   mit  

  • Falls die Lorenz-Kurve differenzierbar ist, gilt:
 
  • Wenn die Lorenz-Kurve zweifach differenzierbar ist, dann existiert die Wahrscheinlichkeitsdichtefunktion   in diesem Punkt und:
 
  • Falls   stetig-differenzierbar ist, so ist die Tangente von   parallel zur perfekten Gleichheitsgerade im Punkt  . Dies ist auch der Punkt, in welchem die Gleichheitsdiskrepanz  , der vertikale Abstand zwischen der Lorenz-Kurve und der perfekten Gleichheitsgerade, am größten ist. Die Größe der Diskrepanz ist gleich der Hälfte der relativen mittleren Abweichung:
 

Die Lorenz-Kurve einer Zufallsvariablen   wird am Punkt   gespiegelt, wenn man von   zu   übergeht, das heißt mit oben eingeführten Bezeichnungen:

 

Extremfälle

Bearbeiten

Je gleichmäßiger die Merkmalssumme unter den Trägern verteilt ist, desto stärker nähert sich die Lorenz-Kurve der Diagonalen an. Im Extremfall der ökonomischen Gleichverteilung (statistische Einpunktverteilung) fällt sie mit ihr zusammen.

Im Falle größerer Disparität bewegt sich die Kurve nach unten in Richtung der Abszisse. Für den Extremfall der maximalen Ungleichverteilung (ein Merkmalsträger vereinigt die gesamte Merkmalssumme auf sich) verläuft die Lorenz-Kurve als Streckenzug auf der Abszisse bis   und führt von dort zum Punkt  .

Stetig und diskret klassierte Daten

Bearbeiten

Welche Form die Lorenz-Kurve genau annimmt, hängt davon ab, welcher Art die Daten des Merkmals sind. Grundsätzlich sind stetige Daten (siehe Beispielbild oben) von diskreten Daten zu unterscheiden. Im zweiten Fall ist die Lorenzkurve ein Streckenzug durch die Punkte  .

Messung der relativen Konzentration (Disparität)

Bearbeiten

Die Lorenz-Kurve bietet eine grafische Möglichkeit, das Ausmaß an Disparität innerhalb einer Verteilung zu betrachten. Je stärker sich die Kurve nach unten wölbt, desto größer die Disparität (siehe Abschnitt Extremfälle). Für den Fall, dass sich zwei Lorenz-Kurven schneiden, lässt sich anhand der Grafik jedoch nicht mehr eindeutig bestimmen, welche die größere Disparität aufweist. Auch ist die Messung mittels Grafik zu ungenau. Präzise Werte liefern dafür die Maßzahlen Gini-Koeffizient und Variationskoeffizient. Der Gini-Koeffizient steht dabei in einem direkten Zusammenhang mit der Lorenz-Kurve: Er ist das Zweifache der Fläche zwischen Lorenz-Kurve und Diagonale im Einheitsquadrat.

Beispieltabelle für diskret klassierte Daten

Bearbeiten

Eine Datenerhebung habe für 5 Klassen, die mit einem Index   benannt seien, die relativen Häufigkeiten (Anteil der Merkmalsträger der Klasse   an der Gesamtheit der Merkmalsträger)   und die Anteile   der Merkmalssumme, die auf die Klasse   entfallen, der unten stehenden Tabelle ergeben. Daraus ermitteln wir

  •   kumulierte (relative Häufigkeit),
  •   kumulierte (Disparität)  .
Index   Relative Häufigkeit   Kumulierte relative Häufigkeit   Disparität   Kumulierte Disparität  
1 0,2 0,2 0,00 0,00
2 0,4 0,6 0,05 0,05
3 0,1 0,7 0,15 0,20
4 0,1 0,8 0,30 0,50
5 0,2 1,0 0,50 1,00

Erläuterung:

Die Lorenz-Kurve entsteht, indem man   auf der Abszisse,   auf der Ordinate aufträgt und die Punkte durch einen Streckenzug verbindet.

Der Artikel zur Paretoverteilung enthält ein weiteres Beispiel für eine Lorenz-Kurve.

Lorenz-Dominanz

Bearbeiten

Mittels der Lorenz-Dominanz kann das Verhältnis unterschiedlicher Lorenz-Kurven beschrieben werden. Für alle   ordnet der Vektor   die zugehörigen Koordinaten in nicht-absteigender Reihenfolge:  . Der Vektor   Lorenz-dominiert den Vektor   mit

 

sofern gilt:   für alle   und   für mindestens ein  .

Diese Form wird auch als starke Lorenz-Dominanz bezeichnet. Dementsprechend Lorenz-dominiert ein Vektor   einen anderen Vektor  , sobald die zugehörige Lorenz-Kurve   nicht unterhalb sowie mindestens einmal oberhalb der Lorenz-Kurve   liegt. Eine Kurzschreibweise ist:  .[6]

Satz von Rothschild und Stiglitz

Bearbeiten

Gegeben seien zwei Verteilungen   und   mit  . Die Lorenz-Kurve von   liegt genau dann oberhalb der Lorenz-Kurve von  , wenn für jede symmetrische und quasikonvexe Funktion   gilt:

 

Folgerung: Wenn sich zwei Lorenz-Kurven schneiden, hängt es von der Wahl der jeweiligen symmetrischen und quasikonvexen Funktion   ab, welche der beiden Kurven als die mit der größeren Ungleichheit zu bezeichnen ist.[7]

Als Disparitätsmaß (Maß der relativen Konzentration) lässt sich auch die Lorenz-Kurven-Länge   anführen. Der Wertebereich ist   für den Definitionsbereich gilt:

 

Diskreter Fall

Bearbeiten

Diese lässt sich – wie der Name bereits vermuten lässt – von der diskreten Lorenz-Kurve ableiten, indem die Längen der Streckenabschnitte kumuliert werden. Für die Länge der diskreten Lorenz-Kurve gilt:

 

Dabei wird für jeden der Streckenabschnitte der euklidische Abstand für den Funktionsgraphen von   verwendet.

Bei Gleichverteilung ist   Bei absoluter Konzentration auf lediglich einen einzigen Merkmalswert ist  

Stetig differenzierbarer Fall

Bearbeiten

Die Länge der stetig differenzierbaren Lorenz-Kurve zwischen den Punkten   sowie   berechnet sich aus der ersten Ableitung der Lorenz-Kurven-Funktion  , wie folgt:

 

mit  .

Anwendungen

Bearbeiten

Wirtschaftswissenschaften

Bearbeiten

In der Ökonomie wird die Lorenz-Kurve zur grafischen Darstellung der kumulierten Verteilungsfunktion der empirischen Wahrscheinlichkeitsverteilung des Vermögens benutzt; sie ist ein Graph, der das Maß der Verteilung zeigt, die für die unteren   der Werte angenommen wird. Häufig wird sie dazu verwendet, um eine Einkommensverteilung darzustellen, wobei für die unteren   der Haushalte illustriert wird, wie groß der Anteil des Gesamteinkommens in   ist, den sie besitzen.[8] Der Anteil der Haushalte wird auf der Abszisse abgetragen, der Anteil des Einkommens auf der Ordinate. Sie kann ebenfalls zur Darstellung der Einkommensverteilung verwandt werden. In diesem Sinne betrachten viele Ökonomen die Lorenz-Kurve als Maß sozialer Ungleichheit (soziales Ungleichheitsmaß). Sie wurde im Jahre 1905 von Max O. Lorenz zur Darstellung der Ungleichheit der Einkommensverteilung entwickelt.

Neben der Illustration der Einkommensverteilung wird die Lorenz-Kurve auch zur Darstellung von Marktmacht oder räumlichen Verteilungen verwendet (vergleiche: Segregation).

Eine weitere Anwendung findet die Lorenz-Kurve in der logistischen ABC-Analyse, bei der die Lorenz-Kurve die Verteilung der Güter verdeutlicht, geordnet nach Klassifizierungseigenschaft (beispielsweise Wert) und Verbrauchsmenge.

Die Lorenz-Kurve lässt sich auch für Geschäftsmodelle verwenden – beispielsweise in den Konsumentenfinanzen, um die reale Nichtzahlung bei Fälligkeit (Delinquenz)   von   der Konsumenten mit den schlechtesten vorhergesagten Risiko-/Kreditscores.

Ökologie

Bearbeiten

Das Konzept der Lorenz-Kurve ist hilfreich für die Beschreibung der Ungleichheit zwischen den Anzahlen an Individuen in der Ökologie[5] und in Forschungsstudien zur Biodiversität nutzt man es, indem man den kumulierten Anteilen an Tierarten die kumulierten Anteile an Individuen gegenüberstellt.[9]

Konzentration sowie Disparität

Bearbeiten

Die Disparität (Lorenz-Kurve) und (absolute) Konzentration (Konzentrationskurve) sind verwandte Maße, beschreiben aber unterschiedliche Dinge. Während die Lorenz-Kurve darstellt, welche Anteile der Merkmalssumme (Ordinate) auf welche Anteile an der Gruppe der Merkmalsträger (Abszisse) entfallen, stellt die Konzentrationskurve dar, welche Anteile der Merkmalssumme (Ordinate) auf welchen Merkmalsträger (Abszisse) entfallen. Das bedeutet, dass die Lorenz-Kurve Anteile mit Anteilen vergleicht, die Konzentrationskurve Anteile mit absoluten Zahlen (Abszisse). So können hohe Disparität und geringe Konzentration oder hohe Konzentration und geringe Disparität gleichzeitig auftreten. Folgendes Beispiel verdeutlicht die Frage:

Angenommen   Unternehmen teilen sich einen Markt. In der Tabelle werden die Fälle von hoher und geringer Disparität bzw. Konzentration mit (fiktiven) absoluten Zahlen durchgespielt:

Disparität hoch Disparität gering
Konzentration hoch  
 
 
 
Konzentration gering  
 
 
 

Literatur

Bearbeiten
  • Joseph Lewis Gastwirth: A General Definition of the Lorenz Curve. In: Econometrica, Bd. 39, Nr. 6, New York Nov. 1971. S. 1037–1039.
  • Josef Bleymüller, Günther Gehlert, Herbert Gülicher: Statistik für Wirtschaftswissenschaftler. WiSt-Studienkurs. 10. Aufl. Verlag Franz Vahlen, München 1996. ISBN 978-3-8006-2081-4 (3-8006-2081-2). 244 S.
  • Rodica Branzei, Dinko Dimitrov, Stef Tijs: Models in Cooperative Game Theory. Springer, Berlin u. a. 2008, ISBN 978-3-540-77953-7.
  • Jens Leth Hougaard: An Introduction to Allocation Rules. Springer, Berlin u. a. 2009, ISBN 978-3-642-01827-5.
  • David Müller: Investitionscontrolling: Entscheidungsfindung bei Investitionen II: Entscheidungstheorie. 3. Aufl. Springer Gabler, Berlin u. a. 2022, ISBN 3-658-36596-X.
Bearbeiten

Einzelnachweise

Bearbeiten
  1. Duden: Lorenz-Kurve. In: Duden Wirtschaft von A bis Z: Grundlagenwissen für Schule und Studium, Beruf und Alltag. 4. Aufl. Bibliographisches Institut, Mannheim 2009 (Lizenzausgabe: Bundeszentrale für politische Bildung, Bonn)
  2. a b Thomas Augustin, Sebastian Petry: Wirtschafts- und Sozialstatistik (Memento des Originals vom 1. Februar 2012 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.statistik.lmu.de. (PDF-Datei; 216 kB), LMU, München 2010. S. 45 ff.
  3. Joseph Lewis Gastwirth: A General Definition of the Lorenz Curve. In: Econometrica, Bd. 39, Nr. 6, New York Nov. 1971. S. 1037–1039.
  4. Karl Mosler, Friedrich Schmid: Beschreibende Statistik und Wirtschaftsstatistik. Springer, Berlin/Heidelberg 2009, ISBN 978-3-642-01556-4.
  5. a b Christian Damgaard, Jacob Weiner: Describing inequality in plant size or fecundity. 4. Aufl. Ecology, 2000. Bd. 81. doi:10.1890/0012-9658(2000)081[1139:DIIPSO]2.0.CO;2 S. 1139–1142.
  6. Vgl. Branzei et al. 2008, S. 37; Hougaard 2009, S. 22–23; Müller 2022, S. 521–522.
  7. L. Egghe: Construction of concentration measures for General Lorenz curves using Riemann-Stieltjes integrals
  8. Arthur O’ Sullivan, Steven M. Sheffrin: Economics: Principles in action (Memento des Originals vom 20. Dezember 2016 im Internet Archive)  Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis.@1@2Vorlage:Webachiv/IABot/www.savvas.com. Prentice Hall, Upper Saddle River (New Jersey 07458) 2003. ISBN 0-13-063085-3. S. 349 ff.
  9. Lieven Wittebolle et al.: Initial community evenness favours functionality under selective stress. 7238. Ausg. Nature, 2009. Bd. 458. S. 623–626. doi:10.1038/nature07840. PMID 19270679.