Ein Lagemaß[1] oder Lageparameter[2] ist in der Stochastik eine Kennzahl der Verteilung einer Zufallsvariable beziehungsweise eines Wahrscheinlichkeitsmaßes. Anschaulich ist es die Aufgabe eines Lagemaßes, den „typischen“ Wert einer Zufallsvariable anzugeben. In Abgrenzung dazu gibt ein Dispersionsmaß an, wie sehr die Zufallszahlen um den typischen Wert streuen würden.

Der Begriff des Lagemaßes und des Lageparameters wird in der Literatur nicht immer eindeutig verwendet. So spricht man in der Statistik auch von Lageparametern von Stichproben oder nennt bei Wahrscheinlichkeitsmaßen, deren Lage durch Wahl eines Parameters bestimmt werden kann, diesen Parameter Lageparameter. Eine genaue Abgrenzung erfolgt im unten stehenden Abschnitt.

Typische Lagemaße

Bearbeiten
 
Dargestellt sind diskrete Messwerte, eine zugehörige -Wahrscheinlichkeitsverteilung sowie verschiedene Lagemaße: Der Median ist jener Wert, unterhalb und oberhalb dessen sich die Hälfte der Messwerte sammeln. Der Mittelwert teilt die Wahrscheinlichkeitsverteilung in zwei gleich große Flächen. Der Wahrscheinlichste Wert entspricht dem Maximum der Wahrscheinlichkeitsverteilung.

Erwartungswert

Bearbeiten

Klassisches Lagemaß ist der Erwartungswert. Er ist allgemein definiert als

 

für eine reelle Zufallsvariable auf dem Grundraum  , versehen mit dem Wahrscheinlichkeitsmaß  . Anschaulich entspricht der Erwartungswert dem „Schwerpunkt“ der Wahrscheinlichkeitsverteilung. Dem Erwartungswert zugeordnete Dispersionsmaße sind beispielsweise die Varianz und die Standardabweichung. Ein Nachteil des Erwartungswertes ist, dass er im Allgemeinen nicht existieren muss, wie die Cauchy-Verteilung zeigt.

Eine Zahl   heißt ein Median, wenn

  und
 

ist (oder allgemeiner über die verallgemeinerte inverse Verteilungsfunktion). Ein Median ist also ein Wert, der die Wahrscheinlichkeitsverteilung so trennt, dass jede Hälfte die Wahrscheinlichkeit 0,5 hat. Bei entsprechender Definition existiert der Median im Gegensatz zum Erwartungswert immer, ist aber nicht eindeutig. Ein mit dem Median assoziiertes Dispersionsmaß ist beispielsweise der Interquartilabstand.

Als Modus bezeichnet man bei diskreten Wahrscheinlichkeitsmaßen diejenige Stelle, an der die Wahrscheinlichkeitsfunktion ein Maximum annimmt, entsprechend bei Wahrscheinlichkeitsmaßen mit Wahrscheinlichkeitsdichtefunktion diejenige Stelle, an der die Wahrscheinlichkeitsdichtefunktion ein Maximum annimmt. In diesen beiden Fällen existiert der Modus immer, ist aber nicht notwendigerweise eindeutig. Beispiel hierfür sind die bimodalen Verteilungen. Außerdem gibt es auch Wahrscheinlichkeitsmaße ohne Wahrscheinlichkeitsdichtefunktion, wie die Cantor-Verteilung.

Beispiele

Bearbeiten

Die folgenden Beispiele zeigen die Grenzen der verschiedenen Lagemaße und typische auftretende Probleme.

Alle Lagemaße bestimmt, aber verschieden

Bearbeiten

Betrachtet man als Beispiel eine exponentialverteilte Zufallsvariable  , so besitzt diese die Wahrscheinlichkeitsdichtefunktion

 

für einen reellen Parameter  . Der Erwartungswert ergibt sich zu  , der Median zu  . Somit müssen Erwartungswert und Median nicht übereinstimmen. Aufgrund der Monotonie der Wahrscheinlichkeitsdichtefunktion auf dem Intervall   besitzt sie im Punkt 0 ein Maximum. Somit ist der Modus der Exponentialverteilung bei 0. Alle drei Lagemaße können also, selbst wenn sie existieren, völlig verschieden sein. Die Aussagekraft des Modus ist hier allerdings gering.

Modus ohne Aussagekraft

Bearbeiten

Betrachtet man eine Zufallsvariable  , die auf dem Intervall   stetig gleichverteilt ist, also die Wahrscheinlichkeitsdichtefunktion

 ,

so sind sowohl Erwartungswert als auch Median gleich 0.5. Als Modus erhält man jedoch das komplette Intervall  , da es ein Maximum der Wahrscheinlichkeitsdichtefunktion ist. Auch hier ist wieder die Aussagekraft des Modus gering.

Nicht existenter Erwartungswert

Bearbeiten

Typischer Fall einer Wahrscheinlichkeitsverteilung ohne Erwartungswert ist die Cauchy-Verteilung, im einfachsten Fall mit der Wahrscheinlichkeitsdichtefunktion

 .

Dann existiert der Erwartungswert

 

nicht. Allerdings sind sowohl Modus als auch Median in diesem Fall eindeutig. Der Median befindet sich aufgrund der Symmetrie der Wahrscheinlichkeitsdichtefunktion bei 0, ebenso wie der Modus.

Mehrdeutiger Median

Bearbeiten

Der Median ist in der obigen Definition nicht immer eindeutig. Ist beispielsweise   binomialverteilt mit dem Parameter  , so ist  . Somit gilt

  und
 

für alle  . Somit ist jede Zahl in diesem Intervall ein Median. Definiert man den Median allgemeiner über die verallgemeinerte inverse Verteilungsfunktion, so ist er eindeutig.

Abgrenzung der Begriffe

Bearbeiten

An zwei Stellen ist die Verwendung des Begriffs des Lageparameters zweideutig:

  1. Bei Verwendung von Verteilungsklassen, die durch ein oder mehrere (reelle) Parameter näher bestimmt werden können
  2. Im Übergang zur deskriptiven Statistik, in der Stichproben Kennzahlen zugeordnet werden sollen, im Gegensatz zu Wahrscheinlichkeitsmaßen

Parametrische Wahrscheinlichkeitsverteilungen

Bearbeiten

Beispiel für den ersten Fall ist die Normalverteilung: Sie wird durch zwei Parameter   bestimmt. Dabei ist der Parameter   sowohl Erwartungswert, Median und Modus und bestimmt die Position der Verteilung auf der x-Achse. Daher wird er auch Lageparameter genannt. Allerdings muss nicht immer solch ein Parameter existieren, der eine Verschiebung entlang der Achse bewirkt, ebenso muss dieser nicht automatisch mit einem der Lagemaße im allgemeine Sinn übereinstimmen.

Lageparameter in der deskriptiven Statistik

Bearbeiten

In der deskriptiven Statistik sind Lagemaße Kennzahlen einer Stichprobe, wohingegen die hier besprochenen Lagemaße Kennzahlen von Wahrscheinlichkeitsmaßen, also (Mengen)funktionen sind. So ist ein Lagemaß der Stichprobe   beispielsweise das arithmetische Mittel, das arithmetische Mittel eines Wahrscheinlichkeitsmaßes auf   ist aber intuitiv nicht wohldefiniert. Zusätzlich verwirrend ist oft, dass dieselbe Bezeichnung für Kennzahlen von Stichproben und von Wahrscheinlichkeitsverteilungen verwendet werden (Modus, Median, manchmal Mittelwert synonym mit Erwartungswert oder arithmetisches Mittel).

Allerdings lassen sich die Begriffe über die empirische Verteilung verknüpfen. Ist eine Stichprobe   gegeben, so gilt:

  • der Erwartungswert der empirischen Verteilung zu   ist das arithmetische Mittel der Stichprobe  .
  • der Median (im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung zu   ist der Median (im Sinne der deskriptiven Statistik) der Stichprobe  .
  • der Modus (im Sinne der Wahrscheinlichkeitstheorie) der empirischen Verteilung zu   ist der Modus (im Sinne der deskriptiven Statistik) der Stichprobe  .

Literatur

Bearbeiten

Einzelnachweise

Bearbeiten
  1. Hesse: Angewandte Wahrscheinlichkeitstheorie. 2003, S. 153.
  2. Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. 2014, S. 241.