Wahrscheinlichkeitstheorie

Die Wahrscheinlichkeitstheorie, auch Wahrscheinlichkeitsrechnung oder Probabilistik, ist ein Teilgebiet der Mathematik, das aus der Formalisierung, der Modellierung und der Untersuchung von Zufallsgeschehen hervorgegangen ist. Gemeinsam mit der mathematischen Statistik, die anhand von Beobachtungen zufälliger Vorgänge Aussagen über das zugrunde liegende Modell trifft, bildet sie das mathematische Teilgebiet der Stochastik.

Die zentralen Objekte der Wahrscheinlichkeitstheorie sind zufällige Ereignisse, Zufallsvariablen und stochastische Prozesse.

Axiomatischer Aufbau

Wie jedes Teilgebiet der modernen Mathematik wird auch die Wahrscheinlichkeitstheorie mengentheoretisch formuliert und auf axiomatischen Vorgaben aufgebaut. Ausgangspunkt der Wahrscheinlichkeitstheorie sind Ereignisse, die als Mengen aufgefasst werden und denen Wahrscheinlichkeiten zugeordnet sind; Wahrscheinlichkeiten sind reelle Zahlen zwischen 0 und 1; die Zuordnung von Wahrscheinlichkeiten zu Ereignissen muss gewissen Mindestanforderungen genügen.

Diese Definitionen geben keinen Hinweis darauf, wie man die Wahrscheinlichkeiten einzelner Ereignisse ermitteln kann; sie sagen auch nichts darüber aus, was Zufall und was Wahrscheinlichkeit eigentlich sind. Die mathematische Formulierung der Wahrscheinlichkeitstheorie ist somit für verschiedene Interpretationen offen, ihre Ergebnisse sind dennoch exakt und vom jeweiligen Verständnis des Wahrscheinlichkeitsbegriffs unabhängig.

Definitionen

Konzeptionell wird als Grundlage der mathematischen Betrachtung von einem Zufallsvorgang oder Zufallsexperiment ausgegangen. Alle möglichen Ergebnisse dieses Zufallsvorgangs fasst man in der Ergebnismenge $\Omega$ zusammen. Häufig interessiert man sich jedoch gar nicht für das genaue Ergebnis $\omega \in \Omega$ , sondern nur dafür, ob es in einer bestimmten Teilmenge der Ergebnismenge liegt, was so interpretiert werden kann, dass ein Ereignis eingetreten ist oder nicht. Ein Ereignis ist also als eine Teilmenge von $\Omega$ definiert. Enthält das Ereignis genau ein Element der Ergebnismenge, handelt es sich um ein Elementarereignis. Zusammengesetzte Ereignisse enthalten mehrere Ergebnisse. Das Ergebnis ist also ein Element der Ergebnismenge, das Ereignis jedoch eine Teilmenge.

Damit man den Ereignissen in sinnvoller Weise Wahrscheinlichkeiten zuordnen kann, werden sie in einem Mengensystem aufgeführt, der Ereignisalgebra oder dem Ereignissystem $\Sigma$ über $\Omega$ , einer Menge von Teilmengen von $\Omega$ , für die gilt: Sie enthält $\Omega$ und ist ein σ-Körper, d. h., sie ist gegenüber den Mengenoperationen der Vereinigung und der Komplementbildung (relativ bzgl. $\Omega$ ) abgeschlossen genauso wie gegenüber der unendlichen Vereinigung abzählbar vieler Mengen. Die Wahrscheinlichkeiten sind dann Bilder einer gewissen Abbildung $P$ des Ereignisraums in das Intervall [0,1]. Solch eine Abbildung heißt Wahrscheinlichkeitsmaß. Das Tripel $(\Omega ,\Sigma ,P)$ wird als Wahrscheinlichkeitsraum bezeichnet.

Axiome von Kolmogorow

Die axiomatische Begründung der Wahrscheinlichkeitstheorie wurde in den 1930er Jahren von Andrei Kolmogorow entwickelt und 1933 publiziert.^[1] Seine ursprünglich aus sechs Axiomen bestehende Axiomatik wird manchmal in folgender verkürzter Form dargestellt. Ein Wahrscheinlichkeitsmaß muss folgende drei Axiome erfüllen:

Axiome:

Für jedes Ereignis $A\in \Sigma$ ist die Wahrscheinlichkeit von $A$ eine reelle Zahl zwischen 0 und 1: $0\leq P(A)\leq 1$ .
Das sichere Ereignis $\Omega \in \Sigma$ hat die Wahrscheinlichkeit 1: $P(\Omega )=1$ .
Die Wahrscheinlichkeit einer Vereinigung abzählbar vieler inkompatibler Ereignisse ist gleich der Summe der Wahrscheinlichkeiten der einzelnen Ereignisse. Dabei heißen Ereignisse $A_{i}$ inkompatibel, wenn sie paarweise disjunkt sind, also bei $A_{i}\cap A_{j}=\emptyset$ für alle $i\neq j$ . Es gilt daher $P\left(A_{1}\;\;\!\!{\dot {\cup }}\;\;\!\!A_{2}\;\;\!\!{\dot {\cup }}\;\;\!\!\!\cdots \right)=\sum P(A_{i})$ . Diese Eigenschaft wird auch σ-Additivität genannt.

Beispiel: Im Rahmen einer physikalischen Modellbildung wird ein Wahrscheinlichkeitsmaß zur Quantifizierung der Wahrscheinlichkeiten von Ereignissen eines Münzwurfes angesetzt; die möglichen Ergebnisse mögen Zahl und Kopf lauten.

Dann ist die Ergebnismenge $\Omega =\{{\text{Zahl}},{\text{Kopf}}\}$ mit zwei möglichen Ergebnissen.
Als Ereignisraum $\Sigma$ kann die Potenzmenge ${\mathcal {P}}(\Omega )$ gewählt werden, also $\Sigma =\{\emptyset ,\{{\text{Zahl}}\},\{{\text{Kopf}}\},\Omega \}$ mit vier Ereignissen.
Ein Wahrscheinlichkeitsmaß $P$ weist den Ereignissen Wahrscheinlichkeiten (Zahlen im Intervall $[0,1]$ ) zu. Dabei gilt aufgrund der Axiome:
- $P(\emptyset )=0$
- $P(\{{\text{Zahl}}\})=1-P(\{{\text{Kopf}}\})$
- $P(\Omega )=1$

Zusätzliche physikalische Annahmen über die Beschaffenheit der Münze können zur Wahl $P(\{{\text{Kopf}}\})=P(\{{\text{Zahl}}\})=0{,}5$ führen.

Folgerungen

Aus den Axiomen ergeben sich unmittelbar einige Folgerungen:

1. Aus der Additivität der Wahrscheinlichkeit disjunkter Ereignisse folgt, dass komplementäre Ereignisse (Gegenereignisse) komplementäre Wahrscheinlichkeiten (Gegenwahrscheinlichkeiten) haben: $P(\Omega \setminus A)=1-P(A)$ .

Beweis: Es ist

(\Omega \setminus A)\cup A=\Omega

sowie

(\Omega \setminus A)\cap A=\emptyset

. Folglich nach Axiom (3):

P(\Omega \setminus A)+P(A)=P(\Omega )

und dann nach Axiom (2):

P(\Omega \setminus A)+P(A)=1

. Umgestellt ergibt sich:

P(\Omega \setminus A)=1-P(A)

.

2. Daraus folgt, dass das unmögliche Ereignis, die leere Menge, die Wahrscheinlichkeit null hat: $P(\emptyset )=0$ .

Beweis: Es ist

\emptyset \cup \Omega =\Omega

und

\emptyset \cap \Omega =\emptyset

, also nach Axiom (3):

P(\emptyset )+P(\Omega )=P(\Omega )

. Hieraus folgt

P(\emptyset )=0

.

3. Für die Vereinigung nicht notwendig disjunkter Ereignisse folgt: $P(A\cup B)=P(A)+P(B)-P(A\cap B)$ .

Beweis: Die für den Beweis erforderlichen Mengen sind im obigen Bild dargestellt. Die Menge

A\cup B

kann danach als Vereinigung von drei disjunkten Mengen dargestellt werden:

Hieraus folgt nach (3):

P(A\cup B)=P(A\setminus B)+P(A\cap B)+P(B\setminus A)

.

Andererseits ist nach (3) sowohl

P(A)=P(A\setminus B)+P(A\cap B)

als auch

P(B)=P(A\cap B)+P(B\setminus A)

.

Addition liefert:

P(A)+P(B)=P(A\setminus B)+P(A\cap B)+P(A\cap B)+P(B\setminus A)=P(A\cup B)+P(A\cap B)

.

Umstellen ergibt

P(A\cup B)=P(A)+P(B)-P(A\cap B)

.

Die Siebformel von Poincaré-Sylvester verallgemeinert diese Behauptung im Falle n verschiedener (nicht notwendig disjunkter) Teilmengen.

Im Weiteren ist zwischen abzählbaren und überabzählbaren Ergebnismengen zu unterscheiden.

Abzählbare Ergebnismenge

Beispiel: Ein Glücksrad mit Ergebnismenge

\Omega =\{1,2,3\}

, Ereignisraum

\Sigma

(hier die Potenzmenge von

\Omega

) und Wahrscheinlichkeitsmaß

P

.

Bei einer abzählbaren Ergebnismenge kann jedem Elementarereignis eine positive Wahrscheinlichkeit zugewiesen werden. Wenn $\Omega$ endlich oder abzählbar unendlich ist, kann man für die σ-Algebra $\Sigma$ die Potenzmenge von $\Omega$ wählen. Die Summe der Wahrscheinlichkeiten aller Elementarereignisse aus $\Omega$ ist hier 1.

Überabzählbare Ergebnismenge

Die Wahrscheinlichkeit, mit einer als punktförmig angenommenen Dartspitze einen bestimmten Punkt auf einer Scheibe zu treffen, ist null. Eine sinnvolle mathematische Theorie kann man nur auf der Wahrscheinlichkeit aufbauen, bestimmte Teilflächen zu treffen. Solche Wahrscheinlichkeiten lassen sich durch eine Wahrscheinlichkeitsdichte beschreiben.

Ein Prototyp einer überabzählbaren Ergebnismenge ist die Menge der reellen Zahlen. In vielen Modellen ist es nicht möglich, allen Teilmengen der reellen Zahlen sinnvoll eine Wahrscheinlichkeit zuzuordnen. Als Ereignissystem wählt man statt der Potenzmenge der reellen Zahlen hier meist die Borelsche σ-Algebra, das ist die kleinste σ-Algebra, die alle Intervalle von reellen Zahlen als Elemente enthält. Die Elemente dieser σ-Algebra nennt man Borelsche Mengen oder auch (Borel-)messbar. Wenn die Wahrscheinlichkeit $P(A)$ jeder Borelschen Menge $A$ als Integral

P(A)=\int _{A}f(x)\,\mathrm {d} x

über eine Wahrscheinlichkeitsdichte $f$ geschrieben werden kann, wird $P$ absolut stetig genannt. In diesem Fall (aber nicht nur in diesem) haben alle Elementarereignisse {x} die Wahrscheinlichkeit 0. Die Wahrscheinlichkeitsdichte eines absolut stetigen Wahrscheinlichkeitsmaßes $P$ ist nur fast überall eindeutig bestimmt, d. h., sie kann auf einer beliebigen Lebesgue-Nullmenge, also einer Menge vom Lebesgue-Maß 0, abgeändert werden, ohne dass $P$ verändert wird. Wenn die erste Ableitung der Verteilungsfunktion von $P$ existiert, so ist sie eine Wahrscheinlichkeitsdichte von P. Die Werte der Wahrscheinlichkeitsdichte werden jedoch nicht als Wahrscheinlichkeiten interpretiert.

Spezielle Eigenschaften im Fall diskreter Wahrscheinlichkeitsräume

Laplace-Experimente

Wenn man annimmt, dass nur endlich viele Elementarereignisse möglich und alle gleichberechtigt sind, d. h. mit der gleichen Wahrscheinlichkeit eintreten (wie zum Beispiel beim Werfen einer idealen Münze, wobei {Zahl} und {Kopf} jeweils die Wahrscheinlichkeit 0,5 besitzen), so spricht man von einem Laplace-Experiment. Dann lassen sich Wahrscheinlichkeiten einfach berechnen: Wir nehmen eine endliche Ergebnismenge $\Omega$ an, die die Mächtigkeit $|\Omega |=n$ besitzt, d. h., sie hat $n$ Elemente. Dann ist die Wahrscheinlichkeit jedes Elementarereignisses einfach $P={\tfrac {1}{n}}$ .

Beweis: Wenn

|\Omega |=n

ist, dann gibt es

n

Elementarereignisse

E_{1},\ldots ,E_{n}

. Es ist dann einerseits

\Omega =E_{1}\cup \cdots \cup E_{n}

und andererseits sind je zwei Elementarereignisse disjunkt (inkompatibel: wenn das eine eintritt, kann das andere nicht eintreten). Also sind die Voraussetzungen für Axiom (3) erfüllt, und es gilt:

P(E_{1})+\cdots +P(E_{n})=P(\Omega )=1.

Da nun andererseits

P(E_{1})=\cdots =P(E_{n})=P

sein soll, ist

n\cdot P=1

und daher umgestellt:

P={\tfrac {1}{n}}

, wie behauptet.

Als Konsequenz folgt, dass für Ereignisse, die sich aus mehreren Elementarereignissen zusammensetzen, die entsprechend vielfache Wahrscheinlichkeit gilt. Ist $A$ ein Ereignis der Mächtigkeit $|A|=m$ , so ist $A$ die Vereinigung von $m$ Elementarereignissen. Jedes davon hat die Wahrscheinlichkeit $P={\tfrac {1}{n}}$ , also ist $P(A)=m\cdot {\tfrac {1}{n}}={\tfrac {m}{n}}$ . Man erhält somit den einfachen Zusammenhang

P(A)={\frac {|A|}{|\Omega |}}.

Bei Laplace-Versuchen ist die Wahrscheinlichkeit eines Ereignisses also gleich der Zahl der für dieses Ereignis günstigen Ergebnisse, dividiert durch die Zahl der insgesamt möglichen Ergebnisse.

Nachstehend ein Beispiel beim Würfeln mit einem idealen Würfel.

\Omega =\{

⚀,⚁,⚂,⚃,⚄,⚅

\}

H=\{

⚄,⚅

\}

P(H)={\frac {|H|}{|\Omega |}}={\frac {2}{6}}={\frac {1}{3}}

Das Ereignis $H$ = Hohe Augenzahl (5 oder 6) hat die Wahrscheinlichkeit 1/3.

Ein typischer Laplace-Versuch ist auch das Ziehen einer Karte aus einem Spiel mit $n$ Karten oder das Ziehen einer Kugel aus einer Urne mit $n$ Kugeln. Hier hat jedes Elementarereignis die gleiche Wahrscheinlichkeit. Um die Anzahl der Elementarereignisse bei Laplace-Versuchen zu bestimmen, werden häufig Methoden der Kombinatorik verwendet.

Das Konzept der Laplace-Experimente lässt sich auf den Fall einer stetigen Gleichverteilung verallgemeinern.

Bedingte Wahrscheinlichkeit

Unter einer bedingten Wahrscheinlichkeit versteht man die Wahrscheinlichkeit für das Eintreten eines Ereignisses $A$ unter der Voraussetzung, dass das Eintreten eines anderen Ereignisses $B$ bereits bekannt ist. Natürlich muss $B$ eintreten können, es darf also nicht das unmögliche Ereignis sein. Man schreibt dann $P(A|B)$ oder seltener $P_{B}(A)$ für „Wahrscheinlichkeit von $A$ unter der Voraussetzung $B$ “, kurz „ $P$ von $A$ , vorausgesetzt $B$ “.

Beispiel: Die Wahrscheinlichkeit, aus einem Skatblatt eine Herz-Karte zu ziehen (Ereignis $A$ ), beträgt 1/4, denn es gibt 32 Karten und darunter 8 Herz-Karten. Dann ist $P({\text{Herz}})={\tfrac {8}{32}}={\tfrac {1}{4}}$ . Das Gegenereignis ist dann Karo, Pik oder Kreuz und hat deshalb die Wahrscheinlichkeit ${\tfrac {24}{32}}={\tfrac {3}{4}}$ .

Ergebnismenge beim Ziehen einer Karte aus einem Skatspiel

Wenn nun aber bereits das Ereignis $B$ „Die Karte ist rot“ eingetreten ist (es wurde eine Herz- oder Karo-Karte gezogen, es ist aber nicht bekannt, welche der beiden Farben), man also nur noch die Auswahl unter den 16 roten Karten hat, dann ist $P(A|B)={\tfrac {8}{16}}={\tfrac {1}{2}}$ die Wahrscheinlichkeit, dass es sich dann um das Herz-Blatt handelt.

Diese Überlegung galt für einen Laplaceversuch. Für den allgemeinen Fall definiert man die bedingte Wahrscheinlichkeit von „ $A$ , vorausgesetzt $B$ “ als

P(A\vert B)={\frac {P(A\cap B)}{P(B)}}.

Dass diese Definition sinnvoll ist, zeigt sich daran, dass die so definierte Wahrscheinlichkeit den Axiomen von Kolmogorow genügt, wenn man sich auf $B$ als neue Ergebnismenge beschränkt; d. h., dass gilt:

$0\leq P(A\vert B)\leq 1$
$P(B\vert B)=1$
Wenn $A_{1},\ldots ,A_{k}$ paarweise disjunkt sind, so ist $P(A_{1}\cup \cdots \cup A_{k}\vert B)=P(A_{1}\vert B)+\cdots +P(A_{k}\vert B)$

Beweis:

$P(A\vert B)$ ist Quotient zweier Wahrscheinlichkeiten, für welche nach Axiom (1) gilt $P(A\cap B)\geq 0$ und $P(B)\geq 0$ . Da $B$ nicht das unmögliche Ereignis sein soll, ist sogar $P(B)>0$ . Also gilt auch für den Quotienten $P(A\vert B)\geq 0$ . Ferner sind $A\cap B$ und $B\setminus A$ disjunkt, und ihre Vereinigung ist $B$ . Also ist nach Axiom (3): $P(A\cap B)=P(B)-P(B\setminus A)$ .
Da $P(B\setminus A)\geq 0$ ist, folgt $P(A\cap B)\leq P(B)$ und daher $P(A\vert B)\leq 1$ .
Es ist $P(B\vert B)={\frac {P(B\cap B)}{P(B)}}={\frac {P(B)}{P(B)}}=1.$
Des Weiteren ergibt sich:

{\begin{aligned}P(A_{1}\cup \cdots \cup A_{k}\vert B)&={\frac {P((A_{1}\cup \cdots \cup A_{k})\cap B)}{P(B)}}\\&={\frac {P((A_{1}\cap B)\cup \cdots \cup (A_{k}\cap B))}{P(B)}}\\&={\frac {P(A_{1}\cap B)+\cdots +P(A_{k}\cap B)}{P(B)}}\\&={\frac {P(A_{1}\cap B)}{P(B)}}+\cdots +{\frac {P(A_{k}\cap B)}{P(B)}}\\\\&=P(A_{1}\vert B)+\cdots +P(A_{k}\vert B).\end{aligned}}

Dies war zu zeigen.

Beispiel: Es sei wie oben $A$ das Ereignis „Ziehen einer Herz-Karte“ und $B$ das Ereignis „Es ist eine rote Karte“. Dann ist:

P(A\cap B)={\frac {8}{32}}={\frac {1}{4}}

und

P(B)={\frac {16}{32}}={\frac {1}{2}}.

Folglich gilt:

P(A\vert B)={\frac {P(A\cap B)}{P(B)}}={\frac {\frac {1}{4}}{\frac {1}{2}}}={\frac {1}{2}}.

Aus der Definition der bedingten Wahrscheinlichkeit ergeben sich folgende Konsequenzen:

Verbundwahrscheinlichkeit (Schnittmengen von Ereignissen)

Das gleichzeitige Eintreten zweier Ereignisse $A$ und $B$ entspricht mengentheoretisch dem Eintreten des Verbund-Ereignisses $A\cap B$ . Die Wahrscheinlichkeit hiervon berechnet sich zur gemeinsamen Wahrscheinlichkeit oder Verbundwahrscheinlichkeit

P(A\cap B)=P(A)\cdot P(B\vert A)=P(B)\cdot P(A\vert B).

Beweis: Nach Definition der bedingten Wahrscheinlichkeit ist einerseits

P(A\vert B)={\frac {P(A\cap B)}{P(B)}}

und andererseits auch

P(B\vert A)={\frac {P(A\cap B)}{P(A)}}.

Umstellen nach $P(A\cap B)$ liefert dann sofort die Behauptung.

Beispiel: Es wird eine Karte aus 32 Karten gezogen. $A$ sei das Ereignis: „Es ist ein König“. $B$ sei das Ereignis: „Es ist eine Herz-Karte“. Dann ist $A\cap B$ das gleichzeitige Eintreten von $A$ und $B$ , also das Ereignis: „Die gezogene Karte ist ein Herz-König“. Offenbar ist $P(A)={\tfrac {4}{32}}={\tfrac {1}{8}}$ . Ferner ist $P(B|A)={\tfrac {1}{4}}$ , denn es gibt nur eine Herz-Karte unter den vier Königen. Und in der Tat ist dann $P(A\cap B)=P(A)\cdot P(B\vert A)={\tfrac {1}{8}}\cdot {\tfrac {1}{4}}={\tfrac {1}{32}}$ die Wahrscheinlichkeit für den Herz-König.

Satz von Bayes

Die bedingte Wahrscheinlichkeit von $A$ unter der Bedingung $B$ lässt sich durch die bedingte Wahrscheinlichkeit von $B$ unter der Bedingung $A$ durch

P(A\mid B)={\frac {P(B\mid A)\cdot P(A)}{P(B)}}

ausdrücken, wenn man die totalen Wahrscheinlichkeiten $P(B)$ und $P(A)$ kennt (Satz von Bayes).

Abhängigkeit und Unabhängigkeit von Ereignissen

Ereignisse nennt man unabhängig voneinander, wenn das Eintreten des einen die Wahrscheinlichkeit des anderen nicht beeinflusst. Im umgekehrten Fall nennt man sie abhängig. Man definiert:

Zwei Ereignisse

A

und

B

sind unabhängig, wenn

P(A\cap B)=P(A)\cdot P(B)

gilt.

Ungenau, aber einprägsam formuliert: Bei unabhängigen Ereignissen kann man die Wahrscheinlichkeiten multiplizieren.

Dass dies dem Begriff „Unabhängigkeit“ gerecht wird, erkennt man durch Umstellen nach $P(A)$ :

P(A)={\frac {P(A\cap B)}{P(B)}}=P(A\vert B).

Das bedeutet: Die totale Wahrscheinlichkeit für $A$ ist ebenso groß wie die Wahrscheinlichkeit für $A$ , vorausgesetzt $B$ ; das Eintreten von $B$ beeinflusst also die Wahrscheinlichkeit von $A$ nicht.

Beispiel: Es wird eine aus 32 Karten gezogen. $A$ sei das Ereignis „Es ist eine Herz-Karte“. $B$ sei das Ereignis „Es ist eine Bild-Karte“. Diese Ereignisse sind unabhängig, denn das Wissen, dass man eine Bild-Karte zieht, beeinflusst nicht die Wahrscheinlichkeit, dass es eine Herz-Karte ist (Der Anteil der Herz-Karten unter den Bilder-Karten ist ebenso groß wie der Anteil der Herz-Karten an allen Karten). Offenbar ist $P(A)={\tfrac {8}{32}}={\tfrac {1}{4}}$ und $P(B)={\tfrac {12}{32}}={\tfrac {3}{8}}$ . $A\cap B$ ist das Ereignis „Es ist eine Herz-Bildkarte“. Da es davon drei gibt, ist $P(A\cap B)={\tfrac {3}{32}}$ . Und in der Tat stellt man fest, dass ${\tfrac {1}{4}}\cdot {\tfrac {3}{8}}={\tfrac {3}{32}}$ ist.

Ein weiteres Beispiel für sehr kleine und sehr große Wahrscheinlichkeiten findet sich in Infinite-Monkey-Theorem.

Maßtheoretische Sichtweise

Die klassische Wahrscheinlichkeitsrechnung betrachtet nur Wahrscheinlichkeiten auf diskreten Wahrscheinlichkeitsräumen und stetige Modelle mit Dichtefunktionen. Diese beiden Ansätze lassen sich durch die moderne Formulierung der Wahrscheinlichkeitstheorie, die auf den Konzepten und Ergebnissen der Maß- und Integrationstheorie beruht, vereinheitlichen und verallgemeinern.

Wahrscheinlichkeitsräume

In dieser Sichtweise ist ein Wahrscheinlichkeitsraum $(\Omega ,\Sigma ,P)$ ein Maßraum mit einem Wahrscheinlichkeitsmaß $P$ . Das bedeutet, die Ergebnismenge $\Omega$ ist eine beliebige Menge, der Ereignisraum $\Sigma$ ist eine σ-Algebra mit Grundmenge $\Omega$ und $P\colon \Sigma \to [0,1]$ ist ein Maß, das durch $P(\Omega )=1$ normiert ist.

Wichtige Standardfälle von Wahrscheinlichkeitsräumen sind:

$\Omega$ ist eine abzählbare Menge und $\Sigma$ ist die Potenzmenge von $\Omega$ . Dann ist jedes Wahrscheinlichkeitsmaß $P$ eindeutig festgelegt durch seine Werte $P(\{\omega \})$ auf den einelementigen Teilmengen von $\Omega$ und für alle $A\in \Sigma$ gilt

P(A)=\sum _{\omega \in A}P(\{\omega \})

.

$\Omega$ ist eine Teilmenge von $\mathbb {R} ^{n}$ und $\Sigma$ ist die Borelsche σ-Algebra auf $\Omega$ . Ist das Wahrscheinlichkeitsmaß $P$ absolut stetig bezüglich des Lebesgue-Maßes, dann besitzt $P$ nach dem Satz von Radon-Nikodým eine Lebesgue-Dichte $f$ , d. h., für alle $A\in \Sigma$ gilt

P(A)=\int _{A}f(x)\,\mathrm {d} x

.

Umgekehrt wird für eine nichtnegative messbare Funktion

f

, welche die Normierungsbedingung

\textstyle \int _{\Omega }f(x)\,dx=1

erfüllt, durch diese Formel ein Wahrscheinlichkeitsmaß auf

\Omega

definiert.

$\textstyle \Omega =\prod _{i\in I}\Omega _{i}$ ist ein kartesisches Produkt und $\textstyle \Sigma =\bigotimes _{i\in I}\Sigma _{i}$ ist die Produkt-σ-Algebra von σ-Algebren $\Sigma _{i}$ auf $\Omega _{i}$ . Sind Wahrscheinlichkeitsmaße $P_{i}$ auf $\Omega _{i}$ gegeben, dann wird durch das Produktmaß $\textstyle P=\bigotimes _{i\in I}P_{i}$ ein Wahrscheinlichkeitsmaß auf $\Omega$ definiert, das die unabhängige Hintereinanderausführung der Einzelexperimente $(\Omega _{i},\Sigma _{i},P_{i})_{i\in I}$ modelliert.

Zufallsvariable

Eine Zufallsvariable ist das mathematische Konzept für eine Größe, deren Wert vom Zufall abhängig ist. Aus maßtheoretischer Sicht handelt es sich um eine messbare Funktion $X$ auf einem Wahrscheinlichkeitsraum $(\Omega ,\Sigma ,P)$ in einen Messraum $(\Omega ',\Sigma ')$ bestehend aus einer Menge $\Omega '$ und einer σ-Algebra $\Sigma '$ auf $\Omega '$ . Messbarkeit bedeutet dabei, dass für alle $A'\in \Sigma '$ das Urbild $X^{-1}(A')$ ein Element der σ-Algebra $\Sigma$ ist. Die Verteilung von $X$ ist dann nichts anderes als das Bildmaß

P_{X}:=P\circ X^{-1}:\Sigma '\to [0,1],\quad P\circ X^{-1}(A')=P(X^{-1}(A'))

,

das von $X$ auf dem Messraum $(\Omega ',\Sigma ')$ induziert wird und diesen zu einem Wahrscheinlichkeitsraum $(\Omega ',\Sigma ',P_{X})$ macht.

Der Erwartungswert einer reellwertigen Zufallsvariable $X$ mittelt die möglichen Ergebnisse. Er lässt sich abstrakt definieren als Integral von $X$ bezüglich des Wahrscheinlichkeitsmaßes $P$ :

\operatorname {E} (X)=\int _{\Omega }X\,\mathrm {d} P

.

Wahrscheinlichkeitstheorie und Statistik

Wahrscheinlichkeitstheorie und mathematische Statistik werden zusammenfassend auch als Stochastik bezeichnet. Beide Gebiete stehen in enger wechselseitiger Beziehung:

Statistische Verteilungen werden regelmäßig unter der Annahme modelliert, dass sie das Resultat zufälliger Prozesse sind.
Statistische Verfahren können auf numerische Weise Anhaltspunkte für das Verhalten von Wahrscheinlichkeitsverteilungen liefern.

Anwendungsgebiete

Die Wahrscheinlichkeitstheorie entstand aus dem Problem der gerechten Verteilung des Einsatzes bei abgebrochenen Glücksspielen. Auch andere frühe Anwendungen stammen aus dem Bereich des Glücksspiels.

Heute ist die Wahrscheinlichkeitstheorie eine Grundlage der Statistik. Die angewandte Statistik nutzt Ergebnisse der Wahrscheinlichkeitstheorie, um Umfrageergebnisse zu analysieren oder Wirtschaftsprognosen zu erstellen.

Große Bereiche der Physik wie die Thermodynamik und die Quantenmechanik nutzen die Wahrscheinlichkeitstheorie zur theoretischen Beschreibung ihrer Resultate.

Sie ist ferner die Grundlage für mathematische Disziplinen wie die Zuverlässigkeitstheorie, die Erneuerungstheorie und die Warteschlangentheorie und das Werkzeug zur Analyse in diesen Bereichen.

Auch in der Mustererkennung ist die Wahrscheinlichkeitstheorie von zentraler Bedeutung.

Wahrscheinlichkeitstheorie in der Schule

Aufgrund ihrer vielseitigen Anwendungsbereiche und des Alltagsbezugs bereits junger Schüler wird die Wahrscheinlichkeitstheorie ab der ersten Klasse in allen Schulformen im Rahmen des Mathematikunterrichts gelehrt. Geht es in der Grundschule noch darum, Grundbegriffe der Wahrscheinlichkeitsrechnung kennenzulernen und erste Zufallsexperimente hinsichtlich ihrer Gewinnchancen zu bewerten,^[2] wird in der Sekundarstufe I zunehmend der Wahrscheinlichkeitsbegriff analytisch in seiner Vielseitigkeit betrachtet und es stehen zunehmend komplexere Zufallsexperimente im Zentrum des Interesses.^[3]^[4]^[5] In der Sekundarstufe II werden die Vorkenntnisse um spezifische Aspekte wie Bernoulliketten, bedingte Wahrscheinlichkeit und Laplace-Experimente erweitert.^[6]

Siehe auch

Literatur (Auswahl)

Robert B. Ash: Real Analysis and Probability (= Probability and Mathematical statistics. Band 11). Academic Press, Inc., New York (u. a.) 1972, ISBN 0-12-065201-3. MR0474442.
Krishna B. Athreya, Soumendra N. Lahiri: Measure Theory and Probability Theory. Springer Verlag, New York 2006, ISBN 978-0-387-32903-1. MR2247694.
Heinz Bauer: Wahrscheinlichkeitstheorie und Grundzüge der Maßtheorie. 4. Auflage. de Gruyter, Berlin 1991, ISBN 3-11-012191-3.
Heinz Bauer: Wahrscheinlichkeitstheorie. 5., durchgesehene und verbesserte Auflage. de Gruyter, Berlin, New York 2002, ISBN 3-11-017236-4. MR1902050.
Patrick Billingsley: Probability and Measure. 3. Auflage. Wiley, New York 1995, ISBN 0-471-00710-2.
Alexandr A. Borovkov: Probability Theory. Springer-Verlag, London 2013, ISBN 978-1-4471-5200-2 (russisch: Teoriya Veroyatnostei, 5. Aufl., 2009. Übersetzt von O. B. Borovkova und P. S. Ruzankin).
Kai Lai Chung: A Course in Probability Theory. Academic Press, San Diego (u. a.) 2001, ISBN 0-12-174151-6. MR1796326.
Erhan Çinlar: Probability and Stochastics (= Graduate Texts in Mathematics. Band 261). Springer, Dordrecht / Heidelberg / London 2011, ISBN 978-0-387-87858-4, doi:10.1007/978-0-387-87859-1.
Harald Cramér: Mathematical Methods of Statistics (= Princeton Mathematical Series). 11. Auflage. Princeton University Press, Princeton 1966.
Richard M. Dudley: Real Analysis and Probability (= Cambridge Studies in Advanced Mathematics. Band 74). Cambridge University Press, Cambridge 2002, ISBN 0-521-00754-2. MR1932358.
William Feller: An Introduction to Probability Theory and Its Applications. 3. Auflage. Band I. Wiley, New York / London / Sydney 1968, ISBN 978-0-471-25708-0.
Bruno de Finetti: Wahrscheinlichkeitstheorie. Einführende Synthese mit kritischem Anhang. 4. Auflage. R. Oldenbourg Verlag, München (u. a.) 1981, ISBN 3-486-44701-7. MR0742141.
Marek Fisz: Wahrscheinlichkeitsrechnung und mathematische Statistik (= Hochschulbücher für Mathematik. Band 40). 8. Auflage. VEB Deutscher Verlag der Wissenschaften, Berlin 1976.
P. Gänssler, W. Stute: Wahrscheinlichkeitstheorie (= Hochschultext. Band 91). Springer Verlag, Berlin Heidelberg, New York 1977, ISBN 3-540-08418-5. MR0501219.
Boris Wladimirowitsch Gnedenko: Lehrbuch der Wahrscheinlichkeitstheorie. Verlag Harri Deutsch, Thun, Frankfurt am Main 1997, ISBN 3-8171-1531-8.
Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 5. Auflage. de Gruyter, 2015, ISBN 978-3-11-035969-5.
J. Hoffmann-Jørgensen: Probability with a View toward Statistics. Volume I (= Chapman & Hall Probability Series. Band 91). Chapman and Hall, New York 1994, ISBN 0-412-05221-0. MR1278485.
Olav Kallenberg: Foundations of Modern Probability (= Probability Theory and Stochastic Modelling. Band 99). 3. Auflage. Springer, Cham 2021, ISBN 978-3-03061870-4, doi:10.1007/978-3-030-61871-1.
A. J. Khintchine und A. N. Kolmogoroff: Über Konvergenz von Reihen, deren Glieder durch den Zufall bestimmt werden. In: Recueil mathématique de la Société mathématique de Moscou [Matematicheskii Sbornik]. Band 32, 1925, S. 668–677.
Achim Klenke: Wahrscheinlichkeitstheorie. 3., überarbeitete und ergänzte Auflage. Springer Spektrum, Berlin, Heidelberg 2013, ISBN 978-3-642-36017-6, doi:10.1007/978-3-642-36018-6.
Oleg Klesov: Limit Theorems for Multi-Indexed Sums of Random Variables. Springer Verlag, Heidelberg, New York, Dordrecht, London 2014, ISBN 978-3-662-44387-3, doi:10.1007/978-3-662-44388-0. MR3244237.
A. Kolmogoroff: Grundbegriffe der Wahrscheinlichkeitsrechnung (= Ergebnisse der Mathematik und ihrer Grenzgebiete. Band 3). Springer, Berlin 1933. Reprint: Grundbegriffe der Wahrscheinlichkeitsrechnung. Springer-Verlag, Berlin / Heidelberg / New York 1973, ISBN 978-3-642-49596-0, doi:10.1007/978-3-642-49888-6 (archive.org).
A. Kolmogoroff: Über die Summen durch den Zufall bestimmter unabhängiger Größen. In: Mathematische Annalen. Band 99, 1928, S. 309–319, doi:10.1007/BF01459098. MR1512588.
Ulrich Krengel: Einführung in die Wahrscheinlichkeitstheorie und Statistik. Für Studium, Berufspraxis und Lehramt (= Vieweg Studium: Aufbaukurs Mathematik). 8. erweiterte Auflage. Vieweg, Wiesbaden 2005, ISBN 3-8348-0063-5.
Norbert Kusolitsch: Maß- und Wahrscheinlichkeitstheorie. Eine Einführung (= Springer-Lehrbuch). 2., überarbeitete und erweiterte Auflage. Springer-Verlag, Berlin, Heidelberg 2014, ISBN 978-3-642-45386-1, doi:10.1007/978-3-322-96418-2.
R. G. Laha, V. K. Rohatgi: Probability Theory (= Wiley Series in Probability and Mathematical Statistics). John Wiley & Sons, New York (u. a.) 1979, ISBN 0-471-03262-X. MR0534143.
Michel Ledoux, Michel Talagrand: Probability in Banach Spaces. Isoperimetry and Processes (= Ergebnisse der Mathematik und ihrer Grenzgebiete (3. Folge). Band 23). Springer Verlag, Berlin (u. a.) 1991, ISBN 3-540-52013-9. MR1102015.
Michel Loève: Probability Theory I. 4. Auflage. Springer-Verlag, New York / Heidelberg / Berlin 1977, ISBN 978-1-4684-9466-2, doi:10.1007/978-1-4684-9464-8.
Richard von Mises: Probability, Statistics and Truth. Reprint of the 1957 English edition. Dover Publications, Inc., New York 1981, ISBN 0-486-24214-5. MR0668875.
Jacques Neveu: Mathematische Grundlagen der Wahrscheinlichkeitstheorie. Aus dem Französischen übersetzt von Karl Bosch. R. Oldenbourg Verlag, München, Wien 1969. MR0245056.
Alfréd Rényi: Wahrscheinlichkeitsrechnung. Mit einem Anhang über Informationstheorie (= Hochschulbücher für Mathematik. Band 54). 5. Auflage. Deutscher Verlag der Wissenschaften, Berlin 1977. MR0474442.
A. N. Širjaev: Wahrscheinlichkeit (= Hochschulbücher für Mathematik. Band 91). Deutscher Verlag der Wissenschaften, Berlin 1988, ISBN 3-326-00195-9. MR0967761.
Klaus D. Schmidt: Maß und Wahrscheinlichkeit. 2., durchgesehene Auflage. Springer, Berlin / Heidelberg 2011, ISBN 978-3-642-21025-9, doi:10.1007/978-3-642-21026-6.
Vladimir Spokoiny, Thorsten Dickhaus: Basics of Modern Mathematical Statistics (= Springer Texts in Statistics). Springer-Verlag, Heidelberg, New York, Dordrecht, London 2015, ISBN 978-3-642-39908-4. MR3289985.
J. V. Uspensky: Introduction to Mathematical Probability. MacGraw-Hill Book Company, Inc., New York, London 1937.
N. N. Vakhania, V. I. Tarieladze, S. A. Chobanyan: Probability Distributions on Banach Spaces (= Mathematics and its Applications (Soviet Series). Band 14). D. Reidel Publishing Company, Dordrecht, Boston, Lancaster, Tokio 1987, ISBN 90-277-2496-2.
Walter Vogel: Wahrscheinlichkeitstheorie (= Studia Mathematica. Band XXII). Vandenhoeck & Ruprecht, Göttingen 1970. MR0286145.

Weblinks

Commons: Wahrscheinlichkeitstheorie – Sammlung von Bildern, Videos und Audiodateien

Einzelnachweise

↑ A. Kolmogoroff: Grundbegriffe der Wahrscheinlichkeitsrechnung. 1933, S. 2, 13.
↑ Bildungsstandards und Inhaltsfelder - Das neue Kerncurriculum für Hessen - Primarstufe. Hessisches Kultusministerium, abgerufen am 21. Januar 2025.
↑ Bildungsstandards und Inhaltsfelder - Das neue Kerncurriculum für Hessen - Sekundarstufe I – Hauptschule. Hessisches Kultusministerium, abgerufen am 21. Januar 2025.
↑ Bildungsstandards und Inhaltsfelder - Das neue Kerncurriculum für Hessen - Sekundarstufe I – Realschule. Hessisches Kultusministerium, abgerufen am 21. Januar 2025.
↑ Bildungsstandards und Inhaltsfelder - Das neue Kerncurriculum für Hessen - Sekundarstufe I – Gymnasium. Hessisches Kultusministerium, abgerufen am 21. Januar 2025.
↑ Kerncurriculum gymnasiale Oberstufe. Hessisches Ministerium für Kultus, Bildung und Chancen, abgerufen am 21. Januar 2025.

[1] A. Kolmogoroff: Grundbegriffe der Wahrscheinlichkeitsrechnung. 1933, S. 2, 13.

[2] Bildungsstandards und Inhaltsfelder - Das neue Kerncurriculum für Hessen - Primarstufe. Hessisches Kultusministerium, abgerufen am 21. Januar 2025.

[3] Bildungsstandards und Inhaltsfelder - Das neue Kerncurriculum für Hessen - Sekundarstufe I – Hauptschule. Hessisches Kultusministerium, abgerufen am 21. Januar 2025.

[4] Bildungsstandards und Inhaltsfelder - Das neue Kerncurriculum für Hessen - Sekundarstufe I – Realschule. Hessisches Kultusministerium, abgerufen am 21. Januar 2025.

[5] Bildungsstandards und Inhaltsfelder - Das neue Kerncurriculum für Hessen - Sekundarstufe I – Gymnasium. Hessisches Kultusministerium, abgerufen am 21. Januar 2025.

[6] Kerncurriculum gymnasiale Oberstufe. Hessisches Ministerium für Kultus, Bildung und Chancen, abgerufen am 21. Januar 2025.

[1]

[2]

[3]

[4]

[5]

[6]