Diskussion:Empirische Varianz

Einleitung dieser Diskussionsseite anzeigen



Zum Archiv
Wie wird ein Archiv angelegt?

Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 7 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind.

${\tilde {s}}^{2}$ vs. $\quad s^{2}$ (s^2 mit und ohne Tilde)

Letzter Kommentar: vor 7 Monaten5 Kommentare3 Personen sind an der Diskussion beteiligt

Aus dem Artikel heraus wird der Unterschied zwischen ${\tilde {s}}^{2}$ und $\quad s^{2}$ nicht klar. Gemeint ist doch die sogenannte Endlichkeitskorrektur, oder? Dann sollte man die Idee dahinter vielleicht genauer explizieren. --Zulu55 (Diskussion) 16:29, 21. Aug. 2018 (CEST)Beantworten

Hallo Zulu55! Mit der Tilde werden üblicherweise verzerrte Schätzer bezeichnet.

{\tilde {s}}^{2}

ist die Realisation der verzerrten Schätzfunktion

{\tilde {S}}^{2}

. Die erwsrtungstreue Schätzfunktion wird mit

{\hat {\sigma }}^{2}=S^{2}

bezeichnet und die Realisation ist

s^{2}

. Beste Grüße.--Jonski (Diskussion) 00:48, 22. Aug. 2018 (CEST)Beantworten

Die Aussage von Jonski: „Mit der Tilde werden üblicherweise verzerrte Schätzer bezeichnet“ kann ich überhaupt nicht nachvollziehen. Wenn irgendetwas üblich ist, dann, den Schätzer

{\frac {1}{n}}\sum _{i=1}^{n}(X_{i}-{\bar {X}})

als

S^{*2}

zur Unterscheidung vom Schätzer

S^{2}={\frac {1}{n-1}}\sum _{i=1}^{n}(X_{i}-{\bar {X}})

zu bezeichnen.--Sigma^2 (Diskussion) 09:09, 23. Mai 2024 (CEST)Beantworten

Die Aussage von Jonski: „Die erwartungstreue Schätzfunktion wird mit

{\hat {\sigma }}^{2}=S^{2}

bezeichnet“ kann ich nicht nachvollziehen. Das mag irgendwer so machen, aber in irgendeinem Sinn üblich ist es nicht. Die Notation

{\hat {\sigma }}^{2}

kann einen Schätzwert oder eine Schätzfunktion bezeichnen, auch eine Maximum-Likelihood-Schätzer kann mit

{\hat {\sigma }}^{2}

bezeichnet sein, ohne dass dieser im Allgemeinen erwartungstreu ist. --Sigma^2 (Diskussion) 09:45, 23. Mai 2024 (CEST)Beantworten

Die Endlichkeitskorrektur hat etwas mit dem Ziehen ohne Zurücklegen aus endlichen Grundgesamtheiten zu tun. Während der Faktor

\textstyle {\frac {1}{n-1}}

mit der Erwartungstreue der Schätzfunktionen zu tun hat.--Sigma^2 (Diskussion) 09:09, 23. Mai 2024 (CEST)Beantworten

Empirische Standardabweichung

Letzter Kommentar: vor 4 Jahren1 Kommentar1 Person ist an der Diskussion beteiligt

Zu den Größen ${\tilde {s}}:=+{\sqrt {{\frac {1}{n}}\sum \limits _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}}$ und $s:=+{\sqrt {{\frac {1}{n-1}}\sum \limits _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}}$ . wurde im Artikel behauptet:

Die Definition $s$ ist im Gegensatz zu ${\tilde {s}}$ ein erwartungstreuer Schätzer für die Standardabweichung $\sigma$ .

Das stimmt natürlich nicht, ein Gegenbeispiel findet sich in Stichprobenvarianz (Schätzfunktion)#Schätzung der Standardabweichung der Grundgesamtheit aus einer Stichprobe. Als Quelle wurde

Kapitel 10: Erwartungstreue Schätzer (PDF-Datei), www.alt.mathematik.uni-mainz.de, abgerufen am 31. Dezember 2018

angegeben. Die Seite ist nicht mehr erreichbar, aber wenn man sich anschaut, was die im Artikel noch belegen sollte, hat da jemand einfach die Linearität des Erwartungswerts auf die nicht-lineare Wurzelfunktion angewendet. Kann jemand bitte zu der analogen (und richtigen) Aussage zu ${\tilde {s}}^{2}$ und $s^{2}$ bzgl. der Varianz $\sigma ^{2}$ eine neue Quelle raussuchen?

Vielen Dank und liebe Grüße -- 2A02:8109:B6C0:2828:2CD4:6FF6:C052:34C1 12:14, 21. Mär. 2020 (CET)Beantworten

Empirische Varianz vs Stichprobenvarianz

Letzter Kommentar: vor 2 Jahren12 Kommentare2 Personen sind an der Diskussion beteiligt

Ich beziehe mich auch auf den Ausgangspunkt dieser Diskussion und stimme zu, dass hier Verbesserungsbedarf besteht. Daher: Ich habe inzwischen den Artikel Stichprobenvarianz präzisiert und genauer zur empirischen Varianz abgegrenzt. Die Abgrenzung ist jetzt auch auf auf der Seite Varianz erklärt. Als nächstes werde ich auf dieser Seite ein paar Verbesserungen vornehmen, um Verwechslung mit der Stichprobenvarianz zu vermeiden. --Mbasti01 (Diskussion) 09:43, 1. Feb. 2022 (CET)Beantworten

Was ich da oben mal etwas frustriert kritisiert hatte (und falsch begründet hatte), scheint nicht nur für mich eine Verständnisbarriere zu sein, wie man dem von dir verlinkten Video entnehmen kann. Evtl. gelingt es uns, das Begriffswirrwar didaktisch irgendwie abzufedern, damit der an sich ja nicht sehr komplizierte Stoff auch Newbies zugänglich wird.Leider kollidieren hier oft die per Definition festgelegten Namen mit dem Sprachgefühl. Z.B. klingt für mich die "Stichprobenvarianz" nach "Varianz der Stichprobe" und überhaupt nicht nach "geschätzte Varianz der Grundgesamtheit". Und der tiefere Sinn des Attributes "empirisch" ist mir bis heute ein Rätsel geblieben. TiHa (Diskussion) 10:44, 3. Feb. 2022 (CET)Beantworten

Vielen Dank für die Antwort. Folgende Idee:

Der Artikel Stichprobenvarianz bezieht sich auf das Ziel, die Varianz der Grundgesamtheit zu schätzen". Für eine bessere Abgrenzung sollte sich dieser Artikel Empirische Varianz auf das Thema "Kennzahl eines konkreten Datensatzes" fokussieren. Dann geht es hier in diesem Artikel also NICHT um "Grundgesamtheit" und "Stichprobe" sondern um die Beschreibung "konkrete Datensätze".

Natürlich gibt es begriffliche Überschneidungen, die man auch benennen ("abfedern") kann. Aber folgende Kategorisierung kann Klarheit bringen:

Die Begriffe "Grundgesamtheit", "Stichprobe", "Schließende Statistik", "Schätzung" .... gehören zusammen und passen bessser zum Artikel/Thema "Stichprobenvarianz". Siehe auch das neue Bild auf der Seite Stichprobenvarianz. Das Ziel einer Stichprobe ist es ja auf eine Grundgesamtheit (Population) zu schließen.
Die Begriffe "Konkreter Datensatz", "Kennzahl für den Datensatz", "Beschreibende Statistik" ... gehören zusammen und passen besser zum Artikel "Empirische Varianz". Mit dem Begriff "Empirisch" bin ich an dieser Stelle auch nicht 100%ig glücklich. Aber ich habe keinen besseren. Und ich empfinde ihn auch nicht als falsch.

Können wir die Unterscheidung in dieser Form verwenden und diesen Artikel entsprechend umgestalten? Bitte um Rückmeldung, wer dieser Argumentation folgen kann, bzw. ob es andere Argumente gibt. Jedenfalls wäre das ein größerer Umbau. Viele Grüße --Mbasti01 (Diskussion) 11:18, 3. Feb. 2022 (CET)Beantworten

Solange es sich nur um Benennungen handelt oder welchen Benennungen zuammengehören, ist m.E. nicht sehr viel erreicht. Am besten wäre es meiner Meinung nach, wenn man, bevor man definiert, wie etwas heißt, erstmal klar macht, was es ist und wozu es gut ist, was, glaub ich, die Aufgabe des Abschnittes "Motivation" ist. Da die Formeln mit unterschiedlichen Namen oder Anwendungszwecken doch mathematisch immer gleich sind (abgesehen von (n) und (n-1)), stellt sich dann halt die Frage, warum es dann so und so heißt, z.B. gleich im ersten Satz, wo "empirische Varianz" mit "einfach Varianz" gleichgesetzt wird. Sobald so ein Attribut, wie "empirisch" dranhängt, muss sich ein aufmerksamer Leser ja fragen, was dann eine "nicht-empirische Varianz" sein mag. Da schickt Wikipedia meinen Wissensdurst aber leider in die Wüste ;-) TiHa (Diskussion) 07:47, 4. Feb. 2022 (CET)Beantworten

Guter Punkt. Die "Bedeutung" steht im Vordergrund.

Das Problem ist, dass die unterschiedliche "Bedeutung" der Seitentitel "Empirische Varianz" und "Stichprobenvarianz" von verschiedenen Literaturstellen verschieden interpretiert wird. Die Wortwahl ist nicht glücklich und taugt daher nicht als Überschrift (Lemma) in Wikipedia.

Empirische Varianz (gibt es auch eine "nicht-empirische V."? (siehe oben TiHa))
Stichprobenvarianz (Varianz der Stichprobe? Oder Verwendung der Stichprobe zur Varianzschätzung?)

"Varianz" 2022-02-05

Ich habe ein Diagramm gemacht um den Bestand der Seiten zu zeigen, die mit Varianz zusammenhängen. Mir hat das geholfen um folgenden Vorschlag zu formulieren:

Wir haben eine Seite "Varianz (Stochastik)" -> OK
Wir brauchen eine Seite "Varianz (Berechnung)" -> NEUE bzw. verschobene bestehende Seite

Inhalt von "Varianz (Berechnung)": Es gibt 2 unterschiedliche Haupt-Motivationen:

a) Schätzung der Varianz einer Gesamtheit basierend auf einer Stichprobe, bzw. es wird von der Stichprobe auf die Gesamtheit geschlossen (induktive Statistik) ( Verwendung Formeln (1)(2) auf der Seite "Stichprobenvarianz").

b) Berechnung der Varianz eines Datensatzes (es gibt keine größere Gesamtheit als diesen Datensatz, bzw. es gibt nichts zu schätzen, es gibt nur etwas zu beschreiben (deskriptive Statistik) ) ( Verwendung von Formel (3) auf der Seite "Stichprobenvarianz")

Es werden auch Beispiele benötigt, um den Unterschied in der Bedeutung von a) und b) greifbar zu machen.

Vorschlag für das Vorgehen:

Verschiebung der Seite "Stichprobenvarianz" nach "Varianz (Berechnung)"
Löschen der Seite "Empirische Varianz"
Anpassen der Links und der anderen Seiten, sowie insbesondere auch Anpassungen/Beispiele auf der (ehemaligen) Seite "Stichprobenvarianz" um das Ganze wieder konsistent zu bekommen.

--Mbasti01 (Diskussion) 12:06, 5. Feb. 2022 (CET)Beantworten

hi Mbasti01, danke für die Übersicht. Ich kann nicht beurteilen, ob das so alles richtig ist. Jedenfalls besitze ich ein Mathemtiklexikon, wo alle Stichwörter wie "emp. Mittelwert", "emp. Var." usw. auf die entsprechenden Artikel wie "Stichprobenmittlwert", "StichprobenVar." usw. verweisen - sprich, die setzen das gleich. TiHa (Diskussion) 19:42, 6. Feb. 2022 (CET)Beantworten

Hallo @TiHa, ich bin in Wikipedia fündig geworden :):

"Empirie .. ist eine methodisch-systematische Sammlung von Daten. … Dem stehen die nichtempirischen Wissenschaften gegenüber, ... , etwa Mathematik … weil hier Aussagen formuliert werden, die allein aus logischen (formalen) Gründen richtig oder falsch sind."

Demnach beruht die "empirische Varianz" auf erhobenen Daten. Und die "nichtempirische Varianz" beruht dagegen auf abstrakter Mathematik (auf Stochastik, ...).

Auch die Stichproben der Seite Stichprobenvarianz sind nichts als eine methodisch-systematische Sammlung von Daten ... also Empirie. Dein Mathematiklexikon hat also recht: Stichprobenvarianz und empirische Varianz kann man gleichsetzen.

Damit bleibt der Vorschlag: Die bestehenden Seiten "Empirische Varianz" und "Stichprobenvarianz" sollten zusammengefasst werden. (neuer Namensvorschlag: "Varianz (Empirie)", als Konterpart zur Seite "Varianz (Stochastik)" ).

Oder?

P.S.: Die Argumentation mit "Empirie" gefällt mir jetzt besser als der Bezug auf die "Beschreibende Statistik", den ich oben bemüht hatte. --Mbasti01 (Diskussion) 17:10, 7. Feb. 2022 (CET)Beantworten

Obercool :-). So, wie du es erklärst, ist es sehr plausibel. Allerdings fragt sich ein von Zweifeln geplagter Mensch wie ich dann, wieso die Verwendung der Grundgesamtheit, wenn man sie denn hat, nicht ebenso "empirisch" ist, wie die Verwendung einer Stichprobe ;-). Ich glaube, man kommt nicht umhin, die Fachwörter als eingebürgerte Konventionen anzuerkennen. Und da, wo die Verwendung nicht einheitlich ist, sollte man erklären, was den Unterschied ausmacht.

Deine Verbesserunsgvorschläge find ich gut. TiHa (Diskussion) 07:15, 8. Feb. 2022 (CET)Beantworten

Danke, freut mich, dass es Dir im Prinzip gefällt. Ich habe daher mal einen Redundanzbaustein platziert. Mit den "Konventionen" hast Du recht. Wir können eingebürgerte Fachwörter nicht ändern und sollten gegebenenfalls unterschiedliche Verwendungen durchaus erklären. Gleichzeitig sollten wir einen neuen Seitentitel finden, der weniger Interpretationsspielraum bietet.

Zur Frage der Grundgesamtheit:

Eine Stichprobe ist ein Ausschnitt aus der Grundgesamtheit. Der Grenzfall ist natürlich, dass die Stichprobe die ganze Grundgesamtheit umfasst. In diesem Fall wäre der "wahre Mittelwert" bekannt und gleich wie der "Stichproben-Mittelwert". Dann würde ich Formel (2) auf der Seite Stichprobenvarianz verwenden mit

\mu _{0}={\overline {X}}

. In diesem Fall: Empirie - systematische Datensammlung - mit dem Ziel wirklich alle Daten zu erheben und nichts zu verlieren.

Häufig ist die Grundgesamtheit jedoch unendlich groß. Oder zumindest sehr groß. In diesem Fall: Empirie - systematische Datensammlung - mit dem Ziel zu einer repräsentativen Stichprobe zu kommen, die auch für Aussagen über die Grundgesamtheit tauglich ist. z.B: Aussage über die gesamte Produktion einer Produktionsmaschine - wie viele Stichproben sollte man mindestens nehmen - und zu welchen Zeitpunkten?. Oft sind es Kostenaspekte, die dazu führen, dass Stichproben nicht größer sein dürfen als xxx. --Mbasti01 (Diskussion) 17:49, 9. Feb. 2022 (CET)Beantworten

Die wesentlichen Inhalte dieser Seite finden sich jetzt in den Seiten Varianz (und Varianz (Stochastik)). Daher wurde eine Weiterleitung eingerichtet. --Mbasti01 (Diskussion) 17:29, 21. Feb. 2022 (CET)Beantworten

nächste Schritte

Auf der Seite Varianz wurde der Ist-Zustand der Varianz-Seiten und die vorangegangen Ergebnisse der Redundanzdiskussion diskutiert. Ergebnis:

Die Weiterleitung wurde wieder entfernt.
Der Fokus für weitere Änderungen ist zunächst die Seite "Empirische Varianz". Danach die anderen Seiten: "Varianz", "Stichprobenvarianz (Schätzfunktion), "Varianz (Stochastik)".
Es wird ein schrittweises Vorgehen durch mehrere Autoren erfolgen.
Die Diskussion wird auf der Seite Varianz fortgeführt. (Es geht ja auch um die Frage: Welcher Inhalt auf welcher Seite?)

--Mbasti01 (Diskussion) 09:26, 18. Mär. 2022 (CET)Beantworten

Das meiste sollte erledigt sein. Bitte um Rückmeldung, falls noch etwas fehlt oder nicht in Ordnung ist. --Mbasti01 (Diskussion) 16:01, 12. Mai 2022 (CEST)Beantworten

Zufallsvariablen versus Realisierungen

Letzter Kommentar: vor 4 Monaten5 Kommentare2 Personen sind an der Diskussion beteiligt

Im Artikel werden Schätzwerte (Realisierungen von Schätzern) und Schätzer (Stichprobenfunktionen als Zufallsvariablen und Funktionen der Stichprobenvariablen) häufig durcheinandergewürfelt.
In der beschreibenden Statistik gibt es keine Begründung für die hier angegebene Form einer Varianz. Erst im Rahmen der induktiven Statistik mit dem Ziel die Varianz einer Grundgesamtheit zu schätzen, ergibt sich, falls das Ziel ist einen erwartungstreuen Schätzer zu verwenden eine Rechtfertigung für die korrigierte Stichprobenvarianz. --Sigma^2 (Diskussion) 21:07, 25. Aug. 2023 (CEST)Beantworten
Ich kam über Portal:Mathematik/Qualitätssicherung#Stichprobenvarianz in zwei Artikeln auf den Artikel. Ich halte die Darstellung insgesamt für so falsch/unangemessen/..., dass ich für eine Löschung plädieren würde. --KlausTh-Mathe (Diskussion) 10:00, 12. Feb. 2024 (CET)Beantworten

Ich bin gegen die Löschung des Artikels, da die empirische Varianz im Rahmen der deskriptiven Statistik eine eigenständige Bedeutung hat.--Sigma^2 (Diskussion) 13:39, 24. Aug. 2024 (CEST)Beantworten

Der Argumentation kann ich folgen. Aber was soll mit dem Artikel geschehen? Vielleicht wäre es sinnvoll, ihn auf den rein deskriptiven Aspekt zu reduzieren und nur konkrete Stichproben (kleine

x_{i},s^{2},\ldots

) zu betrachten. Alle Aussagen über Verteilungen, Erwartungswerte etc. sollten dann hier entfernt und ggf. auf einen entsprechenden Artikel als Hinweis verlinkt werden. --KlausTh-Mathe (Diskussion) 08:20, 26. Aug. 2024 (CEST)Beantworten

Der Artikel ist so fehlerhaft, dass man ihn mit sehr großem Aufwand an sehr vielen Stellen korrigieren muss. Durch die ständige Verwechselung von Schätzwerten und Schätzfunktionen kann er für keine Lesergruppe irgendetwas erklären oder klären.--Sigma^2 (Diskussion) 08:53, 23. Mai 2024 (CEST)Beantworten

Unstimmigkeit im Beispiel 2: Stichprobe mit n = 100

Letzter Kommentar: vor 4 Monaten2 Kommentare2 Personen sind an der Diskussion beteiligt

Der "wahre Varianzwert mit 95% Wahrscheinlichkeit im Bereich von s² " wird mit = 1 +_ 0,28 angegeben. Sind die angegebenen 0,28 zutreffend? --62.225.187.245 18:11, 22. Aug. 2024 (CEST)Beantworten

Der gesamte Abschnitt Genauigkeit der berechneten empirischen Varianz ist ungenau, teilweise falsch und unverständlich.

s^{2}

bezeichnet mal eine Zufallsvariable (Stichprobenfunktion), mal eine feste Zahl. Siehe da zu auch die Kritik im vorausgegangenen Diskussionsabschnitt, die größere Teile des Artikels betrifft. Zusätzlich wird

s^{2}

noch mit der Varianz der Grundgesamtheit verwechselt.

Die berechnete empirische Varianz, wird mit einer einfachen Formel aus den beobachteten Werten

x_{1},\dots ,x_{n}

berechnet. Das Resultat ist eine Zahl, dabei gibt es keine Genauigkeit der berechneten empirischen Varianz.

Etwas anderes ist es wenn, eine empirische Varianz im Kontext einer Zufallsstichprobe als Schätzwert eines unbekannten Parameters – der Varianz der Grundgesamtheit – fungieren soll. Dann kann die Verteilung der zugehörigen Schätzfunktion betrachtet werden. Es gibt allerdings keine Verteilung eines konkreten Schätzwertes, sondern nur Verteilungen von Zufallsvariablen.--Sigma^2 (Diskussion) 13:35, 24. Aug. 2024 (CEST)Beantworten

Abschnitt hinzufügen