Diskussion:Standardfehler

Letzter Kommentar: vor 6 Monaten von Sigma^2 in Abschnitt Standardfehler ist kein Streuungsmaß
Zum Archiv
Wie wird ein Archiv angelegt?
Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 7 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind.

Standardfehler und Stichprobenfehler

Bearbeiten

In der englischen Wikipedia wird zwischen

unerschieden. Ist also eine Unterscheidung zwischen Standardfehler und Stichprobenfehler sinnvoll? --Chrisqwq 12:00, 5. Nov. 2006 (CET)Beantworten

Abgrenzung

Bearbeiten

Stichprobenfehler: Wenn man zufällig n Personen aus der Bevölkerung auswählt und deren Durchschnittsalter bestimmt, dann ist nicht sichergestellt, daß dieser Wert dem Durchschnittsalter der Bevölkerung insgesamt entspricht. Das »arithmetische Mittel« kann in dieser und anderen möglichen Stichproben vom wahren Durchschnittswert der Grundgesamtheit zufällig abweichen.

Die Abweichungen vom Grundgesamtheitsparameter durch Stichprobenziehung bezeichnet man als Stichprobenfehler (engl.: sampling error). Wenn man alle möglichen Zufallsstichproben vom Umfang n betrachtet und jeweils das arithmetische Mittel notiert, erhält man einen Überblick über die Verteilung des arithmetischen Mittels, die man auch graphisch darstellen kann. Diese Darstellung vermittelt einen Eindruck davon, wie sehr das arithmetische Mittel in Stichproben schwanken kann, wie groß also der Stichprobenfehler ist. Die Streuung der arithmetischen Mittel über die verschiedenen Stichproben mißt man mit dem Standardfehler.

Standardfehler: Der Standardfehler (engl.: standard error) ist ein Maß für die Streuung eines Stichprobenparameters über alle möglichen Zufallsstichproben vom Umfang n aus der Grundgesamtheit. Er ist ein Maß für die durchschnittliche Größe des Stichprobenfehlers des Stichprobenparameters (z.B. des arithmetischen Mittels oder des Anteilswertes). Der Standardfehler einer Stichprobenstatistik hängt von verschiedenen Faktoren ab, je nachdem, um welchen Parameter es sich handelt. Ganz allgemein kann man jedoch sagen:

  • Der Standardfehler wird um so kleiner, je größer der Stichprobenumfang ist. Größere Stichproben erlauben präzisere Schätzungen, weil der Stichprobenfehler kleiner wird.

(unsignierter Beitrag)

Ich möchte bitte eine seriöse Quelle dafür, dass der Standardfehler synonym als Stichprobenfehler bezeichnet wird. Ohne eine solche Quellenangabe beabsichtige ich, den Begriff in der Einleitung zu löschen.--Sigma^2 (Diskussion) 15:41, 28. Apr. 2024 (CEST)Beantworten

gute Abbildungen

Bearbeiten

Gute Abbildungen gibt es hier: [1] Was ich mich frage: Wie hängt die Größe der Stichprobe mit dem Standardfehler und der Effektstärke zusammen? Wird die dort dargestellte [2] Normalverteilungskurve schmaler wenn N steigt? Und wenn ja, warum?

Standardabweichung des Mittelwerts

Bearbeiten

Ich habe die laut (jeweils aktuellen) GUM (Guide to the expression of uncertainty) und VIM (Vocabulaire international de métrologie) "richtige" Bezeichnung "Standardabweichung des Mittelwerts" hinzugefügt. Im GUM steht weiter, manchmal würde fälschlicherweise auch die Bezeichnung "Standardfehler" benutzt. Sollte man darauf hinweisen oder sind das nur Spitzfindigkeiten von Metrologen?

Evtl. könnte man auch ergänzen: "'Standardabweichung des Mittelwerts' (im Gegensatz zu der Standardabweichung einer Einzelmessung)". (nicht signierter Beitrag von 192.53.103.101 (Diskussion | Beiträge) 11:12, 29. Jul 2009 (CEST))

Mir persönlich gefällt Standardabweichung des Mittelwerts (oder genauer: des arithmetischen Mittels) auch besser, weil Fehler eigentlich eine verkehrte Bezeichnung ist. Die Varianz bezeichnet ja keinen Fehler, sonder die Schwankung einer Zufallsvariablen. -- Philipendula 13:50, 29. Jul. 2009 (CEST)Beantworten

Meiner Ansicht nach ist der Begriff Standardfehler viel zu eng gefasst. Wie oben bereits gesagt, ist der Standardfehler die Standardabweichung einer Schätz- oder Stichprobenfunktion. Für   ist es natürlich  , aber z.B. in SPSS wird bei der linearen Regression auch für die Regressionkoeffizienten ein Standardfehler ausgegeben, der natürlich   ist. -- Sigbert 08:59, 11. Okt. 2009 (CEST)Beantworten

Beipiele (Binomialverteilung), Korrekturen der Formel

Bearbeiten

Hier gab es offenbar schon seit längerem ein Missverständnis: man muss die Parameter der Binomialverteilung, z.B. N und p, und Stichprobenlänge n unterscheiden. In den bisherigen Korrekturen der Formel wurde manchmal von N=1 ausgegangen oder aber von N=n. Tatsächlich sind es aber verschiedene Parameter, oder? Der Wert N=1 wäre auch nachvollziehbar, dann hätte man aber eine Bernoulli-Verteilung, aus der man n-mal zieht. -- KurtSchwitters 14:03, 24. Nov. 2009 (CET)Beantworten

Eiscreme-Beispiel - Fehlerbalken

Bearbeiten

Müßte man für die Berechnung des Konfidenzintervalls nicht die T-Verteilung zu Grunde legen? Der Faktor von 1,96 für ein beidseitiges 95%-Konfidenzintervall gilt ja strengenommen nur bei unendlich großer Stichprobengröße bzw. näherungsweise ab etwa 1000 Werten - und das ist hier bei weitem nicht gegeben. --Jogy sprich mit mir 17:13, 22. Feb. 2010 (CET)Beantworten

Wie kommt man aus die Aussage "näherungsweise ab etwa 1000 Werten"? -- Da hätte ich aber gerne mal eine Quelle zu. -- Ich finde immer nur so etwas wie "ab ca. 35 Werten kann man die t-Verteilung approximativ mit der Normalverteilung ersetzen" ...
Norman Markgraf (Diskussion) 19:15, 14. Jun. 2020 (CEST)Beantworten

Berechnung des Standardfehlers bei verschiedenen Standardabweichungen

Bearbeiten

Hey! im Abschnitt "Standardfehler des arithmetischen Mittels" sollte evtl. darauf hingewiesen werden, wie man den Standardfehler berechnet, wenn die Varianzen der einzelnen Messungen von einander abweichen. Denn bei n Stichproben von jeweils m Werten, werden die Varianzen der n Mittelwerte oft voneinander abweichen. So ist die so oft zitierte Formel  , mit µ als den Mittelwert der Grundgesamtheit, nicht ohne weiteres anwendbar. Ich schlage daher vor: In der Herleitung darauf hinzuweisen, dass die einzelnen Varianzen der Stichproben als gleich angenommen werden und für abweichende Varianzen gilt:

  (nicht signierter Beitrag von Xeltok (Diskussion | Beiträge) 11:18, 6. Jul 2010 (CEST))
Ich habe es ergänzt. Danke --Sigbert 08:14, 8. Jul. 2010 (CEST)Beantworten

"durchschnittliche Abweichung des geschätzten Parameterwertes "

Bearbeiten

"Der Standardfehler ist daher die durchschnittliche Abweichung des geschätzten Parameterwertes vom wahren Parameterwert."

Wenn man damit die durchschnittliche Differenz eines Wertes vom Mittelwert meint, stimmt das m.E. nicht. Die Werte -2,0,2 weichen im Schnitt um (|-2-0|+|0-0|+|2-0|)/3 = 4/3 = 1,333 vom Mittelwert 0 ab. Der Standardfehler beträgt nach der angegebenen Formel aber Sqrt(((-2-0)²+(0-0)²+(2-0)²)/3) = Sqrt(8/3) = 1.633. equa 21:10, 7. Aug. 2011 (CEST)Beantworten

Standardabweichung des Absolutglieds der linearen Einfachregression

Bearbeiten

Es gab einen kleinen Editwar bei Standardfehler#Standardfehler_der_Regressionskoeffizienten. Richtig ist

 

oder

 .

Bin mal auch so frei, bei linearer Einfachregression B0 und B1 in a und b umzutaufen. Die vorher verwendete Bezeichnungsweise bietet sich vor allem bei multipler Regression an, die hier aber vermieden wird. --Philipendula (Diskussion) 16:23, 8. Jul. 2012 (CEST)Beantworten

Das + gehört nicht in die Formel. Zusätzlich zum Nachschlagen oder Herleiten der Formel kann man auch folgende Überlegung anstellen: Die Schätzwerte bei der Regression werden um so genauer, je mehr Meßwerte vorliegen (bei gleichem   und etwa gleichen  -Werten). Bei einer Verdopplung der Meßwerte verdoppeln sich sowohl   also auch  , der Quotient bleibt also etwa gleich. In der oberen, korrekten Formel wird wegen der Multiplikation mit   die Standardabweichung   kleiner. In der Formel
 
(so stand sie im Artikel) konvergiert   mit wachsendem   gegen einen Wert größer als 0, was den Formeln der Regression widerspricht (s. arithmetisches Mittel). .gs8 (Diskussion) 11:13, 9. Jul. 2012 (CEST)Beantworten
Die von Dir angegebene Formel hat einen Fehler, weil im Zähler   statt   steht. Das ist speziell eine Umformung für Mediziner u.ä., die   besser als   verstehen. Es stimmt tatsächlich, ich habs nachgerechnet. Gruß --Philipendula (Diskussion) 11:46, 9. Jul. 2012 (CEST)Beantworten
Ich hab die Formel aus der letzten Bearbeitung von Dakawo hierhin kopiert. Daß die Änderung in Deiner Formel oben eine beabsichtigte Korrektur ist, war mir nicht aufgefallen. Nach eigener Umformung komme ich auch zu dem Ergebnis, daß beide Formeln von Dir korrekt sind. Wegen des fehlenden Summenzeichens stimmt meine obige Überlegung auch wieder. Trotzdem ist die zweite Formel für mich gewöhnungsbedürftig. Gruß .gs8 (Diskussion) 12:28, 9. Jul. 2012 (CEST)Beantworten
Ja, für mich auch. --Philipendula (Diskussion) 13:54, 9. Jul. 2012 (CEST)Beantworten

Standardfehler -> Binomial / Anteilswerte

Bearbeiten

Zu

bzw

Ich glaube dennoch, die Formel ist falsch (Korrektur muss noch gesichtet werden). Das Statistikbuch (einzige zur Hand), Bortz, 1999, ist im Einklang mit Seiten aus dem Internet, die klar machen, dass das groß-N da nichts verloren hat, sondern bei Antweilswerten (komischerweise in anderssprachigen Wikis nicht aufgeführt) lautet:

 

(deswegen BREXIT fehlprognostiziert!?!? *scherzamrande*) 84.147.233.98 20:55, 3. Dez. 2016 (CET)Beantworten

Das war wohl schon so gedacht: Es wird eine Stichprobe vom Umfang n aus binomialverteilten Zufallsvariablen mit Parameter N und p gezogen. Ist vielleicht ein etwas ungewöhnliches Szenario, aber warum nicht? -- HilberTraum (d, m) 16:12, 4. Dez. 2016 (CET)Beantworten

Quadratwurzel ist immer positiv

Bearbeiten

Gleich im ersten Absatz gibt es einen Verständnisfehler, was Quadratwurzeln betrifft. Es ist zwar so, dass eine quadratische Gleichung wie   zwei Lösungen fü x aufweist, nämlich 2 und –2. Aber:

Das Ergebnis einer Quadratwurzel ist immer positiv.

Genauer gesagt, ist das Ergebnis einer Quadratwurzel ein Betrag – und Beträge sind immer positiv, auch dann, wenn das, was zwischen den Betragsstrichen steht, ein negativer Wert ist. Vgl. dazu den Wikipedia-Artikel Quadratwurzel oder auch beispielsweise das folgende PDF-Dokument:

Eindeutigkeit der Wurzel ↔ 2 Lösungen bei quadratischen Gleichungen.

(Ein Blick in jede beliebige Formelsammlung tuts auch.) Korrekt wird die oben angegebene quadratische Gleichung also so gelöst:

(1)  |Wurzel ziehen

(2)  |Betrag auflösen

(3)  

(4)  

Viele Grüße

--Jake2042 (Diskussion) 03:17, 28. Sep. 2019 (CEST)Beantworten

Wenn das der einzige Fehler dieses Grotten schlechten Beitrags wäre, könnte man darüber hinweg sehen. -- Aber das permanente Springen zwischen Zufallsvariabeln und Statistischen Variablen (aka Merkmale) und deren Werte (aka Merkmalsausprägungen) lässt einen an jeder Ecke schaudern. Hier gehört definitiv mal ein "Bitte dringend überarbeiten"- Schild an den Beitrag!
Norman Markgraf (Diskussion) 19:31, 14. Jun. 2020 (CEST)Beantworten
Norman Markgraf: Welches springen von ZVen und Merkmalsausprägungen meinst du genau? Habe beim groben überfliegen nichts entdecken können. Zudem wird aus Gründen der Vereinfachung zwischen ZVen und Merkmalsausprägungen oft in der Notation nicht unterschieden (auch in der Fachliteratur). Ist daher nicht unbedingt ein Makel. Wenn aber schon unterschieden wird in der Notation, dann sollte die Unterscheidung natürlich durchgehend verwendet werden.--Jonski (Diskussion) 19:37, 14. Jun. 2020 (CEST)Beantworten
Mal ein Beispiel. Im Text steht:
Für die Schätzfunktionen
  und
 
ergibt sich dann
  und  .
Die Standardfehler der Regressionskoeffizienten ergeben sich zu
 
und
 .
Was ist nun  , die Zufallsvariable   oder vielleicht doch deren Realisation  , welche ich aus der Beobachtung/ Messung habe? -- Okay, macht keinen Unterschied, wenn ich die Regressionkoeffizenten kenne und auch das Residuum. -- Aber ... die kenne ich doch gar nicht...
Analog die Frage nach dem   oder ist es doch eher   als Mittelwert der Realisationen  ?
Wie die Standardfehler nun genau sind, möge man mal mit den Kollegen von https://de.wikipedia.org/wiki/Standardfehler_des_Regressionskoeffizienten diskutieren. Die beiden Fassungen sind nämlich nicht äquivalent.
Norman Markgraf (Diskussion) 20:40, 14. Jun. 2020 (CEST)Beantworten
Ich habe den von dir verlinkten Artikel geschrieben und auch die hiesige Formel eingefügt.   und   sind ZVen deswegen sind sie groß notiert. Konkret zu deiner Frage:   ist die Zufallsvariable   und   ist kein Mittelwert von Realisierungen sondern von Zven. Wenn ich es richtig verstanden habe, dann verstehst du nicht genau wie man auf die rechte Seite der Gleichung kommt bei den jeweiligen Parameterschätzern?--Jonski (Diskussion) 20:54, 14. Jun. 2020 (CEST)Beantworten
Dass wie von dir behauptet im Abschnitt #Standardfehler der Regressionskoeffizienten im einfachen Regressionsmodell angeblich rumgesprungen wird zwischen Zufallsvariabeln und statistischen Variablen entspricht schlicht nicht der Wahrheit.--Jonski (Diskussion) 21:33, 14. Jun. 2020 (CEST)Beantworten

Standardfehler des arithmetischen Mittels

Bearbeiten

Hallo. Entschuldigt, falsch ich was falsch verstanden habe, aber der Standardfehler des Mittelwertes bezieht sich immer auf eine Stichprobe, nicht die Grundgesamtheit oder? Also müsste man dann nicht s statt sigma schreiben? (nicht signierter Beitrag von 195.37.187.155 (Diskussion) 17:16, 14. Okt. 2020 (CEST))Beantworten

Standardfehler des arithmetischen Mittels ist eine verkürzte und seltsame Formulierung. Es gibt einen Standardfehler der Mittelwertschätzung und einen geschätzten Standardfehler.--Sigma^2 (Diskussion) 23:02, 28. Apr. 2024 (CEST)Beantworten

Standardfehler ist kein Streuungsmaß

Bearbeiten

Der Standardfehler ist kein eingenständiges Streuungsmaß, sondern eine Schätzung der Standardabweichung einer Schätzfunktion. Da es unterschiedliche Möglichkeiten zur Schätzung gibt, gibt es streng genommen auch nicht den Standardfehler. --KlausTh-Mathe (Diskussion) 09:59, 15. Feb. 2024 (CET)Beantworten

Es müssen drei Dinge auseinandergehalten werden
  1. der (theoretischen) Standardfehler der Schätzfunktion (eine in der Regel unbekannte Konstante, die von einem unbekannten Parameter abhängt),
  2. ein Schätzwert für diesen Standardfehler (verschiedenene Schätzfunktionen für den unbekannten Parameter führen zu verschiedenen Schätzwerten),
  3. eine Schätzfunktion für den Standardfehler der Schätzfunktion (Zufallsvariable, nicht eindeutig).
Beispiel   stochastisch unabhängig mit  ;   ist unbekannt.   ist in diesem Kontext eine übliche Schätzfunktion für  .
  1. Der Standardfehler der Schätzfunktion   für   ist  .
  2. Wenn   ein Schätzwert für   ist, dann ist   ein Schätzwert für den Standardfehler der Schätzung von   durch   oder der geschätzte Standardfehler. Der geschätzte Standardfehler wird in bestimmten Anwendungsbereichen häufig einfach als Standardfehler bezeichnet.
  3. Der Schätzwert   für   ist der realisierte Wert einer Schätzfunktion   (eine Zufallsvariable mit Wahrscheinlichkeitsverteilung). Dann ist   eine Schätzfunktion für den Standardfehler der Schätzung von   durch   oder der zufällige geschätzte Standardfehler. In Wahrscheinlichkeitsaussagen (z. B. Konfidenzaussagen) muss die Zufallsvariable, der zufällige geschätzte Standardfehler, verwendet werden.
Der Standardfehler ist ein Streuungsmaß für eine Schätzfunktion, da er die Standardabweichung einer Schätzfunktion ist. In der statistischen Theorie werden Schätzfunktionen unter anderem anhand ihres Standardfehlers verglichen.
Beispiel: Die Schätzfunktion   hat den Standardfehler  , die ebenfalls denkbare Schätzfunktion   hat den Standardfehler  . Für   hat   den kleineren Standardfehler als  .
In einigen Anwendungsbereichen (teils ganzen Fächern) wird in Statistik eine unscharfe Pfuscherei betrieben, indem man - teilweise auch schon in der Lehre - versucht, um die konzeptionelle und sprachliche Unterscheidung der drei Objekte  ,   und   herumzukommen. Vor allem dort, wo man glaubt, man könne Statistik anhand von Software verstehen. Dort wird aber nur eine Zahl ausgespuckt, die heißt dann z. B. "S. E." für Standard Error.
In dieser Beziehung ist der Artikel noch erheblich verbesserungsfähig, z. B. ist die nicht erklärte Notation   für diejenigen verständlich, die den Artikel nicht benötigen, aber sonst könnte damit ein Schätzwert (eine Zahl) oder ein Schätzer (eine Zufallsvariable) gemeint sein. Insbesondere könnte im Artikel mehr zu geschätzten Standardfehlern stehen, mit denen die Anwender konfrontiert sind.--Sigma^2 (Diskussion) 15:34, 28. Apr. 2024 (CEST)Beantworten
Vielen Dank für die ausführliche Darstellung, mit der ich im wesentlichen übereinstimme; insbesondere betrifft dies die kritischen Bemerkungen im vorletzten Absatz.
In der Literatur wird die Bezeichnung Standardfehler oftmals nur für die (theoretische bzw. konkrete) Schätzung der Standardabweichung einer Schätzfunktion (im obigen Beispiel 2. und 3.) verwendet, nicht jedoch für den theoretischen Wert (im obigen Beispiel 1.). Ich denke, dass es hier für oder gegen beide Varianten gute Gründe gibt.
Hinsichtlich der Bezeichnung des Standardfehlers als Streuungsmaß habe ich eine andere Auffassung, da für mich das Streuungsmaß der Operator (also hier die Standardabweichung) ist. In der Literatur wird der Begriff aber auch für die Ergebnisse verwendet, so dass ich zugeben muss, dass meine ursprüngliche Kritik überzogen war. --KlausTh-Mathe (Diskussion) 20:12, 29. Apr. 2024 (CEST)Beantworten
Wir sind uns ziemlich einig. Eine Literatursichtung hat mir gezeigt, dass der Begriff Standardfehler in der Statistikliteratur erstaunlich selten verwendet wird, am ehesten in sehr anwendungsnahen Büchern (Ökonometrie, Biometrie). Und dann geht es richtig durcheinander: gemeint sein kann 1. die Standardabweichung des Fehlers   (eigentliche Bedeutung!) = die Standardabweichung der Schätzfunktion (da  ), 2. ein Schätzwert für diese Standardabweichung, 3. eine Schätzfunktion (ein Schätzer) für diese Standardabweichung. Dies muss in einem enzyklopädischen Artikel dargestellt sein. In der jetzigen Fassung liest es sich so, als sei es ein klar definierter und eindeutiger Begriff der statistischen Theorie.--Sigma^2 (Diskussion) 21:51, 29. Apr. 2024 (CEST)Beantworten