In der Statistik sind Zähldaten ein Datenformat bei dem Beobachtungen ausschließlich nichtnegative ganzzahlige Werte annehmen können (also 0, 1, 2, 3, …). Diese Werte entstehen durch Zählen, und nicht durch Bewerten und Anordnung (wie etwa bei der Likert-Skala, vgl. Ordinalskala). Außerdem unterscheiden sich Zähldaten von Binärdaten, die nur zwei Werte (0 und 1) annehmen können. Es handelt sich demnach um diskrete Häufigkeiten, etwa wie viele Tage jemand im letzten Jahr gefehlt hat. Bei der Modellierung von Zähldaten kommt es oft zum Phänomen der Überdispersion.

Schätzung von Zähldaten-Modellen

Bearbeiten

Gängige Methoden wie die Methode der kleinsten Quadrate sind zur Schätzung von Zähldaten-Modellen nicht geeignet. Daher gibt es besondere statistische Methoden zur Analyse von Zähldaten (Regression für Zähldaten).[1] Die Methoden beziehen sich auf die zugrunde liegenden Verteilungen, etwa die Poisson-Verteilung oder die negative Binomialverteilung. Hierbei stellt die Verwendung der Poisson-Verteilung die einfachste und am meisten benutzte Variante dar.[2] Um gewisse Probleme mit nicht beobachteten Fällen zu umgehen, kann auf die additive Glättung zurückgegriffen werden.

Literatur

Bearbeiten
  • Winkelmann, R. (2008). Econometric analysis of count data. Springer Science & Business Media.

Einzelnachweise

Bearbeiten
  1. Windzio, M. (2013). Schätzung der Anzahl von Ereignissen: Modelle für Zähldaten. In Regressionsmodelle für Zustände und Ereignisse (pp. 193–207). Springer VS, Wiesbaden.
  2. Ludwig Fahrmeir, Thomas Kneib, Stefan Lang, Brian Marx: Regression: models, methods and applications. Springer Science & Business Media, 2013, ISBN 978-3-642-34332-2, S. 293.