In der Statistik bezeichnet das additive Glätten, auch bekannt als Laplace-Glättung, eine Technik zur Glättung von Zähldaten, um Probleme zu beseitigen, die durch das Auftreten der Häufigkeit 0 eines Ereignisses verursacht werden.

Definition

Bearbeiten

Gegeben seien die beobachtete Zahlen (Engl. counts)  von verschiedenen Merkmalsausprägungen  , dann ist der additiv geglätte Schätzer für die Parameter der Multinomialverteilung:

 

mit   und   ein Glättungsparameter.[1]

Man beachte, dass der additiv geglättete Schätzer der Parameter vom Maximum-Likelihood-Schätzer   abweicht.

Motivation

Bearbeiten

Ein Grund für den Einsatz der Glättung ist auch für bisher nicht beobachtete Ausprägungen ( ) in generativen Modellen einen erzeugenden Pfad zu ermöglichen. Der geglättete Schätzer kann in der Bayesschen Statistik als Maximum-a-posteriori Schätzer betrachtet werden, der mithilfe einer Prior-Verteilung folgt.

Die Laplace-Glättung mit einem Glättungsparameter von   kann intuitiv verstanden werden, da sie darauf hinweist, dass selbst für Ereignisse, die derzeit nicht beobachtet werden, mindestens eine Beobachtung vorhanden sein muss. Andernfalls würde man nichts über die Existenz des Ereignisses wissen.

Einzelnachweise

Bearbeiten
  1. Foster, D. (2020). Generatives Deep Learning: Maschinen das Malen, Schreiben und Komponieren beibringen. Deutschland: O’Reilly. Seite 18, https://books.google.de/books?id=WsDYDwAAQBAJ&pg=PA18