Benutzer:Saperaud/Atmosphäre, Wetter und Klima

Geostatistik

Bearbeiten

Der Begriff Geostatistik bezeichnet bestimmte stochastische Methoden zur Charakterisierung und Schätzung von räumlich korrelierten georeferenzierten Daten, zum Beispiel Oberflächentemperaturen an verschiedenen Stellen eines Sees. Ziel ist es dabei, die punkthaft gemessenen Daten als Ausgangsbasis für eine räumliche Interpolation zu nutzen, also aus einer endlichen Zahl von Messwerten eine unendliche Zahl von Schätzwerten abzuleiten, die möglichst nahe an den real vorliegenden Werten liegen sollen.

Der Schätzwert für eine physikalische Größe (wie die Oberflächentemperatur) an einem Schätzort ist aufgrund der räumlichen Korrelation stärker von den Messwerten benachbarter als von solchen entfernter Messorte abhängig. Für die Abschätzung sind diese benachbarten Messwerte daher stärker zu berücksichtigen. Dabei unterscheidet man zwei Methoden, die nichtstatistischen und die statistischen Interpolationsverfahren, wobei Letztere auf einem geostatistischen Modell beruhen. Beispiele für ein nichtstatistisches Interpolationsverfahren sind die Bildung eines Mittelwerts das gesamte Untersuchungsgebiet oder bestimmte Ausschnitte desselben, die Polygon-Methode, die Triangulierung und die Inverse Distanzwichtung. Das häufigste statistische Interpolationsverfahren ist das Kriging-Verfahren.

Bearbeiten

Variogramm

Bearbeiten

Ein Variogramm oder Semivariogramm ist eine neben dem Korrelogramm und der Kovarianzfunktion eine der zentralen Funktion der Geostatistik zur Beschreibung der räumlichen oder zeitlichen Korrelation von Messdaten. Es basiert auf der Auftragung der Semivarianz gegen einen Abstand h. Man unterscheidet expermimentelle und theoretische Semivariogramme.

Empirisches Semivariogramm

Bearbeiten

Ein empirisches oder experimentelles Semivariogramm ist ein die Korrelation von Messdaten und wird über die folgende Funktion abgeleitet:

 

Dabei ist λ(h) die Semivarianz, also ein Maß für die Unähnlichkeit der Daten. Der Ausdruck h steht meist für den Vektor zwischen den Messorten x und denjenigen bei x+h, wordurch man ein richtungsabhängiges Variogramm erhält. Verwendet man für H einen einfachen Abstand so erhält man omnidirektionales Variogramm. Das Variogramm erhält man nun, indem man λ(h) auf der y-Achse und h auf der x-Achse eines kartesischen Koordinatensystems einträgt.

Im empirischen Semivariogramm können verschiedene Beobachtungen gemacht werden. So nimmt λ(h) mit steigendem h zu, besitzt jedoch einen sinkendem Anstieg. Die Funktion pendelt sich daher um einen bestimmten Wert von λ(h) ein und schwankt dann nur noch um diesen Wert. Diese Obergrenze, die man als Schwellenwert (engl. sill) bezeichnet, markiert die maximale Unähnlichkeit der Daten, es lässt sich also bei weiter zunehmender Entfernung zwischen den Messwerten keine wachsender Unterschied zwischen ihnen mehr feststellen. Der Abstand h bei dem dies eintritt, wird als Reichweite (engl. range) bezeichnet und ist eine zentrale Eigenschaft des Datensatzes. Dabei gilt, dass alle Messwerte mit einer Entfernung die größer als die Reichweite ist, nicht miteinandere korreliert sind.

Obwohl per Definition λ(0)=0 gilt zeigt sich am Ursprung des Koordinatensystems oft ein von Null verschiedener Wert von λ(0). Diese Abweichung wird als Nugget-Effekt bezeichnet und ist auf Messfehler sowie die räumliche Variabilität über kleine Entfernungen unterhalb der kleinsten realisierten Schrittweite h zurückzuführen.

Eine wichtige Eigenschaft besitzen empirische Semivariogramme auch dadurch, dass sie richtungsabhängig sind. Dies erreicht man über ein als Vektor gewähltes h. Durch den Vergleich verschiedener Semivariogramme kann man nun feststellen, in wie weit der Datensatz isotrop bzw. anisotrop ist. Im Normalfall eines anisotropen Datensatzes unterscheidet man je nach den Auswirkungen der Anisotropie. Dabei ist eine geometrische Anisotropie dadurch gekennzweichet, dass sich nur die Reichwerte nicht aber Schwellenwert ung Form des Variogramms verändern, während sich bei einer zonalen Anisotropie auch der Schwellenwert richtungsabhängig sein kann. Haben alle richtungsabhängigen Semivariogramme einen Schwellenwert, was nicht immer der Fall sein muss, so ist dies ein Zeichen für Stationarität.

Eine Einschränkung bei nicht stark rasterhaft gemessenen Datensätzen durch die Anzahl von Datensätzen gegeben, die eine Entfernung von mehr oder weniger exkat gleich h aufweisen. Da nach einer Faustregel etwa 30 bis 50 Datenpaare notwendig sind um einen brauchbaren Wert für die Semivarianz zu erhalten, benutzt man in diesen Fällen Klassen der Art Δh. Dies hat zur Folge das man nur noch die mittlere Semivarianz als Schätzer an die tatsächliche Semivarianz der Klasse Δh erhält.


Empirisches Indikator-Semivariogramm

Bearbeiten

Ein empirisches Indikator-Semivariogramm ist ein Semivariogramm zur Darstellung der Übergangshäufigkeit

 

Theoretisches Semivariogramm

Bearbeiten

Das experimentelle Semivariogramm ist empirischer Schätze der Kovarianz eines Gauß-Prozesses und als solches nicht zwangsläufig bedingt negativ semidefinit, was aber eine Voraussetzung von Kriging ist. Auch benötigt man hier kontinuierliche Werte der Semivarianz, was aber das empirische Semivariogramm durch die Einschränkung auf die Abstände h bzw. Abstandsklassen Δh nicht zu leisten imstande ist.

Für dieses wird daher ein theoretisches Semivariogramm erstellt, wobei man von bedingt negativ definiten Funktionen ausgeht und folglich vom linearen, sphärischen oder gaußschen Semivariogramm spricht, je nachdem welche Funktionen zur Darstellung des empirischen Variogramms geeignet scheinen. Die Anpassung des theoretischen Variogramms an die Vorlage des empirischen Variogramms erfolgt mit Augenmaß durch den Anwender, wobei besonders die Art der Stetigkeit und weniger die genaue Berücksichtigung einzelner Punkte wichtig sind. Die Funktionen sollen dabei möglichst einfach sein, weshalb gerade bei kleinen h eine lineare Funktion oft ausreicht, vergleichsweise oft die Gauß-Funktion. Es ist auch wichtig welche Stationaritätsannahme gemacht wird, also starke, schwache oder intrinsische Stationarität. Ferner spielt die Isotropoie bzw. Anisotropie der Daten eine Rolle, wobei eine undeutliche Anisotropie im Zweifelsfall ignoriert wird, demgegenüber jedoch aus Vorkenntnissen bekannte starke Anisotropien auch dann modelliert werden wenn sie sich nicht in den Daten zeigten. Auch Parameter wie Nugget-Effekt oder Schwellenwert müssen dabei berücksichtigt werden, wobei der Nugget-Effekt allgemein isotrop modelliert wird und bei großen h nahe des Ursprungs leicht überschätzt werden kann (inbesondere bei Gauß muss ein Nugget-Effekt verwandt werden).


 


Ein theoretisches Semivariogramm basiert auf einen geostatischen Modell und dient der Ermittlung der Kriging Wichtungsfunktion.


When the variogram is used to describe the correlation of different variables and is speaking about cross-variograms. Cross-variograms are used in co-kriging. Should the variable be binary or represent classes of values, one is then talking about indicator variograms. Indicator variogram is used in indicator kriging.

The experimental variogram is computed by measuring the mean-squared difference of a value of interest z evaluated at two points x and x+h. This mean squared difference is the semivariance and is assigned to the value h, which is known as the lag. A plot of the semivariance versus h is the variogram.

Nuggeteffekt

Bearbeiten

Der Nuggeteffekt bezeichnet in der Geostatistik ein besonderes Verhalten des empirischen Semivariogramms, wobei die Funktion nicht den Ursprung, sondern die y-Achse schneidet.

Der Begriff geht auf die Eigenschaften von Goldnuggets zurück und steht im Kontext des für den Goldbergbau entwickelten Kriging. Da man hier den Goldgehalt als maßgebende Größe betrachtet, spielen Nuggets nur als Schwankungen in kleinen Größenmaßstäben eine Rolle, so genannte Mikrovariabilitäten. Werteschwankungen des Goldgehalts von wenigen Gramm pro Tonne zu beinahe Reingold innerhalb weniger Millimeter sind dabei keine Seltenheit, können jedoch durch Messgitter nicht statistisch aussagekräftig erfasst werden.

Kriging ist eines der meistgenutzen Regressionsverfahren der Geostatistik und wird hier zur Approximation und Interpolation von Daten genutzt.

 
Figure: example of one-dimensional data interpolation by Kriging, with confidence intervals


Geschichte

Bearbeiten

Kriging stammt ursprünglich aus der Lagerstättenlehre und wurde in seinen Grundzügen von Danie G. Krige für Lägerstättenberechnungen im südafrikanischen Goldbergbau entwickelt. Die theoretische Ausarbeitung erfolgte in den frühen sechziger Jahren bei einem Seminar in Fontainebleau, bei dem unter anderem Krige und der französische Mathematiker Georges Matheron anwesend waren.

Heute ist das Verfahren in zahlreichen Geo- und Umweltwissenschaften mit unzähligen Sonderformen verbreitet.

Fragestellungen und Vorraussetzungen

Bearbeiten

Verfahren

Bearbeiten

Um in Erfahrung zu bringen, bis zu welcher maximalen Entfernung und in welchem Maße Messwerte von benachbarten oder weiter entfernten Messwerten abhängen, werden experimentelle Semivariogramme modelliert.

Die Funktion, die aus der Analyse der Messwerte gewonnen wurde, ist die Grundlage für die nachfolgende Interpolation einer Verteilung von Schätzwerten im Raum in einem Verfahren, das als Kriging bezeichnet wird. Dabei erhalten die Messwerte je nach Nähe zum gesuchten Schätzwert in Abhängigkeit vom modellierten Semivariogramm unterschiedliche Gewichte, mit denen sie in die Berechnung des Schätzwerts eingehen (Gegenbeispiel: arithmetischer Mittelwert als Schätzer: alle Messwerte erhalten ohne Unterschied dasselbe Gewicht).

Voraussetzung für die Interpolation ist, dass im Untersuchungsgebiet die Messwertverteilung homogen ist (Kriterium der Stationarität/Homogenität). Beispiel für Inhomogenität: der Aluminium-Gehalt von Gesteinen eines Untersuchungsgebiets, in dem durch Versatz an einer Störung zwei völlig unterschiedliche Gesteinseinheiten neben vorliegen und ohne Übergangzone aneinandergrenzen.

Für das Beispiel Oberflächentemperatur eines Sees wäre das Ergebnis des Krigings eine Verteilung von Schätzwerten in der Ebene, die zum Beispiel als Isothermen-Karte oder Oberflächenrelief ("fliegender Teppich") mit der Höhen-Achse als Temperatur-Achse visualisiert werden kann.

Güte und Probleme

Bearbeiten
Bearbeiten