GGobi ist eine freie Statistik-Software um hochdimensionale multivariate Daten mit dynamischer Grafik zu visualisieren und zu analysieren. GGobi kann in die ebenfalls freie Programmiersprache R voll integriert werden. Innerhalb der GGobi-Grafiken wird das Brushing und Linking der Datenpunkte unterstützt.

GGobi
Basisdaten

Entwickler Deborah F. Swayne, Dianne Cook, Duncan Temple Lang, Andreas Buja, Heike Hofmann, Michael Lawrence, Hadley Wickham
Aktuelle Version 2.1.10.a
(10. Juni 2012)
Betriebssystem Linux, Microsoft Windows, macOS
Kategorie Statistik-Software
Lizenz GNU General Public License, BSD-Lizenz, Common Public License
deutschsprachig nein
ggobi.org

Überblick

Bearbeiten

GGobi wurde entwickelt, um hochdimensionale Datenmatrizen zu visualisieren. Die Entwickler waren an der Erforschung hochdimensionaler Datenstrukturen interessiert. Der Name der Software änderte sich mehrfach im Laufe der Zeit, insbesondere weil sich die zugrundeliegende Technologie änderte:

  • Mitte der 1980er Jahre: Dataviewer,
  • 1989: XGobi und
  • ab 1999: GGobi.

GGobi ist unter einer Lizenz veröffentlicht, die eine Kombination dreier freier Lizenzen ist, somit ist GGobi freie Software.[1]

 
2D-Projektion (Grand Tour) eines sechsdimensionalen Datensatzes. Es sind drei Cluster sichtbar und zwei Datenpunkte sind gelb hervorgehoben.
 
Paralleler Koordinaten Plot der mit dem Grand Tour Plot gelinkt ist. Die beiden gelb markierten Datenpunkte sind hier ebenfalls gelb markiert.

Grafiken

Bearbeiten

Grafiken können mehr Informationen über eine Verteilung enthüllen als Kennzahlen. Verschiedene Werkzeuge in GGobi unterstützen die Entdeckung von Clustern, nichtlinearen Strukturen, Ausreissern und anderen Strukturen in hochdimensionalen Daten.

Variable(n) Grafik(en)
1 Average Shifted Histogramm, Dotplot, Balkendiagramm, Spineplot
2 Streudiagramm
>2 Streudiagramm-Matrix, Parallele Koordinaten, Grand Tour, Projection Pursuit (geführt und manuell)

Interaktivität

Bearbeiten

Mit Hilfe der interaktiven Werkzeuge können Datenpunkte oder Cluster markiert werden:

  • Brushing
Wenn das Brush-Rechteck über einen Datenpunkt geht, wird er mit einem vorher gewählten Symbol und/oder Farbe angezeigt. Ist die persistent-Option für die Brush ausgewählt, behält der Datenpunkt die Farbe und das Symbol auch dann, wenn er nicht mehr Brush-Rechteck liegt. Ansonsten wird sein Symbol und die Farbe wieder wie ursprünglich angezeigt.
  • Identifizieren
Wenn der Cursor auf einen Datenpunkt kommt, wird ein Text oder Variablenwert angezeigt.
  • Linking
Werden die Datenpunkte eines Datensatzes in verschiedenen Grafiken gleichzeitig dargestellt, dann führt die Änderung eines Symbols oder einer Farbe eines Datenpunktes in einer Grafik zu entsprechenden Änderungen in allen Grafiken.

Literatur

Bearbeiten
  • A. Buja, D. Cook, D. F. Swayne: XGobi: Interactive Dynamic Data Visualization in the X Window System. In: Journal of Computational and Graphical Statistics. Band 7, Nr. 1, März 1998, S. 113–130.
  • A. Buja, D. T. Lang, D. F. Swayne: GGobi: Evolving From XGobi into an Extensible Framework for Interactive Data Visualization. In: Journal of Computational Statistics and Data Analysis. Band 43, Nr. 4, August 2003, S. 423–444.
  • D. Cook, D. F. Swayne: Interactive and Dynamic Graphics for Data Analysis. Springer, 2007, ISBN 978-0-387-71761-6.
Bearbeiten

Einzelnachweise

Bearbeiten
  1. GGobi licences page. Abgerufen am 31. Dezember 2010.