Clustan
Programm zur Clusteranalyse und zum Data-Mining
Clustan war eines der ältesten integrierten Statistik-Programme zur Clusteranalyse und zum Data-Mining. Die Anfänge gehen auf Fortran-Programme aus dem Jahr 1968 zurück. David Wishart war gleichzeitig der Entwickler und Chef der Firma Clustan Ltd aus Edinburgh. In den 1990er Jahren wurde die Software von ihm an den (Windows-)PC angepasst und mit einer interaktiven Grafikausgabe versehen. Die letzte Version erschien 2005, und seit 2018 ist die Webseite nicht mehr erreichbar. Am 12. März 2020 verstarb David Wishart.[1]
Themengebiete der Clustan-Software
BearbeitenHierarchische Cluster Methoden
Bearbeiten- Cluster: hierarchische Clusteranalyse auf Datenmatrizen
- Hierarchy: hierarchische Clusteranalysen auf Ähnlichkeitsmatrizen
- Centroid: Schwerpunktbildung in Ähnlichkeitsmatrizen
- Density: hierarchische Dichteschätzer-Methode
- Divide: hierarchische Verteilungsclusterbildung auf binäre Variablen
Nicht-hierarchische Cluster Methoden
Bearbeiten- Classify: Identifizierung von neuen Fällen durch Traversierung von Clusterbäumen
- Normix: Maximum-Likelihood Abschätzung der Maßgrößen von multivariaten Normalverteilungen mit Signifikanztests
- Invariant: iterative Optimierung von Wilks' Lambda or Hotelling's Trace
- Mode: Finden „natürlicher“ Cluster durch Schätzung disjunkter Dichteflächen
- Relocate: iterative Zuordnung zu Clusters (k-means-Algorithmus)
- Kdend: Suche von Bk-overlapping-clusters (Jardine-Sibson Clustermethode, siehe Voronoi-Interpolation)
- Dndrite: Teilung von minimal reichenden Bäumen, um die Summe der Fehlerquadrate zu minimieren (Regressionsanalyse)
- Euclid: fuzzy Clusterung, um Quadratsummen zu minimieren
Sonstige statistische und grafische Hilfsroutinen
Bearbeiten- Read similarity matrix: Lesen von Ähnlichkeitsmatrizen
- Calculate similarity matrix: Berechnen einer Ähnlichkeitsmatrix mit einer Vielzahl von verschiedenen Koeffizienten
- Print results: Druck der Clusteranalyse-Ergebnisse
- Scatter: Zeichnen von Scatter- und Cluster-Diagrammen (Plots)
- Plink: Zeichnen hierarchischer Cluster-Bäume
- Rules: Signifikanztests für die beste Aufteilung
- Compare: Vergleich hierarchischer Klassifikationen
Grafische Darstellungssoftware
Bearbeiten- ClustanGraphics: interaktive Software um die Ergebnisse grafisch anzusehen
Siehe auch
BearbeitenWeblinks
Bearbeiten- Clustan Ltd. Edinburgh Website (englisch)
- Whisky Classified – Anwendungsbeispiel von Clustan (englisch)
Einzelnachweise
Bearbeiten- ↑ David Wishart. In: Memories.net. 8. August 2020, abgerufen am 25. Januar 2021 (englisch).