ToscanaJ
Erscheinungsjahr: 2003
Entwickler: Peter Becker, Joachim Hereth Correia u.a.
Beeinflusst von: SQL
Betriebssystem: plattformunabhängig
Lizenz: Opensource
toscanaj.sourceforge.net/

ToscanaJ ist ein Programmpaket für die Datenanalyse mit Hilfe der formalen Begriffsanalyse. Das Programmpaket ist Open Source und kann von SourceForge herunter geladen werden.[1]

Einleitung

Bearbeiten

Formale Begriffsanalyse

Bearbeiten

Formale Begriffsanalyse (FBA) ist ein mathematisches Verfahren, mit dem Daten, deren Zusammenhänge und Struktur analysiert werden können. Die FBA gehört damit zur mathematischen Ordnungstheorie und noch weiter gefasst zur mathematischen Logik.

Dabei werden Datensätze aufgrund ihrer Merkmale zu Gruppen zusammengefasst. Daraus ergibt sich eine hierarchische Netz-Struktur (mathematisch: Verband). Diese macht Zusammenhänge in den Daten sichtbar.

Geschichte

Bearbeiten

Die heutige Form der FBA geht zurück auf eine Forschungsgruppe an der TU-Darmstadt um Rudolf Wille, Peter Burmeister, Karl Erich Wolff und Bernhard Ganter. Aus dieser Forschungsgruppe heraus wurde im November 1994 die Firma NaviCon GmbH (Navigation in Contexts) gegründet,[2] da die stärker werdende Nachfrage nach Beratung von Unternehmen zur praktischen Anwendung der FBA, durch die Forschungsgruppe nicht geleistet werden konnte. Die Firma Navicon entwickelte für ihre Zwecke zunächst die Software Toscana und trieb die Entwicklung bis zur Version 3 voran. Als ca. im Jahr 2003 deutlich wurde, dass neue Anforderungen durch schrittweise Erweiterungen nicht mehr sinnvoll zu bewältigen waren, wurde die Software als ToscanaJ (Toscana Java) von Grund auf neu konzipiert unter den folgenden Gesichtspunkten:

  • Klares Rollenkonzept
  • Leichte Erweiterbarkeit, bzw. einfach zu handhabende Schnittstellen
    • insbesondere in Bezug auf Tockit[3]
  • Entwicklung in Java
  • So weit möglich Nutzung vorhandener Open Source Komponenten
  • Entwicklung von ToscanaJ unter Open Source-Lizenz
  • Verwenden eines Standard-Datenformats auf Grundlage von XML bzw. CGXML[4]

Die Firma NaviCon hat ihre Geschäftstätigkeit vor etlichen Jahren eingestellt[5]. Zu heutige Firmen gleichen Namens gibt es keinen Zusammenhang. ToscanaJ existiert jedoch als Open Source-Software weiterhin und wird auch noch gepflegt und weiterentwickelt.[1] Es dürfte sich um eine der umfangreichsten Anwendungen im Umfeld der Formalen Begriffsanalyse handeln.

Materialsammlung

Bearbeiten

Quelle: Numerical Analysis in Conceptual Systems with ToscanaJ[6]

 
Schaubild des Rollenkonzepts für ToscanaJ

ToscanaJ führt gegenüber Toscana ein erweitertes Rollenkonzept ein. Es soll sowohl

  • ein Anwendungstool sein für die FBA, aber auch
  • eine Plattform für die Erweiterung der Theorie der FBA

Neues Feature: Erweiterbarkeit

  • Standardtexte der Label können geändert werden
  • Einem Label kann eine Datenbankabfrage zugeordnet werden, mit Darstellung als Diagramm
  • Es können Verhältnisse dargestellt werden, im Verhältnis zu benachbarten Begriffen

Einige der Features werden in früheren Veröffentlichungen dargestellt:

  • Gerd Stumme, Karl Erich Wolff: Computing in Conceptual Data Systems with relational Structures. (Online [PDF; abgerufen am 3. Mai 2015]).
  • Gerd Stumme, Karl Erich Wolff: Numerical aspects in the data model of conceptual information systems. In: Yahiko Kambayashi, Dik-Lun Lee, Ee-peng Lim, Mukesh Mohania, Yoshifumi Masunaga (Hrsg.): Advances in Database Technologies. Springer, Berlin, Heidelberg 1999, ISBN 3-540-65690-1, S. 117–128 (Online [PDF; abgerufen am 3. Mai 2015]).

Fragen 1

Bearbeiten
  • Es wird auf den "Titanic Algorithmus" referenziert (??)Gerd Stumme, Rafik Taouil, Yves Bastide, Nicolas Pasquier, Lotfi Lakhal: Computing Iceberg Concept Lattices with Titanic. S. 1–40 (Online [PDF; abgerufen am 5. Mai 2015]).
  • "Chianti Algorithmus" von Stumme und Hereth um den Abstand von Skalen zu untersuchen Joachim Hereth, Gerd Stumme, Rudolf Wille, Uta Wille: Conceptual knowledge discovery and data analysis. In: Peter Eklund (Hrsg.): Concept Lattices: Second International Conference on Formal Concept Analysis, ICFCA 2004, Sydney, Australia, February 23-26, 2004, Proceedings. Springer, Berlin, Heidelberg 2001, ISBN 3-540-24651-7, S. 421–437.

Weitreichendere Einbettung von Datenanalysen in die FBA

  • In Toscana alternativ zu einer Liste der Objekte, auch Anzahl oder %-Anteile. ToscanaJ stellt diese als Default zur Verfügung, erlaubt aber darüber hinaus, im .csx-File weitere DB-Abfragen zu hinterlegen. Diese können dem Nutzer zusätzlich zu den Standard-Ausgaben angeboten werden. Dies können Listen, Aggregate oder Diagramme sein. Im .csx-File müssen dazu <aggregate Queries> hinterlegt werden, also eine "Abfrage für eine Aggregierung" die zumindest ein SQL-Fragment enthalten muss, das definiert, wie das Aggregat gebildet werden soll.

Alle Aggregierungen werden auf SQL-Ebene formuliert. Da die Interpretation dieser SQL-Befehle in der Datenbank-Engine erfolgt, werden die Möglichkeiten lediglich durch SQL beschränk und eine hohe Performance erreicht.

ToscanaJ selbst enthält zwei voneinander unabhängige Erweiterungen:

  • Formatierung der Label (z.B. zur Anzeige von Dimensionen)
  • Ergebnisse können als %-Werte zu allen gleichartigen Aggregaten im Diagramm angezeigt werden.

Die in SQL formulierten Anfragen müssen als Ergebnis auch die XML-Tags enthalten, so dass die nachfolgenden Stufen den SQL-Output verarbeiten können.

Diagramme

Bearbeiten

Weiter gibt es die Möglichkeit, zusätzliche Fenster zu öffnen, in denen komplexere Daten und Diagramme dargestellt werden können. Diese werden jeweils einem Label zugeordnet und können durch Anklicken des Titels geöffnet werden. Dabei können Fenster geöffnet werden,

  • die den gesamten Begriff widerspiegeln
  • die ein einzelnes Objekt aus einer Liste widerspiegeln, dazu muss das Objekt aus einer Liste ausgewählt werden.

Im Gegensatz zu Toscana 2 und 3, die eine Schnittstelle zu MS-Acess und zu HTML bereitstellten, besitzt ToscanaJ eine Schnitstelle zu JFreeChart. In der Version 2 und 3 wurden die Daten exportiert und dann mit separaten Tools weiter verarbeitet. ToscanaJ dagegen bietet Schnittstellen, um unmittelbar mit einer Reihe von Applikationen zu kommunizieren und sie so zu integrieren.

Es steht weiterhin ein HTML-Interface zur Verfügung, ähnlich wie bei Toscana 3, allerdings kann ToscanaJ direkt ein Fenster öffnen, um sie anzuzeigen. In T3 wäre ein externer Browswer nötig gewesen, um sie anzuzeigen. In ToscanaJ lassen sich so Auswertungsmöglichkeiten Integrieren. So entstehen neue Anwendungen, die zwar ToscanaJ zur Grundlage haben, aber speziell auf bestimmte Anwendungen zugeschnitten sind.

Datenmodell

Bearbeiten

ToscanaJ benutzt das Datenformat .csx. Es ist eine Erweiterung von XML

Quelle 2

Bearbeiten

Grundlegender Artikel: Peter Becker, Joachim Hereth Correia: The ToscanaJ Suite for Implementing Conceptual Information Systems. In: Bernhard Ganter, Gerd Stumme, Rudolf Wille (Hrsg.): Formal Concept Analysis, Foundations and Applications. Springer, 2005, ISBN 3-540-27891-5, ISSN 0302-9743, S. 324–348 (researchgate.net [abgerufen am 24. November 2017]).

Einzelnachweise

Bearbeiten
  1. a b Welcome to the ToscanaJ Suite. SourceForge, abgerufen am 3. Mai 2015 (englisch).
  2. Karl Erich Wolff: Ordnung, Wille und Begriff - Geschichten aus dem Ernst Schröder Zentrum. Hrsg.: Ernst-Schröder-Zentrum. Darmstadt 2003.
  3. Welcome to Tockit. Abgerufen am 6. Mai 2015 (englisch).
  4. CGXML = Conceptual Graphs XML: CGXML. Tockit Framework for Conceptual Knowledge Processing, abgerufen am 24. November 2017 (englisch).
  5. Wann?
  6. Peter Becker: Numerical Analysis in Conceptual Systems with ToscanaJ. In: Gerhard Goos, Juris Hartmanis, Jan van Leeuwen, Jaime G. Carbonell, Jörg Siekmann, Peter Eklund (Hrsg.): Concept Lattices – Second International Connference on Formal Concept Analysis, ICFCA 2004, Sydney, Australia, 23 - 26 Feb 2004. Proceedings 2004. Springer, Berlin, Heidelberg 2004, ISBN 3-540-24651-7, S. 96–103 (Online [PDF; abgerufen am 3. Mai 2015]).

Kategorie:Mathematische Logik Kategorie:Ordnungstheorie Kategorie:Ontologie Kategorie:Business Intelligence Kategorie:Anwendungssoftware Kategorie:Softwarearchitektur