Formale Begriffsanalyse (FBA) ist ein Teil der mathematischen Ordnungstheorie. Ihre ursprüngliche Motivation ist die konkrete Darstellung vollständiger Verbände und deren Eigenschaften mittels (einwertiger) formaler Kontexte. Diese Datentabellen repräsentieren binäre Relationen zwischen Gegenständen und Merkmalen. Prinzipiell können auch beliebige Tabellen einer relationalen Datenbank als mehrwertige Kontexte aufgefasst und mittels sogenannter Skalierung in einwertige Kontexte übersetzt werden.
Die Theorie in ihrer heutigen Form geht zurück auf die Darmstädter Forschungsgruppe um Rudolf Wille, Bernhard Ganter und Peter Burmeister, in welcher Anfang der 1980er Jahre die Formale Begriffsanalyse entstand. Die mathematischen Grundlagen wurden jedoch bereits von Garrett Birkhoff in den 1930er Jahren im Rahmen der allgemeinen Verbandstheorie geschaffen. Vor den Arbeiten der Darmstädter Gruppe gab es bereits Ansätze in verschiedenen französischen Gruppen. Philosophische Fundierungen der Formalen Begriffsanalyse berufen sich insbesondere auf Charles S. Peirce und Hartmut von Hentig.
Formale Begriffsanalyse findet in vielfältigen Bereichen praktische Anwendung, wie Data- und Textmining, Wissensmanagement, Semantic Web, Softwareentwicklung, Wirtschaft oder Biologie.
Motivation and Philosophischer Hintergrund
BearbeitenMathematische Grundlagen
BearbeitenDas Hauptziel der Formalen Begriffsanalyse ist die Darstellung von vollständigen Verbänden mittels formaler Kontexte einerseits, aber auch die Untersuchung von Daten in Form formaler Kontexte mit Mitteln der Ordnungstheorie andererseits. Die dafür grundlegenden Definitionen sollen in diesem Abschnitt diskutiert werden.
Formale Kontexte und Formale Begriffe
BearbeitenGegeben seien zwei Mengen und eine Relation . Das Tripel wird dann als formaler Kontext[1] bezeichet, als seine Gegenstandsmenge und als seine Merkmalsmenge; für einen Gegenstand und ein Merkmal bedeutet „der Gegenstand hat das Merkmal “. Oft wird auch statt geschrieben. Die Menge wird als Inzidenzrelation des formalen Kontextes bezeichnet.
Sind die Mengen und endlich, so lassen sich formale Kontexte gut in Form von „Kreuztabellen“ darstellen. Man beachte dabei, dass die Gegenstände und Merkmale in dieser Darstellung willkürlich geordnet werden können. Diese Ordnung ist dann aber nicht Teil des formalen Kontextes, sondern nur seiner Darstellung.
Ist Menge von Gegenständen eines formalen Kontextes , so bezeichnet man mit
die Menge der gemeinsamen Merkmale der Gegenstände in . Entsprechend definitiert wird für eine Menge von Merkmalen von die Menge
aller Gegenstände, die die Merkmale aus besitzen. Die Menge und werden als die Ableitungen der entsprechenden Mengen und bezeichnet und die Funktionen, welche beide mit benannt sind, Ableitungsoperatoren von genannt.
Die Ableitungsoperatoren erfüllen eine Reihe von sehr grundlegenden Eigenschaften. Sind Mengen von Gegenständen und Mengen von Merkmalen, so gilt
- und dual ,
- und dual ,
- und ,
- .
Tatsächlich definieren damit die Ableitungsoperatoren eine antitone Galoisverbindung zwischen den Potenzmengenverbänden der Gegenstandsmenge und der Merkmalmenge. Umgekehrt lässt sich jede solche Galoisverbindung zwischen Potenzmengenverbänden als Paar von Ableitungsoperatoren eines formalen Kontextes darstellen.
Zu einem formalen Kontext heißt nun ein Paar ein formaler Begriff[1] von , falls
- eine Menge von Gegenständen von ist,
- eine Menge von Merkmalen von ist,
- und
- gilt.
Die Menge wird dann Umfang und die Menge Inhalt des Begriffes genannt. Die Menge aller Begriffe wird mit bezeichnet. Stellt man formale Kontexte als Kreuztabellen dar und wählt dabei eine geeignete Ordnung auf den Gegenständen und Merkmalen, so lassen sich formale Begriffe als maximale Rechtecke in dieser Kreuztabelle verstehen.
Sind nun , so lässt sich mit
eine Ordung auf definieren. Diese Ordnung macht dann die Struktur zu einem vollständigen Verband. Tatsächlich ist umgekehrt nach dem Hauptsatz der Formalen Begriffsanalyse jeder vollständige Verband ordnungsisomorph zu einem Begriffsverband.
Begriffsverbände können als Ordnungsdiagramme dargestellt werden. Die Beschriftung von Begriffsverbänden erlaubt dabei eine vereinfachte Beschriftung. Betrachtet man für einen Gegenstand die Menge aller Begriffe, die in ihrem Umfang haben, so hat diese Menge einen Hauptfilter im Begriffsverband. Daher wird nur unterhalb des kleinsten Begriffs, der im Umfang enthält, der Gegenstand notiert. Dual dazu wird oberhalb des größten Begriffs, der ein gegebenes Merkmal im Inhalt besitzt, das Merkmal notiert. Ein Begriff im Ordnungsdiagramm hat also genau dann einen Gegenstand in seinem Umfang, wenn er oberhalb des Begriffes liegt, der mit dem Gegenstand beschriftet ist. Entsprechend hat ein Begriff im Ordnungsdiagramm ein Merkmal in seinem Inhalt, wenn er unterhalb des Begriffes liegt, der mit dem Merkmal beschriftet ist.
Hauptsatz der Formalen Begriffsanalyse
BearbeitenEs sei ein formaler Kontext und sein Begriffsverband. Man kann für Gegenstände und Merkmale dann die Begriffe
betrachten. Es wird der Gegenstandsbegriff von und der Merkmalsbegriff von genannt. Weiterhin gilt
Ist nun ein vollständiger Verband, so ist genau dann isomorph zu , wenn es Abbildungen gibt derart, dass
gilt. Insbesondere ist isomorph zu .
Beispiele
Bearbeiten(aus dem Buch, zitieren!)
- Partitionenverband
- Tamari-Verband
Eigenschaften Vollständiger Verbände als Eigenschaften zugehöriger Kontexte
Bearbeiten(alles nur kurz erwähnen, eventuell auf andere Seiten verweisen (auch wenn es die noch nicht gibt)).
- Vollständige Kongruenzen
- Pfeilrelationen
- Verbandsoperationen als Kontextoperationen (Tensorprodukte, subdirekte Produkte, ...)
- Verbandssymmetrien als Kontextsymmetrien
Implikationentheorie Formaler Kontexte
BearbeitenImplikationen und die Kanonische Basis
BearbeitenDefinition Implikation
Definition Pseudoinhalt
Definition Kanonische Basis
Auch noch erwähnen * Association Rules * Regeln * Partielle Implikationen * funktionale und ordinale Abhängigkeiten in mehrwertigen Kontexten
Merkmalexploration
BearbeitenVerbindung zu anderen Formalismen
Bearbeiten- Beschreibungslogiken (Rudolph, Sertkaya, Distel), oder auch allgemein Theorien zur Wissenrepräsentation
- Theorie relationaler Datenbanken
- Philosophie?
- Systembiologie
Varianten
Bearbeiten- Relational Concept Analysis
- Fuzzy stuff
Software
Bearbeiten- ConExp
- Lattice Miner
- Galicia
- conexp-clj (shameless plug ;)
Literatur
BearbeitenWeblinks
Bearbeiten- Formal Concept Analysis Seite von Uta Priss, mit Links zu weiteren Programmen
- The Dresden Formal Concept Analysis Page von Bernhard Ganter
Einzelnachweise
Bearbeiten- ↑ a b Bernhard Ganter, Rudolf Wille: Formale Begriffsanalyse; Springer, Heidelberg, 1996, Kap. 1 „Begriffsverbände von Kontexten“. ISBN 3-540-60868-0.