Im Zuge einer Löschdiskussion [1] habe ich mir einige Gedanken über die Kategorien in der Wikipedia gemacht, die ich inzwischen ausgebaut habe.
Ausgangspunkt muß die Frage sein:
Wozu sind die Kategorien überhaupt da?
BearbeitenWikipedia:Kategorien schlägt vor:
- Die Einordnung von Artikeln in eine Systematik
- Die Zuweisung von Artikeltypen zu Artikeln
- Verschlagwortung von Artikeln
- Grundlage für statistische Auswertungen über die Zusammensetzung der Artikel.
zu Punkt 1: Ja, aber warum? Systematik ist ja kein Selbstzweck. Im Grunde steht da nichts anderes als das Prinzip der Kategorisierung selbst, also: Zweck der Kategorisierung ist die Kategorisierung.
Punkt 2 sagt im Grunde dasselbe wie Punkt 1.
Punkt 3: Auch das ist ja kein Selbstzweck. Ich interpretiere das als Ansatz zur Suche von Artikeln. Siehe dazu unten "Suchzweck" (im Kleingedruckten).
Punkt 4: Naja. Dafür die ganze Mühe? Wird das denn über Kategorien gemacht? Und geht das vielleicht auch anders, wenn man es denn wirklich will?
Ich selbst sehe vor allem folgenden Ansatz: Kategorien sollen einen Artikel mit verwandten Artikeln in eine Umgebung einzuordnen und so dem Leser helfen, von dem Artikel ausgehend größere Zusammenhänge zu beschauen (Verknüpfungszweck). Wenn ich etwa einen Personenartikel (Beispiel: Friedrich Hayek) lese, sehe ich am Ende die Kategorien (etwa "Ökonom (20. Jh.)") und denke mir: na, mal sehen, welche Ökonomen es da noch gibt und was die so sagen.
Das bloße Systematisieren bringt wenig: wenn ich nach Lesen des Artikels "Helmut Schmidt" nicht begriffen habe, daß der Mann systematisch in den Bereich "Politik" gehört, dann sollte ich die Kommunikation mit der Welt vielleicht überhaupt aufgeben.
Auch sind Kategorien doch nicht dazu da, um Informationen zu bringen, die im Artikel nicht ausreichend behandelt werden. Große Freude bereiten mir Leute, die etwa unter einen Bundestagsabgeordneten die Kategorie "NSDAP-Mitglied" setzen, ohne daß das im Artikel erwähnt wird. Wenn man diese Information hat - und sie wäre ja wichtig - warum sie dann nicht zuerst in den Artikel einbauen?
Ein weiterer Ansatz wäre: Kategorien sollen dem Leser, der sich über etwas informieren will, als "Gerüst" dienen, um zu dem Artikel zu gelangen, den er sucht (Suchzweck). Dazu muß ich sagen, daß ich noch nie, wenn ich einen Artikel gesucht habe, über eine Kategorie eingestiegen bin und mich dann hinuntergeklickt habe. Ich glaube auch nicht, daß irgendwer dies öfter tut. Wenn ich also etwa eine Doku gesehen habe, in der ein Ökonom der Österreichischen Schule vorkam, dessen Namen ich vergessen habe - dann gehe ich doch nicht auf Kategorien, lade mir eine x00 kB-Liste, klicke mich durch Person, Beruf, Jahrhundert und Land und lese, bis der Name kommt - sondern gebe im Suchfeld "Österreichische Schule" ein, bekomme den Artikel und lese mich von dort durch. Jetzt kann ich ja auch im Notfall auf eine Kategorie zurückgreifen, die unter diesem Artikel steht, aber dann gehe ich im Grunde schon wieder über Verknüpfungen vor.
Es gibt wohl Überlegungen, die Kategorien eines Tages für eine verbesserte Suchfunktion nutzbar zu machen. Ich sehe das nicht kommen. Genau dazu hat man ja jetzt auch die Personendaten eingefügt. Für die Kategorien, die diese nur verdoppeln, sehe ich keinen Grund; die anderen scheinen mir wiederum eher zur Verknüpfung zu dienen. Daraus ergibt sich: der Verknüpfungszweck ist der primär sinnvolle.
Wie geht man bisher vor?
BearbeitenDie allgemein angewandte Methode zur Kategorisierung ist: einen Artikel in alle Kategorien einzuordnen, in die er irgendwie paßt. Dazu gibt es ein Grundprinzip:
"Die Artikel werden in der Wikipedia nach drei unterschiedlichen Prinzipien kategorisiert:
- dem "gehört-zum-Fachgebiet"-Prinzip (belongs-to)
- dem "ist-ein-(Teil-von)"-Prinzip (is-a)
- mit einer örtlich/zeitlichen Fixierung
Das erste Prinzip wird über die Hauptkategorien, das zweite über die Artikeltypen, das dritte über Fixierungen gesteuert. Die Kombination aus diesen Merkmalen definiert letztlich die Schublade, in die ein Artikel gesteckt wird: So ist der Artikel "Charles Darwin" dem Fachgebiet "Biologie" zugeordnet und dem Artikeltyp "Person". Charles Darwin ist eine Person und gehört zum Bereich Biologie. Sein Werk "Über die Entstehung der Arten" ist ein Buch und gehört zum Bereich Biologie. Artikel können zudem örtlich und zeitlich fixiert werden, Darwin bspw. in die Ortsfixierung "England" und die Zeitfixierung "19. Jahrhundert"."
Kurzer Überschlag: Bei gegenwärtig ca. 35 anerkannten Hauptkategorien, geschätzt 150 möglichen Orts- und 25 Zeitfixierungen sowie ca. 5 möglichen Artikeltypen komme ich auf ca. 650.000 mögliche Kategorien.
Zudem gilt ein unkategorisierter Artikel als unvollständig, man hat Angst, er sei "verwaist". Explizit sagt Wikipedia:Kategorien:
- "Grundsätzlich sollte jeder Artikel einer oder mehrerer der im folgenden gleich erklärten Hauptkategorien oder einer zugehörigen Unterkategorie zugeordnet sein. Wenn man sich mit der Unterkategorisierung eines Fachbereichs nicht auskennt, bitte einfach nur die Hauptkategorie verwenden und den Klassifikatoren des Fachbereichs die Detailarbeit überlassen."
Problem
BearbeitenIch halte diese Regeln für wenig zielführend, will das im folgenden begründen und einen besseren Vorschlag machen.
- Die Regelung führt dazu, daß hunderte Artikel in Kategorien wie *Person *Mann *Deutscher *Philosophie *Begriffsklärung eingeordnet sind, während in anderen Kategorien nur ein oder zwei Einträge stehen. Aber bitte: Was bringen solche Kategorien? Wenn ich den oben angegebenen Zweck verfolge: gar nichts. Wenn ich den Artikel Friedrich Nietzsche gelesen habe und sehe darunter die Kategorie "Mann", werde ich sie anklicken? Niemals! Denn was bringt es mir, dann 50 Artikel gezeigt zu bekommen, die mit A anfangen und im übrigen nur gemein haben, daß sie von Männern handeln? Steht da dagegen eine Kategorie "Deutscher Philosoph des späten 19. Jahrhunderts mit antisemitischer Schwester", werde ich auch die nicht anklicken, weil sie mir keine neuen Infos liefern wird. Wer benutzt diese Kategorien wofür? Vielleicht übersehe ich etwas, aber für mich haben sie keinen Sinn. Das ist das Problem der sinnlosen Kategorien. Zu große gibt es hier haufenweise, zu kleine sind im Moment besonders bei Wikimedia Commons zu beobachten, wo Dutzende Kategorien nur aus einem Objekt bestehen, teilweise sogar noch mit Unterkategorien, in denen dann noch einmal einzig das Objekt drinsteckt.
- Zudem müssen Kategorien neutral sein, insbesondere neutrale Bezeichnungen haben. Diese Bedingung führt auch zu einem Problem: Im konkreten Fall ging es u.a. um die Kategorien "Freiheitskämpfer" und "Terroristen". Es ist offensichtlich, daß beide Bezeichnungen nicht neutral sind; vielmehr könnte jemand mit entsprechender Auffassung einen Artikel von der einen in die andere Kategorie einordnen, und es gäbe großen Streit. Nun könnte man sie ja zusammenlegen - aber dann ergibt sich das Problem, daß unheimlich viele Menschen, die wenig miteinander zu tun haben, in einer einzigen Kategorie mit einem unmöglichen Titel ("Leute, die mit oder ohne Gewalt für etwas gekämpft haben, was sie für gut hielten") eingeordnet würden, und die Kategorie wäre für unseren Zweck wieder wertlos.
- Schließlich müssen Kategorisierungen objektiv nachprüfbar sein, d.h. man muß bei einem Artikel prinzipiell entscheiden können, ob er in die Kategorie gehört oder nicht. Wenn dies nämlich nicht der Fall ist, ist eine Diskussion darum, ob ein Artikel hineingehört oder nicht, unmöglich, und dann kann natürlich jeder Artikel eingeordnet werden, womit sie offenbar den genannten Zweck nicht erfüllt. Beispiel: Es ging um die neue Kategorie "Widerstand im Nationalsozialismus". Das ist hinreichend neutral, aber es erhebt sich die Frage: wer soll hier eingeordnet werden? Bei vielen wäre man ja schnell einig, aber gehört denn etwa Walter Eucken (war eingeordnet) dazu? Oder müßte ohne genaue Spezifizierung nicht, wie ich es zugegeben polemisch formuliert habe, jeder Ortsverein der KPD aufgenommen werden?
Eine gute Methode der Kategorisierung müßte die drei Probleme vermeiden. Das wird durch folgende Beobachtung etwas vereinfacht: objektive Nachprüfbarkeit impliziert Neutralität. Ob jemand "Rechstextremist" ist oder nicht, ist nicht objektiv nachprüfbar, denn die Bezeichnung ist nicht neutral. Die Kategorie erfüllt also die Kriterien nicht. Umgekehrt ist objektiv nachprüfbar, ob jemand "NPD-Mitglied" ist, und diese Kategorie wäre offensichtlich neutral. Sie könnte also sinnvoll sein. Dies liegt einfach daran, daß Fakten per se neutral sind und Werturteile sich per se nicht nur auf Fakten beziehen.
Vorschlag
BearbeitenZur Lösung der Probleme schlage eine neue Richtlinie vor, die die drei genannten Probleme vermeiden und gleichzeitig dem o.g. Zweck dienen soll. Sie soll nicht bestehende Kategorien delegitimieren, sondern einen Leitfaden für zusätzliche Kategorien geben.
Grob gesagt soll hierbei nicht "von oben nach unten" , sondern von unten nach oben vorgegangen werden. Ausgangspunkt der Kategorisierung sind die Artikel. Ich mache also nicht zuerst eine Kategorie "Gesellschaft", dann darunter eine "Politik", dann darunter eine "Widerstand", dann darunter "Widerstand gegen den Nationalsozialismus" auf, sondern ordne umgekehrt von den Artikeln ausgehend:
1. Eine neue Kategorie wird erst aufgemacht, wenn eine "kritische Masse" von Artikeln vorhanden ist, die geradezu nach einer gemeinsamen Kategorie schreien.
2. Die Kategorien haben sich nach den Artikeln zu richten, nicht umgekehrt. ... d.h. es wird nicht am Artikel gebastelt, damit er in eine Kategorie paßt, sondern entweder bietet sich eine Kategorie direkt an oder nicht.
3. Im Zweifelsfall ist Bedingung für die Eröffnung einer Kategorie die Existenz eines gleichnamigen, konsensfähigen Artikels. ... in dem nämlich - das ist ja Sinn des Artikels - definiert ist, worum es überhaupt geht.
"Zweifelsfall" in 3. heißt: Habe ich tatsächlich 8 englische Biologen des 19. Jahrhunderts, kann die Kategorie auch ohne Artikel zur englischen Biologie des 19. Jahrhunderts sinnvoll sein, zumal "englisch", "Biologe" und "19. Jhdt." eindeutig objektiv belegbar sind. Ob diese Kategorie sinnvoll nach 1. wäre, ist trotzdem fragwürdig. Eine Kategorie "RAF-Mitglied" ist dagegen schon dann fragwürdig, wenn es keinen guten Artikel über die RAF gibt, in dem auch die Frage der "Mitgliedschaft" (die führten ja keine Kartei) behandelt wird.
Dies löst das zweite und dritte Problem, denn hier kann ich nachprüfbar vorgehen. Wenn ich also 10 Artikel habe über Mitglieder des Kreisauer Kreises, dann kann ich diese in eine gleichnamige Kategorie einordnen, alle Mitglieder der Weißen Rose in eine gleichnamige Kategorie etc. Nun erst kann ich, wenn es sinnvoll ist, diese alle in einer Überkategorie "Widerstand gegen den Nationalsozialismus" zusammenfassen. Ob es dann im Sinne des angegebenen Zwecks nötig ist, sich noch weiter hoch zu arbeiten, ist fragwürdig. Aber genau dadurch würden auch die sinnlosen Kategorien wegfallen, denn sie ergeben sich einfach nicht.
Soweit mein Vorschlag. Natürlich muß man da nicht dogmatisch sein und kann im Einzelfall anders entscheiden, aber grundsätzlich würde ich diese Methode empfehlen.