Zusammenfassung einzelner Vorschläge zur Überarbeitung der Kategorien
Probleme
Bearbeiten- Artikel linken Kategorien, die nicht existieren Spezial:WantedCategories
- je mehr Kategorien es gibt, desto aufwendiger wird eine Kategorisierung
- es gibt etwa 1500 Kategorien, die nicht verwendet werden Spezial:Unusedcategories
- Kategorien sind teilweise schlecht (oder gar nicht) gewartet
- Viele kleine Kategorien (mit wenigen Artikeln) verringern den Nutzen von Kategorien
Struktur der Kategorien
BearbeitenHierarchisch
BearbeitenBeispiel:
- „Essen > Lebensmittel > Milchprodukte > Käse > Mozzarella“
Essen wäre die Hauptkategorie Lebensmittel,Milchprodukte und Käse wären Unterkategorien Käse wäre der Artikel (bzw. auch Unterkategorie, wenn es mehrere Artikel zum Thema Käse gäbe)
Wenn es nun auch folgende Kategorien gibt, wird die Einordnung von Mozzarella kompliziert und aufwendig.
- „Räumliche Zuordnung > Land in Europa > Italien > …“
Mozzerella ist ein italienischer Käse. Daraus ergeben sich folgende Einordnungsmöglichkeiten:
- Käse UND Italien
- italienischer Käse
- Italien (Käse)
- Käse (Italien)
Ähnliche Möglichkeiten ergeben sich bei Personen, Tieren sowie zeitlichen Angaben (z. B. Politiker: Politik UND Person)
Weiterhin ist ungeklärt, ob man einen Artikel in die tiefste Kategorie eingeordnet werden muss. So wäre es möglich Mozzarella auch unter Milchprodukte einzuordnen.
Kritik:
- Es gibt für beide Punkte keinen Konsens und somit auch keine einheitliche Struktur.
- Das System bläht sich auf, wenn ein Artikel in zwei (oder mehre) grundlegend verschiedene Kategorien passt.
Grundkategorisierung / Facettenklassifikation
BearbeitenDie Grundkategorisierung sieht 4 (oder 5) „Grundkategorien“ vor:
- Thema (z. B.: Person, Unternehmen, Ereignis)
- Typ (z. B.: Objekt, Mann, Frau)
- Raum (z. B.: Europa, Deutschland)
- Zeit (z. B.: Mittelalter, Vorzeit)
Ein Artikel wird in jede Grundkategorie eingeordnet.
Beispiel: „Olympische Sommerspiele 1972“
- Kategorie:Thema:Sport
- Kategorie:Typ:Ereignis
- Kategorie:Raum:Deutschland
- Kategorie:Zeit:20. Jahrhundert
Ein derartiges System macht nur Sinn, wenn es möglich ist, die Schnittmenge aus zwei (oder mehreren Kategorien) zu bilden:
Beispiel:
- Schnittmenge aus Kategorie:Type:Ereignis und Kategorie:Thema:Sport würde alle (vorhandenen) Sportereignisse auflisten. Egal wo und wann sie stattgefunden haben.
Würde man jeder Grundkategorie 10 Unterkategorien verpassen, würde man 10.000 (104) Kategorien „erschaffen“.
Kritik:
- Es ist mit der Wiki-Software zur Zeit nicht möglich die Schnittmenge zu bilden.
- Möglicherweise könnte auch die Performance des Servers unter einem solchen System leiden.
- Wenn die Grundkategorien in sich hierarchisch aufgebaut würden, dann erschiene ein Artikel der Kategorie:Zeit:Mittelalter bei einer Anfrage nach Artikeln des 10. Jahrhunderts (Unterkategorie) nicht. Es würden also nicht alle Artikel, die einen Bezug zum 10.Jahrhundert haben, aufgelistet.
- Die 4 Grundkategorien würde nicht ausreichen um z. B. naturwissenschaftliche Artikel effizient zu kategorisieren.
- Die Kategorisierung der bereits bestehenden Artikel wäre mit sehr viel Arbeit verbunden.
Das semantische Web versucht der Software den Inhalt der Artikel zu vermitteln. Beispiel:
- Die Software weiß, dass Wasser nass ist und dass sich ein Schwimmer im Wasser befindet.
- Sie weiß also, dass ein Schwimmer nass ist.
- Eine Suche nach „nassen Personen“ würde auch die Schwimmer aufzählen, auch wenn im Artikel das Wort „nass“ nicht vorkommt.
Umsetzbar mit Semantic MediaWiki.
siehe auch: Benutzer:Duesentrieb/Semantic_Wiki_Web
Wartung
BearbeitenEs ist notwendig zu prüfen, ob Artikel richtig eingeordnet sind. Es gibt die Idee einen Kategorieverantwortlichen (einen Admin für Kategorien) ins Leben zu rufen. Für die richtige Einordnung von fachspezifischen Artikeln bedarf es jedoch Fachkenntnisse. Es liegt deshalb nahe, die Verwaltung der Kategorien an die entsprechenden Portale zu übergeben.
Weiterhin gibt es die Idee, für Unterkategorien ein Minimum von ungefähr 300 Artikeln einzuführen. Damit würde die Anzahl der Kategorien erheblich verringert und die Wartung sowie Einordnung erheblich erleichtert.