Projekt: Sitemap der Wikipedia in 3D

Bearbeiten

Was der Wikipedia fehlt ist eine Sitemap d.h. ein Überblick über alle Artikel.

Aufgrund der großen Artikelanzahl in der Wikipedia empfiehlt sich ein 3D-Blick auf die Dinge, zudem kann man so die Leistungsfähigkeit moderner Grafikkarten ausnutzen.

Die globalen Themenwahl der Wikipedia ergäbe somit aber keine normale Sitemap, sondern einen großen, allumfassenden Baum des Wissens.

Dank MySQL, PHP, VRML, dem Wikipediadatenbankdownload und der rasanten Hardwareentwicklung war es möglich dieses Web-tauglich umzusetzen. VRML ist dabei ein relativ alter und freier Internetstandard für interaktive 3D-Welten, der Benutzer kann sich frei im virtuellen Raum bewegen und stückchenweise werden die Daten über PHP aus einer Datenbank geholt. Dabei werden nur die Artikeltitel verwaltet auf den eigentlichen Inhalt wird verlinkt.

Das Projekt befindet sich dabei noch in einer beta-Phase. Mit einer flotten Internetverbindung, einem zeitgemäßen Rechner (Stand 2005: 1Ghz und viel RAM) und einem kostenlosen VRML-Plugin kann man schon mal einen Blick darauf werfen. Das VRML-Plugin kann nach seiner Installation auch zum Besuch zahlreicher anderer Welten im Internet genutzt werden. Dabei empfiehlt es sich gemäß untere Erklärung das Blaxxun Contact-Plugin; das Plugin integriert sich dann üblicherweise in den Internet Explorer und danach kann man folgende php-Dateien ausprobieren:

  • wiki4main.php (Deutsche Wikipedia 380000 Einträge!!! Speicher- und Grafikkartenoptimiert, die Links werden nachgeladen wenn man einmal auf einen Artikel klickt)
  • wiki3main.php (Friesenwikipedia:Text als Textur optimiert allerdings nur ASCII-Zeichen) oder wenn es nicht laufen sollte dann
  • wiki2main.php (Friesenwikipedia:mit einfachem VRML-Text)

Die Artikel werden über LODs Stück für Stück nachgeladen. Unter den Artikeln befindet sich übrigens ein L-förmiger Link zu den Wikipediaartikeln (Einfach drauf klicken).

Tips zum Feintuning

Bearbeiten
  • Auch wenn die virtuelle Welt von Anfang an hinreichend funktionieren sollte, so hat der Benutzer über die rechte Maustaste zahlreiche Einstellmöglichkeiten.
  • Die Grafikkarten-Unterstützung sollte beim Blaxxun-Plugin, wenn es die Grafikkarte zulässt, in den Einstellungen auf "Direct3D T&L HAL - Microsoft Direct3D Hardware Transform" eingestellt sein, um den Prozessor zu entlasten.
  • Gravitation, Kollissionserkennung sollte man unbedingt ausstellen. Mipmapping kann man anstellen.
  • Bei der "Text als Textur"-Variante kann zur Not auf Anti-aliasing verzichtet werden. Wenn die Schrift dabei unscharf erscheint, mal nachschauen ob die Texturgröße in den Settings/Performance Options auf mind. 1024 steht.

Tips zu den Plugins

Bearbeiten
  • Cortona von Parallelgraphics scheint erst alle LOD zu laden, bevor es überhaupt etwas anzeigt, womit es für größere DB leider ausscheidet.
  • Unter bitmanagment.de bekommt man nur Plugins mit nervenden Logo, das über den Bildschirm wandert. Die Speicherprobleme treten dabei genauso auf wie bei den älterem BlaxxunContact5.
  • Linux- und OpenSource-Plugins konnten von mir leider nicht getestet werden, da ich an der Installation scheiterte.
  • Damit bleibt aus meiner Sicht, ohne parteiisch sein zu wollen, das BlaxxunContact5 wohl die beste Wahl.

Screenshots

Bearbeiten
  • Die Artikel sind noch vollkommen ungeordnet. Dafür ist eine zusätzliche Tabelle geplant in der zu jedem Artikel und jeder "Sichtweise" (s. unten) Koordinaten gespeichert werden. Prinzipiell sehe ich da kein Problem. Vorstellbar ist es auch jedem Artikel mehrer Koordinaten zugeben da er ja z.B.: in mehrere Kategorien gehört.
  • Die Links zwischen den Artikeln und den Kategorien sollen noch eingezeichnet werden können.
  • Das Speicherplatzproblem ist deutlich entschärft, leider läuft im Moment beim Clienten die Windows-Speicherauslagerungsdatei auf über 500 MB an wenn man lange Zeit durch die Welt läuft oder fliegt.
  • Ein Vorgeschaltetes PHP-Skript soll Einstellmöglichkeiten bieten (LODRange, Startpunkt, Sichtweisen...).
  • Intelligentere ineinander geschachtelte LODs.
  • Ausschleusen des DB-Passwortes in eine getrennte Datei.
  • einfaches Installationsskript.

mögliche Sichtweisen

Bearbeiten

Die Positionierung der Artikel im Raum könnte in getrennt Skripten in größeren Abständen erfolgen.

zufällige oder alphabetische

Bearbeiten

Diese Sichtweise ist auch ohne Koordinaten möglich und auch schon umgesetzt. Sie ermöglicht ein gutes virtuelles Fluggefühl und ein Durchstöbern der Matrix.

(Genauer gesagt läuft das ganze im Moment nicht rein zufällig sondern gemäß der Logistische Gleichung mit r=4. Dadurch stimmen dann Artikel- und Linkpositionen miteinander überein. Allerdings konzentrieren sich die Artikel dadurch etwas an den Würfelkanten.)

nach Kategorien

Bearbeiten

in Arbeit Ausgehend von der Kategorie:!Hauptkategorie als Stamm kann sich die Wikipedia nach unten verästeln. (siehe Baum des Wissens) Auch die Optik der einzelnen Artikelobjekte könnte variieren, je nachdem in welche Kategorie er gehört siehe Wikipedia:Kategorien/Grundkategorisierung. Schriftgröße in Abhängigkeit der Höhe in der Hierarchie und der Anzahl der untergeordneten Themen. Die hier vorhandenen Polyhierarchien wird um gewandelt in eine Monohierarchie, bei einzelnen Artikel mehrfach auftreten. Bsp.: Goethe ->u.a. bei Biologie/Botaniker, Literatur/Autor,Oranisationen/Freimaurer. Aber wie verhindert man Kollisionen unterschiedlicher Themengebiete?

nach Portalen

Bearbeiten

?

nach Listen

Bearbeiten

?

nach zeitlicher Ordnung

Bearbeiten

In der cur Tabelle ist die Entstehungszeit des Artikels gespeichert, dieses ließe sich als Koordinate oder für eine Animation interpretieren.

"Biomorph"

Bearbeiten
 
Netzwerkdarstellung

Die Verbindungen lassen sich als zusammenziehende Federn zu simulieren und die Artikel stoßen sich bis zu einem gewissen Abstand zwecks besserer Lesbarkeit ab. Eng verknüpfte Themenbereiche sollten somit automatisch zusammenfinden. Diese ist vom Rechenaufwand die aufwändigste Methode(>6 Mio Links), vom Formalismus her jedoch fast die einfachste. Bis 30 Objekten schafft sogar Excel solch eine Simulation (nach einem eigenem Skript) in Echtzeit. Bei der vorhandenen Artikelanzahl bin ich, PHP und mein Rechner jedoch überfordert.

Ich favorisiere im Moment eine Kombination aus dem Ordnungsschema der Kategorien und einer in den einzelnen Hierarchieebene stattfindende Ordnung nach Netzwerkgesichtspunkten. So sollten z.B. die Themenbereiche direkt unterhalb der Hauptkategorien direkt die zahlreichen Links zwischen Technik- und Physikartikeln aufsummiert werden. Die deutlich selteneren Links zwischen Technik und Religion würden auch aufsummiert und als deutlich schwächere Feder zu simulieren sein.

zum Thema Artikel-Clusterung: http://wikipedia-clustering.speedblue.org/

Georeferenziert

Bearbeiten

siehe (Wikipedia:WikiProjekt Georeferenzierung). Die in etlichen Artikeln hinterlegten Geokordinaten könnten nicht nur als Verweis auf Worldwind dienen sondern auch für eigene "Wikipediakarten". Teilweise für HTMLund Google Earth umgesetzt, siehe: Wikipedia:WikiProjekt_Georeferenzierung/Wikipedia-World

Synchronoptisch

Bearbeiten

siehe Peters Synchronoptische Weltgeschichte Personen und Ereignisse werden in eine Zeitskala eingezeichnet. (siehe auch Benutzer:Kolossos/Syncronoptische Weltgeschichte und auch die Diskussionsseite)

Zusatzinformationen

Bearbeiten

Sehr schön wäre es natürlich, man würde aus dem Artikel noch Zusatzinformation heraussuchen. So könnten exzellente Artikel mit einem "+" gekennzeichnet sein. Oder das man das erste Bild aus dem Artikel als Thumbnail mit anzeigen.[1].

2D-Abbildung

Bearbeiten

Wenn man eine Koordinate auf 0 setzt hätte man ein übersichtlichere 2D-Abbildung.Und damit die Möglichkeit mit Flash oder SVG zu arbeiten.

Autopilot und Bildschirmschoner

Bearbeiten

Erledigt: Durch einen animierten VRML-Viewpoint ist ein Freiflug denkbar. Programmierung einfach über Lissajous-Figur -> Erst die Maus etwas bewegen, dann mit der Bild nach unten Taste den Blickpunkt wechseln unten rechts erscheint ein Button der den Freiflug startet oder stoppt.

Hilfe erwünscht

Bearbeiten
  • Nutzung der Namespace-Tabelle für Prefixe (z. B.:Bild:... , Benutzer:...)
  • Internationalisierung
  • Links als Linie einzeichnen (alles möglichst optimiert um den Rechner zu schonen). Wenn das ein zu großes Chaos wird dann nur die Links zu den Kategorien oder andere Optik.
  • eine Art Ladebalken der anzeigt wie groß ein Artikel ist.
  • hilfreich wäre ein freier Webserver mit MySQL um die Wikipedia in der Testphase nicht weiter zu belasten. Mein jetziger Uni-Server ist nichts auf Dauer. Er muß gar nicht allzu schnell sein, zu Hause bei einem Clienten tat es ein 600 MHz -Rechner mit einer reduzierten cur-Tabelle locker. Die Post geht erst beim Clienten ab. Etwas Traffic entsteht natürlich schon. Mittlerweile gibt es da jetzt zum Glück den Toolserver.
  • Verbesserung der Bedienungsanleitung
  • Mit auf Java-basierender Technologie wäre es vielleicht möglich auf die Installation des Plugins zu verzichten.
  • Feedback!

PHP-Code

Bearbeiten

Der vorläufige Code ist hier: [2] Das Wirkprinzip ist hier abgebildet:[3]

Erfahrungsberichte

Bearbeiten

Auch wenn die Seite sich in meinem Namensbereich befindet, so darf sie ausdrücklich erweitert und verbessert werden. Bei den Erfahrungsberichten hier bitte Betriebssystem, Plugin, Hardware und Internetzugang mit angeben:

wiki4main.php

Bearbeiten

(Deutsche Wikipedia)

  • WinXP,Blaxxun,3GHz ATI9800XXL 500MB-RAM,DSL ->läuft gut.(100fps) Die Links sitzen leider noch nicht an der richtigen Stelle. Nach dem Beenden dauert es ca. 30sek bis die Windowsauslagerungsdatei wieder leer ist und die Festplatte zur Ruhe kommt. Kolossos 22:39, 24. Mai 2005 (CEST)
  • Win98,Blaxxun,600MHz NVidiaTNT2 400MB-RAM,Modem ->läuft eine Weile (30sec warten, 20 fps) Kolossos 22:39, 24. Mai 2005 (CEST)
  • WinXP,Blaxxun,3.2GHz,Geforce2,1GB RAM,DSL -> läuft gut --APPER\☺☹ 23:33, 13. Jun 2005 (CEST)

wiki3main.php

Bearbeiten
  • WinXP,Blaxxun,3GHz ATI9800XXL 500MB-RAM,DSL ->läuft.(25fps) Kolossos 16:17, 19. Mai 2005 (CEST)
  • Win98,Blaxxun,600MHz NVidiaTNT2 400MB-RAM,Modem ->naja läuft (30sec warten, 13 fps)Kolossos 19:58, 22. Mai 2005 (CEST)

(alt und cronologisch) Vielleicht währe es auch spannend, Wikipedia mit einem semantic Web mit Wissensgraph zu ergänzen. Ein vereinfachtes Konzept würde sich dann nur auf die Links beziehen und diesen dann freiwillig Meta-Informationen mitgeben: Ein Link könnte somit z.B. folgende Informationen tragen:

  • Link auf untergeordneten Begriff oder Gegenstand (Auto->Lenkrad)
  • Link auf übergeordneten Begriff oder Gegenstand (Biologie->Naturwissenschaften)
  • Link auf eine kausale Folge (2.Weltkrieg->Teilung von Deutschland)
  • Link auf eine kausale Ursache (Amtsantritt von Papst den 7.->Ableben von Papst den 6.)
  • Link ohne Meta-Information bedeutet dann "siehe auch"

Mir (als nicht Informatiker) ist es Mittler Weile gelungen in VRML (einer HTML ähnlichen 3D-Beschreibungssprache mit Java-script Unterstützung) aus einer Tabelle für die Objekte und einer Tabelle für die Verbindungen die gezeigten räumlichen und veränderbaren Hierarchie bäume automatisch zu generieren (Screenshot [4]). Diese Tabellen sind meines Wissens nach in der Wikipedia-Datenbank auch abgelegt. Es sollte also für Informatiker möglich sein Web-fähige und Datenbank basierte Wissensgraphen zu erzeugen. Im 2D-Fall sollte auch DHTML ausreichend sein. Der Benutzer sollte die Artikel per Drag-and-Drop verschieben können und per Doppelklick sollte sich die vollständige Seite öffnen.

Ein Beispiel im Bereich der Mathematik was die Verbindung von allen Begriffen unter einander grafisch darstellt findet sich hier: thesaurus.maths.org wenn man dort ins Suchfeld z.B. Sinus eingibt, dann rechts "Graph anzeigen" klickt gekommt man eine schöne Anzeige. (Leider ist dafür Java notwendig das sollte noch geändert werden, dafür scheint die Software aber auch frei verfügbar zu sein). Man kann dann noch einstellen wie viele Links man vom aktuellen Link verfolgen will, von einem zum anderen springen und per Doppelklick erhält man die detaillierte Seite.

Ein Beispiel aus der Linguistik ohne aufwendiges Plugin ist hier.[5]

Bei den über 200000 Wikipediaartikel würde schnell ein ziemliches tolles "Wollknäul" aus Begriffen und Verbindungen entstehen. Aus den o.g. Hierarchien könnte man dann ordentliche Wissensbäume entstehen zulassen. Und so vieleicht eine bessere Übersichtlichkeit über die Artikelflut bekommen. Aufgrund der Datenflut bietet sich vielleicht wirklich 3D an. Dann ist es auch möglich die Verbindungen als sich zusammenziehende Federn zu simulieren und die Artikel stoßen sich bis zu einem gewissen Abstand zwecks besserer Lesbarkeit ab. Eng veknüpfte Themenbereiche sollten sich somit automatisch zusammenfinden.

Ggf. könnte man auch erstmal ein von den wikipedia-Servern getrennt laufendes Projekt aufbauen um die Server nicht noch mehr zubelasten. Wer hat da weitere Ideen?

Interessant ist dabei auch Wikipedia:Kategorien/Meinungsbild zu den jetzigen und zukünftigen Ordnungsvarianten. Und auch was die Leute bei OpenCyg [6] machen (ich verstehe es nur nicht).Kolossos 22:53, 1. Apr 2005 (CEST)

Ich bin jetzt (dank phpmyadmin) einen Schritt weiter und habe die ca. 3000 Seitentitel der Wikipedia auf Plattdeutsch als Blöcke in einer VRML-Datei drin. Der Screenshot heißt nicht ohne Grund wikiwahn.jpg. An den ca 18000 Links zwischen den Artikel hängt sich das Vrml leider vollkommen auf.Kolossos 19:09, 11. Apr 2005 (CEST)


Aufgrund der großen Artikelanzahl in der Wikipedia empfiehlt sich ein 3D-Blick auf die Dinge. Hier ein Rechenexampel:

  • in der aktuellen deutschen cur-Tabelle (April 2005) befinden sich 521000 Artikel (incl. Benutzer und Bildern...) bei linearer Anordnung ergibt sich so eine ungeheure Länge der Darstellung
  • bei flächiger Betrachtung der Dinge ergibt sich über die Wurzelfunktion ein Quadrat mit 722 Artikel auf jeder Kantenlänge. Eine mögliche Umsetzung könnte in Flash oder SVG erfolgen.
  • bei räumlicher Betrachtung der Dinge ergibt sich über die 3.Wurzel ein Würfel mit überschaubaren 80 Artikel auf jeder Kantenlänge

Kolossos 11:21, 26. Mai 2005 (CEST)


siehe auch Wikipedia:Wikipedistik GEO:[7]

1.Vortrag 03.06.05:Wikipedia:Archiv/Wikipedia-Tag_Dresden