Wikipedia:Archiv/WikiPress/Erfahrungsbericht Erstellung

Diese Seite gehört zum Wikipedia-Archiv.

Projektstand

Bearbeiten

Band 1, Wikipedia - Das Buch wurde ausgeliefert, zwei weitere Bände sind im Druck, die restlichen Bände in unterschiedlichen Bearbeitungsstadien. Der aktuelle Stand ist hier zusammengefasst und wird von Achim Raschka hier laufend dokumentiert.

Zum Verständnis des Textes ist die Lektüre des Erfahrungsberichtes zur Wikipedia-CD Herbst 2004 und des Erfahrungsberichtes der Wikipedia-DVD Frühjahr 2005 von Vorteil.

Wer es noch genauer wissen will: http://www.wikipress.de ist natürlich ein offenes Wiki.

Naivität in der Planungsphase bezogen auf die Textqualität

Bearbeiten

Nach der Ankündigung vom 21. April 2005 gab es warnende Stimmen aus der Community, die besagten, dass Wikipedia-Inhalte (noch) nicht druckreif seien. Da sich die Warnungen auf inhaltliche Aspekte bezogen (Vollständigkeit, Korrektheit der Daten) konnten wir einen ungebremsten Optimismus dagegensetzen - schließlich hatten wir für die 10 Bände Wikipeditoren gefunden, die jeweils in Ihrem Thema tief drin waren und diesbezüglich schon grünes Licht signalisierten.

Die Konsequenzen des Medienwechsels wurden jedoch nicht richtig bedacht: Am Bildschirm liest man viel unkritischer als in einem Buch. Die meisten Artikel strotzen vor typographischen Fehlern, sind in einem Mischmasch aus alter und neuer Rechtschreibung geschrieben und enthalten unglückliche, naiv-komische oder gar falsche Formulierungen. Den Effekt kann man vielleicht selbst nachvollziehen, wenn man sich 5 beliebige Artikel herausgreift und sie ausdruckt. Spätestens aber wenn man die Ausdrucke einem professionellen Korrektor oder Lektor gibt und man sie großflächig rot eingefärbt zurückbekommt - und nur betrübt zustimmen kann - sieht man den Unterschied zwischen Bildschirm und Papier.

Dieser Umstand hat den Zeitplan über den Haufen geworfen: Das interne und externe Korrektorat dauert bedeutend länger als geplant. Sehr unangenehm ist dabei, dass der Zeitverlust sich finanziell doppelt auswirkt: Ein einzelner Titel wird teurer in der Erstellung und es können weniger Titel pro Zeiteinheit produziert werden, die die Umlagekosten decken müssen.

An dieser Stelle ist das größte Optimierungspotential im Erstellungsprozess der Bücher vorhanden. Mehrere Maßnahmen sind zu diskutieren und gegebenenfalls zu kombinieren:

  • Stärkere Einbindung der Community vor dem Export aus Wikipedia (Tag X): Zum Jahresende können die ersten WikiPress-Bücher von der Community „in echt“ begutachtet und hoffentlich für gut befunden werden. Wir hoffen, dass sich dann der eine oder andere Benutzer mit guten Korrektorfähigkeiten verstärkt den Artikeln zuwendet, die in Kürze exportiert werden.
  • Interne und externe Korrektoren des Verlages sollen verstärkt vor dem Tag X sinnvolle Korrekturen in der Wikipedia durchführen, natürlich so behutsam wie möglich und im Interesse aller.
  • Klare Aufgabenstellung für den Wikipeditor: Wir haben beim Arbeiten gelernt und müssen den Wikipeditoren der ersten Staffel für ihre Geduld danken. Ab jetzt können wir die Anforderungen an die Arbeit des Wikipeditors besser formulieren.

Augen zu und durch!

Bearbeiten

Nach diversen Krisengesprächen und der ersten Ernüchterung wurde beschlossen, das Projekt trotzdem weiterzuführen.

Erfreulicherweise klappen die anderen Schritte des Erstellungsprozesses ganz gut.

  • Das Prinzip des offenen Redaktionswikis hat sich bewährt: MediaWiki ist eine solide und vertraute Arbeitsumgebung für alle Beteiligten.
  • Der Transfer der Daten zum Tag X aus der Wikipedia ins Redaktionswiki anhand eines Inhaltsverzeichnisses des Bandes klappt gut, die Routinen wurden von Gwicke geschrieben.
  • Die Autorenbestimmung funktioniert automatisiert, geschrieben von Raul.
  • Der Export der Daten nach DocBook-XML funktioniert und bildet eine gute Basis für die Weiterverarbeitung. Zuständig ist Vlado.
  • Via XSLT wird Tagged Text für InDesign erzeugt, Aufgabenbereich von Stf.
  • Das automatisch generierte InDesign-Dokument wird durch Delphi-Routinen von Christian um Bilder angereichert und im Haus von mehreren Mitarbeitern Seite für Seite ordentlich gesetzt.

Während der Aktion Sauberes_Markup wurden von vielen fleißigen Helfern korruptes Markup der Wikipedia korrigiert um den Transformationsprozess nach XML zu unterstützen.

Besonderer Dank gilt dabei Mathias Schindler, jed, dbenzhuser, Michael, Qbi , Jensw, Avatar, Gnu1742, rdb, Robot Monk, HaSee, Baikonur, Carl Steinbeißer, darina, jpp, Trainspotter, Horgner, ChristianErtl, Ilion, Kam Solusar, janKG, Timo Müller, WiseWoman, Ditschi, gNosis, Kolja21, FlaBot und 212.202.113.214.

Im Gegensatz zu den beiden vorhergehenden Ausgaben wurde kein Schnellreview in einem eigenen Wiki zwischengeschoben. Der inzwischen rund 120 GB großer XML-Dump wird geparst, die Software trifft die Auswahl der Artikel selbstständig. U.a. werden folgende Strategien verfolgt:

  • Artikel mit URV-, SLA, LA-, ... Bausteinen werden nicht mit aufgenommen
  • Bilder müssen positive Lizenztags haben
  • Die Versionen eines Artikels innerhalb eines Zeitfensters von 10 Tagen werden auf eine Whitelist von Benutzern hin untersucht, grob gesprochen wird die aktuellste Version eines vertrauenswürdigen Benutzers genommen. Ist innerhalb des Zeitfensters keine vorhanden, wird die älteste Version außerhalb des Zeitfensters genommen, denn diese hat ja immerhin die letzten 10 Tage anstandslos überstanden. Die Whitelist setzt sich aus Benutzer:Achim_Raschka/Vertrauen und Benutzer:Vlado/Sauberes Markup#Ich mache mit! zusammen.

Diese Automatik erlaubt die Produktion einer DVD von jedem aktuellen Dump. Der Zyklus ist rund 7 Tage lang: Dump laden, entpacken, Artikel auswählen lassen, Autorenlisten erzeugen, nach Digibib-XML konvertieren, Digibib-Format generieren (32 h mit rund 100.000 Bildern), DVD brennen, testen.

Die Konvertierung des Markups nach Digibib-XML gestaltet sich jedoch zunehmen schwieriger. Das Problem und ein Lösungsvorschlag werden unter Benutzer:Vlado/Simplates genauer beschrieben.

Der Lohn der Arbeit

Bearbeiten

[1]

Technische Aspekte

Bearbeiten