Wikipedia:Technik/Cloud/giftbot/vorlagenparser
führt eine Suche nach im Quelltext von Seiten enthaltenen Vorlagen-Einbindungen durch und erstellt eine von weiteren Programmen auswertbare CSV-Datei zum Download oder direkter Weiterverarbeitung; etwa durch Tabellenkalkulationsprogramme.
Weil der Quelltext untersucht wird, werden Weiterleitungen auf den Namen der Vorlage nicht aufgelöst; diese müssten separat abgefragt werden.
Der Aufruf generiert sofort einen Download der in der URL angegebenen Parameter; ein interaktives Formular zum Ausfüllen nach Aufruf der Vorlage gibt es nicht.
Zurzeit wird ausschließlich die deutschsprachige Wikipedia analysiert.
Ausgabeformat
BearbeitenAufgelistet werden die jeweils in der einzelnen Einbindung angegebenen Parameterwerte.
- Die erste Zeile enthält den Namen der Vorlage und einen Zeitstempel.
- Die zweite Zeile listet als Spaltenüberschriften gedachte Bezeichner auf, durch Kommata getrennt.
- An erster Stelle steht der Name der einbindenden Seite (
title
). - An zweiter Stelle steht die fortlaufende Nummerierung der Einbindungen in derselben Seite (
#
). - Es folgen die Namen der gefundenen Parameter, durch Kommata getrennt.
- An erster Stelle steht der Name der einbindenden Seite (
- Die dritte und alle folgenden Zeilen enthalten die gefundenen Einbindungen.
- Jede Einbindung erhält eine Zeile.
- Die Werte sind durch Kommata getrennt.
- Die Abfolge in der Zeile entspricht den in der zweite Zeile aufgezählten Spaltenüberschriften.
- Innerhalb derselben einbindenden Seite sind die Einbindungen fortlaufend nummeriert.
- Beginnt der Wert mit
"
, dann ist er in"
eingeschlossen, in der Regel weil er ein Komma enthält. - War ein Parameterwert nicht angegeben oder leer, so folgen die Kommata unmittelbar aufeinander.
Die Datei ist UTF8-kodiert (ASCII); das bedeutet, dass Umlaute usw. ggf. erst als Einzelzeichen dekodiert werden müssen.
Der Informationsstand ist bis auf einige Sekunden, selten wenige Minuten aktuell.
Wie mit der generierten Datei verfahren wird, hängt von der Konfiguration des Browsers ab.
- Die angebotene Datei hat die „Erweiterung“
.csv
– dafür könnte vorgegeben sein, dass sie direkt in einem Anwendungsprogramm geöffnet werden soll, ggf. ohne eine eigene Datei zu schreiben. - Es könnte die Speicherung auf der Festplatte in einem Download-Verzeichnis vorgenommen werden; das Download-Logbuch des Browsers verrät dann mehr.
URL und URL-Parameter
BearbeitenNachstehend sind die Parameter aufgelistet, wie sie in der URL benutzt werden.
- Die Basis-URL lautet:
https://giftbot.toolforge.org/vorlagenparser.fcgi
- Daran ist mit einem vorangehenden Fragezeichen
?
die Parameterliste anzuhängen. - Es folgen Zuweisungen name
=
Wert - Dabei darf Wert keine Leerzeichen enthalten; muss bei bestimmten Zeichen ggf. kodiert werden.
- Die einzelnen Zuweisungen name
=
Wert sind durch&
voneinander zu trennen.
- template
- Titel der eingebundenen Seite (im Vorlagen-Namensraum)
- namespace
- Nummer des Namensraums, der analysiert werden soll
- Keine Angabe:
0
– ANR
Beispiel
Bearbeitenhttps://giftbot.toolforge.org/vorlagenparser.fcgi?template=RussStaatsLib
Quellcode
BearbeitenEntwicklerin
Bearbeiten