Wikipedia:Technik/Cloud/pagepile
(„Haufen von Seiten“) verwaltet Listen von Seiten auf einem Wiki.
- Die Listen lassen sich weltweit von jedem einsehen.
- Verändern lassen sie sich zurzeit nur durch Programmierer auf den Labs.
Der Zweck ist es, eine nach bestimmten Regeln erstellte und turnusmäßig aktualisierte Liste von Seiten mit anderen Werkzeugen (etwa PetScan) auszuwerten.
Das Prinzip wäre mit einer Art Kategorisierung bestimmter Seiten zu vergleichen, wobei aber anders als bei der Kategorisierung im Wiki die Seite im Wiki und das Wiki überhaupt nicht verändert werden.
Funktionalität
BearbeitenJede Liste wird über eine ID (Ganzzahl) eindeutig identifiziert.
- Sie enthält die Identifikation des Wikis, für das sie gilt, und eine Liste von Seitenkennnummern.
- Darüber hinaus können jedem Eintrag mehrere beliebige Felder mit Zusatzinformationen zugeordnet werden.
- Wie bei einer Datenbank können Einträge der Liste hinzugefügt oder daraus enternt werden. De facto steht eine SQLite-Datenbank dahinter.
Listen können in unterschiedlichen Formaten heruntergeladen werden. Sie können außerdem für eine temporäre Darstellung kombiniert und gefiltert werden.
Erstellung und Veränderung
BearbeitenEs gibt mehrere Möglichkeiten, Listen zu erstellen und zu aktualisieren:
- durch Programmierer auf den Labs mittels einer API.
- Siehe: HowTo
- Mittels URL-Parameter und die
action=
– zurzeit kaum Manipulation der Inhalte möglich.- Benutzer können sich dabei durch OAuth persönlich identifizieren; ansonsten wird ein Anonymous user zugewiesen.
- Mittels anderer Tools wie petscan oder quarry.
- PetScan kann statt einer HTML-Darstellung der Ergebnismenge (neben anderen Ausgabeformaten wie CSV) das Suchergebnis direkt an PagePile weiterreichen;
- PagePile akzeptiert als Suchkriterium u.a. eine Quarry-ID, um aus dem Ergebnis der Quarry-Recherche einen PagePile zu erstellen.
- Mittels einer Suchmaske, die neben Quarry auch eine SPARQL-Suche ermöglicht und den Zugriff auf ContentMine oder PasteBin erlaubt.
„Eigentümer“ der Seitenliste ist derjenige Werkzeugbetreiber, der die Liste erstellt; ggf. auch ein durch OAuth autorisierter Schöpfer.
URL und URL-Parameter
BearbeitenNachstehend sind die Parameter aufgelistet, wie sie in der URL benutzt werden.
- Die Basis-URL lautet:
https://pagepile.toolforge.org/
- Daran ist mit einem vorangehenden Fragezeichen
?
die Parameterliste anzuhängen. - Es folgen Zuweisungen name
=
Wert - Dabei darf Wert keine Leerzeichen enthalten; muss bei bestimmten Zeichen ggf. kodiert werden.
- Die einzelnen Zuweisungen name
=
Wert sind durch&
voneinander zu trennen.
- id
- Laufende Nummer der Liste
- Pflichtparameter
123456789
- action
- Aktion
- Pflichtparameter
get_data
– Inhalt einer Liste anzeigenget_info
– Informationen zur ID ausgeben; JSON{"status":"OK","pile":{"id":123456789,"file":"
Dateipfad.sqlite"}}
run_filters
– Trnsformierte Liste anzeigen; siehefilters=
create_pile
– Datenbank wird erstellt, ID vergeben, Erstellung durch den Benutzer markiert- format
- Ausgabeformat
html
– HTML-Seite ansehen (Vorgabe)text
– plain text, eine Zeile pro Seitennamewiki
– Wikitext, Liste mit*
pro Zeile und Wikilink auf den Seitennamenjson
– JSON"pages"
: Objekt mit Seitennamen; Werte der Zuweisungen sind die Zusatzinformationen"wiki"
: [[../../../MediaWiki/Datenbankname|Datenbankname des Wikis]]"id"
: Nummer der Liste
- max
- Anzahl der Ergebnisse pro Aufruf
100
– Vorgabe, keine Obergrenze- start
- Nummer des Ergebnisses, mit dem bei diesem Aufruf die Auflistung beginnen soll
0
– Vorgabe- metadata
- Zusatzinformationen liefern (nur JSON)
1
– ja
- filters
- Filterbedingungen festlegen;
action=run_filters
- Eine temporäre Zusammenstellung wird ausgewertet, indem die Filterbedingungen nacheinander angewendet werden.
- JSON-kodiertes Array.
import:
PagePile-ID- Datensätze als Grundausstattung heranziehen; temporäre Zusammenstellung bilden.
union:
PagePile-ID- Vereinigen mit anderem PagePile
subset:
PagePile-ID- Schnittmenge mit anderem PagePile
exclusive:
PagePile-ID- Restmenge zu anderem PagePile
filter_namespace:
Array mit zwei Elementen,keep
undremove
.- Jedes ist ein Array von Namensraum-Nummern, die behalten oder aus dem Ergebnis entfernt werden sollen.
to_wikidata:
Beliebiger Wert- Wikidata-Item statt Seite
from_wikidata:
Beliebiger Wert- Seite statt Wikidata-Item
- PagePile muss Liste von Items gewesen sein
no_wikidata:
Beliebiger Wert- Nur Seiten ohne Wikidata-Item
follow_redirects:
Beliebiger Wert- Weiterleitungen auflösen
random_subset:
Beliebiger Wert- Zufällige Auswahl zuvor festgelegten Umfangs