Benutzer:ⵓ/externalURLform
Dieses Benutzerskript bindet ein interaktives Werkzeug in die Werkzeugleiste ein, mit dem alle in einem Artikel verstreuten (toten) Weblinks (vor allem in Einzelnachweisen) schnell überprüft, ersetzt und beschriftet werden können.
Einbindung
BearbeitenFolgende Zeilen entweder in die eigene common.js (zur lokalen Verwendung nur in der deutschsprachigen Wikipedia) oder die eigene global.js im Meta-Wiki (zur globalen Verwendung in allen Wikimedia-Wikis) kopieren:
// [[User:ExURLBot/externalURLform.js]]
mw.loader.load( 'https://de.wikipedia.org/w/index.php?title=User:ExURLBot/externalURLform.js&action=raw&ctype=text/javascript' );
// [[User:TMg/autoFormatter.js]]
mw.loader.load( 'https://de.wikipedia.org/w/index.php?title=Benutzer:TMg/autoFormatter.js&action=raw&ctype=text/javascript' ); // autoFormatter ist momentan nicht voll funktionsfähig
mw.loader.load( 'https://de.wikipedia.org/w/index.php?title=Benutzer:TMg/autoFormatter/autoDiff.js&action=raw&ctype=text/javascript' ); // Notwendig für Autoformatter und WeblinkChecker
Weitere Voraussetzungen und Einschränkungen
Bearbeiten- wikEd muss deaktiviert sein (wenn eingebunden, dann ist das mit der Schaltfläche rechts oben deaktivierbar)
- Das Script funktioniert nicht mit dem im Beta verfügbaren neuen Quelltext Editor.
Nutzungsanleitung für externalURLform
BearbeitenEinstellungen
BearbeitenDas Einstellungsmenü findet sich bei geöffneter Tabelle hinter dem Link "Einstellungen" – im ersten Bild dieser Seite ist der Link ganz unten zu sehen.
Im Einstellungsmenü kann man auswählen,
- ob die Spalte "Kontext" angezeigt werden soll,
- In der Spalte Kontext finden sich Informationen wie der externe Link im Wikitext verwendet wird. Dort sieht man ob er innerhalb von ref-Tags verwendet wird, und falls mit einer Vorlage eingebunden, den Namen der Vorlage.
- und eine Vorauswahl zur Suchmaschine treffen:
- In der Spalte "Recherche" findet sich hinter dem "G" ein Link auf eine Suchmaschine. Standardwert ist DuckDuckGo, es kann hier aber auch jede andere Suchmaschine eingetragen werden.
Beschreibung der Tabellenfelder
BearbeitenSpalte „Original“
BearbeitenHier wird die Originalurl angezeigt
- das Protokoll und „www“ wird nicht angezeigt, das spart Platz und verbessert die Übersicht.
- der Query-Teil der URL wird aber ausgeblendet. Dieser ist oft sehr lang und würde die Übersicht erschweren. Fährt man mit der Mouse über den letzten Teil der URL sieht man den vollständigen Link in der Statuszeile.
- Die Domain, und jeder Pfad ist einzeln als eigener Link anklickbar.
- ganz links wird ein „↓“ angezeigt, ein Klick darauf markiert den betroffenen URL im Wikitext. (Chrome markiert zwar, setzt aber den Fokus nicht, sodass man eventuell nach der Stelle selbst scrollen muss. Eine Alternative zum Scrollen ist, nach dem Klick auf das ↓ eine Cursortasten zu drücken, danach das ↓ noch einmal. Damit ist der Fokus jedenfalls im sichtbaren Bereich.)
Spalte „Kontext“
Bearbeiten- Diese Spalte kann mit dem Einstellungsmenü ein- und ausgeblendet werden.
- Wird der URL als Beleg verwendet, steht in der Spalte „Ref.“
- Wird eine Vorlage verwendet, steht dort z. B. „Ref. → Cite book“, das bedeutet, dass es sich um einen Beleg handelt, der die Vorlage {{Cite book}} verwendet.
- Steht in der Spalte kein Kontext handelt es sich meist um Links die innerhalb eines HTML-Kommentars verwendet werden.
Spalte „Recherche“
BearbeitenHinter den Abkürzungen befinden sich folgende Links
Abkürzung | Bedeutung | Verwendung |
---|---|---|
G | googeln | Ein Klick öffnet die eine Suche in der Domain des Links mit dem Linktext falls einer vorhanden ist. |
IA | Internet Archive | Es wird die im Internet archivierte URL aufgerufen, falls nicht im Artikel verlinkt, dann wird die Suche nach Mementos geöffnet. |
T | Archive.today | Es wird ein Link auf Archive.today geöffnet, wobei 2007 als Jahr für die Suche angegeben ist. Eventuell müssen „#“ durch „%23“ ersetzt werden. Achtung: Sinn dieses Links ist, das schnelle Auffinden von online verfügbaren gleichen Inhalten, die den alten URL ersetzen können. Im Artikel selbst sollen archive.today-URLs höchst sparsam verwendet werden. Mementos des Internet-Archive haben immer Vorrang, solange der notwendige Inhalt noch vorhanden ist. |
.is | Archive.today | Hier ist ein archive.today Memento im Artikel vorhanden, ein Klick darauf öffnet es. |
WebC. | Webcitation | Hier ist ein webcitation.org Memento im Artikel vorhanden, ein Klick darauf öffnet es. |
M | Mementoweb.org | Eine allgemeine Suche nach Mementos wird geöffnet. |
LS oder Nummer |
Special:linksearch | Wikipedia Spezial:Weblinksuche wird geöffent, bei häufiger Verwendung wird eine Nummer angezeigt. |
Ist ein direktes Memento auf archive.today oder auf webcitation.org wird allgemeine Suchlink „T“ ausgeblendet. Die Sortierung der Spalte erfolgt bei kleiner Anzahl an URL nach der Anzahl von ähnlichen URL in der Weblinksuche, bei großer Anzahl an URLs nach angezeigten Text.
Achtung: Im Artikel verlinkte Mementos sind nur über die Recherchelinks „IA“, „.is“ oder „WebC.“ anklickbar, da im Original-Feld nur der Originallink zu finden ist.
Spalte „Ersatz“
BearbeitenIn dieses Feld wird die Ersatz-URL eingetragen. Das kann eine beliebige URL sein, kann aber auch eine URL auf ein Memento in einem der unterstützten Webarchive sein.
Spalte „Beschriftung“
BearbeitenHier wird der vorhandene Linktext angezeigt, bzw. kann hier ein neuer Linktext eingetragen werden.
Die Farbcodes der Tabellenzeilen
BearbeitenFarbe | Bedeutung | Anmerkung |
---|---|---|
hintergrundfarbe8 | Toter Link | Die Vorlage {{Toter Link}} ist direkt oder indirekt eingebunden. Ist das Ersatzfeld vorbefüllt, ist das eine URL des IABots |
hintergrundfarbe7 | Archive.today Fehler | Entweder ein Shortlink auf archive.today oder eine Datumsangabe die nicht einem rein numerischen 14 stelligen Zeitstempel besteht. |
hintergrundfarbe6 | IABot Webarchiv | Vom IABot eingetragens Webarchive. Bitte mit Klick auf IA oder ".is/WebC." überprüfen |
hintergrundfarbe5 | Webarchive | Link auf ein unterstütztes Webarchiv |
Mit hintergrundfarbe 6, 7 und 8 markierte Zeilen sollten jedenfalls überprüft werden. Die Sortierung nach Farben wird bei größerer Anzahl an URLs durch die Spalte "Recherche" unterstützt.
Arbeitsweise
Bearbeiten- Hat die Einbindung funktioniert, steht unterhalb der Zusammenfassungszeile ein Link "externalURL-form", mit dem die Tabelle geöffnet wird (siehe Bild).
- Die Reihenfolge der angezeigten Skripte kann dabei variieren.
- Einfacher Ersatz einer URL
- Im Feld Ersatz wird die URL eingetragen, und eventuell im Feld Beschriftung der Linktext angepasst. Im Bild wird ein mit ".is" im Recherchefeld markierter URL durch ein Internet-Archive-Memento ersetzt.
- Dann überprüft man weitere Boteinträge auf Verfügbarkeit. Ist nichts weiter zu tun, klickt man auf "Änderung übernehmen"
- Resultat: ist AutoFormatterDiff aktiviert, zeigt sich das Diff in dem die entsprechende URL ersetzt wurde. Die Boteinträge wurden entfernt.
- In der Zusammenfassungszeile steht der Eintrag wieviele Weblinks geändert wurden.
- Parameter offline
- Der Parameter offline bei Zitationsvorlagen bindet die Vorlage (Seite nicht mehr abrufbar.) ein. Bei Links, die durch den Internet Archive-Bot gefunden wurden, sind das dann gelb markierte Zeilen, mit einem automatisch durch das Webarchive ausgefüllten Ersatz. Funktioniert dieser Ersatz, ist nichts weiter zu tun.
- Funktioniert der Ersatz nicht, hat man auch keinen passenden Ersatzlink zur Hand und ist auch die Original-URL unerreichbar, handelt es sich um einen toten Link. In diesem Fall kann man mit dem Pfeilchen ganz links zur Stelle im Quelltext navigieren. Dort müssen die vom Bot fehlerhaft eingetragenen Parameter "archiv-datum" und "archiv-url" entfernt werden.
- Vom Bot eingetragene Webarchiv funktionieren nicht
- Sind in der Regel violett markiert Links des Bots fehlerhaft, etwa dass sie nicht den gewünschten Deeplink sondern nur eine allgemeine Auffangseite zeigen, und es ist auch kein passender Ersatz zur Hand, dann muss die {{Webarchiv}} manuell in {{Toter Link}} umgewandelt werden. Dass muss per Hand im Quelltext erledigt werden.
{{Webarchiv |text=„Ein unbrauchbares vom Bot eingesetztes Memento“ |url=http://example.org/dead |wayback=20090830022300 |archiv-bot=2018-04-09 14:57:06 InternetArchiveBot }}
wird zu
{{Toter Link|text=„Ein unbrauchbares vom Bot eingesetztes Memento“ |url=http://example.org/dead |datum=2009-08-30 }}
- Ersatz von toten Links
- Ist die Vorlage {{Toter Link}} mit Linktext befüllt oder eine Zitationsvorlage mit Parameter offline=1 befüllt und hat man einen passenden Ersatz-URL gefunden, wird dieser einfach eingetragen, das Script erledigt den Rest automatisch.
- Der InternetArchiveBot stellt neben den toten Link die Vorlage Toter Link nochmal hinzu. Das führt dazu, dass die URL doppelt angezeigt wird, einmal farblich markiert und oberhalb davon ohne farbliche Markierung. (Siehe Bild Beispiel) Faust Ausgebessert muss in diesem Fall die URL ohne farbliche Markierung werden. Danach muss man in den Quelltext und die Vorlage Toter Link manuell entfernen.
Einsatzgebiete und Arbeitslisten
BearbeitenArbeit mit Katgorien
Bearbeiten- Seiten mit manuell als tot markierte Links
- Seiten mit vom InternetArchiveBot als tot markiere Links
- ungeprüfte vom Bot als tot markierte Links
- ungeprüfte vom Bot eingetragene Archivlinks (Anmerkung: Diese Seiten sind für Anfänger mit dem Skript am besten geeignet. Bei den farblich markierten Links klickt man auf "IA" oder falls vorhanden ".is" oder "WebC." Überprüft, ob der Inhalt passt und klickt auf "Änderungen eintragen".
Arbeit mit der Weblinksuche
BearbeitenDas eignet sich am Besten, wenn man eine Lösung pro Domain hat:
- manuell markierte tote Links: Tool Giftbotweblinksuche deaktiviert.
- vom Bot markierte tote Links: Tool Giftbotweblinksuche deaktiviert.
- vom Bot eingetragene ungeprüfte Mementos: Tool Giftbotweblinksuche deaktiviert.
Bitte ausreichend selektive Suchkriterien Eintragen, um die Weblinkssuche nicht zu überlasten, also immer zumindest eine Domain am nach dem Präfix eintragen.
Abarbeiten von InternetArchiveBot-Einträgen
Bearbeiten- Artikel mit Hilfe der oben beschrieben Methoden suchen, und im Quelltextmodus öffnen
- Auf "externalURL-form" klicken, damit sich die Tabelle öffnet.
- Die Tabelle nach »Recherche« sortieren. Damit sind bei größeren Anzahl an URLs die zu recherchierenden Fälle alle zusammen.
- Die mit hintergrundfarbe6 markierten URLs mit der Schaltfläche "IA" (oder .is falls vorhanden") öffnen, und kontrollieren ob dort der Inhalt vorhanden ist. Passt alles und sind keine anderen farblichen Markierungen vorhanden, klickt man auf Änderung übernehmen, und speichert den Artikel.
- Ist eine URL online erreichbar, trägt man das im entsprechenden Feld in der Tabelle ein. (Achtung der Ersatz muss sich vom alten Original geringfügig unterscheiden, etwa https statt http oder ein "#" am Ende, da bei gleicher URL die alte Vorlage nicht entfernt wird. Gibt man eine auf solche Weise manipulierte URL ein, muss man das nachträglich wieder zurückändern)
- Ist der gewünschte Inhalt bei einem anderen Anbieter erreichbar trägt man die URL in das entsprechende Feld ein, navigiert mit der ↓ zum entsprechender Stelle im Quelltext und ändert gegebenenfalls die veralteten Daten.
- Bei hintergrundfarbe8 gibt es 2 unterschiedliche Fälle:
- ist im Feld »Ersatz« eine URL angezeigt, handelt es sich um eine Vorlage mit "offline"-Parameter, hier kann man die URL mit Click auf IA überprüfen
- ist das Feld »Ersatz« leer und es fehlt der Linktext dann steht im Quelltext [https://example.org/badURL Linktext]{{Toter Link|url=https://example.org/badURL}}. Findet man hier Ersatz für so eine tote URL, sortiert man nach dem Eintrag in »Ersatz« nach »Original«, damit die beiden Einträge direkt untereinander stehen, und trägt den Ersatz in der farblich nicht markierten Zeile ein. Klickt auf Änderung übernehmen", navigiert mit der ↓ zum entsprechender Stelle im Quelltext und entfernt die nun überflüssige Vorlage {{Toter Link}}
- Bei hintergrundfarbe7 markierten URL auf achive.today sollte das jedenfalls überprüft werden ob Ersatz, z.B. beim Internet Archive vorhanden ist, und gegebenenfalls der Zeitstempel korrigiert werden. Das gewünschte Format ist YYYYMMTThhmmss.
Effizient arbeiten mit Wartungslisten
BearbeitenDas Internet Archive öffnet oft recht langsam, daher ist es ratsam, mehrere Artikel parallel zu bearbeiten.
- Öffnen einer oben verlinkten Wartungskategorie oder Erstellen einer Liste mit der Weblinksuche.
- Mehre Artikel in neuen Tabs öffnen.
- Den Quelltext öffnen: und in den nächsten Tab springen: [alt]+[E] dann [Strg]+[Tab] (oder [Strg]+[Bilḍ̣↓])
- auf "externalURL-form" klicken, mit der Tastatur in den nächsten Tab springen [Strg]+[Tab]
- Wenn sinnvoll die Spalte "Recherche" sortieren, damit die farblich markierten und die archive.today Links nach oben sortiert werden. Achtung bei doppelt eingetragen toten Links werden diese aus dem Zusammenhang gerissen, man kann das aber durch Sortieren nach "Original" wiederherstellen.
- Öffnen der Archivlinks: in der Regel durch Klick auf "IA" oder falls vorhanden ".is" oder "WebC.", und in den nächsten Wiki-Artikel navigieren, und das Öffnen der Archive wiederholen, bis in allen Tabs erledigt. In der Zwischenzeit haben sich hoffentlich alle Mementos geöffnet, und man kann im ersten Tab die Änderungen eintragen, oder auf "Änderung übernehmen" klicken, wenn alle Mementos passen.
- Änderung übernehmen in allen offenen Wiki-Artikeln, die Webarchive, kann man schon schließen.
- Überprüfen der Diffs: [Strg]+[Tab] danach [Leertaste] um in der Seite nach unten zu navigieren, damit man alles Notwendige sieht. Falls nötig, noch notwendige Änderungen im Quelltext vornehmen, und Zusammenfassungszeile ergänzen.
- Speichern der Tabs: [alt]+[S] und mit [Strg]+[Tab] in den nächsten offene Tab wechseln
Release Notes
Bearbeiten- Version 2019-09-27: Verbesserter Umgang mit nicht normgerechten Zeitstempel bei wayback und archive.today; Zeitstempel wie 20010102123344im_; 20010-10-21; 20010.1.02-12:33:44 usw. werden nun erkannt und gegebenenfalls auf YYYYMMDDhhmmss normiert, wo dies möglich ist. Zusätzlich bessere Erkennung des Zeitstempels bei archive.org (Vermeidung der Fehlerkennung, wenn in der URL 2 Strings vorkommen, die als Zeitstempel interpretierbar wären.)
- Version 2019-09-26: Verbesserter Umgang mit https (Vermeidung von http://https://) und Protokollergänzung für Wayback und archive.today