Wikipedia:Bots/Anträge auf Botflag/Archiv/2016
2016-04-09 – FNBot
Antrag gestellt vor 3186 Tagen.
- Name: FNBot (Diskussion • Beiträge • Sperren • Logbücher • Sperrlogbuch • Benutzerrechte-Logbuch )
- Betreiber: FNDE (Diskussion • Beiträge)
- Flags auf anderen Wikis
- Programmiersprachen: Python 3.5
- Aufgaben-Zusammenfassung: Weblinks ohne Seitentitel mit der Vorlage
{{ Internetquelle }}
ersetzen und tote Links für Wartungslisten aufbereiten. - Aufgaben-Details: Ich habe auf Grundlage einer Botanfrage ein Python-Script entwickelt, dass nackte Weblinks im Stil von
<ref>http://www.weblink.de/seite</ref>
mit Hilfe der Suchfunktion extrahiert und mit allen zur Verfügung stehenden Metadaten unter Einbeziehung der Vorlage{{ Internetquelle }}
ersetzt. Die Metadaten werden sowohl über Citoid als auch über die betreffende Seite selbst bezogen. Um resourcenschonend zu arbeiten, ermittelt der Bot mit einem einzigen Request (je nach Limit) alle betroffene Seiten, fragt die jeweiligen Quelltexte ebenfalls gesammelt ab und extrahiert anschließend alle relevanten Links. Pro Artikel wird der Bot nur einmal aktiv, die Edits werden also zusammengefasst. Bearbeitungskonflikte werden sicher erkannt. Eine exemplarische Bearbeitung könnt ihr hier einsehen. Neben dem Seitentitel wird außerdem (sofern vorhanden) das Datum des Artikels in einer separaten Anfrage abgerufen, da Citoid diese Angaben nicht selbstständig liefert. Für englischsprachige oder andere ausländische Seiten wird außerdem die Landessprache als Parameter hinterlegt. Anhand einer Datenbank wird der Herausgeber (wie im Beispiel) mit dem korrekten Lemma verlinkt, diese Funktion ist selbst im Visual Editor nicht vorhanden. Sofern von einer Seite ein ungewöhnlicher Statuscode geliefert wird, speichert das Programm die betreffende Seite mit Link in einer Datenbank, um sie nachfolgend für Wartungslisten bereitzustellen. Eine Kennzeichnung als toter Link (404) wird bewusst nicht vorgenommen, da unter Umständen nur ein temporäres Problem vorliegen kann. - Sonstiges: Der Bot kann sowohl voll- als auch halbautomatisch betrieben werden. Zu Beginn des regulären Betriebs würde ich zunächst eine große Anzahl Edits persönlich im halbautomatischen Betrieb auf dem lokalen Rechner überwachen. Als weitere Sicherheitsmaßnahme sollen nur autorisierte Domains einbezogen werden. Somit können wir sicherstellen, die Struktur der jeweiligen Seite zu kennen und folglich qualitativ hochwertige Änderungen zu gewährleisten. Bisher befinden sich etwa 25 ausgewählte Seiten (darunter SPON, FAZ, Reuters usw.) in der Warteschlange, welche zusammen etwa 7.000 Einzelfälle auf Wikipedia ergeben. Meiner Beobachtung nach kommen trotz des Visual Editors täglich neue hinzu. Die vollautomatische Abarbeitung der Aufgaben soll auf Tool Labs erfolgen. Alle Operationen werden zur fortlaufenden Verbesserung des Systems lückenlos in einer Logdatei gespeichert. -- FNDE (Diskussion) 20:21, 9. Apr. 2016 (CEST)
Diskussion FNBot
- Würde ich befürworten.
- Verbessert die Qualität der Artikeltexte, richtet keinen Schaden an.
- Statt Vorlage:Internetquelle hätte ich gern in Sonderfällen:
spiegel\.de/spiegel/print/
→ Vorlage:Der Spiegelwelt\.de/print/
undwelt\.de/welt_print/
→ ohne Vorlage, direkt formatiert; URL standardisiert auf die erstgenannte Syntax.zeit\.de/([12][901]\d\d)/([0-5]\d)/
→ ohne Vorlage, direkt formatiert
- Tipp: Zu Satzzeichen am Ende ungeklammerter URL siehe H:L #Weblinks.
- Die Umstellungen kann man dann noch ausdehnen auf unbetitelte geklammerte URL in
<ref>
ohne sonstige Zusätze sowie auf generierte Linktitelspiegel.de]</ref>
.
Viel Erfolg --PerfektesChaos 19:10, 10. Apr. 2016 (CEST)
- Die Sonderfälle werde ich beachten. Zu der Formatierung gibt es in der Zwischenzeit ja unterschiedliche Vorschläge, das kann man aber noch in Ruhe weiterdiskutieren, solange der Rest erstmal klar ist. Aus dem Antrag ging evtl. nicht ganz klar hervor, dass ich auch umklammerte Links ohne Titel mit einbeziehen werde. Danke und viele Grüße! --FNDE (Diskussion) 22:47, 12. Apr. 2016 (CEST)
- Bitte mach mal ein paar (vielleicht 10) Testedits. Danke. --Krd 09:34, 29. Apr. 2016 (CEST)
- @Krd, MBq: Testedits wurden durchgeführt (Spezial:Beiträge/FNBot). Viele Grüße --FNDE (Diskussion) 15:25, 1. Mai 2016 (CEST)
- Der Bot fügt noch das falsche Zugriffsdatum hinzu, Beispiel hier. --Distelfinck (Diskussion) 16:24, 1. Mai 2016 (CEST)
- @Distelfinck: In allen Testedits steht
zugriff=2016-05-01
, was ist daran falsch? :) Viele Grüße --FNDE (Diskussion) 17:53, 1. Mai 2016 (CEST) - Aus meiner Sicht sehen die Edits auch korrekt aus. Die geplante Aktion selbst ist sicher sinnvoll. Wenn es keine Gegenrede mehr gibt, kann ich das Flag morgen erteilen. Natürlich solltest Du, FNDE, den Bot zu Beginn noch eng beaufsichtigen. --MBq Disk 18:01, 1. Mai 2016 (CEST)
- @MBq: Selbstverständlich. Momentan habe ich den Bot auf 2 Edits pro Minute limitiert, so kann man alles just-in-time nachkontrollieren. Viele Grüße! --FNDE (Diskussion) 18:10, 1. Mai 2016 (CEST)
- @FNDE: Der Bot gibt als Zugriffsdatum das Datum der Umformatierung an, anstelle eines korrekten Zugriffsdatums. Ein Zugriffsdatum ist ein Datum, an dem die belegende Information in der Quelle vorhanden war. Zwischen erster Einfügung eines Belegs im Artikel und Umformatierung dieses Belegs durch deinen Bot, in diesem Zeitraum kann die zu belegende Information aus der Quelle gelöscht worden sein, auch wenn der Quellartikel selbst noch vorhanden ist. Der Bot prüft lediglich das Vorhandensein der Quelle, aber nicht, ob die zwischenzeitlich geändert wurde, das genügt nicht um ein zuverlässiges Zugriffsdatum zu liefern. Deshalb sollte das Zugriffsdatum weggelassen werden, anstatt einer ungeprüften Angabe --Distelfinck (Diskussion) 18:32, 1. Mai 2016 (CEST)
- @Distelfinck: In allen Testedits steht
- Der Bot fügt noch das falsche Zugriffsdatum hinzu, Beispiel hier. --Distelfinck (Diskussion) 16:24, 1. Mai 2016 (CEST)
- @Krd, MBq: Testedits wurden durchgeführt (Spezial:Beiträge/FNBot). Viele Grüße --FNDE (Diskussion) 15:25, 1. Mai 2016 (CEST)
- Bitte mach mal ein paar (vielleicht 10) Testedits. Danke. --Krd 09:34, 29. Apr. 2016 (CEST)
- Deine Ausführungen mögen allgemeinphilosophisch nachvollziehbar sein, treffen aber auf die hier in Rede stehenden Websites nicht zu. Zumindest im Fall von SPON haben wir zigtausende von Links, aber noch nie den Fall gehabt, dass die später irgendwas inhaltlich verändert hätten. Was es hin und wieder gibt, sind von unserer Seite falsch buchstabierte URL; in dem Fall erhält der Bot aber überhaupt keine Meta-Infos und kann somit auch nichts und nichts falsches eintragen. Unserer Nachwelt gibt das die Info, zu welchem Zeitpunkt eine nur online verfügbare Ressource noch unter der URL verfügbar gewesen war. Weglassen des Parameterwerts hilft hingegen niemandem, erschwert aber die weitere Arbeit mit dem Artikel. VG --PerfektesChaos 18:51, 1. Mai 2016 (CEST)
- Der Nachwelt die Information geben, dass zu einem bestimmten Zeitpunkt ein Artikel online war, dies machen wir schon wo anders: Im Webarchiv, in welchem wir auch die in Wikipedia verlinkten URLs einreichen. Es geht also keine Information verloren, wenn der Bot kein Zugriffsdatum einträgt. Falls der Bot überhaupt die Verfügbarkeit der URLs testet... --Distelfinck (Diskussion) 19:26, 1. Mai 2016 (CEST)
- Deine Ausführungen mögen allgemeinphilosophisch nachvollziehbar sein, treffen aber auf die hier in Rede stehenden Websites nicht zu. Zumindest im Fall von SPON haben wir zigtausende von Links, aber noch nie den Fall gehabt, dass die später irgendwas inhaltlich verändert hätten. Was es hin und wieder gibt, sind von unserer Seite falsch buchstabierte URL; in dem Fall erhält der Bot aber überhaupt keine Meta-Infos und kann somit auch nichts und nichts falsches eintragen. Unserer Nachwelt gibt das die Info, zu welchem Zeitpunkt eine nur online verfügbare Ressource noch unter der URL verfügbar gewesen war. Weglassen des Parameterwerts hilft hingegen niemandem, erschwert aber die weitere Arbeit mit dem Artikel. VG --PerfektesChaos 18:51, 1. Mai 2016 (CEST)
(nach BK) @Distelfinck: Das sehe ich anders. Bei den gelisteten Seiten ist es üblich, eine Änderung des Artikels zu vermerken (z.B. „Update: ...“ oder „Richtigstellung: ...“). Wenn eine Information fehlt oder grundlegend falsch ist, müsste der Beleg ja ohnehin von Hand neu geprüft werden. Leider ist es nicht ohne Weiteres möglich, das Datum der Einfügung des Belegs zu verifizieren. Ich schlage deshalb vor – genau wie im VisualEditor – als Zugriffsdatum generell das aktuelle Datum zu verwenden. Viele Grüße --FNDE (Diskussion) 18:58, 1. Mai 2016 (CEST)
- Der VisualEditor trägt für das Zugriffsdatum das aktuelle Datum ein, da der Mensch der den VisualEditor benutzt, in der Regel die Quelle vor kurzem erst aufgerufen hat, das aktuelle Datum also in der Regel zutreffend ist.
- Das aktuelle Datum einfach mal so bei einer Umformatierung als Zugriffsdatum einzutragen, nur weil die Quelle zu dem Datum erreichbar ist, ist Raterei. Das genügt nicht. Also sollte der Bot kein Datum angeben, oder – wie der VisualEditor – das Datum der Einfügung des Belegs. Letzteres ließe sich finden mit diesem WikiBlame-Tool, das die Einfügung eines Textes findet. @FNDE --Distelfinck (Diskussion) 19:05, 1. Mai 2016 (CEST)
- @Distelfinck: Das stimmt so nicht. Wenn ich einen Artikel bearbeite und mit dem VisualEditor eine bestehende Quelle auswähle und dort auf konvertieren klicke, wird automatisch das heutige Datum als Zugriff eingefügt. Ich habe mit Wikiblame noch nicht gearbeitet, bin mir aber ziemlich sicher, dass bei diesem Tool eine gewisse Fehlertoleranz gegeben sein wird. Das Zugriffsdatum wegzulassen halte ich für weniger hilfreich, als das aktuelle einzufügen. Viele Grüße --FNDE (Diskussion) 19:11, 1. Mai 2016 (CEST)
- Ah okay.
- @FNDE: "Das Zugriffsdatum wegzulassen halte ich für weniger hilfreich, als das aktuelle einzufügen"
- -- das ist dann ein relativ beliebiges Datum welches irgendwann nach Einfügung der Quelle liegt. Keine Information ist besser als falsche Information. Und das aktuelle Datum bei Umformatierung als Zugriffsdatum einzutragen, ist potentiell falsche Information, weil es geraten ist. Das genügt unseren hohen Standards nicht.
- Wenn einer einen Wikipedia-Artikel liest, und dort bei einem Beleg liest: "Zugriffsdatum", dann erwartet er, dass das auch das Datum ist, an dem ein Mensch die verlinkte Quelle abgerufen hat. Der Leser kann, falls er die Information in der Quelle nicht findet, ein Webarchive aufsuche, und schauen ob um das angegebene Zugriffsdatum rum ein Memento vorhanden ist. Nur so macht das Datum Sinn. Das ist der Grund, warum wir überhaupt irgendwo Zugriffsdaten angeben. Das Datum der Umformatierung hingegen wird den Leser wenig interessieren.
- --Distelfinck (Diskussion) 19:18, 1. Mai 2016 (CEST)
- (nach BK) @Distelfinck: Sehe gerade, dass
zugriff=
nicht optional ist und gesetzt werden muss. Du sprichst von hohen Standards, werden die denn erfüllt wenn über 10.000 (!) Links in der Wikipedia stehen, wo nicht mal ein Titel angegeben wurde? Die Information mit dem Zugriffsdatum wird ja nicht verfälscht, weil sie schlichtweg nicht existiert. Grundlegend ist es also immer noch eine Verbesserung. Viele Grüße --FNDE (Diskussion) 19:38, 1. Mai 2016 (CEST)- Ob es eine Verbeserung ist, ist Glückssache. Es ist schlicht geraten. Wie gesagt, es soll das "Zugriffsdatum" angegeben werden, der Parameter heißt nicht "Seite-gibt-kein-404-zurück-Datum" oder "Datum-an-dem-der-Beleg-umformatiert-wurde". --Distelfinck (Diskussion) 19:40, 1. Mai 2016 (CEST)
- @Distelfinck: Wie ich oben schon schrieb: die Informationen auf den autorisierten Seiten werden nicht einfach ohne Hinweis gelöscht. Es ist also davon auszugehen, dass am Tag der Formatierung alle Informationen vorhanden sind wie zu dem Zeitpunkt, wo der Link eingefügt wurde. --FNDE (Diskussion) 19:43, 1. Mai 2016 (CEST)
- Bei spiegel.de mag es zutreffen, dass die dort immer darauf hinweisen, wenn sie Informationen aus einem Artikel löschen. Das ändert aber nix daran, dass die Informationen dann nicht mehr in den Artikeln vorhanden sind. Und dass, wenn das Umformatierungsdatum als Zugriffsdatum angegeben würde, da dann stünde "abgerufen am so- und so-vielten", mit einem Datum, an dem die Information schon nicht mehr im Artikel war, sondern nur ein Hinweis auf ihre Löschung. Sprich da stünde dann ein falsches Zugriffsdatum.
- --Distelfinck (Diskussion) 19:49, 1. Mai 2016 (CEST)
- @Distelfinck: Finde ich unproblematisch, da man immer noch nachvollziehen kann wofür der Link gedacht war. Vielleicht bekommen wir dazu ja noch eine Dritte Meinung, andernfalls muss ich den Code wohl wieder verwerfen. Gruß --FNDE (Diskussion) 19:57, 1. Mai 2016 (CEST)
- Vielleicht könntest du den Code ja online stellen (GitHub?), dann können wir die nötigen Änderungen vornehmen. Ich sehe zwei Möglichkeiten:
- 1.) Der Bot trägt als Zugriffsdatum das Datum der Einfügung des Links ein
- 2.) Der Bot gibt kein Zugriffsdatum an. Wir machen bei den Vorlagen die es nur auf unserem Wiki gibt das Zugriffs-Parameter optional, und der Bot benutzt dann diese Vorlagen
- --Distelfinck (Diskussion) 20:03, 1. Mai 2016 (CEST)
- @Distelfinck: Finde ich unproblematisch, da man immer noch nachvollziehen kann wofür der Link gedacht war. Vielleicht bekommen wir dazu ja noch eine Dritte Meinung, andernfalls muss ich den Code wohl wieder verwerfen. Gruß --FNDE (Diskussion) 19:57, 1. Mai 2016 (CEST)
- @Distelfinck: Wie ich oben schon schrieb: die Informationen auf den autorisierten Seiten werden nicht einfach ohne Hinweis gelöscht. Es ist also davon auszugehen, dass am Tag der Formatierung alle Informationen vorhanden sind wie zu dem Zeitpunkt, wo der Link eingefügt wurde. --FNDE (Diskussion) 19:43, 1. Mai 2016 (CEST)
- Ob es eine Verbeserung ist, ist Glückssache. Es ist schlicht geraten. Wie gesagt, es soll das "Zugriffsdatum" angegeben werden, der Parameter heißt nicht "Seite-gibt-kein-404-zurück-Datum" oder "Datum-an-dem-der-Beleg-umformatiert-wurde". --Distelfinck (Diskussion) 19:40, 1. Mai 2016 (CEST)
- (nach BK) @Distelfinck: Sehe gerade, dass
- @Distelfinck: Das stimmt so nicht. Wenn ich einen Artikel bearbeite und mit dem VisualEditor eine bestehende Quelle auswähle und dort auf konvertieren klicke, wird automatisch das heutige Datum als Zugriff eingefügt. Ich habe mit Wikiblame noch nicht gearbeitet, bin mir aber ziemlich sicher, dass bei diesem Tool eine gewisse Fehlertoleranz gegeben sein wird. Das Zugriffsdatum wegzulassen halte ich für weniger hilfreich, als das aktuelle einzufügen. Viele Grüße --FNDE (Diskussion) 19:11, 1. Mai 2016 (CEST)
- zu 1) hätte ich ja direkt umgesetzt, aber die API würde nur so glühen wenn wir für jeden (!) Link die komplette Versionsgeschichte durchwühlen.
- zu 2) das könnte man so machen, ist aber insgesamt nicht im Interesse des Projekts bei neuen Links. Aus meiner Sicht gibt es auch keinen Anlass das Datum wegzulassen, wenn es doch bei den ausgewählten Quellen keine falsche Information liefert. VG --FNDE (Diskussion) 20:09, 1. Mai 2016 (CEST)
- Zu 1.) Möglicherweise gibt es ja noch andere Quellen für das Einfügungsdatum eines Links, die wir anzapfen können
- Zu 2.) Das Zugriffsdatum wird ja als "abgerufen am so-und-so-vielten" dargestellt, und damit ist gemeint, dass die Quelle inkl. belegender Information an dem Datum abgerufen wurde. Als Zugriffsdatum das Datum der Umformatierung anzugeben, wäre also nicht richtig, weil wir dann eine unwahre Angabe machen würden.
- --Distelfinck (Diskussion) 20:21, 1. Mai 2016 (CEST)
- Die Argumentation Distelfincks ist stichhaltig, und ich wäre auch dafür, das korrekte Einfügedatum anhand der Versionsgeschichte zu ermitteln, oder zumindest dort, wo es nicht sinnvoll möglich ist, das Datum wegzulassen. Das "die API würde nur so glühen" kann ich nicht ganz nachvollziehen, denn es gibt ja gar keinen Grund, den Task mit voller Geschwindigkeit laufen zu lassen, er ist zwar durchweg sinnvoll, aber keinesfalls zeitlich irgendwie dringend. Vielleicht wäre es sowieso generell sinnvoll, möglichst mit Artikeln mit weniger Versionen anzufangen, da da auch das Erkennen von eventuellen Fehlern erleichtern könnte. --Krd 10:16, 2. Mai 2016 (CEST)
Ich würde dringend empfehlen, diesen Antrag nicht nur hier im engen Rahmen dieser Seite zu diskutieren, sondern auch irgendwo auf FzW oder ähnlich. Gegen die Vorlagen Internetquelle, Web, Literatur und ähnliche gibt es doch erhebliche - und begründete - Widerstände. Hier wird es zu Kollisionen kommen und zu vielen Reverts. 2003:45:4845:1A00:6D72:7CA7:9F7B:97F0 20:14, 1. Mai 2016 (CEST)
- Hi, wir haben das schon auf Botanfragen diskutiert. Wir waren uns dort einig, dass durch das Hinzufügen der Informationen eine deutliche Verbesserung entsteht und die Vorlage durch nachfolgende Botaktionen (und vom VisualEditor besser verarbeitet werden kann. Wie im wahren Leben, kann man es vermutlich nie allen Recht machen – ich halte es aber auch persönlich für eine gute Lösung. Viele Grüße --FNDE (Diskussion) 20:19, 1. Mai 2016 (CEST)
- @Krd, Distelfinck, PerfektesChaos: Wenn das euer letztes Wort ist, werde ich mich dem fügen Wird sich mit der Entwicklung allerdings noch ganz schön hinziehen. Wie funktioniert denn Wikiblame genau? Werden da einfach alle Versionen (von hinten) durchgewühlt und nach dem ersten Treffer durchsucht? Ich meine, da gäbe es ja eine erhebliche Fehlertoleranz. Beispiel: ein Link wird eingefügt, revertiert (+gesichtet) und einige Wochen später wieder eingefügt. In dem Fall hätte ich das erste Match in der Vorlage zu stehen, obwohl es so in der Form gar nicht stimmt – jedenfalls wenn man es so genau nimmt. Viele Grüße --FNDE (Diskussion) 18:48, 3. Mai 2016 (CEST)
- Ich würde auf jeden Fall versuchen, das selbst zu coden und nicht von einem bestehenden Tool abhängig machen. Ich würde glatt vorschlagen, das als gemeinsames Projekt zu bauen, aber python ist leider nicht meine Sprache. --Krd 19:25, 3. Mai 2016 (CEST)
- Genau, das war auch mein Plan. So hat man alles vollumfänglich unter Kontrolle. --FNDE (Diskussion) 19:26, 3. Mai 2016 (CEST)
- Ich mach mir mal ein paar Gedanken, allerdings ohne etwas zu versprechen. --Krd 19:53, 3. Mai 2016 (CEST)
- Am Beispiel Bundestagswahl 2013 benötigt es 16 Abfragen und knapp eine Minute Laufzeit um alle ca. 2350 Versionen zu holen und herauszufinden, dass der in Spezial:Diff/154003574 geänderte Nachweis in Spezial:Diff/106040592 zuerst eingefügt wurde.
- Was man allerdings so nicht herausfindet ist, ob dieser Nachweis heute noch die selbe Information im Artikel belegt, oder vielleicht für einen anderen Zweck verwendet wird. Bin mir jetzt nicht mehr sicher, ob es unter diesen Umständen noch sinnvoll ist, das so zu machen. --Krd 21:01, 3. Mai 2016 (CEST)
- Ich mach mir mal ein paar Gedanken, allerdings ohne etwas zu versprechen. --Krd 19:53, 3. Mai 2016 (CEST)
- Genau, das war auch mein Plan. So hat man alles vollumfänglich unter Kontrolle. --FNDE (Diskussion) 19:26, 3. Mai 2016 (CEST)
- Ich würde auf jeden Fall versuchen, das selbst zu coden und nicht von einem bestehenden Tool abhängig machen. Ich würde glatt vorschlagen, das als gemeinsames Projekt zu bauen, aber python ist leider nicht meine Sprache. --Krd 19:25, 3. Mai 2016 (CEST)
- @Krd, Distelfinck, PerfektesChaos: Wenn das euer letztes Wort ist, werde ich mich dem fügen Wird sich mit der Entwicklung allerdings noch ganz schön hinziehen. Wie funktioniert denn Wikiblame genau? Werden da einfach alle Versionen (von hinten) durchgewühlt und nach dem ersten Treffer durchsucht? Ich meine, da gäbe es ja eine erhebliche Fehlertoleranz. Beispiel: ein Link wird eingefügt, revertiert (+gesichtet) und einige Wochen später wieder eingefügt. In dem Fall hätte ich das erste Match in der Vorlage zu stehen, obwohl es so in der Form gar nicht stimmt – jedenfalls wenn man es so genau nimmt. Viele Grüße --FNDE (Diskussion) 18:48, 3. Mai 2016 (CEST)
- Hi, wir haben das schon auf Botanfragen diskutiert. Wir waren uns dort einig, dass durch das Hinzufügen der Informationen eine deutliche Verbesserung entsteht und die Vorlage durch nachfolgende Botaktionen (und vom VisualEditor besser verarbeitet werden kann. Wie im wahren Leben, kann man es vermutlich nie allen Recht machen – ich halte es aber auch persönlich für eine gute Lösung. Viele Grüße --FNDE (Diskussion) 20:19, 1. Mai 2016 (CEST)
Die Argumentation Distelfincks ist nicht stichhaltig, denn ein Bot, der das (exakte) Einfügungsdatum nicht hat, "weiß" dennoch mehr als nichts und darf - z.B. heute - zutreffend schreiben: "vor Juni 2016". In der Vorlage kann das "schöne", aber überflüssige "am" in "abgerufen am" entfernt werden → "abgerufen vor Juni 2016". Damit wird die Nachwelt weder betrogen noch zu dumm gehalten.
Die Generierung der Historie eines externen Links aus den Versionen eines Artikel ist zwar auch für andere Zwecke gut brauchbar, aber ich finde es reichlich überzogen, das diesem Bot hier jetzt "aufzubrummen", denn ich schätze das so ein, dass das maschinelle Durchforsten der Versionen in zu vielen Fällen kein oder ein falsches Ergebnis liefert bzw. zu viele Sonderfälle zu berücksichtigen sind. --Thoken (Diskussion) 20:25, 3. Mai 2016 (CEST)
- Thoken, ich sehe das ähnlich, und habe dazu ja schon so einen Sonderfall skizziert. Das Problem an deinem Vorschlag wäre, dass wir in der Vorlage Internetquelle (welche verwendet werden soll) keine Möglichkeit haben, den Parameter anzupassen. Ich finde es aber ziemlich clever, und würde sogar vorschlagen dies als optionalen Parameter einzufügen. Wäre ja sogar noch etwas eleganter als der ursprüngliche Vorschlag von Distelfinck, den Parameter zugriff komplett optional zu setzen. Viele Grüße! --FNDE (Diskussion) 21:14, 3. Mai 2016 (CEST)
- Krd,
zu deinem Beitrag oben: das war meine Befürchtung. Summiert sich relativ schnell, da sind wir bei 5 Links in größeren Artikel schnell bei 10.000 API-Abfragen.(war Unsinn) Stimmt, man kann nicht ohne erheblichen Aufwand feststellen, ob der Link nicht innerhalb eines Artikels versetzt wurde. --FNDE (Diskussion) 21:18, 3. Mai 2016 (CEST) - Ah, sorry, stimmt. Bei einem Test mit "vor Juni" sah ich keinen Fehler auf der Artikelseite, Spezial:Linkliste/Vorlage:Internetquelle/Wartung/Zugriffsdatum_nicht_im_ISO-Format kannte ich nicht (mehr?).
- Dass die Vorschrift, ein ISO-Zugriffsdatum zu setzen, falsche Zeitangaben provoziert, zeigt dieser Edit (4. Diff-Absatz) mit dem Tool WP:REFLINKS: Der
movies.nytimes.com
Link war bereits vor dem eingetragenen Zugriffsdatum (und ist) eine Weiterleitung zu einem anderen Inhalt, an der "neuen URL" leicht erkennbar. --Thoken (Diskussion) 12:33, 4. Mai 2016 (CEST)- Thoken: Genau, man müsste dafür also einen eigenen Parameter festlegen. Ist angesichts der Vielzahl an Bearbeitungen (>10.000) aber durchaus denkbar, oder? --FNDE (Diskussion) 12:40, 4. Mai 2016 (CEST)
- Krd,
Da ich die next Generation Vorlage:Internetquelle auf meinem PC habe, kann ich schon mal ankündigen:
- Einen zusätzlichen Parameter mit einem Wischi-Waschi-Zugriffsdatum wird es nicht geben.
- Niemand kann etwas damit anfangen; weder Mensch noch Tool.
- Weder nach innen noch an Werkzeuge außerhalb kann man den Inhalt eines Weiß-nicht-so-genau-Datums kommunizieren, noch kann es jemand auswerten.
Das „Zugriffsdatum“ meint den Zeitpunkt, zu dem ein Server zuletzt eine inhaltlich sinnvolle Antwort gegeben hatte, und nicht etwas wie „Diese Domain steht zum Verkauf“ oder „404 Nicht gefunden“ oder „Netzwerk-Fehler; Domain nicht registriert“.
- Das ist bei SPON regelmäßig der Fall, wenn deren Server sich nicht über eine von uns falsch geschriebene URL beschwert.
- Hier ändern sich die Inhalte auch nicht, was bei einem Blog oder einer Datenbankabfrage leicht passieren kann.
- Ob die im Artikel getroffene Aussage inhaltlich durch ein Buch, einen gedruckt erschienenen Zeitungsartikel oder eine SPON-Meldung belegt ist, kann ein Bot ohnehin nicht feststellen. Daher ist auch Wikiblame wertlos, weil Wikiblame dann auch feststellen müsste, welche inhaltliche Aussage seinerzeit mal an der Stelle gestanden hatte, an der ein Beleg eingefügt wurde. Das kann aber nur ein Mensch kontrollieren; und das gilt für Internetquellen genauso wie für Bücher. Hier geht es nur darum, den Zeitpunkt der letzten inhaltlichen Abrufbarkeit zu dokumentieren, um es als Ausgangspunkt zu nehmen, in Web-Archiven nach nicht mehr abrufbaren Versionen zu suchen. Das ist aber bei SPON irrelevant, weil die gehen entweder alle tot oder keines, wie wir auch bei den tausendfach verlinkten Print-Archiven bekannter Publikationen das Datum der Online-Verfügbarkeit nicht angeben, weil völlig unerheblich und nutzlos.
VG --PerfektesChaos 18:06, 4. Mai 2016 (CEST)
- "Das „Zugriffsdatum“ meint den Zeitpunkt, zu dem ein Server zuletzt eine inhaltlich sinnvolle Antwort gegeben hatte" - das ist unwahr. Wir reden hier vom Zugriffsdatum durch den/die Autoren. Dafür sind die Parameter
zugriff =
,accessdate =
, etc. da. --Distelfinck (Diskussion) 14:36, 5. Mai 2016 (CEST)- @PerfektesChaos, Distelfinck: wenn man es ganz genau nimmt, ist in der Vorlage:Internetquelle nicht die Rede vom Zugriff durch den Autor selbst. Demnach wäre nur erforderlich, dass die betreffenden Informationen auch bei einem erneuten Aufruf noch verwanden sind, was wir ja bei den ausgewählten Seiten garantieren können. --FNDE (Diskussion) 18:07, 8. Mai 2016 (CEST)
- Wenn wir eine Zitierung als Beleg verwenden, und wenn wir dazu auch einen Zugriffszeitpunkt angeben, so ist die Version, die zu diesem Zeitpunkt unter der URL angeboten wird, dann die zitierte Quelle. Das heißt genau die zitierte Version dient als Beleg in unserem Wikipediaartikel. --Distelfinck (Diskussion) 19:35, 8. Mai 2016 (CEST)
- @PerfektesChaos, Distelfinck: wenn man es ganz genau nimmt, ist in der Vorlage:Internetquelle nicht die Rede vom Zugriff durch den Autor selbst. Demnach wäre nur erforderlich, dass die betreffenden Informationen auch bei einem erneuten Aufruf noch verwanden sind, was wir ja bei den ausgewählten Seiten garantieren können. --FNDE (Diskussion) 18:07, 8. Mai 2016 (CEST)
Die API würde glühen, wenn wir die Versionsgeschichte ständig durchwühlen? Kann ich nicht nachvollziehen. Also ich verstehe Distelfincks Darstellungen schon, aber dass FNDE nicht mal drauf eingeht, sondern sein Skript vehement verteidigt, sehe ich zur Zulassung als Botbetreiber problematisch. Man kann einen Weblink/Einzelnachweis, auf den man heute zugreift, auch erst in einer Woche einfügen, und dann ist das Zugriffsdatum immer noch das alte. Ein Vergleich mit der Versionsgeschichte hinkt also. (Genauso problematisch ist die vorgegebene Visual-Editor-Zugriffsdatum-Funktion, wenn man das Zugriffsdatum bei der Eingabe nicht ändern kann.) Allerdings: wenn die Daten neu abgegriffen werden, und das ist bei einer Änderung der Weblinks/Einzelnachweise üblich, wird das Zugriffsdatum aktualisiert, da eben die Daten ebenfalls aktualisiert wurden. Dabei ist zu prüfen, ob der Inhalt an der referenzierten Stelle noch im Artikel hinter dem Link vorhanden ist oder nicht. Wie Du das Deinem Bot beibringst, ist Deine Sache. Ist der Inhalt jedoch nicht mehr vorhanden, gehört der dementsprechende Webarchiv-Link dahin. Und im Webarchiv-Link hast Du bspw. den wayback-timestamp, der den Abgriff des Artikels mit eben jener Information wiedergibt. Wenn Du das nicht mit beachtest, macht der Bot eben nur halbe Sachen und man müsste ihn quasi hinterherräumen oder sein Tun dauernd überprüfen. Stell Dir mal die Frage, warum GiftBot die Defekten Weblinks nicht im Artikel korrigiert sondern auf die Artikeldiskussionsseite setzt? Also, entweder das Skript wird angepasst, so dass der Bot reibungslos arbeiten kann, oder Botflag kann nicht erteilt werden. Danke, und mit ping an @MBq – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 19:40, 9. Mai 2016 (CEST)
- also versucht mal zusammen was konstruktives zu erbauen, lasst die Meinungen und Ratschläge der anderen zu und erwägt die Vorteile und die Nachteile, und dann können die Performance und die Ergebnisse des Bots eigentlich nur besser werden. Kritik ohne konstruktive Ansätze wird eh nichts, man sollte Kritik aber auch nicht von vornherein ablehnen, sondern die Entwicklung im Miteinander fördern. Danke, – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 20:25, 9. Mai 2016 (CEST)
- Doc Taxon, kannst Du bitte mal zusammenfassen in welcher Hinsicht genau das Skript angepasst werden muss? Ich sehe in der obigen Diskussion leider nur Diskussion, keinen konkreten Vorschlag. (Woran ich selbst nicht ganz unschuldig bin.) --Krd 12:35, 10. Mai 2016 (CEST)
- Hi Doc Taxon, ich möchte es ungern so stehen lassen, dass die Vorschläge von Distelfinck durch mich abgelehnt worden sind, oder dass ich die aktuelle Funktionalität verteidige – das ist so nicht wahr und geht meines Erachtens auch aus der obigen Diskussion hervor. Natürlich habe ich eine Meinung zu dem Sachverhalt, die ich hier zur Erarbeitung einer einvernehmlichen Lösung selbstverständlich einbringe. Ich bin gerade etwas unschlüssig was jetzt eigentlich verbessert werden soll, momentan ist das der Stand:
- Es werden nur funktionierende Links formatiert, 404er werden in eine eigene Fehlerliste übertragen und können somit von anderen Bots verarbeitet werden
- Als Zugriffsdatum wird das Datum der Änderung durch den Bot verwendet
- Berücksichtigt werden nur solche Links wo wir sichergehen können, dass keine Informationen „verschwinden“.
- So wie ich das sehe erfüllt der Bot demnach alle die von dir genannten Anforderungen? Viele Grüße --FNDE (Diskussion) 18:19, 10. Mai 2016 (CEST)
- Naja, ist es auch möglich, Links zu berücksichtigen, wo das Verschwinden von Informationen nicht sicher ist? Kannst Du z. B. Prüfsummen zwischen archivierten Webseiten und der aktuellen Webseite zu vergleichen oder Inhaltsvergleiche ziehen, um auch andere Links mit zu verarbeiten? – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 18:43, 10. Mai 2016 (CEST)
- Doc Taxon, über Prüfsummen habe ich auch schon nachgedacht, allerdings gibt es dafür auch zu viele Ausnahmen, z.B. dynamische Inhalte. Man muss ja auch dazu sagen, dass die Seiten nicht nach diesem Kriterium ausgewählt worden sind, sondern ob generell auch Metainformationen zur Verfügung gestellt werden. Dadurch dass es sich zunächst nur um große Nachrichtenportale handelt, können wir entsprechend sichergehen, dass keine Informationen verschwinden. Viele Grüße --FNDE (Diskussion) 19:06, 10. Mai 2016 (CEST)
- Meiner Meinung nach ist dieser Aspekt auch nur bedingt relevant. Die Diskussion ging eher darum, ob durch das Ersetzen Informationen verloren gehen, und das war nur beim Abrufdatum umstritten. Der Inhalt kann sich ja auch ohne den Bot bereits geändert haben oder zukünftig ändern. (Richtig?)
- Bzgl. des Abrufdatums gibt es die Varianten: a) ursprüngliches Einsetzdatum des Links herausfinden (-> unpraktikabel), b) Datum während der Botänderung einsetzen (gibt evtl. eine falsche Information an), oder c) Datum leer lassen oder neues Feld verwenden (dafür muss die Vorlage umgeschrieben werden). Ich persönlich wäre für c). --Krd 19:14, 10. Mai 2016 (CEST)
- Doc Taxon, über Prüfsummen habe ich auch schon nachgedacht, allerdings gibt es dafür auch zu viele Ausnahmen, z.B. dynamische Inhalte. Man muss ja auch dazu sagen, dass die Seiten nicht nach diesem Kriterium ausgewählt worden sind, sondern ob generell auch Metainformationen zur Verfügung gestellt werden. Dadurch dass es sich zunächst nur um große Nachrichtenportale handelt, können wir entsprechend sichergehen, dass keine Informationen verschwinden. Viele Grüße --FNDE (Diskussion) 19:06, 10. Mai 2016 (CEST)
- Naja, ist es auch möglich, Links zu berücksichtigen, wo das Verschwinden von Informationen nicht sicher ist? Kannst Du z. B. Prüfsummen zwischen archivierten Webseiten und der aktuellen Webseite zu vergleichen oder Inhaltsvergleiche ziehen, um auch andere Links mit zu verarbeiten? – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 18:43, 10. Mai 2016 (CEST)
- Hi Doc Taxon, ich möchte es ungern so stehen lassen, dass die Vorschläge von Distelfinck durch mich abgelehnt worden sind, oder dass ich die aktuelle Funktionalität verteidige – das ist so nicht wahr und geht meines Erachtens auch aus der obigen Diskussion hervor. Natürlich habe ich eine Meinung zu dem Sachverhalt, die ich hier zur Erarbeitung einer einvernehmlichen Lösung selbstverständlich einbringe. Ich bin gerade etwas unschlüssig was jetzt eigentlich verbessert werden soll, momentan ist das der Stand:
- Doc Taxon, kannst Du bitte mal zusammenfassen in welcher Hinsicht genau das Skript angepasst werden muss? Ich sehe in der obigen Diskussion leider nur Diskussion, keinen konkreten Vorschlag. (Woran ich selbst nicht ganz unschuldig bin.) --Krd 12:35, 10. Mai 2016 (CEST)
Hi Krd, danke für die Zusammenfassung. Damit wir mal wieder einen Stand haben :) Habe oben auch schon geschrieben, dass ich Vorschlag c) gut finde, da man so definitiv keine falsche Information liefert. Für Vorschlag b) müsste man sich hier darauf einigen, ob man das aktuelle Datum verwenden darf, oder nicht. Viele Grüße --FNDE (Diskussion) 19:31, 10. Mai 2016 (CEST)
- Datum leerlassen? Ich glaub, Du meinst Zugriff leerlassen, oder? Da Du dies nur für bestimmte große Nachrichtenportale verwenden willst, könntest Du zumindest bei denen die Inhalte zw. einer archivierten Damals-Version und der heutigen Version vergleichen? Denn wenn die Inhalte dann übereinstimmen, wird der zugriff-Parameter aktualisiert. Schau mal bitte nach, Du kannst es ja mal prüfen. Wenn sich das nämlich bestätigt, ist dieser Punkt erledigt. – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 20:39, 10. Mai 2016 (CEST)
- Für das Auffinden der ersten Verwendung wäre Wikiblame nutzbar. Das läuft auf einem gespiegelten Labs-Server, kann also die API-Geschwindigkeit nicht beeinflussen. < https://tools.wmflabs.org/xtools/blame/?project=dewiki&article=&text= >, konkretes Beispiel: < https://tools.wmflabs.org/xtools/blame/?project=de.wikipedia.org&article=Leonel_M%C3%A1rio_d%E2%80%99Alva&text=http%3A%2F%2Fdn.sapo.pt%2F2005%2F07%2F12%2Ftema%2Fpobreza_acentua_onda_cepticismo.html >. Falls das nicht möglich wäre., könnte man auch das Veröffentlichungsdatum aus der Webseite extrahieren und nutzten. Ist zwar nicht ganz im Sinne des Erfinders, aber wenigsten nicht komplett unnutz. Um die Diskussion hier abzukürzen würde ich AGF empfehlen, und bei kleineren Problemen mal so gut helfen wie es geht. Frohes Schaffen — Boshomi ⌨ 20:59, 10. Mai 2016 (CEST)
- Wikiblame und ähnlich Mechanismen wurden bereits weiter oben diskutiert. Ich glaube nicht, dass man mit diesem Ansatz weiterkommt. --Krd 08:41, 11. Mai 2016 (CEST)
- AGF ist ja selbstverständlich. Ich werde das Flag demnächst erteilen, warte nur noch auf eine abschliessende Klärung, ob der Bot das Abrufdatum nun leer lassen, oder seinen Zugriff einsetzt (was selektiv bei SPON OK wäre, ich habe dort noch nie broken links oder nachträglich veränderte Archivinhalte gesehen.) --MBq Disk 10:42, 11. Mai 2016 (CEST)
- ja, @MBq: mich würde erst noch interessieren, was @FNDE zu meinem letzten Statement hier schreibt. Dann könnte ich mich auch zum Botflag äußern. Danke, – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 13:09, 11. Mai 2016 (CEST)
- Doc Taxon, genau, wir meinten das Datum für den Zugriff. Für die Wayback Machine gibt es tatsächlich sogar eine API, die man dafür nutzen könnte. Hier sehe ich aber folgende Schwierigkeit: wir können die Seiten nicht 1:1 vergleichen, da sich der Inhalt bereits ändert, wenn jemand einen Kommentar darunter schreibt (z.B. bei SPIEGEL Online). Demnach müsste man gezielt nur den Artikel selbst extrahieren, was technisch gesehen möglich ist, aber einen unheimlichen Wartungsaufwand mit sich bringt. Alle Seiten müssten dafür ständig beobachtet werden um eventuelle Änderungen im Layout mit einzubeziehen. Grundsätzlich kann ich gerade auch nicht ausschließen, dass sich selbst innerhalb des Artikels dynamische Elemente (z.B. Werbung) befinden, die sich bei jedem Aufruf ändern. Ich glaube, dass diese Aufgabe tatsächlich nur ein Mensch ohne Fehler durchführen könnte. Wir sollten deshalb überlegen, wie wir mit dem Zugriffs-Datum genau verfahren. Viele Grüße! --FNDE (Diskussion) 13:26, 11. Mai 2016 (CEST)
- @FNDE: gut, Du weißt also, wie man das technisch umsetzen kann, Dir wäre das nur zu aufwändig? Also pass auf, wenn das einmal im Skript steht, wie der Bot da vorgehen soll, dann saust der da drüber, egal, wie aufwändig das ist. Hierzu meine Erfahrungen: ich lese die Seitenquelltexte der aktuellen Version und der damaligen archivierten Version jeweils als html-kodierte Zeichenkette aus. Dann wandle ich die Zeichenketten in ein xml-Format um. Jetzt kann man prima den Artikeltext-Anteil vom Rest der Seite trennen und dynamische Werbeanteile entnehmen. Jetzt haben wir zwei Text-Rohfassungen, die einfach miteinander verglichen werden können. Solange das Gesamtformat der Webseite sich nicht ändert, ist das ganz einfach auf die Dauer eben auch möglich. Sollte sich das Format ändern, kann man sich anhand eines Maskentests eine Fehlermeldung ausgeben lassen und das Skript daraufhin entsprechend anpassen. Wie gesagt, ich hab das schon gemacht, es geht also. Und je nachdem, ob sich der Text dann geändert hat, wandert der Link auf eine Blacklist und dann kann händisch überprüft werden, welche Änderungen am Artikeltext vorgenommen wurden. Was sagst Du dazu? – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 14:25, 11. Mai 2016 (CEST)
- Doc Taxon, genau, wir meinten das Datum für den Zugriff. Für die Wayback Machine gibt es tatsächlich sogar eine API, die man dafür nutzen könnte. Hier sehe ich aber folgende Schwierigkeit: wir können die Seiten nicht 1:1 vergleichen, da sich der Inhalt bereits ändert, wenn jemand einen Kommentar darunter schreibt (z.B. bei SPIEGEL Online). Demnach müsste man gezielt nur den Artikel selbst extrahieren, was technisch gesehen möglich ist, aber einen unheimlichen Wartungsaufwand mit sich bringt. Alle Seiten müssten dafür ständig beobachtet werden um eventuelle Änderungen im Layout mit einzubeziehen. Grundsätzlich kann ich gerade auch nicht ausschließen, dass sich selbst innerhalb des Artikels dynamische Elemente (z.B. Werbung) befinden, die sich bei jedem Aufruf ändern. Ich glaube, dass diese Aufgabe tatsächlich nur ein Mensch ohne Fehler durchführen könnte. Wir sollten deshalb überlegen, wie wir mit dem Zugriffs-Datum genau verfahren. Viele Grüße! --FNDE (Diskussion) 13:26, 11. Mai 2016 (CEST)
- ja, @MBq: mich würde erst noch interessieren, was @FNDE zu meinem letzten Statement hier schreibt. Dann könnte ich mich auch zum Botflag äußern. Danke, – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 13:09, 11. Mai 2016 (CEST)
- Für das Auffinden der ersten Verwendung wäre Wikiblame nutzbar. Das läuft auf einem gespiegelten Labs-Server, kann also die API-Geschwindigkeit nicht beeinflussen. < https://tools.wmflabs.org/xtools/blame/?project=dewiki&article=&text= >, konkretes Beispiel: < https://tools.wmflabs.org/xtools/blame/?project=de.wikipedia.org&article=Leonel_M%C3%A1rio_d%E2%80%99Alva&text=http%3A%2F%2Fdn.sapo.pt%2F2005%2F07%2F12%2Ftema%2Fpobreza_acentua_onda_cepticismo.html >. Falls das nicht möglich wäre., könnte man auch das Veröffentlichungsdatum aus der Webseite extrahieren und nutzten. Ist zwar nicht ganz im Sinne des Erfinders, aber wenigsten nicht komplett unnutz. Um die Diskussion hier abzukürzen würde ich AGF empfehlen, und bei kleineren Problemen mal so gut helfen wie es geht. Frohes Schaffen — Boshomi ⌨ 20:59, 10. Mai 2016 (CEST)
Doc Taxon: das habe ich so nicht geschrieben. Es wäre mir nicht zu aufwändig diese Prozedur zu schreiben, sie beinhaltet aber vor allem nachträglich sehr viel Arbeit und Research. Mit ein paar Maskentests wäre es da nicht getan, das stellst du dir etwas zu einfach vor. Außerdem würde es voraussetzen, dass wir das korrekte Datum unserer Version auf Wikipedia finden, wo es einfach zu viele Ausnahmefälle gibt, die man niemals alle berücksichtigen könnte. Deshalb wurde Wikiblame weiter oben bereits als unpraktikabel eingestuft. Ich liste einfach mal auf, welche Problemen bei dieser Gegenüberstellung auftreten können und somit entweder gar kein Datum liefern oder das Ergebnis verfälschen:
- wir können nicht mit 100%iger Sicherheit feststellen, wann ein Link als neue Version eingefügt wurde
- es gibt keine Garantie, dass im Archiv ALLE Versionen der Nachrichtenseiten vorhanden sind
- die Portale können nicht mit einfachen Maskentests untersucht werden, da sich bereits die Struktur der aktuellen Seite zu der im Archiv unterscheiden könnte
- im Augenblick beinhaltet die Liste 27 Seiten, die wir auf Wikipedia formatieren würden. Sobald die Liste auf 50-100 erweitert wird ist das mitunter mehr Handarbeit, als der Bot durch seine Aktionen abnehmen würde
Eine weitere Möglichkeit wäre zu überprüfen, ob ein lastmodified-Metatag im Nachrichtenartikel vorhanden ist. Damit könnte man herausfinden, ob der Artikel nach der Verlinkung auf Wikipedia verändert wurde. Hier wäre die Voraussetzung, dass jede Seite die wir mit einbeziehen ein solches Metatag bereitstellt – das ist nicht der Fall. Desweiteren haben wir das gleiche Problem wie bei dem Direktvergleich, nämlich die ungenaue Suche in unserer Version. Aus den benannten Gründen sehe ich selbst keine andere/bessere Möglichkeit, als einem der Vorschläge von Krd zu folgen. Mit Versionsvergleichen bauen wir definitiv mehr Fehler ein, als uns lieb ist. Möglicherweise käme es ja auch in Frage, den Parameter zugriff
komplett neu zu definieren? Viele Grüße --FNDE (Diskussion) 19:11, 11. Mai 2016 (CEST)
- zum Ersatz mit der Wayback Machine: siehe dazu T120433. Ich denke, da arbeiten Cyberpower678 & Co schon an einem ganz guten Stück Software. Der Task wird recht aktiv bearbeitet, und ich hoffe, dass man schon bald was sehen wird. Folglich würde ich zu dieser Teilaufgabe nicht allzuviel Energie reinstecken. Frohes Schaffen — Boshomi ⌨ 19:20, 11. Mai 2016 (CEST)
- @FNDE: ähm, hast Du wenigstens mal die Quelltexte der beiden Seiten verglichen, bevor Du geantwortet hast. Die Maskentests, schrieb ich, ist nur für den Aufbau der html-Seitenelemente, der Seitenstruktur also. Das ist nicht "etwas zu einfach", sondern wurde von mir schon mit positiven Ergebnissen getestet, hab ich auch geschrieben. Und mit Wikiblame hat das alles auch nichts zu tun, das habe ich mit keiner Silbe erwähnt, denn die Artikelversionen brauchen dabei eben nicht durchforstet zu werden. Überall da, wo der zugriff-Parameter fehlt, ist der Linkinhalt sowieso auf Aktualität erst mal zu prüfen. Wo der zugriff-Parameter bereits existiert, lässt sich ein Archiv-Aktuell-Vergleich (nenn ich das mal) zwischen wayback und website prima machen, ich hab es selbst versucht. Im Archiv sind sicher nicht alle Mirrors enthalten, das kriegst Du aber als "Person" dann auch nicht nachgeprüft und kannst den Bot die vorherige Archiv-Version zum Vergleich verwenden lassen. Wenn sich die Struktur zw. Archiv und Aktuell unterscheidet, kommt der Link zur Nacharbeit in die Blacklist, habe ich auch geschrieben. Die Bedeutung von zugriff wegen der Verwendung dieses Bots zu ändern, halte ich für abwegig, genauso wie einen neuen Parameter zu erfinden, weil es nicht wirklich notwendig ist. Bastel diese Prozedur, wie ich sie beschrieben habe, doch einfach mal rein und schau, inwiefern sich das auswirkt. Danke sehr, – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 20:59, 11. Mai 2016 (CEST)
- Doc Taxon, jetzt reden wir gerade aneinander vorbei :) Wir wollen ja nur die Links formatieren, welche mit
<ref>[...]</ref>
eingefasst sind. Das bedeutet: alle Links die durch den Bot verarbeitet werden enthalten definitiv kein Zugriffsdatum. Dies können wir wiederum nur aus der Versionsgeschichte ziehen, was mit den benannten Problemen verbunden ist. Viele Grüße --FNDE (Diskussion) 21:10, 11. Mai 2016 (CEST)- oh sorry, ja okay - wenn Du Unterstützung zum Contents-Vergleich in den Versionen brauchst, kann ich da fix einen Bot entwickeln, der Dir eine Blackliste bastelt, ... – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 21:48, 11. Mai 2016 (CEST)
- oder Du machst es selbst, kannst dann aber WikiBlame liegen lassen. – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 21:51, 11. Mai 2016 (CEST)
- oh sorry, ja okay - wenn Du Unterstützung zum Contents-Vergleich in den Versionen brauchst, kann ich da fix einen Bot entwickeln, der Dir eine Blackliste bastelt, ... – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 21:48, 11. Mai 2016 (CEST)
- Doc Taxon, jetzt reden wir gerade aneinander vorbei :) Wir wollen ja nur die Links formatieren, welche mit
- @FNDE: ähm, hast Du wenigstens mal die Quelltexte der beiden Seiten verglichen, bevor Du geantwortet hast. Die Maskentests, schrieb ich, ist nur für den Aufbau der html-Seitenelemente, der Seitenstruktur also. Das ist nicht "etwas zu einfach", sondern wurde von mir schon mit positiven Ergebnissen getestet, hab ich auch geschrieben. Und mit Wikiblame hat das alles auch nichts zu tun, das habe ich mit keiner Silbe erwähnt, denn die Artikelversionen brauchen dabei eben nicht durchforstet zu werden. Überall da, wo der zugriff-Parameter fehlt, ist der Linkinhalt sowieso auf Aktualität erst mal zu prüfen. Wo der zugriff-Parameter bereits existiert, lässt sich ein Archiv-Aktuell-Vergleich (nenn ich das mal) zwischen wayback und website prima machen, ich hab es selbst versucht. Im Archiv sind sicher nicht alle Mirrors enthalten, das kriegst Du aber als "Person" dann auch nicht nachgeprüft und kannst den Bot die vorherige Archiv-Version zum Vergleich verwenden lassen. Wenn sich die Struktur zw. Archiv und Aktuell unterscheidet, kommt der Link zur Nacharbeit in die Blacklist, habe ich auch geschrieben. Die Bedeutung von zugriff wegen der Verwendung dieses Bots zu ändern, halte ich für abwegig, genauso wie einen neuen Parameter zu erfinden, weil es nicht wirklich notwendig ist. Bastel diese Prozedur, wie ich sie beschrieben habe, doch einfach mal rein und schau, inwiefern sich das auswirkt. Danke sehr, – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 20:59, 11. Mai 2016 (CEST)
Doc Taxon: Der Prozess würde also so aussehen, dass mein Bot alle Links einbezieht, die nicht in der Blacklist/Wartungsliste stehen. Das klingt für sich schon mal gut, hier wurden aber ernsthafte Bedenken geäußert (die ich teile), dass wir das Datum der Einfügung des Links nicht einwandfrei feststellen können. Dieses Problem ist sozusagen das Fundament worauf alle Vorschläge hier aufbauen und automatisch hinfällig sind. Distelfinck hat weiter oben angemerkt, dass das Zugriffs-Datum den Tag der (menschlich) gelesene Information beschreibt, woraufhin PerfektesChaos den entscheidenden Hinweis gab: wir können das einfach nicht einwandfrei validieren, egal wie wir es drehen uns wenden. Ein Versionsvergleich wäre sicherlich eine Näherung, würde aber stellenweise die gleichen Fehler produzieren, wie es ein festgesetztes Datum mit sich bringt. Es läuft meines Erachtens auf das gleiche hinaus, außer dass wir mit Vergleichen der Version mehr Ressourcen beanspruchen und deutlich mehr Zeit investieren müssen. Viele Grüße --FNDE (Diskussion) 11:45, 12. Mai 2016 (CEST)
- Was würde uns das Wissen bringen, ob sich ein Seiteninhalt seit einem alten Datum geändert hat oder nicht? Falls der Seiteninhalt damals wie heute der selbe ist, dann idt es egal, ob man das damalige oder das heutige Datum als Zugriffsdatum angibt. Und wenn der Seiteninhalt heute ein anderer ist, dann wäre nur das damalige Datum anzugeben, nicht das aktuelle. So oder so -- ob sich der Seiteninhalt geändert hat oder nicht --, könnte man also immer das alte Datum als Zugriffsdatum nehmen, und sich den Vergleich der aktuellen Version mit der Webarchiv-Version sparen.
- -
- Die Frage ist aber, ob, wie Krd angesprochen hat, das Einfügedatum gut genug ist als Zugriffsdatum, oder ob man nicht lieber das Zugriffsdatum weglässt, sei es indem der Bot keine Vorlage einbindet sondern direkt formatiert, oder indem das Zugriffsparameter in der Vorlage optional gemacht wird.
- --Distelfinck (Diskussion) 12:43, 12. Mai 2016 (CEST)
Nein, das Zugriffsdatum ist aus gutem Grund nicht optional und wird jetzt wegen dieses Bots auch nicht optional gemacht. Natürlich, ...
- hat sich der Inhalt der Website seit Ersteinfügung (siehe Versionsgeschichte) geändert, der verlinkte Fakt steht aber noch im Text, dann ist das Zugriffsdatum die Bot-Änderung
- hat sich der Inhalt der Website seit Ersteinfügung (siehe Versionsgeschichte) geändert, der verlinkte Fakt wurde damit entfernt, ist die letzte archivierte Version als Webarchiv-Vorlage einzufügen, die diesen Fakt noch hatte
- hat sich der Inhalt der Website seit Ersteinfügung (siehe Versionsgeschichte) nicht geändert, wird mit Aktualisierung des Links das aktuelle Zugriffsdatum eingefügt
– Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 15:06, 12. Mai 2016 (CEST)
- Das alte Zugriffsdatum wird also nirgends verwendet, da eine Aktualisierung des Links die Prüfung der verlinkten Fakten mit sich trägt und somit ein aktueller Zugriff datiert werden kann. – Doc Taxon • Diskussion • Wiki-MUC • Wikiliebe?! • 15:12, 12. Mai 2016 (CEST)
- ..vorausgesetzt wir können bestimmen, wann der Link tatsächlich (nicht erstmalig) eingefügt wurde. Können wir aber nicht ohne eine ziemlich große Fehlertoleranz. --FNDE (Diskussion) 20:12, 12. Mai 2016 (CEST)
- Soweit ich sehe, gibt es keinen Konsens über das Zugriffsdatum. Auch nicht für die Verwendung der Vorlage:Internetquelle. Der Botlauf würde trotzdem die Artikel verbessern, indem er aus <ref>http://www.spiegel.de/spiegel/print/d-139341933.html</ref> <ref>[http://www.spiegel.de/spiegel/print/d-139341933.html ''Roboter: Mach einen Fehler!''] Der Spiegel 43/2015, 17. Oktober 2015.</ref> macht, also Quelle und Artikelname lesbar hinzufügt. Das spart und Arbeit, die sonst ein Mensch machen müsste, die ich selbst schon 1000x gemacht habe. Einwände, das so zu genehmigen? --MBq Disk 11:06, 15. Mai 2016 (CEST)
Botflag erteilt. --MBq Disk 09:22, 17. Mai 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --MBq Disk 09:25, 17. Mai 2016 (CEST)
2016-07-02 – TaxonBota (erl.)
Antrag gestellt vor 3102 Tagen.
- Name: TaxonBota (Diskussion • Beiträge • Sperren • Logbücher • Sperrlogbuch • Benutzerrechte-Logbuch )
- Betreiber: Doc Taxon (Diskussion • Beiträge)
- Flags auf anderen Wikis
- Programmiersprachen: tcl/tk, PHP
- Aufgaben-Zusammenfassung: Hilfsbot für TaxonBot, siehe Details
- Aufgaben-Details: da TaxonBot derzeit sehr viele Tasks wahrnimmt (Autoarchivierung, VM-Archivierung, LKU-Archivierung, Wartungslistenerstellung, Logging, Kategorienarbeit auf Commons, geplante Wikidata-Jobs und weiteres mehr), ist es hilfreich, diese Tasks wegen der Übersichtlichkeit und selektiven Abschaltung (falls was ist) bzw. zur Übernahme weiterer Einmal-Bot-Anfragen einen (ich nenne es mal) Hilfs-Ersatz-Bot einzusetzen, der dann auch mit einem Botflag ausgerüstet werden sollte.
- Sonstiges: – Doc Taxon • Disk. • WikiMUC • Wikiliebe?! • 15:13, 2. Jul. 2016 (CEST)
Diskussion TaxonBota
- Da keine Einwände kamen und der fachkundige Betreiber bekannt, kann das Botflag vergeben werden. --MBq Disk 20:58, 10. Jul. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: --Krd 12:38, 26. Jul. 2016 (CEST)
2016-09-22 – XnebBot
Antrag gestellt vor 3020 Tagen.
- Name: XnebBot (Diskussion • Beiträge • Sperren • Logbücher • Sperrlogbuch • Benutzerrechte-Logbuch )
- Betreiber: Xneb20 (Diskussion • Beiträge)
- Flags auf anderen Wikis
- Programmiersprachen: Wikitext (HTML)
- Aufgaben-Zusammenfassung: Hinzufügen von Vorlagen
- Aufgaben-Details: Hinzufügen von Vorlage {{Shortcut Weiterleitung}} auf Seiten in Kategorie:Wikipedia:Abkürzungen
- Sonstiges: {{{7}}} -- XnebBot (Diskussion) 22:16, 22. Sep. 2016 (CEST)
Diskussion XnebBot
Programmiersprache Wikitext? Versteh' ich nicht Magst du das mal konkretisieren? --FNDE 22:45, 22. Sep. 2016 (CEST)
- Nutzt Programm AutoWikiBrowser, ist dir das ein Begriff? bràuchte dann auch noch ein Sichter bzw. Admin fèr ein Eintrag in die Liste AutoWikiBrowser--Xneb20 (Diskussion) 11:06, 23. Sep. 2016 (CEST)
- Kenn ich Aber das Ding läuft nur halbautomatisch, oder? --FNDE 11:11, 23. Sep. 2016 (CEST)
- Kommt darauf an, was du darunter verstehst. Er kann aber auch vollautomatisch, ich schau aber hin und wieder vorbei. Die meiste Zeit würde er halbautomatisch laufen, ja. --Xneb20 (Diskussion) 11:26, 23. Sep. 2016 (CEST)
- Kenn ich Aber das Ding läuft nur halbautomatisch, oder? --FNDE 11:11, 23. Sep. 2016 (CEST)
Warum genau soll das durchgeführt werden, wofür wird es benötigt? --Krd 11:12, 23. Sep. 2016 (CEST)
- {{Shortcut Weiterleitung}} auf alle Shortcut Seiten hinzufügen, nach Beispiel hier :WP:QS. (nicht signierter Beitrag von Xneb20 (Diskussion | Beiträge) 11:26, 23. Sep. 2016 (CEST))
Zeitweilig arbeitet der Benutzer als eine Art Benutzerbegrüßungsbot. Ob er das auch automatisieren möchte ... ? --194.25.30.14 11:12, 23. Sep. 2016 (CEST)
- Nein :). Ich hör jetzt nach kurzer Info auf meiner Disk auf.--Xneb20 (Diskussion) 11:26, 23. Sep. 2016 (CEST)
- Wozu soll denn diese Vorlage:Shortcut Weiterleitung überhaupt gut sein?
- Und warum haben wir sie das letzte Dutzend Jahre noch nie gebraucht??
- Bei der regulären Benutzung bekommt niemals jemand diesen Baustein zu sehen, weil jeder sofort weitergeleitet wird.
- Es könnte also nur für jemanden interessant werden, der gezielt eine solche Weiterleitungsseite mittels
redirect=no
bearbeiten will. - Wer sowas bearbeitet, sollte ein Minimum an Ahnung von der Materie haben und keiner solcher Bausteine bedürfen.
- Die Frage, was grad der „offizielle Shortcut“ sein mag und was nur eine von einem Dutzend vorstellbarer Weiterleitungsseiten ist, ist schon hochkomplex. Diese Vorlage und die Anforderung, Weiterleitungsseiten damit zusätzlich ausstatten zu müssen, verkompliziert die Sache noch weiter und bringt niemandem etwas.
- Ich würde eher empfehlen, als Ersteller die Vorlage gleich wieder per SLA zu löschen.
- VG --PerfektesChaos 11:47, 23. Sep. 2016 (CEST)
- Nun, es gibt leider immer noch die Neulinge, die diese Weiterleitungen nicht verstehen. Es ist ja legentlich ein kleiner Verweis auf die dazugehörigen Hilfeseiten. Schaden kann es auf jeden Fall nicht, es verhindert die WL nicht, helfen kann dieser Baustein schon, vor allem Neulingen. Mit freundlichen Grüßen --Xneb20 (Diskussion) 11:54, 23. Sep. 2016 (CEST)
- Nochmals:
- Ein „Neuling“ kommt niemals auf eine derartige Seite. Vielmehr wird jeder sofort weitergeleitet.
- Wer die schon bestehenden Shortcuts warten und pflegen will, sollte sich mit Projektorganisation und den Tücken derartiger Kürzel auskennen. Das ist definitiv nichts für Neulinge, und die hätten an solchen Seiten auch nichts zu suchen.
- Vielmehr müsste man Wikipedia:Shortcuts erstmal verinnerlichen; und wenn man das durchschaut hat, dann braucht es auch derartige Vorlagen nicht mehr.
- Und die Regeln, auf welche der Weiterleitungsseiten diese Vorlage eingefügt werden sollen und auf welche gerade nicht müssten auch erstmal auf Wikipedia:Shortcut dargelegt werden.
- A propos WD:Shortcuts:
- Bevor du dich aufmachst, bis zu 10.000 Weiterleitungsseiten (einschließlich Disk) mit solchen Vorlagen auszustaffieren, wäre es üblich erstmal auf WD:Shortcuts vorstellig zu werden, deine Absichten zu erläutern und eine Weile abzuwarten.
- A propos „Neuling“:
- Du hast wenige 100 Edits.
- Gleichwohl baust du Vorlagen, willst in die Projektorganisation eingreifen und ein Botflag haben.
- Das ist nicht das typische Profil eines Newbie.
- Unter welchem Namen kennen wir dich denn sonst so?
- VG --PerfektesChaos 12:22, 23. Sep. 2016 (CEST)
- Benutzername vergessen deshalb habe ich mir ein neuen Account angelegt. Und ja, eigentlich dachte ich, ich hätte mein Anliegen bereits auf WD:Shortcuts dargelegt. --Xneb20 (Diskussion) 13:51, 23. Sep. 2016 (CEST)
- Typischer Fall von "Lösung sucht Problem", bitte schnellbeenden. --Krd 12:24, 23. Sep. 2016 (CEST)
- Nochmals:
- Also sind hier alle der Meinung, ein solcher Baustein wäre unnötig?! Ich meine, schaden wird es wohl kaum, oder? (nicht signierter Beitrag von Xneb20 (Diskussion | Beiträge) 13:54, 23. Sep. 2016 (CEST))
Mir ist das auch nicht klar. Xneb20 könntest du bitte erläutern, wozu das nützlich sein sollte. Danke --Itti 13:45, 23. Sep. 2016 (CEST)
- Als zusätzliche Info, warum hier eine Weiterleitung erstellt wurde. Wie ich bereits geäußert habe, soll es einen Verweis auf WP:SC geben, damit alle verstehen, was das hier soll und das dies keine übliche WL ist. MfG --Xneb20 (Diskussion) 13:54, 23. Sep. 2016 (CEST)
- @MBq: meine Meinung: ich würde die Botrechte ablehnen, Sinn erschließt sich mir nicht, es wird auf eine Diskussionsseite verwiesen, auf der ich keinen Konsens für diese Änderung finde, @Xneb20, ansonsten bitte deine obige Aussage präzisieren, der Benutzer hat keine 500 Edits und mir fehlt da das Vertrauen. Bitte schau mal drüber. --Itti 14:37, 23. Sep. 2016 (CEST)
- Ich stimme Dir zu, Itti. - @Xneb20: Nimm mir das nicht übel, aber mir scheint, Du hast noch zu wenig Erfahrung mit solchen Wartungsarbeiten und auch im übrigen Projekt. Wir lassen Bots normalerweise nur zu, wenn der Betreiber die Technik, aber auch die Usancen der Wikipedia-Gemeinschaft sicher beherrscht. Können wir den Antrag einvernehmlich zurückstellen? Gruss, -- MBq Disk 14:44, 23. Sep. 2016 (CEST)
- Bitte nicht zurückstellen sondern ablehen. Da versucht sich Xneb20 in einer Spielerei, indem er eine Vorlage anlegt, die keiner braucht, programmiert in Wikitext (html), was gar nicht geht und will dafür auch noch ein Flag haben. Nein danke, hier fehlt es in mehrerer Sicht an der nötigen Erfahrung zumindest was das Betreiben von Bots betrifft. LA auf die Vorlage stelle ich noch. @xqt 14:57, 23. Sep. 2016 (CEST)
- Ich stimme Dir zu, Itti. - @Xneb20: Nimm mir das nicht übel, aber mir scheint, Du hast noch zu wenig Erfahrung mit solchen Wartungsarbeiten und auch im übrigen Projekt. Wir lassen Bots normalerweise nur zu, wenn der Betreiber die Technik, aber auch die Usancen der Wikipedia-Gemeinschaft sicher beherrscht. Können wir den Antrag einvernehmlich zurückstellen? Gruss, -- MBq Disk 14:44, 23. Sep. 2016 (CEST)
- @MBq: meine Meinung: ich würde die Botrechte ablehnen, Sinn erschließt sich mir nicht, es wird auf eine Diskussionsseite verwiesen, auf der ich keinen Konsens für diese Änderung finde, @Xneb20, ansonsten bitte deine obige Aussage präzisieren, der Benutzer hat keine 500 Edits und mir fehlt da das Vertrauen. Bitte schau mal drüber. --Itti 14:37, 23. Sep. 2016 (CEST)
- MBq Disk 15:54, 23. Sep. 2016 (CEST) Nein Inzwischen wurde der Antragsteller wegen anderweitiger Störung befristet gesperrt. --
- Archivierung dieses Abschnittes wurde gewünscht von: -- MBq Disk 15:56, 23. Sep. 2016 (CEST)
Bot-Konto gesperrt, Bot-Flag wurde abgelehnt --Itti 15:56, 23. Sep. 2016 (CEST)
2016-09-24 – LarusBot
Antrag gestellt vor 3018 Tagen.
- Name: LarusBot (Diskussion • Beiträge • Sperren • Logbücher • Sperrlogbuch • Benutzerrechte-Logbuch )
- Betreiber: Freddy2001 (Diskussion • Beiträge)
- Flags auf anderen Wikis
- Programmiersprachen: PHP
- Aufgaben-Zusammenfassung: Aktualisierungen auf den JWP-Seiten
- Aufgaben-Details: Der Bot soll die StatusBox der Jungwikipedianer aktualisierern. Dabei verlinkt er von der Dikussionsseite aktuelle, nicht erledigte Diskussionsabschnitte. Am Anfang jeden Monats sollen der Artikel des Monats und das Bild des Monats auf der Hauptseite sowie auf anderen JWP-Unterseiten (wie z.B. der Newsletter) aktualiert werden.
- Sonstiges: -- Freddy2001 DISK 20:18, 24. Sep. 2016 (CEST)
Diskussion LarusBot
So, ich sag mal was dazu: ich kenne die Arbeit von Freddy, jetzt nicht genauestens im Detail, aber diese Aktualisierungen bzw. Wünsche auf Aktualisierungen sind mir durchaus bekannt. Die Aufgaben derzeit beschränken sich auf das JWP-Projekt, es steht aber derzeit durchaus offen, dass da einige Skripte auch für anderweitige Projektwartungen und ANR-Aktualisierungen künftig entwickelt werden. Ich finde es gut, wenn wir Jungwikipedianer fördern und unterstützen und sehe diese Botarbeit als unbedenklich und erwünscht an, weshalb ich den Einsatz des LarusBot mit BotFlag befürworte. Danke, – Doc Taxon • Disk. • WikiMUC • Wikiliebe?! • 23:15, 28. Sep. 2016 (CEST)
- Der Bot ist zudem Teil von WP:TNB, sprich wir entwicklen die Aufgaben mit mindestens 4 Augen und einem Code-Review (Peer-Review), zudem nutzt der Bot vom Grundgerüst her mein Framework mit. Freddy ist damit aktuell der erste von (hoffeltich einer Reihe) von Botbetreibern, die wir versuchen beim Einstieg zu begleiten, und zu unterstützen, wo es möglich ist. Jeder der Jobs der dann auch eingesetzt werden soll wurde übrigens voher schon auf einem privaten Testwiki getestet. Wir haben insgesamt vor, auch Aufgaben von WP:BA zu bearbeiten, oder das ein oder andere Tool zu schreiben, sollte mit dem System was wir haben alles im unproblematischem Bereich bleiben. (Um Irritationen zu vermeiden: Mein "Wir" heißt in dem Fall nicht, da sich den Bot mitbetreibe, aber bei Beratung und Code-Review arbeite ich mit.) Luke081515 23:44, 28. Sep. 2016 (CEST)
- Risiken sind wohl sehr überschaubar, wenn ihr das Ding nur auf den Seiten von JWP verwendet. Finde ich ebenfalls sehr unterstützenswert, zumal das Framework von Luke dadurch intensiver genutzt wird und somit nur besser werden kann. --FNDE 23:33, 28. Sep. 2016 (CEST)
- Wie viele Edits pro Monat sind geplant? --Krd 07:33, 29. Sep. 2016 (CEST)
- Zunächst, nur mit den JWP-Aufgaben werden es wohl nicht so viele werden. Die genaue Anzahl hängt von der Aktivität dort ab, wird aber wohl im zweistelligen Bereich bleiben. Wenn später auch Anfragen von WP:BA abgearbeitet werden, können es je nach Aufgabe mehr Edits werden. -- Freddy2001 DISK 21:17, 29. Sep. 2016 (CEST)
- Wie viele Edits pro Monat sind geplant? --Krd 07:33, 29. Sep. 2016 (CEST)
- Risiken sind wohl sehr überschaubar, wenn ihr das Ding nur auf den Seiten von JWP verwendet. Finde ich ebenfalls sehr unterstützenswert, zumal das Framework von Luke dadurch intensiver genutzt wird und somit nur besser werden kann. --FNDE 23:33, 28. Sep. 2016 (CEST)
Hast du vor dieser Sache schon in anderen Projekten (außerhalb von WP) mitgearbeitet oder ist das hier sozusagen das Erstlingswerk? Schönen Gruß --FNDE 21:19, 29. Sep. 2016 (CEST)
- Was meinst du mit „mitgearbeitet“? Einen Bot betrieben? Projekte in PHP realisiert? Mit diesem Framework gearbeitet? Oder etwas ganz anderes? -- Freddy2001 DISK 22:34, 29. Sep. 2016 (CEST)
- Projekte in PHP. VG --FNDE 22:41, 29. Sep. 2016 (CEST)
- Ich habe bereits mehrere Projekte in PHP realisiert, allerdings ist dies mein erstes, welches die Media-Wiki API verwendet. -- Freddy2001 DISK 07:20, 30. Sep. 2016 (CEST)
- Projekte in PHP. VG --FNDE 22:41, 29. Sep. 2016 (CEST)
- Lass den Bot mal ein paar Probeedits machen. -- MBq Disk 06:06, 30. Sep. 2016 (CEST)
Probeedits für die Aufgaben StatusBox und AdM sind erfolgt. Die Statusbox soll täglich überprüft werden, die Aktualisierung des AdM am Anfang jeden Monats. -- Freddy2001 DISK 16:41, 2. Okt. 2016 (CEST)
- Sieht gut aus, solange er nur diese wenigen Aufgaben hat, genügt mir das -- MBq Disk 21:18, 2. Okt. 2016 (CEST)
Botflag erteilt -- OkMBq Disk 21:20, 2. Okt. 2016 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: -- MBq Disk 21:20, 2. Okt. 2016 (CEST)
2016-12-02 – BrackiBot
Antrag gestellt vor 2949 Tagen.
- Name: BrackiBot (Diskussion • Beiträge • Sperren • Logbücher • Sperrlogbuch • Benutzerrechte-Logbuch )
- Betreiber: Brackenheim (Diskussion • Beiträge)
- Flags auf anderen Wikis
- Programmiersprachen: AutoWikiBrowser
- Aufgaben-Zusammenfassung: kleine Änderungen (typografischen Fehler)
- Aufgaben-Details: Nach DIN 5008, dem Duden oder auch hier nochmals ganz nett erklärt, gehört zwischen Abkürzungen wie "z. B." ein Leerzeichen. Dass es sich dabei um ein geschütztes Leerzeichen handel muss, wurde auf Wikipedia:Technik/Werkstatt#Gesch.C3.BCtztes_Leerzeichen abgeklärt. Auf Benutzer:Phzh/Abkürzungen wird auf die betroffenen Artikel verlinkt. Da BrackiBot mit AWB betrieben wird, werden dabei auch gleich weitere kleine Korrekturen durchgeführt, wie etwa die Korrektur von [[Link|Link]] zu [[Link]].
- Sonstiges: Leider habe ich nicht daran gedacht, für die Korrektur solcher typografischer Fehler einen neuen Antrag zustellen, weshalb der Bot derzeit gesperrt ist. Ich bin davon ausgegangen, dass Typos letzes Mal mit im Antrag standen ... Grüße, Brackenheim 10:36, 2. Dez. 2016 (CET)
Diskussion BrackiBot
Hallo. Also Spezial:Diff/160037166 ist schon ein dicker Hund, solche Fehler dürfen da nicht passieren, und sind genau der Grund, warum wir diese Edits und auch Rechtschreibkorrekturen nicht automatisch machen.
Das massenhafte Ausrollen geschützter Leerzeichen sehe ich per Wikipedia:Wie gute Artikel aussehen ebenfalls nicht, und in der Technikwerkstatt wurde auch nur gesagt, dass es zur Zeit nicht automatisch geht, aber nicht, dass wir das jetzt per Bot ausrollen (und später zurückbauen) wollen. Sorry. --Krd 10:52, 2. Dez. 2016 (CET)
- Hallo Krd, danke für Deine schnelle Rückmeldung. Bei der von Dir verlinkten Panne hast Du natürlich Recht, habe den Fehler aber gleich darauf korrigiert und in AWB eine entsprechende Ausnahme hinzugefüht, damit so etwas nicht noch einmal passiert.
- Auf Wikipedia:Typografie#Leerzeichen steht das mit den Leerzeichen. Generell finde ich ja, dass man die WP-internen Schreib- und Grammatikregeln ruhig mal der neuen Rechtschreibung bzw. den entsprechenden Normen anpassen kann ... Gruß, --Brackenheim 11:10, 2. Dez. 2016 (CET)
- Auch bzgl. "ruhig mal der neuen Rechtschreibung … anpassen" ist Wikipedia:Rechtschreibung anderer Meinung. Ich glaube nicht, dass wir das per Botflagantrag entscheiden können, ggf. wäre es zuerst grundsätzlich zu klären. Die verlinkte Diskussion in der Technikwerkstatt halt ich wie gesagt für nicht ausreichend. --Krd 11:15, 2. Dez. 2016 (CET)
- Passt schon, soll ja auch keine Kritik an Dir sein ;-) Aber wo kann man das denn entgültig klären? Etwa ein Meinungsbild? Für so eine kleine Anpassung an den Duden erscheint mir das schon etas übertrieben ... Brackenheim 11:20, 2. Dez. 2016 (CET)
- Das weiß ich auch nicht genau, womöglich auf WD:Rechtschreibung oder WD:Typografie? --Krd 11:22, 2. Dez. 2016 (CET)
- Ok, danke, dan hoffe ich mal, dass dort auch mal jemand vorbeisieht. Gruß, Brackenheim 11:25, 2. Dez. 2016 (CET)
- Das weiß ich auch nicht genau, womöglich auf WD:Rechtschreibung oder WD:Typografie? --Krd 11:22, 2. Dez. 2016 (CET)
- Passt schon, soll ja auch keine Kritik an Dir sein ;-) Aber wo kann man das denn entgültig klären? Etwa ein Meinungsbild? Für so eine kleine Anpassung an den Duden erscheint mir das schon etas übertrieben ... Brackenheim 11:20, 2. Dez. 2016 (CET)
- Auch bzgl. "ruhig mal der neuen Rechtschreibung … anpassen" ist Wikipedia:Rechtschreibung anderer Meinung. Ich glaube nicht, dass wir das per Botflagantrag entscheiden können, ggf. wäre es zuerst grundsätzlich zu klären. Die verlinkte Diskussion in der Technikwerkstatt halt ich wie gesagt für nicht ausreichend. --Krd 11:15, 2. Dez. 2016 (CET)
Per WP:Bots 10. Spiegelstrich ist der Wunsch ohnehin abzulehnen: Minimale Änderungen und kleine Schönheitskorrekturen ... nur zusammen mit größeren, wirklich gravierenden Eingriffen vornehmen. @xqt 12:22, 4. Dez. 2016 (CET)
- Um es noch deutlicher zu machen: auch Korrekturen von [[Link|Link]] zu [[Link]] sind solcherlei minimale Änderungen kosmetischer Art, weil sie an der Darstellung nichts ändern. Auch solches darf nur zusammen mit einem sinnvollen Botlauf vorgenommen werden. Im Übrigen wurden solche Änderungen wie hier vorgeschlagen auf WP:BA des Öfteren schon abgelehnt, siehe z. B. Wikipedia:Bots/Anfragen/Archiv/2010-1#z.B._-.3E_z..C2.A0B._.28mit_non-breaking_space.29; typographisch ist das geschütze Leerzeichen ohnehin falsch, weil der Abstand zu groß ist. Das Botflag ist ja schon erteilt und üblicherweise wird auf de-wiki im Gegensatz zu manch anderen Projekten nicht für jede Aufgabe eine neue Zulassung gefordert, solange die grundlegenden Regeln eingehalten werden. Umgekehrt kann ein Botflag bei häufigen Fehlern oder Botläufen ohne Konsens wieder aberkannt oder der Bot gesperrt werden. Soweit würde ich nicht gehen. Aber die letzten Edits sind weder konsensual nicht im Einklang mit den gängigen Bot-Richtlinien. @xqt 13:45, 4. Dez. 2016 (CET)
- Typographische Dinge wie geschützte Leerzeichen rein/raus, soft hyphens, der Austausch von - gegen –, " " gegen " ", die geografisch unterschiedlichen Anführungszeichen u.v.m. sind problematisch, weil sie Geschmackssache sind, und ästhetische Edits sollten IMHO nur Menschen durchführen, die damit ein persönliches Stilempfinden ausdrücken, keine Software. Ich würde auch unbedingt ein Meinungsbild oder eine Umfrage empfehlen, und ich fürchte, dass es dabei recht laut und kontrovers zugehen wird. -- MBq Disk 14:45, 5. Dez. 2016 (CET)
- Wer viel fragt geht viel irr. Viele der typographischen Verbesserungen sind schon machbar, allerdings sollte sein ein Bot auf sichere, und einfach durchzuführende Fälle beschränken. Eine Absicherung durch im besten Fall mehrere anerkannte Wörterbücher, allgemein anerkannte typographische Empfehlungen,... kann dabei nicht schaden. Dinge die sich als annerkannter Weise als fehlerhaft zu beurteilen sind, kann man auf jeden Fall korrigieren. Beispiele wären "z.B." oder "zB." in Ersteren fehlt ein Leerzeichen, im zweiten Fall ist ein Punkt zuviel. Einge der Dinge die man sicher machen kann findet man in PCs Benutzer:PerfektesChaos/js/WikiSyntaxTextMod und TMGs Benutzer:TMg/autoFormatter und den Listen von Checkwiki; allerdings besteht die Kunst der Botbetreiber darin, nur die Artikel und die Aufgaben zu filtern, bei denen derartige Edits keiner Nachkontrolle mehr bedüfren. Auf enwiki werden die Checkwiki-Listen zu einem Gutteil durch AWB-basierte Bots erledigt. Frohes Schaffen — Boshomi ⌨ 15:59, 5. Dez. 2016 (CET)
- Typographische Dinge wie geschützte Leerzeichen rein/raus, soft hyphens, der Austausch von - gegen –, " " gegen " ", die geografisch unterschiedlichen Anführungszeichen u.v.m. sind problematisch, weil sie Geschmackssache sind, und ästhetische Edits sollten IMHO nur Menschen durchführen, die damit ein persönliches Stilempfinden ausdrücken, keine Software. Ich würde auch unbedingt ein Meinungsbild oder eine Umfrage empfehlen, und ich fürchte, dass es dabei recht laut und kontrovers zugehen wird. -- MBq Disk 14:45, 5. Dez. 2016 (CET)
Unter Wikipedia Diskussion:Typografie#Anwendung geschützter Leerzeichen scheint sich kein Konsens dafür abzuzeichnen, dass diese Aufgabe umgesetzt werden soll. --Krd 18:08, 6. Jan. 2017 (CET)
- @Brackenheim, MBq, Itti: ? --Krd 12:35, 10. Jan. 2017 (CET)
- umstritten und nur im Rahmen inhaltlicher Edits als Ausdruck des individuellen Autorenstilempfindens akzeptiert, deshalb kann ich das Flag nicht erteilen. Ich lasse ihn ungesperrt für den Fall, dass er für andere Aufgaben noch benötigt wird (dann wieder hier melden). -- MBq Disk 13:27, 10. Jan. 2017 (CET)
Nein Gemäß dem Diskussionsergebnis hier und auf den verlinkten Seiten sind manche der aktuell vorgechlagenen Botarbeiten - insbesondere - Archivierung dieses Abschnittes wurde gewünscht von: MBq Disk 13:27, 10. Jan. 2017 (CET)