Wikipedia:Projektdiskussion/Ein Bot zu bekämpfen von WP:Defekte Weblinks (Bereitstellen von InternetArchiveBot zu dewiki)

Dies ist eine archivierte Unterseite der Seite Wikipedia:Projektdiskussion. Benutze bitte die aktuelle Diskussionsseite, auch um eine archivierte Diskussion weiterzuführen. Um auf diese Diskussion zu verlinken, kopiere den Seitennamen aus der Adresszeile deines Browsers.

Hallo an alle der deutschen Wikipedia. Ich bin Cyberpower678, ein Bot-Operator auf der englischen Wikipedia. Ich reiche an die Inhaltsredakteure dieser Wikipedia, in Bezug auf die erwähnten Phabricator-Aufgaben auf der rechten Seite. T120433 ist ein Tracking-Ticket für ein laufendes Bot-Projekt zur Bekämpfung von toten Links die ständig auftauchen in Hunderten von Tausenden von Artikeln. Dieses Ticket wurde als Ergebnis der Nummer eins angefordert bot auf der m:2015 Community Wishlist Survey, und kann hier gefunden werden. Ich bin derzeit der führende Entwickler dieses Bot-Projekts, und mit dem Bot bereit für den Einsatz auf andere Wikis, frage ich deutsche Wikipedians, so ein Bot willkommen wäre. Die Phabricator-Aufgabe, die dieses Projekt verfolgt, ist T120433.

Das spezifische Ticket für die Bereitstellung dieses Bots an die schwedische Wikipedia ist T136147. Der erste Schritt ist einen Einigkeit zu bekommen, durch diesen Vorschlag, und dann die Anpassung der Bot an die Bedürfnisse dieses Wiki anzupassen.

Was macht der Bot?

Bearbeiten

Dieser Bot ist sehr funktional, konfigurierbar und sehr intelligent. Der Bot kommt mit einer Kontrollseite, die für die schnelle Deaktivierung des Bot, im Falle einer Störung ermöglicht. Jedes Wiki hat auch eine Konfigurationseite, die den Bot veranlasst, wie man sich auf diesem Wiki verhält. Auf der englischen Wikipedia ist der Bot in der Lage, vorhandene URLs zu scannen und zu erkennen, ob sie tot sind oder nicht. Während der Testversuche hat dies eine Fehlerrate von 0,1% ergeben. Die Zuverlässigkeitsrate ist jetzt noch besser, als bei der Erstverhandlung. Der Bot ist in der Lage, ursprüngliche URLs mit Archiv-URLs zu ersetzen oder hinzuzufügen. Es ist in der Lage, Quellen und Zitate zu lesen, die auf verschiedene Weise formatiert sind, und entweder intelligent die Quelle nach Bedarf reparieren oder die Formatierung konsistent machen, nach akzeptierten Formatregeln. InternetArchiveBot, kann eine Nachricht mit Details, was es auf der Artikelseite getan haben, auf die Diskussionsseite hinterlassen. Die Konfigurationsseite hat auch die Möglichkeit, nur Nachrichten zu hinterlassen und den Hauptartikel überhaupt nicht zu berühren. InternetArchiveBot ist {{nobots}} kompatibel und unterstützt auch ein leeres Tag, das auf der englischen Wikipedia verwendet wird, {{cbignore}}, die den Bot anweist, eine bestimmte Quelle auf einer Seite zu ignorieren.

Welche Wikis unterstützen das?

Bearbeiten

Es ist derzeit voll funktionsfähig auf den englischen und schwedischen Wikipedias.

Einige Beispiele: [1][2][3][4]

CYBERPOWER (Diskussion) 03:02, 20. Apr. 2017 (CEST)[Beantworten]

Diskussion

Bearbeiten

User:GiftBot already detects dead links on German Wikipedia and leaves messages on talk pages of the affected articles. -- hgzh 10:47, 24. Apr. 2017 (CEST)[Beantworten]

That may be so, but IABot can actually do the work on the main articles as well. The bot can be customized to suit the needs of the wiki.—CYBERPOWER (Diskussion) 15:26, 24. Apr. 2017 (CEST)[Beantworten]
I'll note that GiftBot also hasn't done anything related to that task for more than a half a year. The last actions being done to talk pages was archiving and that was in August 2016.—CYBERPOWER (Diskussion) 03:28, 25. Apr. 2017 (CEST)[Beantworten]
Thank you for informing us.
  • We need no update, since we have 115.067 open issues left from previous run. These need to be fixed, before some 400.000 further articles are thrown on that pile.
  • I don’t think that this community will accept „intelligent die Quelle nach Bedarf reparieren“ by a native English bot.
  • The only thing which would be done is writing into perhaps 400.000 articles a notification that this or that URL did not work. Yes, we know that.
  • We provide our authors with detailed information about available archive links and link history, as you may find at Diskussion:Be Berlin #Defekte Weblinks or Diskussion:Beam Me Up Scotty (Mixtape) or Diskussion:Pappa Bear or Diskussion:Bearwallow-Dammbruch, and link to other articles which had or still have the same broken URL to fix them together or to get an idea how those were repaired.
By the way, you provide some Phabricator tasks, but I fail to see a documentation page where functionality is described precisely (English sufficient).
Greetings --PerfektesChaos 14:21, 30. Apr. 2017 (CEST)[Beantworten]
@PerfektesChaos: The bot is adapted to each individual wiki so it runs correctly as intended. The bot can edit the article directly, and not create such a massive backlog to begin with. Before deploying the bot, I modify wiki specific aspects of the code that then gets loaded into the main parser on start up. For dewiki, it will have it's own dewiki parsing and processing extension. Also, the bot has been designed to operate on multiple wikis, and is very customizable with an on wiki configuration file. If you want a precise functionality see m:InternetArchiveBot.—CYBERPOWER (Diskussion) 14:30, 30. Apr. 2017 (CEST)[Beantworten]
@Cyberpower678: I think there is a widespread view in German Wikipedia's community that each dead link needs human review and bots should only assist by reporting dead links (on the talk page). No automated fixes by bots directly in articles. One of the reasons for that view is that the appropriate replacement for a dead link is not necessarily an archive link. I guess that the community here, if given the choice of automated bot edits or a huge backlog they need manually to fix over the course of years, will still prefer the latter. There is also very strong skepticism regarding any kind of bot activity in articles here. For example, German WP's community would never accept bot generated stubs such as Swedish Wikipedia has (e.g. sv:Tasilik (ö i Grönland, Qeqqata)). Personally, I don't think that bot-generated geography stubs are such a bad idea, but the rejection here is overwhelming. It's just a different culture. Many see bot edits as a "no-go". Gestumblindi 16:15, 6. Mai 2017 (CEST)[Beantworten]
@Gestumblindil: What if we adapted this proposal to make the semi-automated tool available to users. It would essentially execute the bot, only on request, on a target page determined by the user? The bot comes with a collection of tools that help the bot to become more reliable than it is now. See https://tools.wmflabs.org/iabot to have a look. Same scope but removes the fully automated aspects of it.—CYBERPOWER (Diskussion) 16:43, 6. Mai 2017 (CEST)[Beantworten]
Oh, and by the way, if you wonder why you don't get more feedback here: You have probably used Wikipedia:Projektdiskussion because it's interwiki-linked from English Wikipedia's Village Pump. However, the "Projektdiskussion" isn't quite the central discussion place that VP is. A more popular place is Wikipedia Diskussion:Kurier (the talk page of our "Signpost" equivalent, which is used for general discussions of all kind). Finally, before any such bot deployment, I think that community assent via a Meinungsbild (poll) would be necessary, but I don't think you will get that assent (because of said basic averseness to bot edits). Gestumblindi 16:38, 6. Mai 2017 (CEST)[Beantworten]
I know long before this proposal was started that getting the bot to be accepted on dewiki wasn't going to be easy, if at all possible. But it never hurts to try and this is a funded project so it is receiving dedicated time in its development. Thanks for pointing out the alternative locations to post.—CYBERPOWER (Diskussion) 16:43, 6. Mai 2017 (CEST)[Beantworten]