Wikipedia:Bots/Anfragen/Archiv/2024-1

Liste von Frelichtmuseen

Letzter Kommentar: vor 1 Jahr4 Kommentare2 Personen sind an der Diskussion beteiligt

Es wäre total nett, wenn jemand einen Bot für alle Links auf die umbenannte Seite Liste von Freilichtmuseen erstellen könnte. Vorher hieß der Artikel Liste europäischer Freilichtmuseen und so steht es noch an dutzenden Stellen. Danke! --Fährtenleser (Diskussion) 12:38, 13. Jan. 2024 (CET)

@Fährtenleser: läuft schon – Doc Taxon • Disk. • 10:50, 14. Jan. 2024 (CET)

Prima, danke! --Fährtenleser (Diskussion) 19:45, 14. Jan. 2024 (CET)

Archivierung dieses Abschnittes wurde gewünscht von: – Doc Taxon • Disk. • 11:03, 14. Jan. 2024 (CET)

Vorlage:WSC

Letzter Kommentar: vor 1 Jahr5 Kommentare2 Personen sind an der Diskussion beteiligt

Nach dieser Entfernung sollte die Vorlage im Abschnitt Weblinks jeweils mit einem Sternchen am Zeilenanfang eingebunden werden (Beispiel). Mag das jemand übernehmen? --Leyo 15:51, 16. Jan. 2024 (CET)

Ich guck mal, sollte ja einfach sein. --Wurgl (Diskussion) 16:23, 16. Jan. 2024 (CET)

Danke! Wie viele Artikel waren denn betroffen? --Leyo 21:26, 16. Jan. 2024 (CET)

258 Stück. Ab hier in der Beitragsliste des Bots. --Wurgl (Diskussion) 21:51, 16. Jan. 2024 (CET)

:Archivierung dieses Abschnittes wurde gewünscht von: --Wurgl (Diskussion) 18:50, 16. Jan. 2024 (CET)

Thüringer Allgemeine

Letzter Kommentar: vor 1 Jahr20 Kommentare4 Personen sind an der Diskussion beteiligt

Die Thüringer Allgemeine hat heute ihre URL-Struktur geändert. Alle eingebundenen Links führen zur 404-Seite. --2A00:20:B28A:C06F:8159:B5EC:3CC8:F4CC 13:52, 9. Jan. 2024 (CET)

Okay. Ich hab mir den ersten Treffer in der Weblinksuche angeguckt und per Hand probiert

Wie kann man die alte ID 574776672 in die neue ID 220556913 automatisch umrechnen? --Wurgl (Diskussion) 15:33, 9. Jan. 2024 (CET)

Web.archive.org scheint eine Umleitung gemäß HTTP 301 anzubieten. Wenn ich den letzten archivierten Link anklicke:

web.archive.org/web/20230509171819/https://www.thueringer-allgemeine.de/web/zgt/politik/detail/-/specific/Ramelow-und-der-Ex-Stasi-Offizier-Lieberknecht-greift-Linke-an-574776672

,

so gelange ich zur Variante

web.archive.org/web/20230514013538/https://www.thueringer-allgemeine.de/politik/ramelow-und-der-ex-stasi-offizier-lieberknecht-greift-linke-an-id220556913.html

.

www.thueringer-allgemeine.de/politik/ramelow-und-der-ex-stasi-offizier-lieberknecht-greift-linke-an-id220556913.html
scheint denselben Artikel zu verlinken wie

www.thueringer-allgemeine.de/politik/article220556913/Ramelow-und-der-Ex-Stasi-Offizier-Lieberknecht-greift-Linke-an.html

.

Lässt sich sowas automatisieren? Ansonsten könnte man ja die Zeitung selbst fragen, ob es eine Regel für die Umstellung gibt. --T. Wirbitzki (Diskussion) 16:32, 9. Jan. 2024 (CET)

Also Links mit -id<nummer> kann ich möglicherweise über die Suche auf der Zeitungsseite retten, ist zwar Gedaddel aber könnte klappen. das sind ca. 800 von den insgesamt ca. 1400 Links im ANR. Das mit webarchiv … keine Ahnung, da denk ich später drüber nach. --Wurgl (Diskussion) 17:08, 9. Jan. 2024 (CET)

Links mit -id<nummer> können größtenteils über die Webseite selbst aufgelöst werden, ich kann die trotzdem durch die neue URL ersetzen, wenn nicht wie der nächste:

Für Links dieser Art und Links die auf -<nummer> enden kann ich suchen und soweit ich gesehen habe ist der sprechende Text in der alten URL (bis auf Groß/Kleinschreibung) der selbe wie in der neuen Url.

Webarchiv … ich weiß nicht. Da ist sauviel Javascript-Gedaddel (das geht nicht im Bot, das geht nur mit Browser), da müsste ich das API bemühen und dazu brauch ich dort einen Account usw. und dann noch:

https://web.archive.org/web/20240000000000*/https://www.thueringer-allgemeine.de/web/zgt/leben/leserreisen/detail/-/specific/Erdarbeiten-fuer-ICE-Trasse-bei-Azmannsdorf-beendet-1229888612/

die Links von 2017 haben (gefühlt) 10 Weiterleitungen und dann lande ich auf einer anderen Webseite und dort auf der Startseite. Ja, der 2016er-Archivlink ist im Archiv und eben nur dort.

Webarchiv daher erstmal nicht. --Wurgl (Diskussion) 16:08, 11. Jan. 2024 (CET)

Danke für die Prüfung, war ja nur so eine Idee. --T. Wirbitzki (Diskussion) 20:02, 11. Jan. 2024 (CET)

Es gibt auch den Fall, wo der Archivlink den vollen Text bietet, während der aktuelle Link hinter der Bezahlschranke wäre. --T. Wirbitzki (Diskussion) 04:56, 13. Jan. 2024 (CET)

Ich hab mal den Bot losgeschickt. 208 bisher tote Links konnte ich reaktivieren und etliche Weiterleitungen sind aufgelöst. ca. 700 tote Links bleiben. --Wurgl (Diskussion) 00:28, 14. Jan. 2024 (CET)

Super! Das sind 208 manuelle Edits weniger.

Es gibt einige Fälle, wo statt „www.“ ein Ortsname als Subdomain verwendet wird, z.B. in Bad Langensalza:

https://badlangensalza.thueringer-allgemeine.de/web/badlangensalza/startseite/detail/-/specific/Bad-Langensalzaer-Stadtrat-verleiht-Ufhoven-den-Ortsteilstatus-2077380171

Der neue Link wäre hier

https://www.thueringer-allgemeine.de/regionen/bad-langensalza/article225150899/Bad-Langensalzaer-Stadtrat-verleiht-Ufhoven-den-Ortsteilstatus.html

Hat der Bot die besucht, und wenn nicht, würde es sich lohnen, wenn er sie besucht, oder kann in diesen Fällen die neue ID nicht über die Website ermittelt werden? --T. Wirbitzki (Diskussion) 13:57, 14. Jan. 2024 (CET)

Läuft und dürfte nochmals so ca. 250 von knapp 600 Links retten. --Wurgl (Diskussion) 15:54, 14. Jan. 2024 (CET)

Schön, dass da noch was ging. Ich hab noch festgestellt, dass die Suche auf der Zeitungshomepage nicht mit gewandelten Umlauten umgeht, z.B. „ue“. Wenn in der alten URL z.B. steht

eisenach.thueringer-allgemeine.de/web/lokal/politik/detail/-/specific/Protest-zum-Burschentag-in-Eisenach-angekuendigt-1157573249

, so muss in die Suche Protest-zum-Burschentag-in-Eisenach-angekündigt eingegeben werden, um die neue Fassung zu finden.

Ich hoffe, dass die Bots zum Checken von URLs die übrigen Fälle nach und nach finden und für die manuelle Korrektur markieren werden, weil bei den alten URLs „Status: 404“ angezeigt wird. --T. Wirbitzki (Diskussion) 19:22, 14. Jan. 2024 (CET)

Gut beobachtet. Das waren nochmals ca. 625 Artikel die angefasst wurden. --Wurgl (Diskussion) 22:25, 16. Jan. 2024 (CET)

Prima, das hilft enorm, wenn in vielen Fällen wenigstens Autor, Datum und Titel/Lead wieder nur einen Klick entfernt sind.

Die Zahlschranke nimmt hier vermutlich weitere ehemals kostenfreie Belege aus dem Netz. Vereinzelt hab ich Internet-Archivlinks gesucht (Beispiel Eisenach, Edit von heute), das ist mühselig und vielleicht müßig, weil auch die Internet-Archivlinks wegbrechen können. Ich werde sporadisch noch ein paar Kandidaten nach defekten Links und mangelnden bibliografischen Angaben/Belegen durchforsten, schwerpunktmäßig die älteren HTTP- und nicht die neueren HTTPS-Adressangaben.

Aus meiner Sicht hat der Bot hier alles gegeben, so dass der Fall erledigt ist. --T. Wirbitzki (Diskussion) 07:42, 17. Jan. 2024 (CET)

Die Domain „thueringer-allgemeine.de“ haben wir behandelt. Zur gleichen Verlagsgruppe gehören auch noch die Thüringische Landeszeitung (tlz.de) und die Ostthüringer Zeitung (otz.de). Bei deren Domains hat es eine ähnliche Umstellung gegeben, siehe z.B. die veralteten Links http://www.tlz.de/startseite/detail/-/specific/Amy-Winehouse-ist-zurueck-in-den-Charts-1048378292 oder http://www.otz.de/web/zgt/wirtschaft/detail/-/specific/Plastiktueten-Schaedliches-Abfallprodukt-445645144. --T. Wirbitzki (Diskussion) 14:08, 20. Jan. 2024 (CET)

1066 Artikel angefasst und dabei 695 tote Links gerettet. --Wurgl (Diskussion) 21:33, 20. Jan. 2024 (CET)

Kleine Anmerkung: Es ist etwas ungünstig, wenn Apperbot neben der Originalurl auch die Archivurl ändert und diese dann ins Leere laufen, da so nicht im Archiv vorhanden. Könnten eigentlich auch weg, wenn erstere wieder läuft. Aber es geht wohl hauptsächlich um die Bezahlschranke, nehm ich an. Nebenbei: T. Wirbitzki, bitte beim füllen vom Parameter archiv-url mit archive.today auch die ID vom archivierten Zeitpunkt eintragen und das Datum im Parameter archiv-datum nur mit Jahr, Monat und Tag füllen. Sonst, weiter so. --Pintsknife (Diskussion) 22:52, 20. Jan. 2024 (CET)

Ich weiß dass ich die Webarchiv-Links nacharbeiten muss. Bei thueringer-allgemeine waren das genau 2 Stück. Aber nicht mehr heute. --Wurgl (Diskussion) 23:08, 20. Jan. 2024 (CET)

Vielen Dank für den Hinweis zu archive.today, habe ich jetzt berücksichtigt. --T. Wirbitzki (Diskussion) 23:45, 20. Jan. 2024 (CET)

Super, damit ist die Bot-Aktion zu diesem Thema vollständig. Was jetzt noch übrig ist, bleibt der Handarbeit überlassen. --T. Wirbitzki (Diskussion) 00:03, 21. Jan. 2024 (CET)

Archivierung dieses Abschnittes wurde gewünscht von: --T. Wirbitzki (Diskussion) 07:23, 5. Feb. 2024 (CET) --T. Wirbitzki (Diskussion) 07:23, 5. Feb. 2024 (CET)

Sade (Band)

Letzter Kommentar: vor 1 Jahr6 Kommentare3 Personen sind an der Diskussion beteiligt

Bitte Artikel Benutzer:Monokw/Sade_(Band) verschieben in den öffentlichen Raum. Allerdings gibt es im öffentlichen Raum schon eine Weiterleitung title=Sade_(Band) nach Sade_Adu, die dann aufgelöst werden soll.

Den Artikel Sade_(Band) habe ich angelegt, um dort z.B. auch die Bandmitglieder aufzuführen. Sade Adu sagt selbst über ihre Band "We are Sade", deshalb sind auch beide Artikel Sade_Adu und Sade_(Band) zu trennen. Siehe auch Einträge in der englischsprachigen Wikipedia.

Ich würde dann im Artikel Sade_Adu im ersten Absatz den Link auf Sade_(Band) einfügen. Die Information dort, dass ihre Band den Namen Sade führt fehlt dort leider, steht allerdings auf der Seite der Begriffsklärung zu Sade. (nicht signierter Beitrag von Monokw (Diskussion | Beiträge) 13:44, 25. Jan. 2024 (CET))

Es gibt genau zwei Links die fraglich sind und eventuell umgebogen werden sollten, da fehlt mir aber das Wissen:

Die anderen Links auf Sade (Band) passen meiner Meinung nach. Trotzdem: Das ist nix für Bots. Deinen Artikel kannst du selbst verschieben (oder wenn nicht, dann einen Admin fragen). Eventuell kannst du diesen Abschnitt nach Wikipedia Diskussion:Redaktion Musik verschieben, dort wird dir sicher geholfen. --Wurgl (Diskussion) 14:53, 25. Jan. 2024 (CET)

Das Problem ist, dass ich den Artikel nicht verschieben kann, ich erhalte die Meldung: "Die Seite konnte nicht verschoben werden, aus dem folgenden Grund: Unter diesem Namen existiert bereits ein Artikel. Bitte wähle einen anderen Namen."

Kann ich die vorhandene Weiterleitung einfach löschen? Wie? --Monokw (Diskussion) 16:35, 25. Jan. 2024 (CET)

Ich schrubte ja: "oder wenn nicht, dann einen Admin fragen". In Wikipedia Diskussion:Redaktion Musik guckt sicher ein Admin rein. Oder eben bei WP:AA fragen. --Wurgl (Diskussion) 16:44, 25. Jan. 2024 (CET)

Artikel inzwischen im ANR. –IWL04 • 19:59, 19. Feb. 2024 (CET)

Archivierung dieses Abschnittes wurde gewünscht von: –IWL04 • 19:59, 19. Feb. 2024 (CET)

Löschbenachrichtigung

Letzter Kommentar: vor 10 Monaten16 Kommentare6 Personen sind an der Diskussion beteiligt

Aktuell werden Artikelersteller nicht über Löschanträge auf ihren Artikel informiert. Dass das generell wieder ein Bot übernehmen würde, wäre sehr hilfreich. --ɱ 12:35, 2. Apr. 2024 (CEST)

Ich würde mich da gern drum kümmern. --DerIch27 (Diskussion) 17:37, 6. Apr. 2024 (CEST)

Als Benachrichtigungskriterien hätte ich folgendes vorgeschlagen: Ein Nutzer wird informiert, wenn der Artikel auf einer Löschkandidaten-Seite steht und auf den Nutzer eines der folgenden Kriterien

Er hat den Artikel erstellt
Er hat die meisten Beiträge im Artikel (kleine Änderungen 0,2-fach zählend)
Er hat mindestens 30% der Beiträge im Artikel (kleine Änderungen 0,2-fach zählend)

aber keines der folgenden Kriterien

Die Nutzerdiskussionsseite steht auf der Opt-Out Liste.
Auf dem Nutzer wird bereits aus dem entsprechenden Abschnitt verlinkt, d.h. er hat dort wahrscheinlich schon eine signierte Nachricht hinterlassen.
Auf der Nutzerdiskussionsseite gibt es bereits einen Abschnitt, der "lösch" enthält, mit dem Artikellemma als Überschrift, d.h. er wurde wahrscheinlich bereits anderweitig informiert.

zutrifft. Sobald WikiHistory repariert ist, könnte ich das anstatt der Beitragszahlen nutzen. Die Nachricht habe ich an die Nachrichten, die Benutzer:Nordprinz verschickt, angelehnt. Zum Testen habe ich ihn mal auf die heutigen Löschkandidaten losgelassen. Siehe Beiträge. Deckt sich das mit dem Gewünschten? Gruß, DerIch27 (Diskussion) 19:02, 6. Apr. 2024 (CEST)

Hallo, erstmal danke, dass Du Dich drum kümmerst. Per Hand ist das auf Dauer doch etwas mühsam. Ggf. müsste man schauen, was beim früheren xpt-Bot vermerkt ist, der ja nur diese Funktion nicht macht. Ist nur heute zeitlich etwas schlecht.

Allerdings ein Hinweis: ggf. müsste geklärt werden, ob Du für den Bot einen Bot-Flag brauchst. Auch dazu melde ich mich nochmal spät am Abend oder morgen. Freundl. Grüsse --Nordprinz (Diskussion) 19:14, 6. Apr. 2024 (CEST)

@Xqbot, könntest du berichten, woran deine Benachrichtigungen gescheitert sind? --DerIch27 (Diskussion) 19:20, 6. Apr. 2024 (CEST)

Der Diskussionsseite von Xqt zufolge scheint der Bot vor rund 8 Monaten das Versenden der Benachrichtigungen eingestellt zu haben. Xqt war übrigens vor 5 Monaten zuletzt aktiv (Siehe seine Beiträge). Botflag habe ich übrigens vor geraumer Zeit beantragt. Die Antrag verschleppt sich bisher mit dem Argument, die Jobs des Bots seien zu wenig oder so (siehe hier). Gruß, DerIch27 (Diskussion) 20:28, 6. Apr. 2024 (CEST)

Anmerkung: Genau das ist das Problem: Grundsätzlich arbeitet Xqtbot noch. Er macht nur keine Infos über Löschbenachrichtungen mehr. Scheinbar ist irgendwas an den Löschdiskussionen geändert wurden. Deshalb ergänzte TaxonBot diese auch nicht mehr über frühere Löschanträge, siehe Benutzer_Diskussion:TaxonBot/Archiv/2023#Infos_bei_Löschanträgen. Da DocTaxon aktiv, konnte er das Problem bei TaxonBot reparieren. Nur Xqt ist nicht aktiv, weshalb ich die Infos über Löschanträge seit Mitte November 23 per Hand mache. (und mich schon freuen würde, wenn dies wieder maschinell funktionieren würde.) --Nordprinz (Diskussion) 20:55, 6. Apr. 2024 (CEST)

Macht nicht der TabellenBot diese Benachrichtigungen? Siehe Spezial:Beiträge/TabellenBot? --Wurgl (Diskussion) 23:12, 6. Apr. 2024 (CEST)

So wie ich das sehe, informiert der TabellenBot nicht, wenn eine Seite zum Löschen vorgeschlagen wurde, sondern erst wenn sie gelöscht wurde. --DerIch27 (Diskussion) 23:18, 6. Apr. 2024 (CEST)

Richtig. Der Xpqbot informierte über einen Löschantrag. Und seit Mitte November 23 spiele ich Bot per Hand. Der Tabellenbot informiert über die Löschung. --Nordprinz (Diskussion) 23:52, 6. Apr. 2024 (CEST)

Kann ich den Dauerbetrieb eigentlich anwerfen oder soll ich auf die Flag warten? --DerIch27 (Diskussion) 22:43, 7. Apr. 2024 (CEST)

@DerIch27: Schön wäre es, wenn du {{nobots|DerIchBot}} und {{bots|deny=DerIchBot}} ebenfalls als OptOut unterstützen würdest, oder geht das schon?
Nett wäre auch eine Auswertung von Benutzer:Xqbot/Opt-out:LD-Hinweis. Murdoch Mysteries Episodenliste- und Die Legenden von Andor-Aktualisierer 11:01, 10. Apr. 2024 (CEST)

Vielen Dank für den Hinweis. Die Liste von XqBot hatte ich tatsächlich schon gefunden und berücksichtigt. Die Vorlagen werte ich aktuell nicht aus, kann ich aber natürlich gerne machen. Werde ich aber heute nicht zu kommen. Gruß, DerIch27 (Diskussion) 12:22, 10. Apr. 2024 (CEST)

@DerIch27: Das Bot-Flag musst du hierfür nicht abwarten.

Löschbenachrichtigungen darf jeder (auch manuell) auf BD schreiben.
Bei individuellen Einzelnachrichten wie dieser hier ist es auch später sinnvoll, wenn sie ohne Bot-Flag geschrieben werden: Alle Mitlesenden aus gleichem Interessengebiet bekommen das auf ihrer Beo mit, selbst wenn sie nicht persönlich adressiert wurden, und können ggf. auch Urlaubsvertretung machen.

VG --PerfektesChaos 18:02, 10. Apr. 2024 (CEST)

Danke für die Antwort. Ich hatte den Bot eben für eine Weile laufen, hab ihn aber erstmal wieder gestoppt, weil sich die Benachrichtigungskriterien als nicht ideal herausgestellt haben und es an anderer Stelle Verhalten des Bots gab, dass ich mir nicht erklären konnte, ich aber gerade keine Zeit habe, mir das tiefer anzuschauen --DerIch27 (Diskussion) 20:09, 10. Apr. 2024 (CEST)

Bot läuft jetzt wieder. Er berücksichtigt jetzt auch die Artikelgrößenänderung bei der Hauptautorenschätzung und loggt vor allem mehr, damit ich irgendeine Chance habe, seine Entscheidungen stichprobenartig nachzuvollziehen. Berücksichtigung der nobot-Vorlagen folgt dann die nächsten Tage. Wenn niemand widerspricht, kann der Abschnitt dann archiviert werden. Wenn es noch Probleme gibt, gerne auf meine Benutzerdisk.--DerIch27 (Diskussion) 15:05, 13. Apr. 2024 (CEST) :Archivierung dieses Abschnittes wurde gewünscht von: --DerIch27 (Diskussion) 15:05, 13. Apr. 2024 (CEST)

toollabs im ANR

Letzter Kommentar: vor 9 Monaten6 Kommentare2 Personen sind an der Diskussion beteiligt

Es betrifft Artikel, die toollabs enthalten; knapp 700.

toollabs ist schon mal veraltet, weil die Tool/Labs, auf die sich das bezieht, seit einigen Jahren nicht mehr existieren.
Es hat aber auch Auswirkungen auf Performance; sowohl für die Wiki-Farm aber damit auch für die Anwendenden:
- Inzwischen hat jedes Werkzeug einen festen Server bekommen, und dieser eine dauerhafte IP-Adresse. Auf einem Server können mehrere Werkzeuge aktiv sein. Aber damit hat jedes Werkzeug seine eigene IP-Adresse und kann direkt auf der richtigen Hardware ausgeführt werden.
- Die veraltete Verlinkung führt zunächst einmal auf ein Pseudo-Werkzeug iw (für Inter-Wiki).
- Dieses eine Werkzeug bekommt sämtliche Anfragen aus veralteten Verlinkungen aus aller Welt und leitet diese dann in einem zweiten Schritt auf den richtigen Server weiter.
- Damit funktioniert aber die automatische Lastverteilung nicht mehr, mit dem Werkzeuge so konfiguriert werden, dass sie ggf. eigene Server bekommen, und jeder Server genau die richtige Anzahl an Werkzeugen versorgt. Vielmehr bekommt iw zu viele. Damit erhöht sich ggf. die Antwortzeit.

Es ist zu ersetzen:

{{fullurl:toollabs:wikitools/listcoord.php|page={{FULLPAGENAMEE}}&imagecheck}} (oder analog) durch:
https://wikitools.toolforge.org/listcoord.php?page={{FULLPAGENAMEE}}&imagecheck&lang=de

Wenn wir schon mal hier sind – die nachstehenden Bezeichner von Vorlagen sind bei diesem Edit aktualisierungsbedürftig:

Für toolforge gelten die obigen Betrachtungen zwar analog, stehen aber momentan noch nicht auf der Agenda.

Zuvor sind gründlichere Erforschungen des Bestands erdorderlich, und es geht nicht nur um ein einzelnes Werkzeug listcoord.

Danke im Voraus --PerfektesChaos 20:56, 29. Feb. 2024 (CET)

Ich guck mal … --Wurgl (Diskussion) 22:09, 29. Feb. 2024 (CET)

Ein Testedit: Spezial:diff/242692655 … und du willst (erstmal) nur fullurl:toollabs:wikitools/listcoord.php ersetzen? --Wurgl (Diskussion) 22:47, 29. Feb. 2024 (CET)

Jau, danke, korrekt; und die Kombination toollabs + listcoord ist maßgeblicher Trigger.

Es gibt wohl noch 5 andere toollabs, die jedoch individuell und durch die „Hauptautoren“ aufgearbeitet werden müssten.

Alles andere, also Vorlagen-WL, sind dann nur Beifang.

VG --PerfektesChaos 23:20, 29. Feb. 2024 (CET)

Ist durch. --Wurgl (Diskussion) 08:44, 1. Mär. 2024 (CET)

Archivierung dieses Abschnittes wurde gewünscht von: --Wurgl (Diskussion) 16:31, 30. Apr. 2024 (CEST)

%26

Letzter Kommentar: vor 9 Monaten9 Kommentare4 Personen sind an der Diskussion beteiligt

Mag jemand insource:/ %26 / durch & ersetzen? --Leyo 13:43, 16. Apr. 2024 (CEST)

Läuft in der Nacht. --Wurgl (Diskussion) 14:38, 16. Apr. 2024 (CEST)

Ist durch. --Wurgl (Diskussion) 12:19, 17. Apr. 2024 (CEST)

Danke! Hast du auch sichtbare Vorkommen ohne Leerzeichen korrigiert? Mittels insource:/[a-z]%26[A-Z]/ scheinen jedenfalls nur Fälle, bei welchen %26 Teil der URL oder das Dateinamens ist, gefunden zu werden. --Leyo 14:22, 18. Apr. 2024 (CEST)

Mittels insource:/_%26_/ kommen auch verschiedene Wikilinks bzw. Dateinamen im Ergebnis vor (ähnlich wie bei der ursprünglichen Suche mit den Leerzeichen), und natürlich jede Menge URLs. Sichtbare Prozent-Codierungen scheinen da jedenfalls keine dabei zu sein. lg --Invisigoth67 (Disk.) 14:42, 18. Apr. 2024 (CEST)

Ich weiß nicht so recht, da muss man aufpassen. https://organindex.de/index.php?title=Kategorie:F%C3%B6rster_%26_Nicolaus ist okay. https://organindex.de/index.php?title=Kategorie:F%C3%B6rster_&_Nicolaus ist falsch

Hingegen: http://www.bain.com/Images/BAIN_BRIEF_Management_Tools_%26_Trends_2013.pdf leitet nach http://www.bain.com/Images/BAIN_BRIEF_Management_Tools_&_Trends_2013.pdf weiter

Das ist etwas (zu) heiß. --Wurgl (Diskussion) 15:12, 18. Apr. 2024 (CEST)

Naja, die Domain muss natürlich ein MediaWiki-Wiki abbilden; namentlich: .wikipedia.org/wiki/ --PerfektesChaos 15:35, 18. Apr. 2024 (CEST)

@Wurgl: Ich habe eigentlich eh gemeint, dass da nichts mehr zu tun ist, wenn keine im angezeigten Artikel sichtbaren %26 mehr vorhanden sind. Bei den Wikilinks, Dateinamen und URLs wird das ohnehin automatisch umcodiert, das kann also eigentlich alles so bleiben. lg --Invisigoth67 (Disk.) 16:04, 18. Apr. 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --Wurgl (Diskussion) 16:30, 30. Apr. 2024 (CEST)

Vorlage:Google Buch mit ungültigem Parameterwert

Letzter Kommentar: vor 9 Monaten9 Kommentare4 Personen sind an der Diskussion beteiligt

Innerhalb Kategorie:Wikipedia:Vorlagenfehler/Vorlage:Google Buch gibt es teilweise Parameterwerte mit folgendem Schema:

BuchID *= *............&pg *[|}]
Das Anhängsel &pg ist sinnfrei und stört.
............ sind 12 Zeichen [-A-Za-z_0-9]
Es soll nur das &pg herausgeschnitten werden, wenn es allein am Ende des Parameterwerts steht.

Danke im Voraus --PerfektesChaos 12:18, 19. Apr. 2024 (CEST)

Moin zusammen, sollte ein &dq das Ende sein, dann bitte auch weg nehmen ;) mfg --Crazy1880 15:16, 19. Apr. 2024 (CEST)

Rückfrage: Also sowas wie BuchID=bPcfAAAAIAAJ&oi=fnd&pg ebenfalls rausnehmen oder ist das nicht "alleine" weil ja "oi=fnd" auch zu finden ist. --Wurgl (Diskussion) 16:55, 19. Apr. 2024 (CEST)

Najaaaa – der ist zwar auch wirkungslos, könnte in diesem Fall auch ohne &pg weil nur was wie &pg=17 wirksam, aber das wird dann irgendwann etwas heikel, alle Kombinationen durchzuspielen und wie Google irgendwas bewerten würde.

Die Fälle kamen zustande, weil serienmäßig die URL irgendwie manuell gesplittet wurde und der Vorlagenparameter SeitenID zugewiesen wurde, und das Zeugs davor stehenblieb.

Erstmal soll also der Massenanfall in der Wartungskat reduziert werden, damit dann manuell durchgeguckt werden kann, was von den Resten funktioniert oder weg kann.

Danke fürs Kümmern --PerfektesChaos 17:20, 19. Apr. 2024 (CEST)

Okay, also nur wenn 12 Zeichen und danach ein naggisches &pg, &dq oder ein einsames & (hab ich auch gesehen) vorkommt. --Wurgl (Diskussion) 17:42, 19. Apr. 2024 (CEST)

Ja, nacktes & liefert eine Google-URL id=ABCDEFGHIJKL&&pg=17 und abgeschnittenes &pg bringt id=ABCDEFGHIJKL&pg&pg=17 – funktionieren googleseitig wohl alle, aber erschweren es, die richtig falschen Kombinationen herauszufinden.

VG --PerfektesChaos 17:48, 19. Apr. 2024 (CEST)

Ein id=......#v=onepage sollte auch entfernt werden können.--Mabschaaf 17:54, 19. Apr. 2024 (CEST)

Bot ist durch. Ich bau das in den nächtlichen Botlauf ein. --Wurgl (Diskussion) 20:17, 19. Apr. 2024 (CEST)

:Archivierung dieses Abschnittes wurde gewünscht von: --Wurgl (Diskussion) 16:29, 30. Apr. 2024 (CEST)

Vorlage:Infobox Fluggesellschaft – Webseite > Website

Letzter Kommentar: vor 9 Monaten5 Kommentare2 Personen sind an der Diskussion beteiligt

Moin Moin zusammen, ich habe die o.g. Vorlage von falschen Parametern bereinigt und gut auf Stand. Wäre es möglich via Bot den alten Parameter |Webseite= nach |Website= zu setzen, dass wäre 500 Bearbeitungen manuell ersparen. Vielen Dank im Voraus --Crazy1880 14:01, 5. Mai 2024 (CEST)

Läuft. --Wurgl (Diskussion) 14:47, 5. Mai 2024 (CEST)

@Crazy1880: Bot ist durch. --Wurgl (Diskussion) 16:35, 5. Mai 2024 (CEST)

Moin Wurgl, das ging ja schnell, vielen vielen Dank --Crazy1880 18:40, 5. Mai 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --Crazy1880 18:40, 5. Mai 2024 (CEST)

Links auf Websites von Hamburger Abendblatt und Berliner Morgenpost

Letzter Kommentar: vor 9 Monaten26 Kommentare3 Personen sind an der Diskussion beteiligt

Hallo @Wurgl.

Anfang des Jahres wurden von Dir per Bot Links zu drei Zeitungen repariert, die zu einer Verlagsgruppe gehören, welche noch ca. 10 weitere Zeitungen umfasst.

Mir sind noch zwei weitere Zeitungen aus der Gruppe aufgefallen, deren Webauftritt sehr ähnlich zu bereits behandelten ist. Mit etwas Glück lässt sich durch den alten Link oder durch die Linkbeschriftung ein gültiger Ersatzlink finden. Wieviele Links auf die beiden Zeitungen defekt sind, weiß ich nicht, aber es gibt welche.

Beispiele

Hamburger Abendblatt

Defekter Link in Kanada

http://www.abendblatt.de/politik/ausland/article2125195/Kanada-steigt-aus-Kyoto-Protokoll-aus.html

kann durch Suche auf der Website nach „Kanada-steigt-aus-Kyoto-Protokoll-aus“ ersetzt werden (letzter von 2 Treffern):

https://www.abendblatt.de/politik/ausland/article108199006/Kanada-steigt-aus-Kyoto-Protokoll-aus.html

Defekter Link in Griechenland

http://www.abendblatt.de/wirtschaft/article1404862/Griechenland-erhoeht-die-Steuern-und-senkt-Gehaelter.html

kann durch Suche auf der Website nach „Griechenland-erhöht-die-Steuern-und-senkt-Gehälter“ ersetzt werden (letzter von 3 Treffern):

https://www.abendblatt.de/wirtschaft/article107655849/Griechenland-erhoeht-die-Steuern-und-senkt-Gehaelter.html

Berliner Morgenpost

Defekter Link in Ministerium für Staatssicherheit

http://www.morgenpost.de/printarchiv/biz/article1248445/Mielkes-mafioese-Methoden.html

kann durch Suche auf der Website nach „Mielkes-mafiöse-Methoden“ ersetzt werden:

https://www.morgenpost.de/printarchiv/biz/article103950424/Mielkes-mafioese-Methoden.html

Defekter Link in Euro

http://www.morgenpost.de/content/2007/04/11/politik/893618.html/

kann durch Suche auf der Website nach „Deutsche Wirtschaft bringt Europa nach vorn“ ersetzt werden (27. von 28 Treffern):

https://www.morgenpost.de/printarchiv/politik/article103125119/Deutsche-Wirtschaft-bringt-Europa-nach-vorn.html

Kannst Du Dir das bitte anschauen? Lässt sich die Verfahrensweise der Aktion vom Januar wiederholen? Links auf Webarchive brauchen nicht behandelt zu werden. --T. Wirbitzki (Diskussion) 16:45, 27. Mär. 2024 (CET)

Freitag guck ich, ich will vorher noch was anderes fertig machen. --Wurgl (Diskussion) 17:13, 27. Mär. 2024 (CET)

:-)

--T. Wirbitzki (Diskussion) 17:53, 27. Mär. 2024 (CET)

Also das ist ein wenig anders, vor allem sie Artikel hatten nicht die Zeichenfolge "id-<nummer>" sondern schon das neue "article<nummer>", aber egal.

Es gibt aber seltsames Verhalten:

Der Link https://www.morgenpost.de/politik/article233927291/cannabis-legalisierung-ampel-koalitionsvertrag-plaene-spd-fdp-gruene.html leitet weiter zur www.waz.de und dann passen natürlich die anderen Parameter von Vorlage:Internetquelle nicht so ganz toll, siehe Cannabis als Rauschmittel bzw. Spezial:Diff/243555604, ebenso Hanf und Rechtliche Regelungen zu Cannabis nach Ländern

Die Links auf die mobile Version (m.abendblatt.de bzw. mobil.abendblatt.de) leiten zur Hauptseite um, das kann ich lösen. Ist in Krankenhaus Jerusalem bzw. Spezial:Diff/243555688 aufgetreten. Ebenso das unnötige ":443" (Portnummer ist 443 und dieses 443 ist bei https ohnehin Standard)

Jetzt ist die Frage: Was tun bei Weiterleitungen auf andere Zeitung? Ich lass die erstmal aus. --Wurgl (Diskussion) 18:37, 29. Mär. 2024 (CET)

Und diese Weiterleitung ist auch seltsam: https://www.abendblatt.de/ratgeber/article215483857/Zeitumstellung-2019-Stellt-iPhone-und-Smartphone-automatisch-auf-Winterzeit.html die URL deutet auf Informationen zum Jahr 2019 hin, der Link geht aber aktuell auf die Umstellung in 2024? aus Sommerzeit … Diese Änderungen wo sich diese id nicht ändert werde ich auslassen. --Wurgl (Diskussion) 19:28, 29. Mär. 2024 (CET)

Fun-Fact: Was belegt wird, der Umgang mit Tieren nach einer Zeitumstellung, ist in beiden Versionen gleich behandelt, siehe archivierte Version von 2019. Solche Änderungen nicht automatisiert zu machen, ist dennoch richtig. --T. Wirbitzki (Diskussion) 23:02, 3. Apr. 2024 (CEST)

@T. Wirbitzki: Wäre nett wenn du dir diese 80 Diffs anguckst. Die oberen 50 sind so wie es sein soll, die unteren 30 sind diejenigen wo ich noch Probleme entdeckt habe. --Wurgl (Diskussion) 23:27, 29. Mär. 2024 (CET)

Angeguckt und bis auf einige wenige Fälle für gut befunden.

Die 2 Verschiebungen von morgenpost auf waz sind zwar belegtechnisch richtig, nur die Beschriftung muss manuell überarbeitet werden.

Ja, eben deshalb mag ich die nicht anfassen. Ich kann nachher eine Liste dieser Links basteln. --Wurgl (Diskussion) 10:57, 30. Mär. 2024 (CET)

Das unnötige 443 ist auch in Volksgesetzgebung in Hamburg und Oedeme aufgetreten, stört aber nicht.

Kommt nicht mehr vor, die paar die drinnen sind lass ich erstmal. --Wurgl (Diskussion) 10:57, 30. Mär. 2024 (CET)

Die Wiederverwendung der Artikelnummer bei abweichendem Zusatz hinter der Artikelnummer ist in Sommerzeit und in Esso-Häuser aufgetreten. Der Server schlägt für http://www.abendblatt.de/hamburg/altona/article123201136/Senat-ist-in-der-Pflicht-die-Flora-Problematik-zu-loesen.html den abweichenden Ersatz https://www.abendblatt.de/hamburg/altona/article123201136/Kritik-an-Randalierern-Politik-und-Polizei-nach-Krawallen.html mit gleicher Artikelnummer vor. Das kommt mir für automatische Änderungen auch zu gefährlich vor. Steht jedoch hinter der Nummer beide mal dasselbe, ist das ein anderer Fall. Allerdings können wir triviale Fälle wie http://www.mobil.abendblatt.de/hamburg/article119681246/Ex-Senator-Frigge-wegen-Untreue-vor-Gericht.html im Artikel Carsten Frigge auch aus der Maßnahme herauslassen, weil hier nur von http auf https umgeschaltet wird, solche Links funktionieren ja eigentlich noch. Ich hätte nichts gegen die Ersetzung von http://www.mobil... oder http://mobil... zu https://www....

Ich prüfe ob der "Textteil" in der Url gleich bleibt, wenn sich der ändert, dann fass ich das nicht an. Könnte ebenfalls nachher eine Liste machen.

Das www.mobil.abendblatt.de nach www.abendblatt.de mach ich aus zwei Gründen: 1.) passt bei https das Zertifikat nicht und 2.) leitet jeder Link nach mobil.abendblatt.de auf die Hauptseite, ich fürchte dass irgendwann das selbe mit www.mobil.abendblatt.de passiert. Das möchte ich gerne weiterhin ändern, auch wenn es eine Trivialänderung ist. --Wurgl (Diskussion) 10:57, 30. Mär. 2024 (CET)

Ja, stimmt, mein Beispiel war nicht gut gewählt. Eine wirklich simple Änderung ist eine, die *nur* aus einem http ein https macht und sonst nix, z.B. im selben Artikel

http://www.abendblatt.de/hamburg/kommunales/article107889553/Finanzsenator-Frigge-tritt-zurueck-Kruse-wird-Nachfolger.html

zu

https://www.abendblatt.de/hamburg/kommunales/article107889553/Finanzsenator-Frigge-tritt-zurueck-Kruse-wird-Nachfolger.html

.

In diesem Fall ist der Link nicht defekt. Wenn auch der ursprüngliche Link schon „STATUS 404“ liefert, wäre es eventuell ein Kandidat für eine Todo-Liste, andererseits findet man diese Fälle später ja auch über insource:"abendblatt.de/" insource:/[^\/]http:\/\/www\.abendblatt\.de/ (noch sind's über 3000, inklusive der trivialen). --T. Wirbitzki (Diskussion) 13:12, 30. Mär. 2024 (CET)

Fixed. Problem war hier, dass der Server beim http-Link eine Umleitung nach https meldet (Status 301 oder 302) und erst beim https-Link den Status 404. --Wurgl (Diskussion) 16:46, 30. Mär. 2024 (CET)

In einigen Fällen meldet der Server sowohl vor als nach der Ersetzung ein HTTP 404, und zwar in der Response in der Zeile <span class="text-overline inline-block uppercase">Status: 404</span>, z. B. https://www.abendblatt.de/archive/1991/pdf/19910624.pdf in Andy Grote, https://www.abendblatt.de/daten/2005/02/18/400494.html in Bahnstrecke Berlin–Hamburg und https://www.abendblatt.de/hamburg/article210113085/Buendnis-von-Hamburger-Studierenden-G20-Gipfel-verhindern.html in G20-Gipfel in Hamburg 2017. Das würde ich lieber auch aus der Aktion rausnehmen.

Okay, da muss ich gucken warum/wieso. --Wurgl (Diskussion) 10:57, 30. Mär. 2024 (CET)

Fixed. siehe oben. --Wurgl (Diskussion) 16:46, 30. Mär. 2024 (CET)

Es gibt unbehandelte Fälle, wie http://mobil.abendblatt.de/hamburg/article133864056/Stadt-Hamburg-kauft-Rote-Flora-fuer-820-000-Euro.html in Schulterblatt (Straße), hier würde die Ersetzung durch https://www.abendblatt.de/hamburg/altona/article133864056/Stadt-Hamburg-kauft-Kretschmer-die-Rote-Flora-ab.html helfen. Wurde vielleicht deswegen nichts gemacht, weil die Linkbeschriftung im Artikel fehlt?

Das war nicht beim letzten Durchgang, da hab ich noch nachgebessert, beim nächsten Lauf werde ich das wohl finden. --Wurgl (Diskussion) 10:57, 30. Mär. 2024 (CET)

Wenn Weiterleitungen auf andere Server, Wiederverwendungen von Artikelnummern und HTTP-404-Fehler aus den automatischen Änderungen rausgenommen werden, könnten sie evtl. in eine Todo-Liste für alternative Belege geschrieben werden? Gerne in meinem BNR, wenn die Liste nicht zu lang wird ;-)

Die Problemfälle aus den 80 Diffs werde ich nacharbeiten, habe mir Notizen gemacht. --T. Wirbitzki (Diskussion) 09:50, 30. Mär. 2024 (CET)

Nur zur Info: Ich hab über 12.000 Artikel mit Links auf die beiden Seiten, ist also recht viel. Wie viele ich anfassen werde, ist unklar. Beim letzten 50er Lauf sind 50 von 72 Artikeln angefasst worden, es kann also um die 8000 Edits geben. --Wurgl (Diskussion) 10:57, 30. Mär. 2024 (CET)

Danke für die Hinweise, bin bei allem dabei. Vielleicht sollte nochmal ein Probelauf mit angucken stattfinden. Über Umarbeitungen von morgenpost.de haben wir noch nicht so viel erfahren, vielleicht gibt es da auch weniger Fälle, die für eine Bot-Aktion geeignet sind. --T. Wirbitzki (Diskussion) 12:27, 30. Mär. 2024 (CET)

Morgenpost sind auch recht wenige umzustellen. Bei 270 Artikeln waren nur 7 mit einer Änderung, insgesamt nur 49 mobil-links. Jedenfalls laufen die nach dem selben Schema (im gleichen Script). --Wurgl (Diskussion) 16:46, 30. Mär. 2024 (CET)

@T. Wirbitzki: ab hier sind (teilweise vermischt mit dem nächtlichen Botlauf) 50 Änderungen, die obersten 17 hab ich angeguckt und nix gefunden wo was falsch war. Hab am späten Nachmittag noch ein Problem mit Links gehabt, bei denen /archiv/<jahr>/ in der Url war, da wurden unpassende gefunden (weil der Textteil in der URL nicht eindeutig war, ich prüfe bei solchen Links jetzt auch, ob die Jahreszahl passt. --Wurgl (Diskussion) 09:00, 31. Mär. 2024 (CEST)

Ja, sowas wie http://www.abendblatt.de/archiv/1973/article201354897/Personalien.html war problematisch, gut dass Du das gesehen hast. Ich schaue bis morgen auch noch mal drüber. --T. Wirbitzki (Diskussion) 09:18, 31. Mär. 2024 (CEST)

Habe die Änderungen vom 31.3. durchgeschaut und nichts Auffälliges gefunden. Selten scheint die Funktion "Link in neuem Tab öffnen" in meinem Chrome-Browser trotz korrekter Selektion zu versagen, ich glaub das hat nichts zu bedeuten. Wiederhole ich das Öffnen oder gehe ich über "Link zum markierten Text kopieren", dann funktioniert der zu prüfende Link.

In Amerikanisches Generalkonsulat in Hamburg hat der Bot im Fall "article131011930" korrekterweise *nichts* gemacht, weil die Server-Weiterleitung eine neue Überschrift bekam, vielleicht wieder ein Fall für ein Todo-Protokoll. So nebenbei habe ich bei Internetquellen Fälle von "zugriff=..." statt "abruf=..." gesehen, vielleicht kann man das als "Beifang" mitnehmen. --T. Wirbitzki (Diskussion) 01:05, 1. Apr. 2024 (CEST)

@Crazy1880: Was meinst du zum Tausch zugriff gegen abruf (bzw. noch allgemeiner: Jeden Aliasparameter gegen den originalen tauschen)? --~~

Bot ist durch. 2023 Artikel ab hier sind angefasst. Den zugriff hab ich gegen abruf getauscht, aber nur dieses eine Alias, die anderen hab ich nicht angefasst (alle anfassen ist nicht gut, weil es gibt ein paar Parameter wo die Schweizer Version ein ss hat, die nicht-Schweizer Version ein ß und vielleicht noch weitere), aber ev. hat Crazy1880 noch ein paar die ich so ändern soll. --Wurgl (Diskussion) 08:19, 5. Apr. 2024 (CEST)

Das ist eine gute Ausbeute. Ich vermute, die restlichen Links (z. B. diese) müssen manuell überarbeitet werden.

Im Artikel Bewusstsein ist ein toter Link (Fußnote 33) http://www.abendblatt.de/daten/2003/01/03/109897.html auf einen Artikel namens „Der sprechende Affe.“ Auf der Homepage der Zeitung kann ich den Originalartikel finden: https://www.abendblatt.de/suche/?query=Der+sprechende+Affe. Die Treffer sind kompliziert ins HTML eingebettet, und es könnte auch der 500. Treffer von 600 sein.

Fies sind auch Fälle, wo die Homepage aufgrund gleicher Artikelnummer einfach mal weiterleitet (http://www.abendblatt.de/region/norddeutschland/article155486/Erweiterter-Selbstmord.html, nun hinter Bezahlschranke unter https://www.abendblatt.de/region/norddeutschland/article106753293/Erweiterter-Selbstmord.html). --T. Wirbitzki (Diskussion) 18:08, 6. Apr. 2024 (CEST)

Ich wüsste nicht, wie die verbleibenden Fälle automatisiert bereinigt werden könnten, daher kann dieser Abschnitt von mir aus archiviert werden. --T. Wirbitzki (Diskussion) 09:30, 4. Mai 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: Soll ins Archiv. Murdoch Mysteries Episodenliste- und Die Legenden von Andor-Aktualisierer|2=08:25, 6. Mai 2024 (CEST)

Links auf Peter Mühlbauer löschen

Letzter Kommentar: vor 8 Monaten5 Kommentare2 Personen sind an der Diskussion beteiligt

Peter Mühlbauer wurde gelöscht (Löschdiskussion). Dabei wurden die über 60 Links in Artikeln auf den gelöschten Artikel nicht entlinkt. Da das händisch viel Aufwand ist, würde ich mich freuen, wenn wer alle Links von Artikeln auf Peter Mühlbauer entfernen könnte. Vielen Dank. Beste Grüße --Fan-vom-Wiki (Diskussion) 01:05, 25. Mai 2024 (CEST)

Läuft. --Wurgl (Diskussion) 08:32, 25. Mai 2024 (CEST)

@Fan-vom-Wiki: Bot ist durch. --Wurgl (Diskussion) 09:33, 25. Mai 2024 (CEST)

Herzlichen Dank! --Fan-vom-Wiki (Diskussion) 14:58, 25. Mai 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --Fan-vom-Wiki (Diskussion) 14:58, 25. Mai 2024 (CEST)

Dateiattribute, Seitentitel und Sortierung

Letzter Kommentar: vor 8 Monaten7 Kommentare2 Personen sind an der Diskussion beteiligt

Ich möchte am Wochenende folgenden Botlauf machen:

Dateiattribute korrigieren (ca. 1800 Artikel)
- mini/miniatur/thumb/thumbnail/frame/framed/gerahmt inkludiert rand/border; rand/border wird entfernt
- mini/miniatur/thumb/thumbnail inkludiert rechts/right; rechts/right wird entfernt
- px-Angabe ignoriert hochkant/upright; hochkant/upright wird entfernt
- Die Bildbeschreibung kommt immer ans Ende
- Bei solchen Änderungen wird dann auch die Reihenfolge einheitlich gemacht
  1. mini/gerahmt/rahmenlos
  2. hochkant/px
  3. rand
  4. links/rechts/zentriert/ohne
  5. grundlinie/tief/hoch/oben/…
  6. alle weiteren Attribute
  7. Bildbeschreibung
Doppelte {{SORTIERUNG:xxx}} entfernen (bzw. DEFAULTSORT) (ca. 80 Artikel)
Doppelte {{SEITENTITEL:xxx}} entfernen (bzw. DISPLAYTITLE) (ca. 10 Artikel)
Nicht notwendiges {{SEITENTITEL:xxx}} entfernen (bzw. DISPLAYTITLE), also wenn das Lemma identisch mit der Angabe ist (ca. 340 Artikel)

Zusätzlich falls der Artikel angefasst wird

Deutsche Schlüsselworte statt der engl. (DISPLAYTITLE => SEITENTITEL, REDIRECT => WEITERLEITUNG, DEFAULTSORT => SORTIERUNG, engl. Bildattribute wie thumb => mini, border => rand, etc.)

Zusammen sind das ca. 2200 Artikel. Siehe auch Benutzer Diskussion:PerfektesChaos/js/WikiSyntaxTextMod, dort ist auch ein Diff für die Änderungen der Bildattribute verlinkt.

Wenn es Einwände und/oder Anregungen gibt, bitte gerne. --Wurgl (Diskussion) 10:19, 31. Mai 2024 (CEST)

hallo Wurgl, entschuldige, ich nerve nochmal, ich habe mich wohl nicht klar auszudrücken vermocht. ich würde nur die nach folgenden umsortierungen machen:

1) mini/gerahmt/rahmenlos

2)

hochkant/px
rand
links/rechts/zentriert/ohne
grundlinie/tief/hoch/oben/…
alle weiteren Attribute

3) alt/alternativtext

4) Bildbeschreibung (Legnde/Tooltip)

in 1) wird die generelle einbindungsart festgelegt; 2) alles andere, reihenfolge innerhalb von 2) egal; zum schluss die attribute des bildinhalts betreffend - 3) der alt text für blinde, und am ende 4) bildlegende (tooltip)

innerhalb von 2) nichts umschieben, nur dafür sorgen, dass es nach 1) und vor 3) bzw 4) kommt.

gruss, --Wetterwolke (Diskussion) 14:42, 31. Mai 2024 (CEST)

Das schaffst du nicht … also mich zu nerven schaffst du nicht ;^)

Okay, hab die Sortierung angepasst und neuen Diff erzeugt. --Wurgl (Diskussion) 16:07, 31. Mai 2024 (CEST)

na dann noch weitere hinweise :)

Dateieinbingen die du änderst sehen gut aus, aber es könnte noch ein bischen mehr beifang geben bei seiten die du eh anfässt, nicht aber aber eine dateieinbindug diff Seelenzorn, statt

Seelenzorn-DDT-Lahr.jpg|alt=Seelenzorn-DDT2009|mini|Seelenzorn auf dem 30. Dark Dance Treffen in Lahr. zu belassen, besser mitändern zu

Seelenzorn-DDT-Lahr.jpg|mini|alt=Seelenzorn-DDT2009|Seelenzorn auf dem 30. Dark Dance Treffen in Lahr.

oder diff Hans Hummel (Orgelbauer) nebenbei aus

Olkusz.Orgel.jpg|alt=|mini|Hans-Hummel-/Georg-Nitrowski-Orgel von 1611–1633 in Olkusz besser

Olkusz.Orgel.jpg|mini|alt=|Hans-Hummel-/Georg-Nitrowski-Orgel von 1611–1633 in Olkusz machen

alt= sollte immer der (vor-)letzte parameter sein (nur gefolgt von der legende) diff Liste der Denkmale der Stadt Arnsberg statt

Denkmalplakette Nordrhein-Westfalen 2010.svg|120px|alt=Schildförmige Denkmalplakette [...] mittig ein Nagel.|rechts|Denkmalplakette des Landes Nordrhein-Westfalen

besser

Denkmalplakette Nordrhein-Westfalen 2010.svg|120px|rechts|alt=Schildförmige Denkmalplakette [...] mittig ein Nagel.|Denkmalplakette des Landes Nordrhein-Westfalen

Bei den Sortierungen, sollte {{SORTIERUNG:xxx}} immer direkt vor den Kategorien stehen, im letzten diff Caspar Herrmann (auch diff Tōchō-ji), sieht es aus, als ob du die einbindung am richtigen platz entfernst, und die am falschen platz belässt. --Wetterwolke (Diskussion) 20:41, 31. Mai 2024 (CEST)

Okay! Das dritte war ein echter Fehler. Die ersten beiden hab ich auch gemacht. --Wurgl (Diskussion) 21:09, 31. Mai 2024 (CEST)

Bot ist durch --Wurgl (Diskussion) 06:48, 2. Jun. 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --Wurgl (Diskussion) 06:48, 2. Jun. 2024 (CEST)

Linkänderung

Letzter Kommentar: vor 6 Monaten10 Kommentare5 Personen sind an der Diskussion beteiligt

Ich wurde hierher verwiesen. Bei [1] sollte

http://www.uniprot.org/uniprot/

nach

https://www.uniprot.org/uniprotkb/

geändert werden. Ein Teil könnte so[2] oder ohne "kurz"[3] ersetzt werden. --162.23.30.16 16:04, 21. Jun. 2024 (CEST)

Fälle wie [https://www.uniprot.org/uniprot/P84487 Caerulein] würde ich nicht durch die Vorlage ersetzen, wg. WP:KORR. Die Vorlage gestattet es nicht, den Titel wie bei einer Internetquelle anzupassen.

In den restlichen Fällen würde ich nur das uniprotkb einpflanzen oder noch gar nichts machen, weil der Server ja eine Umleitung bereitstellt. --T. Wirbitzki (Diskussion) 10:30, 29. Jun. 2024 (CEST)

Jetzt schon, aber vielleicht irgendwann einmal nicht mehr. 194.230.147.31 11:17, 29. Jun. 2024 (CEST)

Habe mal in der Diskussion der Vorlage die Frage gestellt, ob ein Parameter für einen individuellen Titel sinnvoll wäre. --T. Wirbitzki (Diskussion) 00:15, 12. Jul. 2024 (CEST)

Erledigt Murdoch Mysteries Episodenliste- und Die Legenden von Andor-Aktualisierer 13:16, 25. Jun. 2024 (CEST) Grund: Mit AWB erledigt; ich bin der Meinung, es sollten keine falschen Links mehr gefunden werden.

Doch[4] 194.230.146.217 14:14, 25. Jun. 2024 (CEST)

Habe ich mittlerweile auch schon festgestellt (ich hatte nur nach http://www.uniprot.org/uniprot/ gesucht und nicht nach https://www.uniprot.org/uniprot/) und bin weiter am Abarbeiten. Schöner wäre es natürlich, wenn sich ein Botbetreiber finden würde. Halbautomatisch ist das echt eine Strafe. Murdoch Mysteries Episodenliste- und Die Legenden von Andor-Aktualisierer 14:21, 25. Jun. 2024 (CEST)

Ich höre jetzt auf. Den Rest soll bitte entweder ein anderer oder (am Liebsten ein Botbetreiber machen). Das ist mir zuviel. Murdoch Mysteries Episodenliste- und Die Legenden von Andor-Aktualisierer 14:26, 25. Jun. 2024 (CEST)

Dank der Unterstützung von @Darkking3 können jetzt noch viele von den restlichen knapp 70 Fällen mit der Vorlage:UniProt nachbearbeitet werden, indem die Parameter titel oder abruf verwendet werden.

Damit lassen sich einige Dutzend Fälle jetzt angenehmer auch manuell bearbeiten, was dann übrig bleibt sieht zu speziell für einen Bot aus. --T. Wirbitzki (Diskussion) 09:33, 12. Jul. 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: T. Wirbitzki (Diskussion) 01:01, 26. Jul. 2024 (CEST) --T. Wirbitzki (Diskussion) 01:01, 26. Jul. 2024 (CEST)

Link auf Neues Deutschland

Letzter Kommentar: vor 5 Monaten11 Kommentare4 Personen sind an der Diskussion beteiligt

Mir fällt gerade auf, dass Links auf Artikel der Zeitung Neues Deutschland nicht mehr funktionieren. Statt https://www.neues-deutschland.de müssen sie jetzt mit https://www.nd-aktuell.de beginnen. Ich habe gerade die Links bei Rosa Luxemburg aktualisiert. Kann man die Änderungen evtl. automatisieren? --Rita2008 (Diskussion) 22:02, 2. Apr. 2024 (CEST)

Hier noch zwei Links: Suchergebnisse für das Problem (fast 1900) und Beispielbearbeitung. --Kallichore (Diskussion) 22:58, 2. Apr. 2024 (CEST)

Am Wochenende guck ich mal. --Wurgl (Diskussion)

@Kallichore, Rita2008: Das scheint ja recht trivial zu sein, 20 Testedits zum gucken. Ich hab mir 9 angesehen und die waren alle okay. Sonderfälle und Spezialgedaddel ist wohl keines notwenig. Ein paar Links wie in Fremdenfeindliche Ausschreitungen in Heidenau lass ich unangetastet, in dem Beispiel ändert sich der Text in der URL von "dresden-nazifrei-jetzt-erst-recht-zur-demo.html" nach "gericht-setzt-demoverbot-fuer-heidenau-wieder-in-kraft.html" bei denen muss wohl von Hand nachgearbeitet werden bzw. geguckt ob das wirklich die richtige Referenz ist. --Wurgl (Diskussion) 17:28, 6. Apr. 2024 (CEST)

Danke, die 20 Testfälle sehen gut aus.--Kallichore (Diskussion) 17:56, 6. Apr. 2024 (CEST)

Der Bot ist soweit durch. Webarchiv, Toter Link und Parameter archiv-url hab ich nicht angefasst. Ebenso Links, wo sich der "Text" in der Url ändert, sowas wie https://www.neues-deutschland.de/artikel/1061068.streitbar-ein-nachruf-auf-erberhard-jaeckel.html => https://www.nd-aktuell.de/artikel/1061068.streitbar-ein-nachruf-auf-eberhard-jaeckel.html Da wird aus dem "erberhard" ein "eberhard". --Wurgl (Diskussion) 15:59, 7. Apr. 2024 (CEST)

Danke, damit sind mehr als 92% der Fälle erledigt. @Rita2008: Hilfst du mit, die restlichen Fälle abzuarbeiten? --Kallichore (Diskussion) 18:53, 7. Apr. 2024 (CEST)

Danke. Sehe ich mir in den nächsten Tagen an. --Rita2008 (Diskussion) 19:08, 7. Apr. 2024 (CEST)

Es ist aber doch noch eine Menge nachzuarbeiten. Helfer sind gern willkommen. --Rita2008 (Diskussion) 18:00, 10. Apr. 2024 (CEST)

Es sind nur noch knapp über 20 Fälle übrig. Für einen Bot gibt es nichts mehr zu tun. Daher würde ich den Fall bald auf erledigt setzen. --T. Wirbitzki (Diskussion) 07:00, 26. Aug. 2024 (CEST)

Es wundert mich, warum der Bot diesen Fall nicht mitgenommen hat, sieht nicht nach einem Sonderfall aus. Vielleicht, weil direkt dahinter ein (kommentierter und nicht mehr nötiger) Griff ins Archiv steht?

Ist jetzt manuell erledigt, sind ja nicht mehr viele Fälle, kein Problem. --T. Wirbitzki (Diskussion) 20:00, 10. Mai 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --T. Wirbitzki (Diskussion) 15:33, 1. Sep. 2024 (CEST) --T. Wirbitzki (Diskussion) 15:33, 1. Sep. 2024 (CEST)

Klimadaten

Letzter Kommentar: vor 5 Monaten10 Kommentare6 Personen sind an der Diskussion beteiligt

In der schwedischen und cebuano-sprachigen Wikipedia hat der LSJbot Millionen von Artikeln generiert. Dort hat er in den geographischen Artikeln Klimadaten eingebunden − nun meine Frage: Wäre es möglich, dass ein Bot in der deutschen Wikipedia Klimadaten zu bestehenden geographischen Artikeln hinzufügt? Rein technisch ist das ja möglich, wie das schw. u. ceb.-Wiki eindrucksvoll bewiesen haben.--77.9.92.75 10:43, 24. Mär. 2024 (CET)

Alternativ könntest du den LSJBotbetreiber fragen, ob er sich vorstellen könnte, den Bot nach einem Antrag auf Botflag auch in der dewp laufen zu lassen … Murdoch Mysteries Episodenliste- und Die Legenden von Andor-Aktualisierer 19:34, 24. Mär. 2024 (CET)

Abgesehen von der technischen Machbarkeit wäre erstmal zu klären, ob eine derartig flächendeckende Änderung in zig- oder hunderttausenden Artikel überhaupt erwünscht ist. --Invisigoth67 (Disk.) 08:18, 25. Mär. 2024 (CET)

… und dann ist die Frage: Woher nehmen? --Wurgl (Diskussion) 08:28, 25. Mär. 2024 (CET)

Die Daten? Das müsste uns der Betreiber vom LSJBot ja erklären können (bzw. steht das wahrscheinlich auch in seiner Doku bzw. dem Sourcecode) Murdoch Mysteries Episodenliste- und Die Legenden von Andor-Aktualisierer 09:47, 25. Mär. 2024 (CET)

Der LSJ-Bot hat die Daten aus NASA-Datenbanken gezogen --46.114.157.161 08:29, 26. Mär. 2024 (CET)

Eine weitere Möglichkeit ging mir gestern noch durch den Kopf: Die Klimadaten über Wikidata zu internationalisieren und dann dort die Klimadaten zu (meinetwegen auch botgestützt, dann bist du allerdings hier falsch) aktualisieren. Das wäre ressourcenschonender, weil alle Wikipedien, die möchten, davon profitieren könnten. Murdoch Mysteries Episodenliste- und Die Legenden von Andor-Aktualisierer 09:47, 25. Mär. 2024 (CET)

Was sagt denn das Portal „Wetter und Klima“ dazu? Murdoch Mysteries Episodenliste- und Die Legenden von Andor-Aktualisierer 09:47, 25. Mär. 2024 (CET)

Für derartige Massenbearbeitungen wäre zunächst ein Konsens zu erzielen. -- hgzh 20:38, 3. Sep. 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: hgzh 20:38, 3. Sep. 2024 (CEST)

Mythologische Artikel

Letzter Kommentar: vor 5 Monaten5 Kommentare3 Personen sind an der Diskussion beteiligt

Liebes Team,

ich habe eine etwas komplexe Anfrage, die aber technisch wahrscheinlich einfach umzusetzen ist. Roschers Ausführliches Lexikon der griechischen und römischen Mythologie wird hier bei dewiki häufig (2.223mal) als Quelle verwendet in den Artikeln zu Gestalten der griechischen Mythologie. Eine Liste generiert dieser Link.

Könnte man ein Skript programmieren, dass

in all diesen 2.223 Seiten im Quelltext den Abschnitt sucht, wo die Vorlage:Roscher eingebunden ist,
dann aus der Vorlage den 4. Parameter (Lemma im Roscher) extrahiert,
die Wikidata-Q-ID des Wikipedia-Artikels herausfindet und
Wikipedia-Lemma, Roscher-Lemma und Wikidata-ID in einer dreispaltigen Tabelle ausgibt?

Bzw. wäre jemand bereit, dieses Skript zu programmieren?

Mit der daraus entstehenden Liste hätte ich Hilfe dabei, mein mit CC-0 lizensiertes Verzeichnis sämtlicher Roscher-Artikel um die Wikidata-IDs zu ergänzen.

Herzliche Grüße, jonathan groß (ad fontes) 23:12, 14. Mai 2024 (CEST)

Als CSV-Datei: https://persondata.toolforge.org/data/roscher_wikidata_id.csv --Wurgl (Diskussion) 23:58, 14. Mai 2024 (CEST)

Sag mal, lieber Wurgl, wie genial ist das denn?!? Du bist ein As! Danke!

Verstehe ich richtig, dass "Einbindung" die Anzahl der Verwendungen im Artikel zählt?

Herzlichen Dank nochmal, und beste Grüße, jonathan groß (ad fontes) 14:38, 15. Mai 2024 (CEST)

Im Prinzip ist das diese Abfrage ergänzt um die Wikidata-Id. --Wurgl (Diskussion) 14:53, 15. Mai 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: hgzh 20:36, 3. Sep. 2024 (CEST)

Kategorienzahl ermitteln

Letzter Kommentar: vor 5 Monaten11 Kommentare4 Personen sind an der Diskussion beteiligt

Früher gab es dafür ein Tool (Categorycount), das aber nicht mehr unterhalten wird, weil Magnus Manske die Funktion in PetScan integriert hat. Doch da haben wir das Problem, daß dieses auf 500.000 Zeilen begrenzt ist.

Hat jemand eine Idee, wie man die Zahl der Kategorien dennoch ermitteln kann? --Matthiasb – ^{(CallMyCenter)} _{Wikinews ist nebenan!} 18:50, 15. Mai 2024 (CEST)

quarry:query/82851; es gibt ca. 520.000 Kategorien. -- hgzh 19:16, 15. Mai 2024 (CEST)

Trivial ins Suchfeld einzugeben.

Was scheitern wird, ist eine Beschränkung auf den ANR; deepcategory streikt bei einer Verschachtelung von 15 oder so, und ob der großen Menge und Rechenzeit wird auch sonst keiner den Baum bis in jeden Ast durchzählen können.

Nebenbei bemerkt sind das nur die Kategoriebeschreibungsseiten, die für eine Kategorisierung nicht erforderlich sind, aber grad im ANR schon vollständig sein dürften.

Gefühlt: ≈500.000 ANR + ≈20.000 Meta.

VG --PerfektesChaos 20:28, 15. Mai 2024 (CEST)

Den Baum durchgehen klappt per Query nicht. Klappt nicht weil mariadb Loops im Baum nicht berücksichtigen kann, sprich: Verfällt in Endlosschleife (Ja, "DISTINCT" gibt es, das wirkt aber erst nach der Rekursion und verhindert die Endlosschleife nicht). Zu Fuß per Script wäre das machbar, aber verrückt viel Aufwand.

Eventuell wird quarry:query/80732 irgendwann fertig. Das sollten Anzahl getrennt nach dem Teil vor dem ersten : werden, kann aber ins Timeout fallen. --Wurgl (Diskussion) 20:53, 15. Mai 2024 (CEST)

Wenn man es richtig macht, dann funktioniert das auch … --Wurgl (Diskussion) 21:09, 15. Mai 2024 (CEST)

Der zweite Ansatz sind die nicht-leeren Kategorien, egal ob angelegt oder nicht: quarry:query/82853 --Wurgl (Diskussion) 21:18, 15. Mai 2024 (CEST)

Danke für eure Antworten. Die sich voll und ganz mit meiner Plausibilitätsgrenze decken. Ich weiß, daß wir im November 2014 etwa 320.000 Kategorie hatten. Und aus einigen Stichproben in den Jahren darauf, daß etwa 30.000 Kategorien pro Jahr engelegt wurden. D.h. die genannten Zahlen liegen eigentlich im Trend. Einen leichten Rückgang bei den Neuanlagen haben ich aus zweierlei Gründen erwartet; da ist zum einen der Wegfall von SDB, Didionline und Radschläger, zum anderen ist das in etwa konsistent mit dem Verhältnis zwischen Kategorien und Artikeln, das seit Jahrn reletiv konstant ist. Die meisten Unterkategorien innerhalb einer Gemeindekategorien gibt es unterhalb on Kategorie:Gemeinde in Berelin; ca. 1820 Kategorien mit 56.000 Artikeln roundabut. --Matthiasb – ^{(CallMyCenter)} _{Wikinews ist nebenan!} 10:56, 16. Mai 2024 (CEST)

Ich habe mir das ganze nochmal angekuckt.

Die Suchfeldeingabe und hgzhs Query sollten theoretisch dasselbe Ergebnis zeigen, tun dies natürlich nicht, weil die Suchfeldabfrage in Echtzeit ist, während der Link zu hgzhs Query auf die unter 82851 archivierte Abfrage geht, und deswegen per jetzt schon drei Tage alt.
Rote Kategorien sind solche ohne Kategorienbeschreibungsseiten. Die Sortierung funktioniert dennoch. Wir bekommen sie intendiert, wenn sie zu Wartungszwecken erzwungen werden (und in vielen Fällen werden die dann früher oder später blau gemacht, obwohl man sie eigentlich nicht braucht) und eigentlich unerwünscht, weil sie im Rahmen von ifexist-Programmierungen aufgerufen werden.
In der DE.WP sind Loops im Kategorienbaum in der Regel Fehler, und weil diese seit bald 20 Jahren systematisch bekämpft werden, kommen sie in unserer Sprachversion selten, hoffentlich gar nicht vor bzw. werden schnell aufgedeckt.
Wenn Deepcategory bei 15 oder so aussteigt: dieses Problem taucht mW nur in der Biologie auf, weil Kategorie:Nagetiere et al. auf Ebene 18 liegt. Überall sonst wird eine solche Tiefe nicht erreicht. Liste von Kriegerdenkmälern in Deutschland steht auf Ebene 15 und ist mW die tiefste Verschachtelung außerhalb der Biologie.
Worin besteht eigentlich der Unterschied zwischen den beiden Abfragen von Wurgl? — Richtig erklärbar ist hierbei nur die eine Kategorie mit dem Pseudonamensraum "Benutzerin", weil es Kategorie:Benutzerin:Nicola tatsächlich gibt; sie ist nicht leer und verfügt über eine Beschreibungsseite. Kategorie:Bestandteil der Welterbestätte „Rio de Janeiro und drei weitere sind fehlerhafte Lemmata im Welterbebereich. Wo kommt der Murks eigentlich her? Diese Lemmata sind weder verlinkt, noch gibt es eine Beschreibungsseite, noch sind in diesen Kategorien Artikel eingetragen. Ich glaube, daß Kategorie:Bestandteil der Welterbestätte „Rio de Janeiro: Carioca-Landschaften zwischen Bergen und Meer“ ein ungültiges Kategorienlemma ist bzw. daß der zweite Doppelpunkt hier ähnlich überraschene Wirkung hat wie in:

;Deutschland–Österreich: 5:5, ergibt:

Deutschland–Österreich: 5:5

--Matthiasb –

^{(CallMyCenter)} _{Wikinews ist nebenan!} 14:13, 17. Mai 2024 (CEST)

Die erste meiner Queries zählt die angelegten (blauen) Kategorien. Die Zweite zählt alle Kategorien (auch die Roten) die mindestens 1 Seite enthalten.

Kategorie:Bestandteil der Welterbestätte „Rio de Janeiro: Carioca-Landschaften zwischen Bergen und Meer“ das ist der tatsächliche Name der Kategorie. Ich hab einfach nach dem : aufgesplittet (das Prefix "Kategorie:" bzw. dessen Doppelpunkt zählt dabei nicht) und diese Kategorie (und ein paar weitere) haben einen Doppelpunkt im Namen. --Wurgl (Diskussion) 14:31, 17. Mai 2024 (CEST)

Ah, dann ist das geklärt. Danke. --Matthiasb –

^{(CallMyCenter)} _{Wikinews ist nebenan!} 14:53, 17. Mai 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: hgzh 20:35, 3. Sep. 2024 (CEST)

Persönlichkeiten / Söhne und Töchter der Stadt

Letzter Kommentar: vor 5 Monaten12 Kommentare6 Personen sind an der Diskussion beteiligt

Viele Autoren vergessen immer wieder, Biografien unter Söhne und Töchter der Stadt / Persönlichkeiten einzutragen. Das muss dann relativ umständlich per Hand gemacht werden. Dabei wäre ein Bot, der das macht, gar nicht so schwer zu programmieren. Der müsste dann nur Geburtsort und -datum aus den Personendaten abfragen und dann in dem Ortsartikel unter Söhne und Töchter der Stadt o. ä. eintragen. Beispiel: Max Mustermann: Personendaten:
{{Personendaten |NAME=Mustermann, Maximilian |ALTERNATIVNAMEN=Mustermann, Max |KURZBESCHREIBUNG=Beispielsperson |GEBURTSDATUM=1. Januar 2000 |GEBURTSORT=[[Musterstadt]] |STERBEDATUM=31. Dezember 2000 |STERBEORT=[[Musterstadt]] }}
Der Bot würde dann im Artikel Musterstadt oder Liste von Söhnen und Töchtern Musterstadts unter Söhne und Töchter / Persönlichkeiten o. ä. folgendes eintragen:
* [[Maximilian Mustermann]] (2000–2000), Beispielperson
Also allgemein: * [[{{{NAME}}}]], (* {{{GEBURTSDATUM (nur Jahr)}}}) oder, falls STERBEDATUM vorhanden ({{{STERBEDATUM (nur Jahr)}}}), {{{KURZBESCHREIBUNG}}}
Damit würde vielen Autoren Arbeitsaufwand erspart. Was sagt ihr dazu? --MarcelloIV (Diskussion) 09:13, 18. Mai 2024 (CEST)

Nur wenn es einen solchen Abschnitt gibt?

teuflisch wird es, wenn die Person schon in einem Ortsteil eingetragen ist, bzw. wenn in den PD der Ortsteil angegeben ist. Es ist nicht immer ganz so leicht per Bot vom Ortsteil zur Stadt zu kommen.

wie ist die Sortierung bei mehreren Personen? Alphabetisch (könnte Probleme bei existierenden Rotlinks geben), nach Geburtsdatum oder in irgendwelche Gruppen (geboren in / gestorben in)?

Wann ist eine Person für einen Eintrag relevant? Also jeder Hinz & Kunz oder gibts Einschränkungen?

Problem Editwar: Wenn ein Autor einen Eintrag rauswirft, dann sollte der Bot nicht immer wieder den Eintrag reinmachen

Die Punkte mal ganz auf die Schnelle als Anmerkungen. --Wurgl (Diskussion) 09:53, 18. Mai 2024 (CEST)

Zu Punkt 1: Wenn das ein Ortsteil in Deutschland ist, kann man über die Infobox oder Kategorie die Stadt automatisiert rausfinden. In anderen Ländern wird es schwierig.

Zu Punkt 2: In den bisherigen Listen ist das uneinheitlich geregelt. Beispielsweise sind die Personen in Liste von Söhnen und Töchtern der Stadt Bischkek nach Geburtsdatum geordnet, in Liste von Söhnen und Töchtern der Stadt Schymkent sind sie aber alphabetisch sortiert. Ich persönlich bevorzuge die Sortierung nach Geburtsjahr. In bereits bestehenden Listen müsste der Bot allerdings erkennen, ob die Sortierung nach Geburtsdatum oder nach dem Alphabet geschieht.

Zu Punkt 3: Es ist jede Person mit einem Artikel in dewiki relevant.

Zu Punkt 4: Dann wäre eine Ausschlussliste sinnvoll.

--MarcelloIV (Diskussion) 10:15, 18. Mai 2024 (CEST)

PS: Mir fällt grad ein, sass der APPERbot die Liste der Biografien auf ähnliche Weise pflegt.

Ja, der APPERbot ist unter meiner Kontrolle. Ich versuch mich mal daran. Jedenfalls mit einem Protokoll analog zu dem hier: Benutzer:APPERbot/Begriffsklärungsseiten

PS: Punkt 0 hast du übersehen. --Wurgl (Diskussion) 11:29, 18. Mai 2024 (CEST)

Danke! Ich hätte nicht erwartet, dass das so schnell geht. Nachtrag zu Punkt 0: Wenn der Bot keine Liste findet, so sollte er einen entsprechenden Abschnitt am Artikelende hinzufügen.--MarcelloIV (Diskussion) 11:51, 18. Mai 2024 (CEST)

Zuallererst: Ich berücksichtige nur die Personen, bei denen der Parameter GEBURTSORT mit der Zeichenfolge "[[" beginnt und berücksichtige den ersten Wikilink, also alle aktuell 24.443 Personen aus [dieser Liste fallen raus.

@MarcelloIV: Ich hatte sowas im Hinterkopf: Jouko Salomäki: Geburtsort laut PD: Kauhajoki … das ist eine Gemeinde und kein Ort. Soll da auch so ein Absatz rein? Das würde dann alle diese Verwaltungseinheiten unterhalb von Kategorie:Gemeinde betreffen.

William McWillie mit Madison County (Mississippi) ist aber wohl eine zu große Verwaltungseinheit, oder?

Problem mit Stadtteilen/Ortsteilen:

Neheim ist ein Stadtteil von Arnsberg und hat eine Liste von Persönlichkeiten, zum Beispiel den Jazzmusiker Matthias Strucken. Zu Arnsberg gibt es Liste von Persönlichkeiten der Stadt Arnsberg und dort fehlt der Matthias Strucken. Ein Hinzufügen ist für einen dummen Bot nicht machbar weil der Abschnitt nicht entscheidbar ist (Extrembeispiel: Brian May ist Astrophysiker und auch Musiker).
Carl Manchot ist in Wipkingen geboren, ein Quartier von Zürich, dort gibts keine Liste, wohl aber für Zürich, siehe Liste von Persönlichkeiten der Stadt Zürich.

Es gibt also sowohl den Fall Personenliste im Stadtteil und der Stadt als auch nur in der Stadt. Da stellt die Frage: Auch in dieses Quartier eine Liste hinzufügen?

Jetzt mal ganz abgesehen von der Frage: Wie komm ich von Wipkingen nach Zürich? Hier möglicherweise via Navigationsleiste Aber wie von Schabs nach Natz-Schabs? Oder von Groß-Lichterfelde nach Berlin? Für heute ist erstmal Schluss. --Wurgl (Diskussion) 19:44, 18. Mai 2024 (CEST)

Anm: Kauhajoki hat bereits so einen Abschnitt. Aber du hast natürlich Recht, so einfach, wie es mir vorgeschwebt ist, ist es doch nicht--MarcelloIV (Diskussion) 19:47, 18. Mai 2024 (CEST)

Das Problem mit den amerikanischen Countys ist, daß Orte nicht zwingend nur einem County angehören. Bei obigem McWillie fehlt im Artikel übrigens der Grund, warum die Person etwas mit dem Madison County zu tun hat. Weil er nämlich Camden (Mississippi) gegründet hat, nach seinem Geburtsort Camden (South Carolina). Hier ist der "Fehler" also mehrstufig; zum einen die inkomplette Biographie, zum anderen der fehlende Ortsartikel.

Dennoch könnte ein sinnvoller Ansatz sein, abzugleichen, ob von den in den Personendaten verlinkten Ortslemmata ein Baklink zum Personenartikel führt. --Matthiasb –

^{(CallMyCenter)} _{Wikinews ist nebenan!} 00:23, 19. Mai 2024 (CEST)

STOP!

Derartige Bot-generierte Listen ohne menschliche Kontrolle (=Autoren) und bei automatischer Aktualisierung (=Revert der menschlichen Korrekturen) führen regelmäßig an den Baum.
Alle Menschen, die in den letzten 500 Jahren in Berlin geboren wurden? Oder in Wien, Paris, London? Wie viele Tausend sollen das denn werden, und welche Leser interessiert eine derartige Liste? Zumal Berlin von 1700 ein anderes Territorium ist als Berlin von 1930.
Bergisch Gladbach hat ebenfalls einen gesonderten Artikel nur dafür.
Wenn in der Kreisstadt die einzige Geburtsklinik im Kreiskrankenhaus ist, dann kommen nach Rückgang der Hausgeburten alle Menschen nur in dieser Stadt zur Welt; in Liechtenstein mittlerweile kaum noch, weil die liechtensteinische Geburtsklinik sich in der Schweiz befindet. Das ist aber eine Angelegenheit für Verwaltungsbeamte; außer eines Aufenthalts von knapp einer Woche haben Menschen, die dann nie wieder diese Stadt betreten nichts damit zu tun. Malle-Urlaub kann da schon länger dauern, nach zwei Wochen am Strand hat man ja auch keinen Zweitwohnsitz in Spanien und wird zum Deutsch-Spanier.

VG --PerfektesChaos 09:29, 19. Mai 2024 (CEST)

Stimme da sehr zu. Es macht zukünftig immer weniger Sinn, die Personen nach Geburtsort zu listen, weil in mittelgroßen Städten die Liste dann genauso "Liste der im Krankenhaus XY geborenen Persönlichkeiten" lauten könnte. Persönlich bevorzuge ich deshalb auch Listen, in denen der Wirkungskreis und nicht der Geburtsort ausschlaggebend ist. Der Bot könnte das aber nie im Leben leisten. --CaroFraTyskland (Diskussion) 09:59, 19. Mai 2024 (CEST)

Hierfür gibt es keinen Konsens. -- hgzh 20:34, 3. Sep. 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: hgzh 20:34, 3. Sep. 2024 (CEST)

Punkt vor Klammer

Letzter Kommentar: vor 5 Monaten14 Kommentare4 Personen sind an der Diskussion beteiligt

siehe insource:/\. \(siehe / ergibt etliche Treffer, bei welchen nach Satzende ein (siehe xxx) folgt. Der Satzendpunkt sollte daher nach die Klammer verschoben werden (Beispiel), falls dort nicht schon ein Punkt vorhanden ist. Bei der Suche gibt es jedoch recht viele Falsch-Positive. Sieht jemand einen Weg für eine effiziente Triage und Abarbeitung? --Leyo 23:54, 21. Apr. 2024 (CEST)

insource:/\. \(siehe [^\)]*\)[^\.]/ schließt die Fälle aus, bei denen sowohl vor als auch nach der Klammer ein Punkt steht. Das schließt falsch positive aus, bei denen der Satz davor auf eine Abkürzung endet. Wahrscheinlich ist das aber trotzdem eher ein Fall für eine Wartungsliste wie bei Benutzer:Aka. Gruß, DerIch27 (Diskussion) 22:02, 29. Apr. 2024 (CEST)

siehe insource:/en\. \(siehe / scheint kaum Falsch-Positive zu haben. --Leyo 17:10, 30. Apr. 2024 (CEST)

Wenn ich das "Wort" (im Sinne von 'die Zeichen ungleich Leerzeichen') vor dem Punkt betrachte und dann folgende rausfiltere:

Eine Zahl ist enthalten oder ein > oder ein & oder ein . (& wegen  -Gedaddel)
Kein Selbstlaut (Abkürzungen)
Mindestens 3 Buchstaben
Das Wort besteht nur aus Zeichen XIVLDMC bzw. nur aus xivldmc (römische Zahlen)
endet mit Chr
endet mit )
Das Wort ist jun, sen, min, max, etc, usw, mio

dann bleibt so ein Drittel der Fälle übrig. Soll ich? --Wurgl (Diskussion) 21:27, 30. Apr. 2024 (CEST)

Diff sieht dann so aus: https://persondata.toolforge.org/data/punkt_vor_klammer.txt --Wurgl (Diskussion) 22:09, 30. Apr. 2024 (CEST)

Du musst noch das Ausgleichen von Klammern einbauen. Dein Diff enthält beispielsweise folgendes:

== Baudenkmale ==
- …tur)|Chor]] von 1597 mit [[Strebepfeiler]]n hat ein rundbogiges West-Portal. (siehe auch ''[[Liste der denkmalgeschützten Objekte in Straßburg (Kärnten)]]'')
* …                                                                           -
+ …tur)|Chor]] von 1597 mit [[Strebepfeiler]]n hat ein rundbogiges West-Portal (siehe auch ''[[Liste der denkmalgeschützten Objekte in Straßburg (Kärnten).]]'')
* …

--DerIch27 (Diskussion) 22:28, 30. Apr. 2024 (CEST)

Gut geguckt. Hatte gestern keine Zeit mehr, aber jetzt ist das mit ein wenig hübscherer Regular Expression gefixt. --Wurgl (Diskussion) 07:48, 1. Mai 2024 (CEST)

Danke. Ich habe deine Diffliste stichprobenartig geprüft und keine Fehler entdeckt. Ich nehme an, dass du auch sicherstellst, keine Dateieinbindungen zu erwischen. --Leyo 09:25, 1. Mai 2024 (CEST)

Die Diffliste ist nix anderes als der Wikipedia-Diff nur halt ohne HTML-Zeugs und die Zeilen gekürzt damit man das auf der Kommandozeile auch angucken kann. Ich guck auch ob die Anzahl der Klammern passt, aber mehr als eine Verschachtelungstiefe gabs nicht. --Wurgl (Diskussion) 10:14, 1. Mai 2024 (CEST)

Der Bot ist durch. --Wurgl (Diskussion) 14:58, 1. Mai 2024 (CEST)

Danke. Die einfacheren Fälle scheinen damit abgearbeitet zu sein. Bei den verbleibenden Treffern handelt es sich wohl primär um Falsch-Positive. Falls niemand noch einen guten Vorschlag hat, kann hier geschlossen werden. --Leyo 21:44, 4. Mai 2024 (CEST)

Die mit Punkt vor ( und Punkt nach ) könnten noch ein paar Treffer liefern, die hat der Bot nichtmal angeguckt. --Wurgl (Diskussion) 22:15, 4. Mai 2024 (CEST)

Unter den 78 Treffern von insource:/\. \(siehe [^\)]+\)\./ sind keine zu korrigierenden mehr dabei. --Leyo 01:04, 9. Mai 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --hgzh (Diskussion) 20:37, 3. Sep. 2024 (CEST)

Umleitungen von externen Links auf Zeitungsservern auflösen?

Letzter Kommentar: vor 5 Monaten12 Kommentare3 Personen sind an der Diskussion beteiligt

Anknüpfend an diese Aktion, habe ich mir externe Links auf Artikel einer Mediengruppe angeschaut.

Es gibt hunderte Fälle von vom Server umgeleiteten externen Links wie diese

Neue Rhein/Neue Ruhr Zeitung in Moers

https://www.nrz.de/staedte/moers-und-umland/spektakulaere-funde-in-moers-id4476366.html

wird vom Server umgeleitet auf:

https://www.nrz.de/staedte/moers-und-umland/article4476366/spektakulaere-funde-in-moers.html

Die Server haben also in diesen Fällen Aliasse eingerichtet. Ähnlich betroffen sind neben nrz.de und wr.de die Domains wp.de, ikz-online.de, waz.de und harzkurier.de.
Es sind ebenfalls manuell zu behandelnde Fälle darunter, wo der Weblink tot ist, wie im Artikel „Rolf Fritz“:

https://www.wr.de/staedte/dortmund/die-menschen-hinter-der-fassade-id1696729.html

In einigen Fällen leiten Zeitungen auf waz.de um, wohl nach einer Übertragung des Artikels

Westfälische Rundschau in Oberhausen

https://www.wr.de/wirtschaft/siemens-schliesst-werk-in-oberhausen-id211355461.html

wird vom Server umgeleitet auf:

https://www.waz.de/wirtschaft/article211355461/siemens-schliesst-werk-in-oberhausen.html

Hallo @Wurgl, Du hast mal in diesem Zusammenhang geschrieben, Umleitungen auf andere Server solle man nicht per Bot anfassen, wegen der Beschriftung. Bei Internetquellen kann ich mir vorstellen, dass man die Umleitung automatisiert ersetzt und das im Kommentar erklärt (nur falls der Kommentar noch leer ist)

{{Internetquelle |autor=Denise Ludwig |url=https://www.nrz.de/wirtschaft/ghh-rand-schliesst-werk-in-oberhausen-id213216771.html |titel=GHH Rand schließt Werk in Oberhausen |werk=nrz.de |datum=2018-01-25 |abruf=2024-02-18}}

->

{{Internetquelle |autor=Denise Ludwig |url=https://www.waz.de/wirtschaft/article213216771/ghh-rand-schliesst-werk-in-oberhausen.html |titel=GHH Rand schließt Werk in Oberhausen |werk=nrz.de |kommentar=ursprünglich nrz.de, später waz.de |datum=2018-01-25 |abruf=2024-02-18}}

Wäre das Attribut hrsg leer und werk gefüllt wie hier, könnte man zudem den Inhalt von werk ersetzen.
Mir ist nicht klar, ob das „Spielchen“ mit den Umleitungen noch oft hin und her gehen wird, die waz.de könnte den Link ja auch wieder an die nrz.de zurück übertragen. Lohnt es sich, die Umleitungen abzubauen, oder sollte erst reagiert werden, wenn die Links defekt sind? Etwas Zeit kostet die Umleitung beim Aufruf eines Links ja auch. --T. Wirbitzki (Diskussion) 13:32, 15. Jun. 2024 (CEST)

Was sagen die Mitleser dazu? --Wurgl (Diskussion) 13:44, 15. Jun. 2024 (CEST)

Ich würde vorschlagen, dass bei Artikeln, die sowieso schon bearbeitet werden, auch die Weiterleitungen als Beifang korrigiert werden sollten. Ansonsten sollten wir auf die Weiterleitungen der Verlage vertrauen. Alles andere würde unnötig Serverlast verbrauchen. Murdoch Mysteries Episodenliste- und Die Legenden von Andor-Aktualisierer 14:56, 15. Jun. 2024 (CEST)

Klingt einleuchtend --T. Wirbitzki (Diskussion) 00:14, 22. Jun. 2024 (CEST)

@T. Wirbitzki: Ich hab endlich dafür Zeit gefunden. Kannst ja mal durchgucken ob das so passt: https://persondata.toolforge.org/data/diff_waz.txt Ich löse zusätzlich noch die waz-Weiterleitungen auf, welche vorher ein "-id<Zahl>.html" und nachher ein /article<Zahl>/" im Link haben. --Wurgl (Diskussion) 10:22, 22. Jul. 2024 (CEST)

@Wurgl Danke, Stichproben sehen gut aus, bei den WAZ-Weiterleitungen ließe sich ein Kommentar einfügen bzw. ergänzen, der auf die originale Seite hinweist. Außer der Reihe hab ich noch die Mitteldeutsche Zeitung aus einer anderen Mediengruppe vorgefunden, die ebenfalls URLs geändert hat, siehe hier. Auch bei Links auf mz-web.de scheinen die Umleitungen zu funktionieren. --T. Wirbitzki (Diskussion) 12:24, 23. Jul. 2024 (CEST)

Ich hab jetzt noch ein paar Weiterleitungen innerhalb der vier wr.de, wp.de, nrz.de und ikz-online.de aufgelöst und wenn die nach waz.de gewandert sind kommt der Kommentar mit der alten Url. mz.de kommt später. --Wurgl (Diskussion) 16:15, 23. Jul. 2024 (CEST)

So, mz-web.de passt jetzt auch. Dort müssen im "sprechenden" Teil der Url mindestens die letzten 6 der durch Minus-Zeichen getrennten Worte übereinstimmen. --Wurgl (Diskussion) 20:23, 27. Jul. 2024 (CEST)

@T. Wirbitzki: Bisher hat der Bot 14 Stück aufgelöst, siehe: quarry:query/85239 --Wurgl (Diskussion) 10:33, 31. Jul. 2024 (CEST)

Ich nehme mal an, der Bot entnimmt der HTTP-301-Meldung die neue URL und nimmt die, sofern die ID im Wesentlichen die Gleiche ist.

Jedenfalls sieht es sehr gut aus; wenn jeden Tag 14 Fälle gefunden werden, wäre das auch ein schönes Tempo.

Im Moment waren interne Weiterleitungen auf nrz, waz und mz dabei, noch keine „Umleitung“ auf waz.de. --T. Wirbitzki (Diskussion) 00:07, 1. Aug. 2024 (CEST)

@Wurgl Nun hat er 24 Stück aufgelöst. Für mich ist die Bot-Anfrage gut abgeschlossen, an den Umleitungen wird gewerkelt. --T. Wirbitzki (Diskussion) 06:02, 13. Sep. 2024 (CEST)

Archivierung dieses Abschnittes wurde gewünscht von: --T. Wirbitzki (Diskussion) 05:47, 19. Sep. 2024 (CEST)