Benutzer Diskussion:SirJective/Wartungslisten/Kürzere Treffer

Hi Sir Jectiv, danke für's einstellen des Artikels. Wegen des Namens hab ich leider auch keine Idee, bin bei so was auch sehr unkreativ ;-) -- Gruß Peter Lustig 22:50, 28. Aug 2004 (CEST)

Entfernung von Einträgen

Bearbeiten

Ich hab mal die Einträge bei denen die links angepasst wurden entfernt, ich hoffe das geht in Ordnung. -- Gruß Peter Lustig 14:52, 29. Aug 2004 (CEST)

Absolut, das tue ich auch. Nur da, wo der Link so gehört, schreib ich das dazu, damit der nächste nicht wieder alles durchgucken muss. Deine Bemerkungen sind gut so. --SirJective 17:18, 29. Aug 2004 (CEST)

Hi SirJective, soll ich die korrigierten kaputten Links aus der Liste entfernen oder wie? --Katharina 16:40, 31. Aug 2004 (CEST)

Die korrigierten, ja. Diejenigen, die so bleiben sollen, lässt du bitte drin, bis ich sie in eine Tabelle aufgenommen hab, um sie beim nächstenmal gleich draußen zu lassen. --SirJective 16:49, 31. Aug 2004 (CEST)
Also, wenn ich beim Abarbeiten von Begriffsklärungen auf einen deiner Begriffe stosse, korrigiere ich die Sache schnell mit dem Zwobot und entlinke den Begriff auf Deiner Liste (wie eben "Single"). Dann kannst Du davon ausgehen, dass dieser Begriff erledigt ist. Geht das so in Ordnung? --Katharina 17:02, 31. Aug 2004 (CEST)
Ich bin grad nicht sicher, ob ich dich verstanden hab: Du bist die BKS "Single" durchgegangen, dabei auf diese Liste gestoßen, und hast dann was mit den Links auf "Singles" gemacht? Angeguckt, ob sie wirklich einen der Single-Begriffe meinen und entsprechend umverlinkt? In dem Fall ist das so in Ordnung und die "erledigt"-Markierung durch Entlinkung genügt in dieser Liste. (Könntest du alternativ die ganze Zeile entfernen? Natürlich kann das auch ein anderer gebündelt tun, wenn du mit dem Bot arbeitest und der das nicht zulässt.) --SirJective 18:52, 31. Aug 2004 (CEST)

Ausschliessen

Bearbeiten

Artikel aus dem Lösch-Logbuch bitte beim nächsten mal ausschliessen -- Ninjamask 22:50, 30. Aug 2004 (CEST)

Das sollte bereits mit dieser Abfrage geschehen sein:
AND cfrom.cur_namespace = 0 and cfrom.cur_id = bl_from
Wenn nach dem Zeitpunkt des Dumps der ensprechende normale Artikel (cfrom) bereits bearbeitet wurde, oder es sich um eine "Karteileiche" in der brokenlinks-Tabelle handelt, erscheint der Eintrag in dieser Liste, obwohl kein Artikel darauf verweist.
Ich arbeite bereits daran, diese Liste um Treffer mit 2 Buchstaben weniger zu erweitern, und schließe bisher als korrekt erkannte brokenlinks aus der nächsten Abfrage aus.
Oder meinst du, dass Artikel, die vom Löschlogbuch verlinkt sind, unabhängig von verweisenden Artikeln nicht aufgelistet werden sollen? Das würde ich ablehnen, höchstens im Eintrag einen Hinweis auf diese Tatsache geben. --SirJective 12:53, 31. Aug 2004 (CEST)
Ich meinte Brokenlinks, die im Löschlogbuch stehen. Da im Löschlogbuch nichts verändert werden soll, könnten wir diese Brokenlinks rausfiltern. -- Ninjamask 13:55, 31. Aug 2004 (CEST)
Vielleicht meinen wir dasselbe mit anderen Worten... Der momentane Filter ist der: Brokenlinks, die nicht von normalen Artikeln verlinkt sind, sondern ausschließlich von Diskussionen, Benutzer-Seiten, Wikipedia-Seiten (incl. Löschlogbuch) etc., werden hier nicht gelistet. Brokenlinks vom Löschlogbuch werden aber gelistet, wenn auch normale Artikel darauf verweisen, und natürlich sollen nur die Artikel geändert werden. Möchtest du an dieser Filterung etwas ändern? --SirJective 14:26, 31. Aug 2004 (CEST)
ah, ok dann ist ja alles klar. -- Ninjamask 23:41, 1. Sep 2004 (CEST)
Ich würd gern noch Wikipedia:Artikelwünsche/Ding-Liste/A bis Z ausschliessen -- Ninjamask 13:38, 15. Nov 2004 (CET)
Wie - ausschließen?
Warum sollte ich Artikel ausschließen, die auch(!) von der Ding-Liste verlinkt sind? Artikel, die zum Zeitpunkt der Listenerstellung nur(!) von der Ding-Liste verlinkt sind, werden sowieso nicht aufgeführt. --SirJective 14:01, 5. Dez 2004 (CET)
Ich meinte auch nur die Artikel die nur(!) von der Ding-Liste verlinkt waren. Hattest du noch nirgends erwähnt, dass die schon ausgeschlossen werden. Grund war eine Häufung dieses Falles... wahrscheinlich dann aber nur Zufall ^^ -- Ninjamask 22:00, 6. Dez 2004 (CET)
Das muessen dann Titel sein, die nach Erstellen der Liste von Artikel-Links befreit wurden. Auf dieser Diskussionsseite hatte ich das bereits erwaehnt: "Brokenlinks, die nicht von normalen Artikeln verlinkt sind, [...] werden hier nicht gelistet." Ich werde es aber der Klarheit halber auf der Seite selbst hervorheben. :) --SirJective 12:28, 7. Dez 2004 (CET)

Markierung von Einträgen?

Bearbeiten

Das ist eine gute Liste. Mir ist allerdings nicht klar, ob man die abgearbeiteten Listeneinträge markieren sollte. (Wenn oft genug aktualisiert wird, dann ist das natürlich nicht nötig; als Bearbeiter weiß aber nicht, wie oft aktualisiert wird.) --Kerbel 23:06, 14. Sep 2004 (CEST)

Wenn alle Links von normalen Artikeln auf den nicht vorhandenen Artikel umgebogen sind, kann der Eintrag hier weg, und wird auch beim nächsten Update nicht wieder auftauchen, es sei denn, er wird erneut verlinkt. Wenn aber der nicht vorhandene Artikel ein echtes Ziel ist, dann schreib das bitte hier dazu, damit ich ihn beim nächsten Update trotz vorhandenen Links aus der Liste entfernen kann.
Bisher wurde diese Liste noch nicht aktualisiert, ich werde das auch erst tun, wenn ein Großteil abgearbeitet ist. --SirJective 18:50, 15. Sep 2004 (CEST)

gekürzte Zahl-Artikel unwahrscheinlich

Bearbeiten

Hmm... Es ist eher unwahrscheinlich, dass ein Artikel der mit einer Zahl endet, korrekterweise um ein Zeichen gekürzt gehört, oder? Eher noch sollte man schauen, ob die Zahl ganz überflüssig ist. Ich denke, aus dieser Liste der um einen (oder bald auch um zwei) Zeichen gekürzten Titel werde ich die End-Zahlen beim nächsten Update raushalten. --SirJective 19:41, 28. Sep 2004 (CEST)

ich glaub bei einmal drübergucken hatte ich einen der falsch war. wenn man alle mal anschaut und du die richtigen in deine ausschlussliste nimmst ham wir doch fast den gleichen effekt -- Ninjamask 20:58, 30. Sep 2004 (CEST)
Ist auch OK. Dann machen wir es so. --SirJective 22:33, 30. Sep 2004 (CEST)

Zweibuchstabenliste fertig

Bearbeiten

Die SQL-Abfrage zur Erstellung einer Liste der brokenlinks, zu denen um 1 oder 2 Buchstaben gekürzte Artikel existieren, ist fertig. Der Dump vom 2. Oktober enthält 8454 solche brokenlinks (von 871.087 insgesamt, davon 548.639 verschiedene fehlende Titel), also 1,5% aller fehlenden Titel. Es wurden dabei 236 Titel ausgeschlossen.

Ich habe einen Teil der "End-N-Liste" hochgeladen (allein davon gibt es 1700 Titel) und werde die Sonderzeichen und Großbuchstaben folgen lassen. --SirJective 00:47, 4. Okt 2004 (CEST)


neue Liste

Bearbeiten

Hallo SirJective, ich habe einen grossen Teil der Liste abgearbeitet, daher nehme ich an, dass deine Fragen hauptsaechlich an mich gerichtet sind. Im Abschnitt L steht "OK" fuer "- kein Zusammenhang", spaeter habe ich dann gesehen, dass andere "- kein Zusammenhang" geschrieben haben und mich angepasst. "- nur Ding-Liste" habe ich geschrieben, weil ich dachte, dass man diese Eintraege in der Ding-Liste vielleicht anpassen sollte, damit sie dort nicht mehr verlinkt werden (beispielsweise Plurale). Koenntest Du vielleicht bei den naechsten Listen *Aine [[Spezial:Whatlinkshere/Aine]] -> [[Ain]] schreiben, dann wird das neue Bearbeiten einfacher. Bis dann, --Elwe 00:03, 10. Jan 2005 (CET)

Hallo Elwe, ich hab primär "alle Bearbeiter dieser Seiten" angesprochen. :) Da ich mir nicht im einzelnen angesehen habe, wer diese Bearbeiter sind, hatte hatte ich vorrangig Ninjamask im Kopf, der die Liste erbeten hatte. Ich freue mich aber, dass auch du dich dieser Liste annimmst, denn ich selbst komme kaum noch dazu, meine eigenen Listen abzuarbeiten.
Ich dachte mir schon, dass dein OK ausdrückt, dass der brokenlink erwünscht ist. Ursprünglich hatten wir da sogar eine kurze Erklärung der Varianten (z.B. "Biologie: Gattung vs. Art"). In meine Ausschlussliste übernehme ich aber sowieso nur den Titel des fehlenden Artikels, daher kann man die gleich weglassen.
Unerwünschte Einträge in der Ding-Liste sollten tatsächlich irgendwie eliminiert werden. Soweit ich weiß, reicht es nicht, sie einfach zu entfernen, weil die Liste automatisch aus externen Quellen erzeugt wird. So können wir nur hoffen, dass die "Betreiber" der Liste ebenfalls eine Ausschlussliste haben. Du kannst gern mit ihnen Kontakt aufnehmen. Die entsprechenden Einträge in der Liste darfst du hier markieren (oho, ich erlaube dir etwas, was ich dir sowieso nicht verbieten kann *g*), am besten packst du die in einen eigenen Abschnitt "nur von Ding-Liste verlinkt" auf den Listenseiten; bereits von mir gelöschte Einträge kannst du ja der Versionsgeschichte entnehmen.
Falls du darüberhinaus daran interessiert bist, die fehlenden Artikel zu begutachten, die jetzt schon nur von der Ding-Liste verlinkt sind, kann ich dir gern eine entsprechende Liste zusammenstellen. (Hier landen ja nur Einträge, die zum Zeitpunkt der Listenerstellung auch von Artikeln verlinkt sind.)
Deinem Vorschlag, den Titel separat voranzustellen, werde ich gern Folge leisten.
--SirJective 15:50, 10. Jan 2005 (CET)

Idee für kommende Listen

Bearbeiten

Wär statt

*Aine W -> Ain

auch

*Aine W -> Ain

möglich?

Dadurch könnte man dann auch noch sehen ob Aine überhaupt noch überpüft werden muss. -- Ninjamask 13:46, 10. Aug 2005 (CEST)

Ja, das kann ich machen.
Ich muss allerdings erstmal schauen, wie ich es mit dem neuen Datenbankformat hinbekomme, die gewünschten Angaben überhaupt zu beschaffen. Die neue "pagelinks"-Tabelle (die die frühere Tabellen "links" und "brokenlinks" vereint) hat einen Index, der den Import in die Datenbank praktisch unmöglich macht. Mit dem nächsten Dump werde ich versuchen, die Tabelle anders zu nutzen. --SirJective 23:50, 21. Aug 2005 (CEST)

Abfrage für MediaWiki Version 1.4

Bearbeiten

Die folgende Abfrage benötigt die Tabellen cur, links und brokenlinks, sowie die mit dem untenstehenden Skript erzeugte Tabelle bl_wanted. --SirJective 14:19, 27. Feb 2006 (CET)

-- Erzeugt eine Tabelle, die alle brokenlinks enthaelt,
-- welche von Artikeln verlinkt sind und bestimmten
-- Titelkriterien genuegen.
drop table if exists bl0;
create table bl0(
  bl_id int(8) unsigned auto_increment not null,
  bl_title varchar(255) binary not null,
  bl_title1 varchar(255) binary not null,
  bl_title2 varchar(255) binary not null,
  bl_lastchar char(1) binary not null,
  primary key (bl_id),
  unique key (bl_title)
);
insert into bl0 (bl_title, bl_title1, bl_title2)
select distinct bl_to, "", ""
from brokenlinks, cur
where length(bl_to)>=4 and bl_to regexp '[a-z]'
and bl_from = cur_id and cur_namespace = 0;

-- Konstruiert zu den gefundenen Titeln die um einen bzw. zwei
-- Zeichen verkuerzten Titel.
update bl0
set
bl_title1 = substring(bl_title, 1, length(bl_title)-1),
bl_title2 = substring(bl_title, 1, length(bl_title)-2),
bl_lastchar = substring(bl_title, length(bl_title), 1);

----

-- Erzeugt eine Tabelle aller brokenlinks, fuer die ein
-- kuerzerer Treffer existiert.
drop table if exists bl1;
create table bl1(
  full_title varchar(255) binary not null,
  short_title varchar(255) binary not null,
  last_char char(1) binary not null
);

insert into bl1
select bl_title, bl_title1, bl_lastchar
from bl0, title0
where bl_title1 = cur_title;

insert into bl1
select bl_title, bl_title2, bl_lastchar
from bl0, title0
where bl_title2 = cur_title;

----

-- Entferne gewuenschte laengere Treffer
delete from bl1 using bl1, bl_wanted
where full_title = wanted_title;

Nun sind alle benötigten Daten versammelt, und wir können die Ergebnisse buchstabenweise ausgeben:

select concat('*',full_title,' [[Spezial:Whatlinkshere/',full_title,'|W]] ->'),
group_concat(concat(' [[',short_title,']]'), '')
from bl1
where

-- Sonderzeichen
--last_char < '0' or (last_char > '9' and last_char < 'A')
--or (last_char > 'Z' and last_char < 'a') or last_char > 'z'

-- Grossbuchstaben
--last_char >= 'A' and last_char <= 'Z'

-- Einzelner Endbuchstabe
last_char = 's'

group by full_title
order by last_char, full_title;

Ausschlussliste

Bearbeiten

Ich lege die bisherige Ausschlussliste hier ab, damit eventuell ein anderer die Erneuerung der Abfrage auf die Reihe kriegt. ;) Die Liste ist eine simple Textdatei und sollte aus dem Quelltext der Seite entnommen werden (wegen der Zeilenwechsel): Benutzer:SirJective/Wartungslisten/Kürzere Treffer/Ausschlussliste

Hier ist ein sed-Skript, welches die Textdatei in eine SQL-Import-Anweisung umwandelt:

1{idrop table if exists bl_wanted;\
create table bl_wanted(\
  wanted_title varchar(255) binary not null,\
  primary key (wanted_title)\
);\
insert into bl_wanted values
d
}
s/'/\\'/g
s/^\(.*\)$/('\1'),/
$s/,$/;/

Das Skript geht davon aus, dass die erste Zeile nicht importiert werden soll: Ich kopiere die Ausschlussliste bisher via Notepad aus der WP, und beim Speichern wird in der ersten Zeile eine utf8-Kennung gespeichert.

--SirJective 14:08, 27. Feb 2006 (CET)