Wikipedia Diskussion:Personendaten/Wartung/Fehlerliste/Archiv/2008/Jun
Wie sieht es mit dieser Vorlage aus? Soll sie entfernt werden? Also so, oder kann sie drin bleiben, andernfalls, sollte man auf WP:PD explizit davon abraten. Der Umherirrende 00:48, 1. Jun. 2008 (CEST)
- Tja, die alte Diskussion. Es ist teilweise einfacher Personendaten zu extrahierieren, wenn die Lang-Vorlage nicht vorkommt. Sobald man aber aus der SQL-Ebene raus ist und mit regulären Ausdrücken arbeiten kann ist es bis auf das letzte Datenfeld (Sterbeort) kein Problem. Nur wenn man da auch noch solche Vorlagen zulässt, verlässt es den Bereich der einfachen regulären Ausdrücke. Die Vorlage:lang kann wirkliche Zusatzinformationen bringen. Ob die jemand derzeit nutzen kann ist die andere Frage. Ich persönlich bin da relativ emotionslos. Wir sollten uns nur auf eine der Möglichkeiten einigen. Wenn sie zugelassen werden, sollte das klar sein und an mehr stellen genutzt werden als derzeit, ansonsten halt entfernt werden (ich tendiere dazu, dass zweitere Lösung derzeit am ehesten durch die Wartungslisten praktiziert wird, finde aber auch die Lösung unter Nutzung der Vorlage attraktiv). --APPER\☺☹ 02:25, 1. Jun. 2008 (CEST)
- Meine Meinung ist raus damit. Hauptargument: die PD´s sollten für alle möglichst einfach zu extrahieren sein. Und da sind diese Vorlagen für viele einfache Ansätze einfach eine große Hürde. Alle Infos die diese Vorlage bringt kann man in der Klammer auch vorhalten. -- sk 09:51, 1. Jun. 2008 (CEST)
- "die alte Diskussion", wo kann ich den da was nachlesen? Ich kann mir auch vorstellen, das die Informationen der Vorlage in Klammern dahinter besser und einheitlicher genutzt werden können, andernfalls müsste man zwei Syntaxen zulassen (einmal sprachen per lang, und namensbestandteile), und immer gucken, ob auch gerade die richtige verwendet wird. Wie vielel Artikel wären betroffen? Der Umherirrende 11:37, 1. Jun. 2008 (CEST)
- Betroffen wären glaube ich gar keine. Weil wir derzeit überhaupt keine Vorlage drin haben. Sonst würde ja mein Skript nicht funktionieren. (A.A.o.Gewähr) -- sk 12:36, 1. Jun. 2008 (CEST)
- Mein Beispiel hast du gesehen? Das hatte ich von ALTERNATIVNAMEN mit Doppelpunkt, dort stehen jetzt auch noch welche, dort wo nach dem Doppelpunkt nichts mehr folgt. Beispielsweise Aaron Jakowlewitsch Gurewitsch, es scheint so, das du diese vorher herausfilterst. Der Umherirrende 12:43, 1. Jun. 2008 (CEST)
- Hmm, scheinbar hab ich da schon mal irgendwo eine Sicherung eingebaut. Auf jeden Fall hast du es meiner Meinung nach sehr schön umgebaut. -- sk 17:12, 1. Jun. 2008 (CEST)
Kategorie:Geboren doppelt
Hallo, diese Überschrift wird auch bei "Kategorie:Gestorben doppelt" angezeigt. Andim 22:00, 1. Jun. 2008 (CEST)
- Hab den Fehler korrigiert. -- sk 22:11, 1. Jun. 2008 (CEST)
Leerzeichen
Ich hab jetzt mal vom Skript nicht mehr das erste und letzte Leerzeichen wegschneiden lassen. Dadurch erhöht sich zwar die Fehlerzahl, aber vielleicht möchte der eine oder andere ja die Fehler abarbeiten. Dadurch werden jetzt auch z.B. "3. Februar " mit zwei Leerzeichen am Ende als inkorrekt in der Rubrik "mehrere Leerzeichen" angezeigt. Was meint ihr dazu? -- sk 20:59, 1. Jun. 2008 (CEST)
- Ich finde diese Änderung gut. Andim 22:00, 1. Jun. 2008 (CEST)
- An sich ist das ja nicht schlecht, aber vielleicht sollte man die Fehler mit nur Leerzeichen in einem Feld erstmal außen vorlassen, da so sehr viele "Fehler" gelistet werden. Vielleicht zum Ende hin, wenn weniger ist, da ein entfernen, nur von Leerzeichen sicherlich nicht gerne gesehen wird. Du hast so nämlich nicht nur die Rubrik "mehrere Leerzeichen" mit mehr Einträgen versehen, sondern sehr viele andere auch. Ich halte doppelte Leerzeichen (vorerst) für wichtiger. Der Umherirrende 22:24, 1. Jun. 2008 (CEST)
- Ok, ich hab das Skript entsprechend angepasst, dass es die einfachen Leerzeichen bei einigen Rubriken ignoriert. -- sk 20:53, 2. Jun. 2008 (CEST)
- An sich ist das ja nicht schlecht, aber vielleicht sollte man die Fehler mit nur Leerzeichen in einem Feld erstmal außen vorlassen, da so sehr viele "Fehler" gelistet werden. Vielleicht zum Ende hin, wenn weniger ist, da ein entfernen, nur von Leerzeichen sicherlich nicht gerne gesehen wird. Du hast so nämlich nicht nur die Rubrik "mehrere Leerzeichen" mit mehr Einträgen versehen, sondern sehr viele andere auch. Ich halte doppelte Leerzeichen (vorerst) für wichtiger. Der Umherirrende 22:24, 1. Jun. 2008 (CEST)
Pokerturnier ...
... will Personendaten (Zumindest steht es immer unter "Personendaten fehlen"). Und ich weiß nicht warum, es hat keine Kat Mann oder Frau oder Geboren oder Gestorben und auch keine Vorlageneinbindung. --Ephraim33 18:11, 2. Jun. 2008 (CEST)
- Das hab ich mich auch gefragt. Und heute hab ich endlich die Ursache entdeckt. Unter Pokerturnier#Preise steht ein Kommentar "Achtung: Vorlage:Infobox Pokerprofi linkt auf diese Überschrift! Ändere sie nur, wenn Du genau weist, was Du tust!" wodurch ich die Infobox Pokerprofi in dem Artikel finde und es als Person deklariert wird. Die frage sollte der Kommentar angepasst werden oder mein Skript? Ich persönlich finde diesen Kommentar seltsam. -- sk 20:45, 2. Jun. 2008 (CEST)
- Ich finde den Kommentar schon passend. Evtl. solltest du Kommentare vor der Auswertung löschen. Wie hast du eigentlich die Liste der "Personenkategorien" erstellt? Soweit ich das sehe, hast du nicht sämtliche Personenkategorien genommen, zumal das ja kompliziert ist, da unterhalb der Kategorie:Person auch Personenlisten sind. Aber auf jeden Fall hab ich letztens vier Personen der Kategorie "Radsportler (Spanien)" mit der Kat:Mann und Personendaten versehen, die da schon fast ein Jahr schlummerten. --APPER\☺☹ 00:36, 3. Jun. 2008 (CEST)
- Die Personenkategorie ist Handarbeit. War mal eine Fleißaufgabe, aber hat sich gelohnt. Ich muss jetzt nur noch mein Skript wieder anpassen, damit ich die auch nutzen kann. -- sk 20:26, 3. Jun. 2008 (CEST)
Neuer Dump
Hallo Stefan, unter [1] gibt es einen neuen dump, der wieder als Basis für die Auswertung dienen kann. Andim 07:57, 8. Jun. 2008 (CEST)
- Sehr schön, den werde ich gleich mal einpflegen. -- sk 09:43, 8. Jun. 2008 (CEST)
- Eingebaut! -- sk 21:27, 8. Jun. 2008 (CEST)
Eine Bitte an alle Abarbeiter der Fehlerliste
Bitte löscht Eure erledigten Einträge unbedingt aus den Listen. Natürlich wird man nicht jeden erledigten einzelnen Edit aus der Liste rausholen, würde ja auch die Versionsgeschichte unnötig aufblähen. Um unnötigen Aufwand zu vermeiden, schlage ich vor, dass wir in der entsprechenden Liste einen Bearbeitungsvermerk anbringen und diesen nach Ende der Bearbeitung auch wieder löschen. --Pelz 22:18, 1. Jun. 2008 (CEST)
- Ich halte es auch für sinnvoll den gesamten Abschnitt samt Überschrift und erklärung zu entfernen (Strg+A, Entf), den dann taucht die Überschrift erst garnicht im TOC auf und so ist es übersichtlicher. Es kommt ja beim nächsten Aktualisieren alles wieder. Für die vollen Listen (100 Einträge) ist ein Bearbeitungshinweis, wie es Vorlage:Inuse liefert, hilfreich, aber ich halte es nicht für verpflichtend, den wenn ich den besagten Fehler nicht mehr finde, schaue ich in die Versionsgeschichte, wenn dann kurz vorher ein Edit war, lasse ich die Rubrik in Ruhe. Der Umherirrende 22:28, 1. Jun. 2008 (CEST)
- Ich muss leider hier nochmal was sagen. Gerade habe ich mich geärgert als ich mir eine kleine Liste vornehmen wollte und feststellte, dass diese heute Nachmittag offenbar abgearbeitet worden ist. Dazu bedurfte es aber schon einiger Kontrollklicks die allesamt unnötig wären, wenn die Bearbeiter hier ihre abgearbeiteten Artikel löschen und vor dem Beginn der Abarbeitung den Abschnitt, wie auch immer, als in Bearbeitung kennzeichnen. Bitte SK ändere doch entsprechend den Erklärungstext. Danke. Gruss an alle Mitstreiter die sich hier einbringen. --Pelz 22:27, 9. Jun. 2008 (CEST)
Kategorie Mann/Frau fehlt
Was ist denn mit der Kategorie Kind in diesem Zusammenhang siehe hier? Ersetzt diese Kat die Kat Mann/Frau. Wenn ja, bitte die Auswertungen vielleicht ändern. Danke. --Pelz 22:43, 9. Jun. 2008 (CEST)
- Nein. Ein Kind ist entweder männlich oder weiblich und wird entsprechend einsortiert. --08-15 22:52, 9. Jun. 2008 (CEST)
ALTERNATIVNAMEN identisch mit Titel
Was ist bei jemandem wie Amauri zu tun? Soll NAME und ALTERNATIVNAMEN vertauscht werden oder soll ALTERNATIVNAMEN gelöscht werden? Gruß, Code·is·poetry 10:24, 11. Jun. 2008 (CEST)
- Name und Alternativnamen sollten vertauscht werden. Im Feld NAME sollte der Name wie im Lemma auftauchen, also der bekannte Name. --APPER\☺☹ 14:27, 11. Jun. 2008 (CEST)
Kurzbeschreibung mit Professor / Kurzbeschreibung mit "aus Land XY"
Das ist so lächerlicher Kleinkram, dass er nicht mal im Artikeltext automatisch behoben werden sollte, erst recht nicht in einer Box, die 95% der Leute nie zu Gesicht kriegen werden. Code·is·poetry 10:27, 11. Jun. 2008 (CEST)
- Das siehst du so. Einige Benutzer und ich sehen das aber anders. Die Punkte, die mein Skript auswirft, sind auch eindeutig als "Verbesserungsvorschläge" und nicht als zwingend notwendig zu sehen. Aber gerade die "Professoren" sollten dringend geändert werden. Oder findest du etwa Albert Oeckl - "deutscher Professor" aussagekräftig? Genauso Albin Moroder - "Bildschnitzer aus Österreich"! Ist zwar nicht falsch, aber wir haben uns hier auf die Form "österreichischer Bildschnitzer" verständigt und dann sollten wir das auch so durchziehen. -- sk 22:03, 11. Jun. 2008 (CEST)
Mehrfach angegebener Parameter
Was passiert eigentlich, wenn ein Parameter mehrhach angegeben ist, "gewinnt" dann die letzte Wertzweisung bei der Auswertung? Wird so etwas von dem Skript erkannt? USt 22:18, 11. Jun. 2008 (CEST) --
{{Personendaten
|NAME=Yoshitomo
|ALTERNATIVNAMEN=Zimmer, Carl
|ALTERNATIVNAMEN=Zimmer, Karl
|ALTERNATIVNAMEN=Hussan Bey
|ALTERNATIVNAMEN=Perez, Lorenzo
|ALTERNATIVNAMEN=Room, Charles
|KURZBESCHREIBUNG=deutscher Komponist, Chorleiter und Dirigent Karl/Carl Zimmer'
|GEBURTSDATUM=
|GEBURTSORT=Guben
|STERBEDATUM=
|STERBEORT=Berlin
}}
- Hmm... also es sollte auf jeden Fall als Fehler erkannt werdne, ich vermute nur, dass mein regulärer Ausdruck das sogar schlucken würde. Ich hoffe jedoch, dass Stefan sowas erkennt ;). --APPER\☺☹ 01:42, 12. Jun. 2008 (CEST)
- Also mir ist vor einigen Wochen mal so ein Fall untergekommen. Er war dann auch in einer Fehlerrubrik als Fehler angemeldet worden, aber ich weiß nicht mehr genau welcher Artikel es war und in welcher Fehlerrubrik er zu finden war. Wer einen solchen Fehler entdeckt bitte mal hier melden, ansonsten werde ich auch mal versuchen das Skript dahin gehend anzupassen. -- sk 08:08, 12. Jun. 2008 (CEST)
- Im Dump vom 7. Juni trat dies nur bei ALTERNATIVNAMEN auf, und zwar in genau folgenden Fällen:
Otto von Habsburg Jakob Albrecht Andreas Birnbacher Isa Haller - (hier fehlte das '|' vor dem 2. 'ALTERNATIVNAMEN') korrigiert von Pelz Friedrich von Suckow Wolfgang G. Haas - eine leere Alternative Jim Taylor Friedrich von Röth Alfred Heurteaux Hans Witten von Köln Maurycy Allerhand José Antonio Benton Leyla Gencer - eine leere Alternative Claude-Adrien Nonnotte - korrigiert von Frank C. Müller Yoshitomo - s.o., korrigiert von USt Antoine Sabatier de Castres
- Außer in den als 'korrigiert' beschriebenen Fällen ist der Fehler noch drin. (Ich ließ ihn drin, um eventuelle Tests zu ermöglichen. Es 'gewinnt' übrigens die letzte Zuweisung.) --Griot 21:34, 12. Jun. 2008 (CEST)
- Ich hab es in das Skript eingebaut. Kann aber gerade den Dump nicht scannen, weil es ein Problem auf dem Toolserver gibt. -- sk 22:17, 13. Jun. 2008 (CEST)
Leerzeichen
Um Edits wie diesen hier zu vermeiden, sollte vielleicht ein bisschen am Script gebastelt werden, so ein „\s*“ im RegExp ist ja nicht allzu aufwändig. Kann jedenfalls nicht angehen, dass sich hunderte Beobachtungslisten nach einem Script richten müssen, das MediaWiki-Syntax nicht sauber parst. Gruß, Code·is·poetry 17:41, 9. Jun. 2008 (CEST)
- Ich habe erst alle Artikel aufgelistet die mehr zwei oder mehr Leerzeichen hintereinander enthielten. Dabei hab ich ein führendes oder ein nachgestelltes Leerzeichen bei den Daten generell ignoriert. Ich wurde daraufhin aber auf Einträge wie "Text " mit zwei Leerzeichen hingewiesen, die wegen dem Ignorieren eines Leerzeichens nicht in der Liste enthalten waren. Deshalb habe ich dann auch diese Ignorierung der Leerzeichen herausgenommen, wodurch jetzt alle mit angezeigt werden. Ich werde da mal noch was machen. -- sk 21:47, 9. Jun. 2008 (CEST)
- Ich hab gerade nochmal nachgeschaut. Es werden nur die 1400 Artikel angezeigt, in denen sich in einem Datenfeld 2 oder mehr Leerzeichen hintereinander befinden. Ich denke das ist ok so. Ein Leerzeichen am Anfang oder am Ende wird ignoriert. -- sk 21:51, 9. Jun. 2008 (CEST)
- Ich halte es für wenig sinnvoll, sowas als Fehler zu deklarieren. Die Leerzeichen müssen nicht sein, sind meiner Meinung nach aber zu verkraften und entsprechen der Definition (die zwar nirgends explizit ist, aber implizit ist klar, dass auf jedes Datenfeld ein Trim angewendet werden muss). Vor allem stehen diese größtenteils unter "hohe Priorität". Also einfach ein Trim anwenden, das macht sowieso jeder, der es dann auswertet. Grüße --APPER\☺☹ 22:04, 9. Jun. 2008 (CEST)
- Unter "hoher Priorität" steht nur "GEBURTSDATUM oder STERBEDATUM mit falschem Ende". Da sind aber nur noch 45 Einträge abzuarbeiten. Bei eventuellen Änderungen bitte ich, dieses noch abzuwarten. Andim 22:11, 9. Jun. 2008 (CEST)
- Ich halte es für wenig sinnvoll, sowas als Fehler zu deklarieren. Die Leerzeichen müssen nicht sein, sind meiner Meinung nach aber zu verkraften und entsprechen der Definition (die zwar nirgends explizit ist, aber implizit ist klar, dass auf jedes Datenfeld ein Trim angewendet werden muss). Vor allem stehen diese größtenteils unter "hohe Priorität". Also einfach ein Trim anwenden, das macht sowieso jeder, der es dann auswertet. Grüße --APPER\☺☹ 22:04, 9. Jun. 2008 (CEST)
Vielleicht verstehe ich ja irgendwas falsch, aber IMHO reden wir hier über eine Syntax, die vollständig ok nach MediaWiki-Maßstäben ist. Und 1400 Artikel sind definitiv nicht „ok so“, weil das geschätzte 5000 Diff-Angugucken auf den verschiedensten Beobachtungslisten bedeuten. Für – nochmal deutlich: nix. Code·is·poetry 23:06, 9. Jun. 2008 (CEST)
- Für nix ist so auch nicht richtig. Die Personendaten sind für die automatische Auswertung gedacht. Das Beispiel: Chalid Scheich Mohammed "[[1. März]] [[1964]] oder [[14. April]] [[1965]] mag zwar für die Mediawiki-Software und Menschen ok sein, aber für den Programmierer einer Auswertung ist es eine weitere Fehlerquelle. Ich kann aber die Artikel wo wirklich nur am Anfang oder am Ende die Leerzeichen auftauchen entsprechend herausnehmen, wenn das die Mehrheit möchte. -- sk 06:50, 10. Jun. 2008 (CEST)
- Ich glaube der Grund für diesen Abschnitt war, das ein Leerzeichen zwischen Pipe und Parameter war und somit der NAME nicht richtig erkannt wurde. Siehe auch hier. Die Problematik der doppelten Leerzeichen im Text kann aber auch überdacht werden. Ich hatte mich dafür ausgesprochen, da so etwas immer vorkommt und ich es bei Textverabeitungsprogrammenm nicht richtig interpretiert wird, und ich nicht gedacht das es so häufig ist, wobei aber auch mal vorkommt, das am Ende jeder Zeile drei oder mehr Leerzeichen einfach so stehen, was sehr unsauber aussieht und meiner Meinung nach entfernt werden sollte, eine getrennete Liste wäre da vielleicht auch sinnvoll. Der Umherirrende 08:58, 10. Jun. 2008 (CEST)
- Mehrere Leerzeichen IM text sollten korrigiert werden, ja. Aber am Anfang oder am Ende oder gar vor der Pipe sollten egal sein. Ersteres sollte der entsprechende reguläre Ausdruck (da könnten wir auch mal einen einheitlichen Ausdruck für alle Auswerter irgendwo diskutieren) machen, letzteres wird einfach mit einem Trim auf die ausgelesenen Parameter erledigt (oder auch mit einem noch ausgeklügelteren regulären Ausdruck für die ganzen Personendaten... --APPER\☺☹ 14:32, 10. Jun. 2008 (CEST)
Ich hab den Fehler völlig missverstanden. Die oben genannte Änderung ist völlig korrekt. Dort wurde aus "| NAME=" das Leerzeichen entfernt. Das gehört zum Fehler "Datenfeld fehlerhaft", der für mich der wichtigste Fehler ist (deswegen Hohe Priorität). Durch die korrekte Einhaltung der Schreibweise der Vorlage, wie sie auch auf WP:PD aufgezeigt wird, haben wir eine wesentliche Erleichterung der Auswertung erreicht. Über 200000 Artikel werden genau so geschrieben. - Das mit den anderen Leerzeichen können wir noch klären. -- sk 22:40, 10. Jun. 2008 (CEST)
- Die Schreibweise ist aber in Wikisyntax korrekt. Wenn Skripte das nicht auswerten können, gehören die korrigiert. Solche Edits sehen einige als Sperrgrund an. --Complex 23:59, 10. Jun. 2008 (CEST)
- Wie gesagt, bei über 200000 Artikel wird die Vorlage so geschrieben. Beim letzten Durchlauf des Skriptes wurde dieser Fehler bei drei Artikel angemeldet. Ich denke hier kann man von Gewohnheitsrecht sprechen. -- sk 08:16, 11. Jun. 2008 (CEST)
- Nein, warum auch? Skripte so zu schreiben und ggf. anzupassen, dass sie auf jede gültige Eingabe korrekt reagieren sollte zur Selbstverständlichkeit gehören. --Complex 08:46, 11. Jun. 2008 (CEST)
- Bitte schau dir nochmal die Seite WP:PD genau an. Dort wird die Vorlage so festgelegt.
{{Personendaten |NAME= |ALTERNATIVNAMEN= |KURZBESCHREIBUNG= |GEBURTSDATUM=<br /> |GEBURTSORT= |STERBEDATUM=<br /> |STERBEORT= }}
Wenn jetzt bei 200000 Artikeln das so gemacht wird dann ist es wirklich nicht hilfreich wenn dann jemand so was macht
{{ Personendaten| NAME = Mustermann, Schulz |ALTERNATIVNAMEN= |KURZbeschREIBUNG= |GEBURTSDATUM=<br /> | Geburtsort= Dresden |STERBEDATUM=<br /> | STERBEORT = München }}
Klar ist das auswertbar für die Mediawiki-Software, aber wollen wir das wirklich so? Nein, wir wollen eine standardisierte Form, die jeder mit möglichst wenig Aufwand auslesen kann. Genau deshalb versuchen wir solche kleinen Abweichungen wie bei Rihanna zu entfernen. -- sk
- Und genau diese Trivialedits sind sinnlos ressourcenfressend. Rate mal, warum Bots "minimale Änderungen und kleine Schönheitskorrekturen (z. B. überflüssige Leerzeichen entfernen) nur zusammen mit größeren, wirklich gravierenden Eingriffen vornehmen" sollen und erklär mir, warum das inhaltliche Argument dahinter nicht für Personendaten gelten sollte. --Complex 09:10, 12. Jun. 2008 (CEST)
- Ein Bot ändert täglich hunderte von Seiten. Da macht so eine Regel sinn. Aber wenn wir hier täglich 3-5 Seiten haben in denen der Fehler eventuell auftritt, dann sehe ich da kein Problem, wenn das ein Benutzer ändert. -- sk 20:48, 13. Jun. 2008 (CEST)
- Das ändert nichts daran, dass die Bearbeitungen für den Artikel total unnötig sind. Durch nicht durch das Bottag geschützte Edits macht es die Sache nur noch schlimmer. --Complex 23:39, 14. Jun. 2008 (CEST)
- Nun mach mal bitten einen Punkt. Die Bearbeitungen sind sinnvoll. Und sie werden von Benutzern durchgeführt, also ist da auch kein Bottag nötig. Und, das ist meiner Meinung nach entscheidend: Es werden nur extrem wenige solcher Einträge durchgeführt. So wenig, dass wir uns hier jegliche Diskussion sparen können und die Kräfte statt in dieser Diskussion woanders sinnvoll walten lassen können. -- sk 10:25, 15. Jun. 2008 (CEST)
GEBURTSORT oder STERBEORT eventuell im Text
Ich schlage für diese Rubirk vor, erstmal nur den ersten Satz (bei kurzen Artikeln) oder den ersten Abschnitt (bei längere Artikeln, "section=0") zu beachten, dadurch wird die Anzahl vielleicht erstmal etwas übersichtlicher und außerdem ist die trefferchance enorm höher. Alternativ kann anstatt von kurzen Artikel auch nur Artikel mit einer oder zwei Überschriften und anstatt der langen Artikel welche mit 3 oder mehr Überschriften berücksichtigt werden. Der Umherirrende 22:38, 16. Jun. 2008 (CEST)
- Bitte A, B und C aus dieser Rubrik ausblenden, da dort keine Treffer mehr sind. Damit werden die nächsten zugänglich und können abgearbeitet werden. Der Umherirrende 17:52, 17. Jun. 2008 (CEST)
- Aufgrund des Umfangs der Rubrik und der Tatsache, das alle Seiten nur einmal begutachtet werden müssen, halte ich eine komplette Auslagerung für sinnvoll. Es könnte ja die Fehlerliste2 reaktiviert werden. Einfacher wäre es, wenn der Vorschlag aus dem ersten Absatz dieses Abschnitt umsetzbar wäre. Der Umherirrende 14:35, 18. Jun. 2008 (CEST)
- Ich habe noch keine clevere Methode gefunden nur den ersten Absatz eines Artikels zu betrachten. Bsp: Tom Jones, wenn man sich da mal den Artikeltext anschaut, sieht man das es zuviele Ausnahmen dabei gibt (ein oder mehrere Bilder, Begriffsklärung, Chartplatzierungen, Infoboxen und vieles mehr). Mein Vorschlag wäre jetzt, das man bei den Artikeln die ersten 200-300 Zeichen betrachtet und dort nach dem Datum sucht (gefolgt von in,bei,...). Da sind dann wesentlich weniger Artikel als bisher. Später kann man ja die Zeichenzahl erhöhen oder ganz weg nehmen, weil sehr häufig auch z.B. der Sterbeort ganz am Ende eines Artikels erst erwähnt wird. --sk 18:29, 18. Jun. 2008 (CEST)
- Ich habe mal die Fehlerrubrik geändert, so dass nur noch die ersten 600 Zeichen überprüft werden. Mal sehen wie das beim nächsten Durchlauf aussieht. -- Oksk 22:39, 18. Jun. 2008 (CEST)
Löschkandidaten
Es würde sinn machen, die Artikel mit Vorlage:Löschantrag aus dieser Liste generell auszuschließen. Beispielsweise ist jetzt ein roter Link auf der Seite. Außerdem ist ein edit ja unnötig, wenn der Artikel gelöscht wird, sofern auf behalten entschieden wurde, können die Fehler ja immernoch ausgebügelt werden, wenn die Vorlage entfernt wurde, so dringend sollte es ja nicht sein, das es direkt gemacht werden muss. Außerdem kann die Zeit sinnvoller genutzt werden. Der Umherirrende 20:31, 17. Jun. 2008 (CEST)
- Stimme dem fleißigen Der Umherirrende zu. Scheint mir auch sinnvoll zu sein. --Pelz 21:43, 17. Jun. 2008 (CEST)
- Kompromissvorschlag: Ich baue eine weitere Rubrik ein "PD fehlt und Löschantrag" (niedrige Priorität). Begründung: Mein Skript scannt jeweils die letzten neuen Artikel und schau ob es sich um Personenartikel handelt. Wenn das der Fall ist, wird alles durchgecheckt. Falls irgend ein Fehler gefunden wird, dann wird am nächsten Tag dieser Artikel erneut gecheckt. Würde ich jetzt aber einen Artikel wegen eines Löschantrages ganz rauswerfen, dann würde mir bei einem doch nicht gelöschten Artikel diese ganz verloren gehen und er erst wieder beim nächsten neuen Dump über den Weg laufen. Mit der neuen Kategorie können wir das umgehen und trotzdem die Rubrik "Personendaten fehlen" sauber halten. Generell gilt, wenn ein Artikel nicht mehr gefunden wird, weil gelöscht, dann taucht er auch nicht mehr in der Fehlerliste auf. Demnach würde sich die neue Rubrik selber aufräumen, weil ja entweder der Artikel gelöscht wird oder der Löschantrag wieder rausgenommen wird. -- sk 18:21, 18. Jun. 2008 (CEST)
- eingebaut mit extra Rubrik. Mal sehen wie das beim nächsten Durchlauf aussieht. -- Oksk 22:38, 18. Jun. 2008 (CEST)
- Ok, schauen wir mal, ich hatte es eigentlich so gedacht, das die Artikel in jeder Rubrik ignoriert werden, also garnicht analysiert werden. Vielleicht kann man es so realiseren, das man eine Liste anlegt, wo Artikel mit Löschantrag drauf stehen, und diese Liste vor jedem Lauf kontrolliert wird, ob noch ein Löschantrag vorhanden ist, wenn nicht, dann kommt der Artikel in den großen Pott, ansonsten bleibt der in der Liste und wird ignoriert. Der Umherirrende 22:46, 18. Jun. 2008 (CEST)
- Nein, wenn PD-Daten drinne sind, dann werden alle Fehlerrubriken überprüft. Meist geht es ja nur um die Artikel, in denen noch keine Personendaten drin sind, die kommen jetzt in die extra Rubrik. Überprüft werden sie auch bei jedem Check. -- sk 22:49, 18. Jun. 2008 (CEST)
- Ok, schauen wir mal, ich hatte es eigentlich so gedacht, das die Artikel in jeder Rubrik ignoriert werden, also garnicht analysiert werden. Vielleicht kann man es so realiseren, das man eine Liste anlegt, wo Artikel mit Löschantrag drauf stehen, und diese Liste vor jedem Lauf kontrolliert wird, ob noch ein Löschantrag vorhanden ist, wenn nicht, dann kommt der Artikel in den großen Pott, ansonsten bleibt der in der Liste und wird ignoriert. Der Umherirrende 22:46, 18. Jun. 2008 (CEST)
- eingebaut mit extra Rubrik. Mal sehen wie das beim nächsten Durchlauf aussieht. -- Oksk 22:38, 18. Jun. 2008 (CEST)
GEBURTSORT und STERBEORT eventuell im Text
Der Artikel Katharina von Hanau (gestorben 1581) enthält keine Informationen zu den Orten und sollte daher ausgeblendet werden. Der Umherirrende 14:12, 18. Jun. 2008 (CEST)
- Ist die Dame überhaupt relevant? Zu ihr steht extrem wenig in dem Artikel. Ich definiere ungern feste Ausnahmen, weil das typischerweise immer weitere Ausnahmen nach sich zieht und so ich am Ende immer mehr Arbeit habe. Na mal schauen. -- sk 18:32, 18. Jun. 2008 (CEST)
- eingebaut. -- Oksk 22:37, 18. Jun. 2008 (CEST)
- Ich kann nicht sagen, ob sie relevant ist, aber du hast mit den Ausnahmen, das kann sich nur auftürmen, aber was soll man sonst machen, jedes mal den Artikel wieder zu entfernen ist ja auch doof, vorallem da es Zeit bindet und neue auch erstmal verduzt gucken. Daher denke ich, ist es so die beste Möglichkeit. Der Umherirrende 22:49, 18. Jun. 2008 (CEST)
Hohes Alter
Bei dem Fehler "GEBURTSDATUM und STERBEDATUM ergeben zu hohes Alter" werden ja mittlerweile 5 Artikel angezeigt. Was wollen wir mit solchen Artikeln machen. Soll ich die in mein Skript aufnehmen, so das sie dort nie mehr erscheinen oder soll ich die da weiter bis in alle Ewigkeit stehen lassen? Die Obergrenze von 122 Jahren würde ich aber gerne so bestehen lassen, da man dadurch schnell Fehler entdecken kann. Meinungen? -- sk 08:19, 11. Jun. 2008 (CEST)
- Ich würde bevorzugen, diese als Ausnahmen ins Skript aufzunehmen. Vielleicht kann man auch die Höchstgrenze von 122 auf z.B. 115 senken, dadurch entstehen aber mehr Ausnahmen. Andim 08:27, 11. Jun. 2008 (CEST)
- Ok, ich werde das mal einbauen. -- sk 21:58, 11. Jun. 2008 (CEST)
- Ist eingebaut und Alter auf 115 gesenkt. -- sk 22:18, 13. Jun. 2008 (CEST)
- Sujin und Zhaozhou sollten auch auf die Ausnahmeliste. Andim 07:48, 17. Jun. 2008 (CEST)
- Der Text müsste auch noch angepasst werden, vielleicht auch mit Hinweis auf Ausnahmen, und wo man sie melden kann. Der Umherirrende 21:53, 17. Jun. 2008 (CEST)
- , eingebaut und Text angepasst. -- Oksk 22:40, 18. Jun. 2008 (CEST)
- Scheint sich ein Tippfehler eingeschlichen zu haben: Hier steht der Artikel als Ausnahme, wird aber trotzdem angezeigt. Der Umherirrende 14:48, 19. Jun. 2008 (CEST)
- Ja, sowas kann passieren. :-) -- sk 21:58, 19. Jun. 2008 (CEST)
Ungenaue Geburts- und Sterbedaten
Hallo, ich habe noch einige Vorschläge im Bereich Geburts und Sterbedatum
- 1) Wenn im Feld GEBURTSDATUM oder STERBEDATUM nur ein Jahrhundert angegeben ist, so sollen diese Artikel auch in die entsprechenden Kategorien sein.
- 2) Wenn das Datum aus "um Jahr" besteht, darf die Kategorie "Geboren Jahr" bzw. "Gestorben Jahr" nicht vorhanden sein. Diese Artikel sollten dann in den Kategorien "Geboren im Jahrhundert" bzw. Kategorien "Gestorben im Jahrhundert" sein. Was macht man z.B. bei "um 1300" (Geboren im 13. Jahrhundert oder Geboren im 14. Jahrhundert)?
- Ebenso bei "vor Jahr", "nach Jahr" und "oder mit zwei Jahresangaben" Andim 00:43, 20. Jun. 2008 (CEST)
- 3) Wenn die Kategorie "Geboren im Jahrhundert" oder "Gestorben im Jahrhundert" vorhanden ist, so sollte dies auch im GEBURTSDATUM oder STERBEDATUM stehen.
Andim 21:42, 18. Jun. 2008 (CEST)
- Ok, diese Rubriken kann ich alle mit einbauen. Wird zwar nicht mehr heute, aber in den nächsten Tagen bestimmt. Danke für die Vorschläge. -- sk 22:08, 18. Jun. 2008 (CEST)
Verlinkung schlecht
Ich hatte gesehen, das es mal eine solche Rubrik gab, ich hätte dafür noch eine Idee. Eine Verlinkung ist auch schlecht wenn sie so ist:
[[Link | Linktext]]
(Beispiel) Ich weiß nicht, ob sich das lohnt zu verbessern, ich halte es für sinnvoll, sofern machbar. Der Umherirrende 12:05, 19. Jun. 2008 (CEST)
- Kann ich mit einbauen.-- sk 21:57, 19. Jun. 2008 (CEST)
Lemma und Name in den PD
Ich verweise hier mal auf meine Anfrage an Marcus. Danach sollte die Rubrik "Name fehlt Leerzeichen" wohl entweder mit einem entsprechenden Hinweis versehen werden, oder die entsprechenden Namen müssen auf eine Negativliste. Was machen wir hier? --Pelz 22:46, 17. Jun. 2008 (CEST)
- Ich bin da etwas anderer Meinung als Marcus. Wenn ich ihn richtig verstehe möchte er bei Nikarete aus Korinth nur den fachlich korrekten Namen im Datenfeld NAME stehen sehen (also "Nikarete"), aber als Artikeltitel soll weiterhin "Nikarete aus Korinth" stehen bleiben. Meiner Meinung nach versteht er aber dann den Sinn der Personendaten falsch. Wir wollen mit den Personendaten nicht eine Fachdatenbank erstellen sondern die Wiedrigkeiten der Wikipediasystems ausmerzen. Der Anstoß für die Personendaten waren doch die schlechte Sortierbarkeit. Nur dafür und nicht für irgendwas anderes wurden die Personendaten eingefügt und mit zusätzlichen Infos (Lebenszeit und Kurzbeschreibung) versehen. Im Nachhinein in das Feld NAME etwas hineinzwängen zu wollen was so nicht geplant war, ist nicht die feine Art. Deshalb befürworte ich ja auch die strikte Vorgehensweise nur den konkreten Titel im Datenfeld NAME in der korrekten Sortierreihenfolge einzutragen und das wäre hier eben "Nikarete aus Korinth". Wenn ihn das stört, dann soll er sich um eine Umbenennung des Artikels kümmern. z.B. Nikarete (aus Korinth) oder Nikarete (Korinth). Dann würde ich sofort höchstpersönlich in den Personendaten "NAME=Nikarete" eintragen. Alles andere ist inkonsequent und nicht zielführend. -- sk 18:15, 18. Jun. 2008 (CEST)
Die Diskussion hat sich wohl hierhin verlagert. USt 17:07, 21. Jun. 2008 (CEST) --
Zuviele Leerzeichen und Vorlage:lang
Da es so scheint, das die Vorlage:lang in Personendaten erhalten bleibt, müssen ein paar anpassungen her.
- Bei der Rubrik "Zuviele Leerzeichen" sind jetzt nur noch Artikel enthalten, die die Vorlage in den Personendaten haben. Durch das wegschneiden der Vorlage entstehen aber durch das vorherige Leerzeichen und nachfolgende Leerzeichen ein doppeltes Leerzeichen, welches dann in der Rubrik auftaucht. Vielleicht kann man immer ein Leerzeichen mit wegschneiden, sofern vorhanden?
- Die Rubrik "ALTERNATIVNAMEN mit schlechtem Anfang" enthält auch Artikel, welche die Vorlage in den Personendaten haben, durch das wegschneiden der Vorlage bleiben aber beispielsweise ein semikolon alleine stehen, dies führt auch wieder zu einem Eintrag, obwohl ja nichts falsch ist (für die Rubrik). Hierfür sollte ein nachfolgendes Semikolon auch entfernt werden.
- Ob nach der Vorlage ein sprachangabe fehlt, wäre etwas für eine neue Rubrik.
Falls ich das mit der Vorlage:lang nicht richtig mitbekommen habe, dann schreibt es hier, dann müss die Vorlage nur entfernt werden und das Problem ist gelöst Der Umherirrende 19:25, 23. Jun. 2008 (CEST)
- Ich bitte darum, die Vorlage:lang nicht mehr zu entfernen. Die Diskussion hat sich in Richtung 'zulassen' bewegt. Eigentlich fehlt nur noch die Zustimmung von sk, der als Einziger noch Einwände erhob. Das ist aber auch schon einige Zeit her. Solange dies in der Schwebe ist, macht die Bearbeitung der PD von Personen mit Originalnamen in nichtlateinischen Schriftsystemen wenig Sinn. Um einen Durchbruch zu erzielen, wäre es allerdings gut, auch zwei weitere Entscheidungen zu fällen: (1) Es sollten mehrzeilige Angaben toleriert werden, d.h., sie sollten, wo man sie findet, nicht ohne 'guten Grund' beseitigt werden. (2) (Nicht ganz so wichtig.) Es sollte ein Semikolon am Anfang des ALTERNATIVNAMEN-Feldes zulässig sein oder eines am Ende des NAME-Felds. (Zum Sinn beider Wünsche, siehe Hilfe Diskussion:Personendaten/Alternativnamen#Beziehung originaler Name zu transliteriertem/transkribiertem. Selbst wenn über den Sinn mehrzeiliger Angaben noch keine Einigkeit erzielt wird, könnte bereits entschieden werden, sie zu tolerieren.) --Griot 21:55, 23. Jun. 2008 (CEST)
- Ich entferne die Vorlage nicht mehr, füge sie aber auch nicht hinzu. Ich halte sie nicht für nötig, dulde sie aber. Ich habe nur um Meldung gebeten, falls ich die Entscheidung nicht richtig mitbekommen haben sollte und dann hätte ich die gelisteten Fehler auch selber bereinigen können, so muss das skript angepasst werden. Zu den anderen Dingen kann ich allerdings nichts sagen. Der Umherirrende 22:52, 23. Jun. 2008 (CEST)
- Ich bin gerade beruflich und private stark eingespannt. Ich kann deshalb gerade nix am Skript ändern. Nur kurz meine Meinung zur Vorlage:Lang. Weg damit. Es verkompliziert nur alles und wenn ich mich jetzt nicht verzählt habe, dann sind derzeit so oder so nur 15 mal diese Vorlage in den 200000 Personendaten drin. Wir brauchen überhaupt es nicht in den Personendaten. Wir haben Unicode, damit kann ich kyrillisch und japanisch und chinesisch darstellen und Infos können in die Klammern dahinter. -- sk 21:37, 26. Jun. 2008 (CEST)
- Das bitte hier diskutieren. --APPER\☺☹ 21:57, 26. Jun. 2008 (CEST)
Irgendetwas läuft schief
- ALTERNATIVNAMEN identisch mit Titel: Die Artikel stehen heute so ziemlich alle wieder in der Liste, obwohl sie gestern korrigiert wurden.
- Personendaten fehlen: z.B. wurden Peter Kubelka und Nazar (Rapper) schon am Vortag korrigiert, stehen aber wieder in der Liste.
Wo klemmt's? USt 12:05, 29. Jun. 2008 (CEST) --
- Ich hab den Fehler nach deiner Meldung gesehen. Hab versucht nachzuvollziehen, warum dieser Fehler passiert ist. Hab aber bisher keine vernünftige Erklärung. Bei der Liste vom 30. Juni tauchen dann die besagten Artikel nicht mehr auf. Hab erst darauf getippt, dass es evtuell Löschkandidaten waren, aber dass trifft nicht zu. Vielleicht hatte ja auch nur der Server einen Schluckauf. Also weiter beobachten und falls nochmal auftritt einfach hier melden. -- sk 22:48, 30. Jun. 2008 (CEST)
GEBURTSDATUM oder STERBEDATUM ist nicht korrekt angegeben
Hier landeten ein paar Einträge mit Daten aus dem Monat Jänner. Bekanntlich ist ja diese Schreibweise mit Rücksicht auf die sprachliche Gepflogenheit unserer österreichischen Freund zulässig. Kann man da Filtern? --Pelz 23:35, 30. Jun. 2008 (CEST)
- Soweit ich weiß, sollen in den PD keine "sprachliche Gepflogenheit" gepflegt werden. Steht auch so auf WP:PD#Datum. Der Umherirrende 23:41, 30. Jun. 2008 (CEST)
Kurzbeschreibung mit "aus Land XY"
Kannst du bei der Beschreibung der Rubrik Kurzbeschreibung mit "aus Land XY" einen Link auf Wikipedia:Namenskonventionen/Staaten einfügen? Häufig scheitert die Korrektur (zumindest bei mir) daran, dass das Adjektiv unbekannt ist. Außerdem sollten - falls möglich - die Länder ohne Adjektiv als Ausnahmen definiert werden. Dies betrifft wohl vor allem:
- Republik Kongo/Demokratische Republik Kongo
- St. Kitts und Nevis
- Trinidad und Tobago
- Vereinigte Arabische Emirate
Insbesondere Letztere stehen gerade in dieser Rubrik. --Schnark 09:48, 27. Jun. 2008 (CEST)
- Denn Link kann ich problemlos einfügen. Die Ausnahmen werde ich auch bei nächster Gelegenheit mal entsprechend auslesen. Danke für den Hinweis. -- sk 22:49, 30. Jun. 2008 (CEST)
- Eingebaut! -- sk 22:29, 2. Jul. 2008 (CEST)
Neuer Dump
Unter [2] gibt es einen neuen Dump. Andim 10:13, 30. Jun. 2008 (CEST)
- Eingebaut. -- sk 22:45, 30. Jun. 2008 (CEST)
Unter [3] gibt es wieder einen neuen Dump. Andim 10:04, 13. Jul. 2008 (CEST)
- Danke für den Hinweis. -- sk 10:27, 13. Jul. 2008 (CEST)
Und schon wieder [4]. Andim 08:58, 25. Jul. 2008 (CEST)
- Ich habe jetzt etwas an meinem Skript gebastelt. Es werden jetzt automatisch neue Dumps heruntergeladen und abgearbeitet. Ihr braucht also keine Hinweise mehr geben. Danke. -- sk 11:01, 26. Jul. 2008 (CEST)
- Stefan braucht den Hinweis nicht mehr... Ich allerdings würde mich weiter darüber freuen, vielleicht auch andere? Vorschlag: Da anscheinend (oder ?) z.Zt. mittels Beobachtungsliste kein Hinweis auf einen neuen Dump erhältlich ist, könnte eine festgelegte beobachtbare Seite (vielleicht Wikipedia:Download ?) minimal geändert werden - etwa: Leerzeichen einfügen/streichen - mit Zusammenfasung 'Neuer Dump'. --Griot 11:54, 28. Jul. 2008 (CEST)
Führende Null bei Geburts- und Sterbedatum
In den letzten Tagen sind mir einige PD mit Geburtsdaten der Form 05. Januar 1960 untergekommen. Dies sollte auch erkannt werden. Andim 18:35, 23. Jun. 2008 (CEST)
Verbesserungsvorschläge
Folgendes hab ich noch für die Erweiterung mir überlegt:
- 1) Nutzung der Infoboxen:Person zum Suchen weitere Daten (Geburtstag etc.)
- 2) Artikel nach Personen durchforsten die zwar eine Personenkategorie (Kategorie:Schauspieler) haben aber sonst nix personenspezifisches (dazu muss ich mal eine Liste alle Personenkategorien generieren)
- 3) Filterung des ersten Absatzes nach * und † um weitere Personen ohne PD zu finden
- 4) Auswertung fremdsprachiger Personendaten (en etc.), dadurch Abgleich und Fehlersuche möglich
Falls ihr noch weiter Ideen habt, egal wie spinnert, einfach mal hier mit auflisten für das gemeinsame Brainstorming! -- sk 22:00, 8. Mai 2008 (CEST)
- zu 2) Eingebaut und in der Testphase. -- sk 22:13, 15. Mai 2008 (CEST)
- 5) Abgleich des Datums im ersten Absatz nach * und † mit den Daten in den Personendaten.
- 6) In dieser Version [5] war der Anfang vom GEBURTSORT "in". Dies könnte man auch erkennen lassen. Wurde das nicht sogar in der alten Version gemacht?
Andim 22:27, 8. Mai 2008 (CEST)
- zu 5) Extrem schwierig. Weil zu viele Sonderfälle. Deswegen lässt es sich ja nicht automatisiert aus dem Text rausfiltern. Aber ich kann testen ob z.B. das Geburtsdatum im Text auch nochmal auftaucht. Das ist einfach zu machen
- Im allgemeinen geht das nicht. Kann man aber nicht nach "* Datum" und "† Datum" im ersten Absatz suchen, und nur die Artikel betrachten, in denen das so auftritt. Also Artikel, bei denen nach * oder † kein konkretes Datum kommt, ignorieren. Andim 11:34, 11. Mai 2008 (CEST)
- Das würde gehen. -- sk 11:48, 11. Mai 2008 (CEST)
- Im allgemeinen geht das nicht. Kann man aber nicht nach "* Datum" und "† Datum" im ersten Absatz suchen, und nur die Artikel betrachten, in denen das so auftritt. Also Artikel, bei denen nach * oder † kein konkretes Datum kommt, ignorieren. Andim 11:34, 11. Mai 2008 (CEST)
- zu 6) Kein Problem, wird mit eingebaut. --sk 22:24, 10. Mai 2008 (CEST)
- Eingebaut. -- sk 11:56, 11. Mai 2008 (CEST)
- 7) Kann man bei den 'Kategorie:Geboren fehlt' auch eine Schnittmenge der beiden machen, sowas wie 'Kategorie:Geboren und Kategorie:Gestorben fehlt', dann muss es natürlich auch 'nur Kategorie:Geboren fehlt' geben. Würde die Sache vereinfachen, da man beispeilsweise keine Kategorie vergessen kann, wenn beide fehlen, oder aber auch nicht zuviel setzt, falls man die eine nicht gesehen hat. Fänd ich ganz praktisch. Machbar? Der Umherirrende 23:46, 8. Mai 2008 (CEST)
- zu 7) Hmm, ja das sollte machbar sein. Sehe ich aber als nicht so dringend an. Ich schau mal wie einfach das geht. -- sk 22:24, 10. Mai 2008 (CEST)
- Eingebaut. Aber aus technischen Gründen gibt es keine Rubrik 'nur Kategorie:Geboren fehlt'. Alle die in der Sammelrubrik auftauchen, tauchen auf in den einzelnen Rubriken auf. -- sk 11:56, 11. Mai 2008 (CEST)
- Es scheint mir so, das die Liste derzeit Seiten enthält, die Geburtsdatum und Sterbedatum haben, aber eine Kategorie fehlt. Ich fände es aber sinnvoller, wenn dort nur Seiten stehen, wobei beide Kategorieeinträge fehlen und Geburtsdatum und Sterbedatum vorhanden ist, zumindestens würde ich das "sowie" so interpretieren. Aber "aber es fehlt der Kategorieneintrag" sagt wieder das gegenteil, da wäre "aber es fehlen die Kategorieeinträge" besser. Ansonsten finde ich das gut so. Wäre das so auch machbar? Der Umherirrende 00:12, 14. Mai 2008 (CEST)
- Das war ein Bug. Mir ist der auch aufgefallen und ich hab ihn jetzt mit rausgenommen. Interessanterweise bin ich dadurch auch auf einen neuen Fehler in den Personendaten gestossen. Wenn z.B. 2x Kategorie:Geboren eingetragen ist und kein gestorben. Werde das aber nicht mit als neuen Fehler ausgeben, weil diese Artikel ja bei "Kategorie fehlt" mit auftauchen. -- sk 22:13, 15. Mai 2008 (CEST)
- Es scheint mir so, das die Liste derzeit Seiten enthält, die Geburtsdatum und Sterbedatum haben, aber eine Kategorie fehlt. Ich fände es aber sinnvoller, wenn dort nur Seiten stehen, wobei beide Kategorieeinträge fehlen und Geburtsdatum und Sterbedatum vorhanden ist, zumindestens würde ich das "sowie" so interpretieren. Aber "aber es fehlt der Kategorieneintrag" sagt wieder das gegenteil, da wäre "aber es fehlen die Kategorieeinträge" besser. Ansonsten finde ich das gut so. Wäre das so auch machbar? Der Umherirrende 00:12, 14. Mai 2008 (CEST)
- Eingebaut. Aber aus technischen Gründen gibt es keine Rubrik 'nur Kategorie:Geboren fehlt'. Alle die in der Sammelrubrik auftauchen, tauchen auf in den einzelnen Rubriken auf. -- sk 11:56, 11. Mai 2008 (CEST)
- 8) In [6] dieser Version war bei NAME ein Leerzeichen vor dem Komma. Dies ud ähnliches Plenken kann man auch überprüfen. Andim 22:52, 9. Mai 2008 (CEST)
- zu 8) Ja, ist kein Problem. Werde das für alle anderen Felder gleich mitprüfen. -- sk 22:24, 10. Mai 2008 (CEST)
- Eingebaut. -- sk 11:56, 11. Mai 2008 (CEST)
- Leerzeichen vor Komma ist abgearbeitet. Wird auch nach Leerzeichen vor ;:). gesucht? Andim 16:17, 19. Mai 2008 (CEST)
- Eingebaut. -- sk 11:56, 11. Mai 2008 (CEST)
- 9) [7], könnte man solche Fehler finden? Also: "zwischen 1. und 3. Januar 2008" oder auch "1. oder 3. Januar 2008". --Klapper 22:11, 10. Mai 2008 (CEST)
- zu 9) Ja, das sollte einfach machbar sein. Ich suche nach 'Zahl. und Zahl.' und sollte so alle Tage mit "und" dazwischen bekommen. -- sk
- Eingebaut. -- sk 11:56, 11. Mai 2008 (CEST)
- Könnte man das mit 'Zahl. oder Zahl.' auch noch einbauen? Da gehört ja auch das volle Datum rein.--Klapper 20:54, 13. Mai 2008 (CEST)
- Eingebaut. -- sk 11:56, 11. Mai 2008 (CEST)
- 10) Wäre es möglich, die Nekrologe (z.B. Nekrolog 2008) durzugehen mit den PDs vergleichen?--Klapper 20:54, 13. Mai 2008 (CEST)
- Welchen Vorteil soll das bringen? Derzeit werden erst der Dump und dann Live die neusten Artikel analysiert. Spätestens beim nächsten Dump fallen die Leute aus dem Nekrolog mit auf. Derzeit finde ich den Aufwand zu groß. -- sk 21:13, 13. Mai 2008 (CEST)
- Ich habe es mir so vorgestellt: einmal werden die verschiedene Nekrologs-Artikel automatisch durchgegangen. (erster Artikel öffnen; überprüfen ob zB Kategorie:Gestorben 2005 drinn ist; Todesdatum in der PD mit Nekrolog vergleichen; Geburtsdatum nach dem Alter im Nekrolog überprüfen) Das wäre ähnlich wie dein Vorschlag #1. Vorteil wäre, dass im Nekrolog meistens Quellen angegeben sind. Es kann ja sein, dass das Todesdatum um einen Tag korrigiert wurde und die Änderung im Artikel vergessen worden ist. Ob das möglich ist oder zu aufwändig wär, musst natürlich du sagen. --Klapper 23:48, 16. Mai 2008 (CEST)
- 11) [8] Ich denke nicht, dass es diesen Fehler oft gibt, eine Suche nach "ist" in Name oder Alternativnamen würde vielleicht trotzdem was bringen. --Klapper 23:48, 16. Mai 2008 (CEST)
- Gute Idee, ich suche gleich noch nach "war", "wird" etc. -- sk 09:45, 17. Mai 2008 (CEST)
- Eingebaut. Den Fehler gab es aber nur in 3 Artikeln Bernd Dittert, Bob Latchford, Fazang. Aber für die Zukunft wird das jetzt automatisch mit entdeckt. -- sk 09:44, 25. Mai 2008 (CEST)
- 12) Wird nach dem schon gesucht: Jemand hat zwei unterschiedliche Geboren/Gestorben Kategorien (also zb. Gestorben 2001 und Gestorben 2005). Mehrere Personen brauchen ja keine PDs/Personen-Kats und bei Unklarheiten sollte keine Kat drinn sein. --Klapper 22:53, 17. Mai 2008 (CEST)
- Nein danach wird noch nicht gesucht, aber ich hab letztens auch einen Fall gesehen, wo 2x die Kategorie:Geboren auftaucht. -- sk 17:59, 18. Mai 2008 (CEST)
- 13)[9] "Unbekannt" in einem Feld.--Klapper 14:34, 18. Mai 2008 (CEST)
- Unbekannt hab ich bisher noch nicht mit abgefragt, weil ja noch so viel zu machen gewesen ist. Ich werde es mal einschalten. -- sk 18:01, 18. Mai 2008 (CEST)
- Eingebaut! -- sk 20:28, 25. Mai 2008 (CEST)
- 14) Prüfung auf die Verwendung des richtigen Apostroph, also so wie im Lemma, dies ist mir hier aufgefallen. Auch ist mir aufgefallen, das manchmal nicht der Buchstabe mit Akzent verwendet wurde, obwohl dies im Lemma vorgegeben ist. Gab es da nichtmal soetwas mit "äöü"? Der Umherirrende 21:06, 20. Mai 2008 (CEST)
- zu 14) Das lässt sich einbauen. Kommt beim nächsten Software-Update mit rein. -- sk 20:43, 22. Mai 2008 (CEST)
- Eingebaut! -- sk 20:28, 25. Mai 2008 (CEST)
- 15) Wenn bei einem Feld (wohl am besten Geburtsort bzw. Sterbeort) auf eine BKL verweist wird, könnte man prüfen, ob innerhalb des Artikels der gleiche Ausdruck mit einer Klammer verlinkt ist.--Klapper 23:53, 21. Mai 2008 (CEST)
- zu 15) Hab beim zweiten Mal durchlesen verstanden was du meinst. Also "Ort" da steht und im Text gibt es "Ort (Bundesland)" dann sollte das ermittelt werden. --sk 20:43, 22. Mai 2008 (CEST)
- Genau, so hatte ich das gemeint. --Klapper 00:05, 23. Mai 2008 (CEST)
- Naja, nicht nur mit der Klammer - es sollte halt keine BKL vorkommen, die nicht auch im Text vorkommt (also eigentlich gaaar keine, aber in der ersten Stufe lässt sich das am leichtesten prüfen). Im Prinzip sollte überhaupt kein Link dort vorkommen, der nicht auch im Text vorkommt... wobei manche "USA" verlinken bei sowas wie "Stadt, Bundesstaat, USA", was evtl. ja im Text nicht vorkommt, also am besten erstmal BKL checken. Da lässt sich sicher auch noch mehr machen: z.B. "BKL, Bundesland/Staat/IrgendwelcherText"... damit könnten gleich noch so manche Begriffsklärungen auch im Text gefixt werden. --APPER\☺☹ 02:31, 23. Mai 2008 (CEST)
- So, ich hab mal ein Script laufen lassen, dass nach Begriffsklärungen in den Feldern Geburtsort bzw. Sterbeort sucht... gefunden wurden dabei über 4000 solcher Fälle gefunden. Ich habe mal die ersten 500 unter Hilfe:Personendaten/Wartung/Fehlerliste/BKL eingestellt. --APPER\☺☹ 02:49, 25. Mai 2008 (CEST)
- Sehr gut! Vielen Dank APPER, ich hätte so auf die Schnelle nicht so fix realisieren können. Kannst du mir vielleicht deine Herangehensweise erläutern, damit ich diese Fehler hier mit integrieren kann. -- sk 09:41, 25. Mai 2008 (CEST)
- Hab dir ne Mail mit Codeausschnitten und Erläuterung geschickt. --APPER\☺☹ 16:09, 25. Mai 2008 (CEST)
- Danke, ist angekommen. Leider glaube ich, dass ich das nicht umsetzen kann. Bei dem Live-Scan würde das heißen zu den derzeit 10000 Artikel müsste ich nochmal die Anzahl der Links und deren Redirects abfragen. Bei z.B. nur 5 Links pro Artikel wären das 50000 Artikel die ich jeden Abend scannen müsste. Hier müsste man mit einer Liste arbeiten. Na mal sehen vielleicht fällt mir noch was in den nächsten Tagen ein. -- sk 16:33, 25. Mai 2008 (CEST)
- Hab dir ne Mail mit Codeausschnitten und Erläuterung geschickt. --APPER\☺☹ 16:09, 25. Mai 2008 (CEST)
- Sehr gut! Vielen Dank APPER, ich hätte so auf die Schnelle nicht so fix realisieren können. Kannst du mir vielleicht deine Herangehensweise erläutern, damit ich diese Fehler hier mit integrieren kann. -- sk 09:41, 25. Mai 2008 (CEST)
- So, ich hab mal ein Script laufen lassen, dass nach Begriffsklärungen in den Feldern Geburtsort bzw. Sterbeort sucht... gefunden wurden dabei über 4000 solcher Fälle gefunden. Ich habe mal die ersten 500 unter Hilfe:Personendaten/Wartung/Fehlerliste/BKL eingestellt. --APPER\☺☹ 02:49, 25. Mai 2008 (CEST)
- Der Scan über sämtliche Artikel lief gestern ca. 10 Minuten oder so. Also bei 4000 fehlerhaften Artikeln geht das in wenigen Sekunden... naja... vielleicht ner Minute. --APPER\☺☹ 16:36, 25. Mai 2008 (CEST)
- Hi Apper! Vielen Dank für das Erstellen der Liste! Könntest du dein Helferlein auf dieser Liste ausschalten? Es geht bei mir einige Zeit, bis die Seite geladen ist.--Klapper 17:27, 25. Mai 2008 (CEST)
- 16) Mir sind vermehrt Tabulatorzeichen in PD ausgefallen. Ich denke, diese haben dort in keinem Fall etwas zu suchen und sollten entfernt werden. Beispiel/Beispiel Der Umherirrende 10:45, 27. Mai 2008 (CEST)
- Sollte kein Problem sein. Ich schau mal was sich machen lässt. -- sk 22:21, 27. Mai 2008 (CEST)
- 17) Ich habe vermehrt gesehen, das im Alternativnamen ein Leerzeichen vor dem Semikolon ist. Beispiel. Ich denke, das kommt dort immer unbeabsichtig rein, sollte entfernt werden. Der Umherirrende 10:45, 27. Mai 2008 (CEST)
- zu 17) Man sollte vielleicht in allen Feldern auf Leerzeichen vor Komma, Punkt, Semikolon, Doppelpunkt, schließende Klammer suchen. Andim 13:19, 27. Mai 2008 (CEST)
- Kann ich mit abfragen. Kommt beim nächsten Software-Update. -- sk 22:21, 27. Mai 2008 (CEST)
- 18) Evtl. sollte man mal in der Kurzbeschreibung nach "Professor" suchen. Wie oft ich schon "Professor für Chemie" oder so gesehen hab. Das bedeutende ist, dass die Person Chemiker ist, der Titel ist im Normalfall vollkommen uninteressant. Also "deutscher Chemiker" statt "Professor für Chemie an der TU Dresden" oder sowas... --APPER\☺☹ 03:41, 28. Mai 2008 (CEST)
- zu 18) Sehr gute Idee. Stört mich auch schon seit längerem. Hab da schon was ausgeknobelt. Werde ich demnächst einbauen. -- sk 19:11, 28. Mai 2008 (CEST)
- Eingebaut.--sk 17:08, 30. Mai 2008 (CEST)
- 19) Ich habe gesehen, das der Alternativnamen manchmal mit einem Semikolen beginnt oder endet. Ich denke mal dies entsteht, wenn man einen Namen dort entfernt hat, aber dann das Semikolen vergessen hat. Manchmal waren auch noch Leerzeichen vor oder nach dem Semikolen. Meiner Meinung nach, könnte man sie problemlos entfernen. Der Umherirrende 11:38, 29. Mai 2008 (CEST)
- zu 19)Wird eingebaut. -- sk 22:24, 29. Mai 2008 (CEST)
- 20) Alternativname enthält Doppelpunkt. Dies deutet darauf hin, das zu einem Namen eine Erläuterung vorhanden ist. Diese sollte aber in Klammern dahinter stehen. Beispiel. Der Umherirrende 22:02, 29. Mai 2008 (CEST)
- zu 20) :-) Hab ich gestern schon eingebaut. Wird in naher Zukunft mit angezeigt. -- sk 22:24, 29. Mai 2008 (CEST)
- Eingebaut.--sk 17:08, 30. Mai 2008 (CEST)
- 21) Ich denke mal HTML-Syntax sollte in keinem Feld vorkommen, Beispiel, desweiteren sollte auch keine Wikisyntax (außer den Wikilink) in einem Feld vorkommen (auch nicht #Vorlage:Lang?). Beispiel, da gibt es sicherlich auch noch andere Beispiele. Lässt sich das herrausfiltern? Der Umherirrende 00:55, 1. Jun. 2008 (CEST)
- Nachtrag: Ich denke eine html-syntax kann gut über eine spitze klammer
<>
gesucht werden, die wikisyntax über ein Paar Apostroph''
, so bekommt man ja kursiv und fett und kursivfett. Dann sollte man auch nicht alzu viele falschpositive bekommen. Der Umherirrende 11:30, 1. Jun. 2008 (CEST)- Die sollten alle in Hilfe:Personendaten/Wartung/Fehlerliste#ALTERNATIVNAMEN_mit_Slash auftauchen, weil ja ein HTML-Tag auch mit einem Slash im Endtag vorkommen muss. -- sk 17:14, 1. Jun. 2008 (CEST)
- Dann aber auch nur für das eine Feld, ich weiß ja nicht, was die Leute so alles einbauen, ich bin immer wieder überrascht, was man alles so sieht. Daher hatte ich es angedacht. Der Umherirrende 22:30, 1. Jun. 2008 (CEST)
- Ich überprüfe das nochmal in der Datenbank, ob sich da der Aufwand lohnt. -- sk 20:55, 2. Jun. 2008 (CEST)
- Dann aber auch nur für das eine Feld, ich weiß ja nicht, was die Leute so alles einbauen, ich bin immer wieder überrascht, was man alles so sieht. Daher hatte ich es angedacht. Der Umherirrende 22:30, 1. Jun. 2008 (CEST)
- Die sollten alle in Hilfe:Personendaten/Wartung/Fehlerliste#ALTERNATIVNAMEN_mit_Slash auftauchen, weil ja ein HTML-Tag auch mit einem Slash im Endtag vorkommen muss. -- sk 17:14, 1. Jun. 2008 (CEST)
- 22) doppelte Parameter/Reihenfolge/Überflüssige Parameter: Ich hatte irgendwann mal gesehen, das der Paramter ALTERNATIVNAME doppelt im Quelltext stand, dies wird auch von MediaWiki nicht richtig erkannt und dadurch gehen informationen verloren, daher wäre eine rubrik dafür gut (und andere Parameter auch). Desweiteren sollte ja auch die Reihenfolge der Parameter stimmen, damit man nicht ausversehen die Informationen an falscher Stelle platziert. Auch sollten nicht benötigte Parameter erkannt und anschließend entfernt werden (ballast). Der Umherirrende 21:44, 11. Jun. 2008 (CEST)
- Eingebaut. -- sk 22:44, 18. Jun. 2008 (CEST)
- 23) In KURZBESCHREIBUNG sollten die Wörter "bekannt" und "bedeutend" nicht vorkommen
- Kann ich mit einbauen. -- sk 22:44, 18. Jun. 2008 (CEST)
Bitte neue Vorschläge jetzt nur noch unter eigener Überschrift!