[ohne Überschrift]

Bearbeiten

@Kolja21, Silewe: Ich hab wieder mal eine Liste gebastelt. Hier geht es darum, ob die GND-Nummern gültig sind oder nicht, bzw. ob ein Namenseintrag als Personen-GND eingetragen ist oder umgekehrt, oder ob z.B. eine GND eines Werks als Personen-GND eingetragen wurde. Der Dump der DNB ist vom 22. Februar, aber es scheint so, als ob etliche Nummern die mit "115" beginnen und 9 Stellen haben, noch nicht im dem Dump enthalten sind und daher als "unbekannte GND" benörgelt werden. Laut PICA sind die teilweise schon im Januar angelegt worden, das muss ich dann beim nächsten Dump beobachten und eventuell diese neuen Nummern irgendwie rausfiltern.

Und da stellt sich gleich eine Frage: Es gibt so einige wenige Einträge die sich auf ein Pseudonym beziehen, wie bei Ilona_Andrews. Soll so eine GND für ein Sammel-Pseudonym in der WP als Typ=k (Körperschaft) oder als Typ=p (Person) eingetragen werden (es gibt beide Fälle, siehe J.H._Praßl).

Es gibt ganz sicher noch so einiges, das nicht so ganz toll ist – einfach mal nörgeln. Die Erstellung der Liste dauert so 7-8 Stunden, ich werde die recht selten (1 x im Monat oder so) laufen lassen. Mal sehen, wie oft die DNB einen Dump liefert, eventuell auch nur jedesmal wenn die einen frischen Dump gekocht haben.

--Wurgl (Diskussion) 10:18, 12. Mär. 2018 (CET)Beantworten

Danke für die Liste. Sie überschneidet sich vermutlich teilweise mit Benutzer:Gymel/GND-Probleme; eine Liste, die übersichtlich gegliedert, aber schon länger nicht mehr aktualisiert wurde. Zur Frage mit dem Sammel-Pseudonym: Ein Sammelpseudonym (pis) ist ein Pseudonym = GND, Tpy p. Genauso steht es auch in GND 1075213967. --Kolja21 (Diskussion) 16:08, 12. Mär. 2018 (CET)Beantworten
In dem Dump sind die Typen ganz anders gezeichnet, momentan erkenne ich die Typen "DifferentiatedPerson", "RoyalOrMemberOfARoyalHouse", "Family", "CollectivePseudonym", "LiteraryOrLegendaryCharacter" und "Gods" als Personen-GND an. Ist aber gruselig! Der Dump hat ausgepackt 19GB, passt damit nicht mehr in das Memory meines Rechners und damit ist das durchsuchen doch eher langweilig :-( --Wurgl (Diskussion) 17:46, 12. Mär. 2018 (CET)Beantworten

Beim nächsten Lauf filtere ich dann die neu angelegten (und noch nicht im Dump vorhandenen) raus. Sind halt so 500 Webzugriffe, das muss deren Server aushalten. --Wurgl (Diskussion) 09:39, 14. Mär. 2018 (CET)Beantworten

Erweiterung?

Bearbeiten

@Kolja21: Den Dump kann ich ja für mehr verwenden, Beispiel:
<rdf:Description rdf:about="http://d-nb.info/gnd/277-X">
        <rdf:type rdf:resource="http://d-nb.info/standards/elementset/gnd#CorporateBody"/>
        <gndo:gndIdentifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">277-X</gndo:gndIdentifier>
        <foaf:page rdf:resource="https://de.wikipedia.org/wiki/American_Heart_Association"/>
        <owl:sameAs rdf:resource="http://viaf.org/viaf/139377934"/>
        …
Da ist erstmal ein Link auf die Wikipedia, nämlich auf American Heart Association, dann ist die GND-Nummer GND 277-X und eine Viaf-Nummer 139377934. Im Artikel der Herz-Vereinigung sind keine Normdaten und genau das könnte ich als Hint zum ergänzen angeben. Was meinst du dazu? --Wurgl (Diskussion) 22:44, 14. Mär. 2018 (CET)Beantworten

Klingt vielversprechend, aber auch nach viel Arbeit. Mich würde vor allem interessieren, die Kategorie:Wikipedia:Veraltete Normdaten‎ zu leeren, also jene Artikel aufzuspüren, in denen sowohl GKD wie SWD eintragen sind, eine der beiden Normdaten aber mittlerweile in eine Weiterleitung umgewandelt wurde. Gruß --Kolja21 (Diskussion) 22:56, 14. Mär. 2018 (CET)Beantworten
Also wenn ich auf eine GKD- (oder SWD-)Nummer klicke, dann lande ich bei der angegebenen GND-Nummer? Meinst du solche? Bei 4 Stichproben war das nicht der Fall, die Nummern sind jedenfalls im Dump enthalten.
Ganz generell hab ich bei und in der WP GND-Nummern gefunden wo ich draufklicke und dann bei einer anderen Nummer lande. Die könnte ich natürlich auch melden, hab das aber wegen "keine Verbesserung" sein lassen.
Zurück zu meiner Idee: Ja, das mag Arbeit sein, aber da muss man wohl nicht viel denken. Die Zuordnung (und damit das Hirnschmalz) hat ja schon die DNB gemacht. Mehr als optische Kontrolle (vor allem bei der VIAF) ist da nicht notwendig. --Wurgl (Diskussion) 23:25, 14. Mär. 2018 (CET)Beantworten
GND-Nummern, "wo ich draufklicke und dann bei einer anderen Nummer lande" = gehört zum Abschnitt Benutzer:Gymel/GND-Probleme#Veraltete Normdaten. Diese Weiterleitungen würden mich schon interessieren und sind auch vergleichsweise schnell abzuarbeiten. --Kolja21 (Diskussion) 23:35, 14. Mär. 2018 (CET)Beantworten
Okay! Aber dauert so 3-5 Tage, in 4-5 Stunden bin ich mit dem filtern der noch nicht im Dump vorhandenen Nummern durch, die werd ich per Hand in die Liste einpflegen. PS: Deine Schule mit der Fehlermeldung ist im Online-Datensatz schon korrigiert (im Dump tatsächlich Typ "DifferentiatedPerson"). Lesen die mit, oder hast du das parallel zu Meldung korrigieren können? --Wurgl (Diskussion) 23:41, 14. Mär. 2018 (CET)Beantworten
Du meinst Karl-Rehbein-Schule = GND 2015253-X? Da erhalte ich die Rückmeldung: "Sie dürfen diese Daten nicht korrigieren. Unser Servicedesk erteilt Ihnen gegebenenfalls die Befugnis." Der fehlerhafte Typ "Person (piz)" steht noch im Datensatz. --Kolja21 (Diskussion) 23:55, 14. Mär. 2018 (CET)Beantworten
Aha! Nicht genau genug geguckt. Oben steht "Organisation" und unten noch "Person" :-) Okay, okay, *Aschenbecher überm Kopf auslehr* :-) --Wurgl (Diskussion) 23:59, 14. Mär. 2018 (CET)Beantworten
Sieht ganz gut aus. Ich denke morgen am Vormittag kann ich per Hand die Ausgabe von Bot einpflegen und wenn ich nicht noch einen Sack Fehler eingebaut hab, dann dürften alle Punkte aus dem Abschnitt implementiert sein (zumindest so, wie ich es verstanden habe). Blöderweise läuft das Zeugs so 7-8 Stunden, daher geht es nicht schneller vorwärts. Die weiterleitenden GNDs hab ich ja heute schon reingemacht, da war im Script so alles fehlerfrei *schwer hoff*, jedenfalls war die Ausgabe okay. --Wurgl (Diskussion) 20:38, 16. Mär. 2018 (CET)Beantworten

Änderung okay?

Bearbeiten

Bei Landkreis Franzburg-Barth war die Weiterleitung verkehrt herum. Das was als GND eingetragen war, leitete auf die eingetragene GKD-Nummer weiter. Spezial:Diff/175130118 --Wurgl (Diskussion) 10:36, 18. Mär. 2018 (CET)Beantworten

erledigtErledigt Da hat jemand SWD und GKD verwechselt, aber das ist heute völlig egal, da es nur noch eine GND gibt. --Kolja21 (Diskussion) 18:39, 18. Mär. 2018 (CET)Beantworten

Bei Organisation Ukrainischer Nationalisten gibt es unter GND 5056096-7 einen Eintrag für 1929-1940 (der war bisher verlinkt) und unter GND 106979600X einen Eintrag ab 1940. Hab das als REMARK dazugemurmelt. Okay? --Wurgl (Diskussion) 11:05, 18. Mär. 2018 (CET)Beantworten

erledigtErledigt Kann man so machen, muss man aber nicht, da die Nachfolger bereist in GND 5056096-7 verlinkt sind. --Kolja21 (Diskussion) 18:45, 18. Mär. 2018 (CET)Beantworten

Bei Heinrich Bresslau hab ich die Tn 186684754 rausgenommen. Da sind zwar 7 Werke, aber 5 sind von vor seiner Geburt und die restlichen 2 passen nicht zu einem Architekten. --Wurgl (Diskussion) 21:37, 19. Mär. 2018 (CET)Beantworten

Bei der Person David Schindelmeißer ist die GND einer Körperschaft (Organisation / kiz) verlinkt. Tp oder Tn gibt es wohl nicht. Den lass ich dir, Kolja21 :-) --Wurgl (Diskussion) 21:52, 19. Mär. 2018 (CET)Beantworten

Bei Tn 1051356792 ist am Namen Holger Krahmer ein Werk angehängt, dessen Bezug zu dem Namen mir nicht einleuchtet. Das Buch Fehlermeldung? --Wurgl (Diskussion) 22:47, 19. Mär. 2018 (CET)Beantworten

Fehlende Fehler

Bearbeiten
1.) Tp eingetragen, trotzdem ein GND-Check eingetragen, siehe z.B. hier.
2.) Tn eingetragen, aber GND-Check-Angabe fehlt (das umgekehrte von obigem).
--Informationswiedergutmachung (Diskussion) 21:55, 18. Mär. 2018 (CET)Beantworten
Ja okay. Ich hab mich auf den Abgleich des Dumps der DNB mit unseren Daten konzentriert. Aber ich kann das irgendwann nächste Woche implementieren.
Ich will (falls der Probelauf jetzt klappt) die Liste neu generieren. Wird dann so 15 Uhr fertig sein (Änderungen bis ca. 10 Uhr sind dann wohl berücksichtigt). Neu sollte der Hinweis auf dazu passende VIAF sein, falls bisher keine eingetragen ist. Muss man nicht doof rumsuchen wenn es keine gibt. --Wurgl (Diskussion) 22:14, 18. Mär. 2018 (CET)Beantworten
3.) Eine Liste, bei der die leere ND-Vorlage im Artikel ist ({{Normdaten|TYP=p|GND=|VIAF=}}) fehlt auch noch. --Informationswiedergutmachung (Diskussion) 22:55, 18. Mär. 2018 (CET)Beantworten
Die liefert bei Typ=p wenigstens den Link zum persondata-Tool. Wenn der Typ ein anderer ist, dann auf jeden Fall ja. --Wurgl (Diskussion) 23:07, 18. Mär. 2018 (CET)Beantworten
Dafür ist die Vorlage aber nicht gedacht. Sie ist für die Verwendung von Normdaten gedacht, nicht als Ersatz für die Personensuche, die irgendwo Links unter Werkzeuge hingehört. Und wieso rede ich eigentlich mit dir? Schon wieder vorbei, ich arbeite die Liste ab und gut, mit dir reden muss ich dabei nicht. --23:13, 18. Mär. 2018 (CET)
@Wurgl: Danke für die gute Arbeit! --Kolja21 (Diskussion) 00:33, 19. Mär. 2018 (CET)Beantworten

Service:

  • 1.) Suche 7.838 Treffer
  • 2.) Suche 539 Treffer (Nachtrag 23:40 Uhr: jetzt 420 Treffer)
  • 3.) Suche 5.108 Treffer

--Wurgl (Diskussion) 09:11, 19. Mär. 2018 (CET)Beantworten

Nr. 2 erle(di)gt... --Informationswiedergutmachung (Diskussion) 22:35, 24. Mär. 2018 (CET)Beantworten
Ich präzisiere Nr. 1: Tp eingetragen, keine Tn, aber GND-Check. Die 7.838 Treffer stimmen daher nicht. --Informationswiedergutmachung (Diskussion) 03:32, 26. Mär. 2018 (CEST)Beantworten
Sollte dann so sein: Suche 272 Treffer --Wurgl (Diskussion) 06:56, 26. Mär. 2018 (CEST)Beantworten

Was machen bei sowas?

Bearbeiten

VIAF 151431426 vs. VIAF 155742396 Wobei es mir nicht um die VIAF geht, sondern vor allem um die daran hängenden GND 10178700-5 und GND 3001188-7 bei Abdou-Moumouni-Universität Niamey. --Wurgl (Diskussion) 08:56, 23. Mär. 2018 (CET)Beantworten

Vorgänger + Nachfolger = 1 Artikel in Wikipedia. Das kommt häufig vor. In der Regel trage ich die GND für den aktuellen Namen der Institution ein, also Abdou-Moumouni-Universität Niamey = "Université Abdou Moumouni", GND 10178700-5. --Kolja21 (Diskussion) 19:42, 23. Mär. 2018 (CET)Beantworten

Wikipedia-Personensuche

Bearbeiten

@Johanna Strodt (WMDE): Hallo, folgendes: in der Vorlage:Normdaten ist auch die Wikipedia-Personensuche integriert. Die Vorlage wird oft leer in einen Personenartikel eingetragen, weil viele, zu viele, der irrigen Meiunung sind, jede Biografie bekäme Normdaten. Dem ist nicht so. Daher die Bitte, die Personensuche links bei Werkzeuge integrieren und sie dann dafür aus der ND-Vorlage streichen. Ob es auch inhaltlich erwünscht ist, wäre dann die nachfolgende Frage, aber erst einmal die Frage: ist das technisch möglich? MfG --Informationswiedergutmachung (Diskussion) 13:21, 25. Mär. 2018 (CEST)Beantworten

Es geht, wenn ich es recht verstehe, um das Tool Wikipedia-Personensuche, d.h. ein Werkzeug, das nicht alle, aber einen Großteil der Artikel betrifft. --Kolja21 (Diskussion) 17:52, 25. Mär. 2018 (CEST)Beantworten
@Informationswiedergutmachung: Technisch möglich ist das, ja. Das kann im MediaWiki-Namensraum von Admins gemacht werden. -- Viele Grüße, Johanna Strodt (WMDE) (Diskussion) 15:26, 26. Mär. 2018 (CEST)Beantworten
@Doc Taxon, Flominator, Schniggendiller, Graphikus: (rein willkürliche Auswahl!) Dann mal die Frage an euch: kannst du das machen? Gibt es Einwände dagegen oder wo sollte man das besprechen? MfG --Informationswiedergutmachung (Diskussion) 15:31, 26. Mär. 2018 (CEST)Beantworten
wenn es keine GND oder andere der IDs gibt, aber vielleicht später mal, ist doch der Link für die Personensuche genau am Platz der Vorlageneinbindung ideal. ... – Doc TaxonDisk.WikiMUCWikiliebe?! 21:27, 26. Mär. 2018 (CEST)Beantworten
Aua, nein, eben nicht, weil die leere Vorlage:Normdaten nicht in den Artikel gehört nur für die Personensuche. Es bekommt nicht jeder bekommt nicht jeder Biografieartikel Normdaten. Bisher wird die leere Vorlage rein willkürlich in die Artikel gesetzt und das ist ein Fehler, weil es die Bearbeitung der ND stört. Und zwar massiv. --Informationswiedergutmachung (Diskussion) 21:41, 26. Mär. 2018 (CEST)Beantworten
Und dann müßt man konsequenterweise alle Artikel, nicht nur die Biografieartikel mit der Vorlage versehen. Und das wäre echter Horror. 2 Mio. Artikel (abzüglich der BKS) mit Vorlageneinbindung? Das ist völlig überflüssig. --Informationswiedergutmachung (Diskussion) 21:46, 26. Mär. 2018 (CEST)Beantworten
was genau meinst Du mit "Bearbeitung der ND", die da gestört werden soll? – Doc TaxonDisk.WikiMUCWikiliebe?! 00:18, 27. Mär. 2018 (CEST)Beantworten

https://de.wikipedia.org/w/index.php?title=Benutzer_Diskussion:Wurgl/Fehler_GND&action=edit&section=5

Ich habe mal allen (!) Schauspielern die ND-Vorlage verpaßt, im Moment gibt es keine Schauspieler ohne ND-Vorlage, siehe hier. Schauspieler zählen zu den üblichen Verdächtigen, also Personen, die einen Eintrag in der DNB haben oder bekommen werden. Leere Vorlagen sind daher Mist. Weil keiner überprüft hat, ob sie nun welche haben oder nicht. Haben sie welche, fehlen die; haben sie keine fehlt dann das Kein GND-Personendatensatz. Letzte Überprüfung: 27. März 2018. (als Beispiel siehe Zbigniew Sawan)
Im Abschnitt Fehlende Fehler steht unter Punkt 3, dass es insgesamt 5.108 Treffer gibt. Ist mittlerweile auf gut 4.700 abgesunken, weil ich die bearbeite. Ich weiß nicht, wieviele Schauspieler und natürlich auch Autoren, aber auch haufenweise andere Personen dabei sind, die eine Tp haben, oder eine Tn, weil es noch nie einer geprüft hat. Ich räume in nächster Zeit diese Liste ab, aber das wird niemanden daran hindern, erneut leere ND-Vorlagen in die Artikel zu bringen und damit die Arbeit derer zu behindern, die die eigentliche Arbeit machen.
Bestes Beispiel: Jan Bluthardt. Am 20. März 2018. 14:56 angelegt, eine IP kopiert um 15:11 von irgendwo her die leere Vorlage rein (samt Kategorien). Wenn jemand, in dem Fall ich, also, siehe den ersten Link, jetzt nach Schauspielern sucht, die keine ND-Vorlage haben, ist er gelackt. Der Mann hat einen DNB-Eintrag. Die Vorlage gehört raus, übrigens auch aus der Wikipedia:Formatvorlage Biografie gelöscht bzw. kommentiert. --Informationswiedergutmachung (Diskussion) 13:31, 27. Mär. 2018 (CEST)Beantworten
Übrigens ein schönes Beispiel für Wie macht man es nicht in Uwe Schröder (Jurist). Leere Vorlage, aber eine Wikikacka-Eintrag. Der übliche Stuß: zwei Personen mit selbem Namen und Geburtsjahr werden zusammengewürfelt. Es gab ja schon die irrsinnige Idee, sowas dann automatisch von Wikikacka in die Wikipedia übertragen zu lassen und das dann bei uns löschen? Ein gruseliger Gedanke, hier wäre dann der Fehler nie entdeckt worden, weil es keine Prüfung mehr gibt und in Wikikacka eh nicht, warum auch, er hat ja eine Tp...  Vorlage:Smiley/Wartung/facepalm  --Informationswiedergutmachung (Diskussion) 14:00, 27. Mär. 2018 (CEST)Beantworten
Hab mal bei Wikikaka die Windeln gewechselt, jetzt ist es dort weg. --Wurgl (Diskussion) 14:54, 27. Mär. 2018 (CEST)Beantworten
Nächstes Beispiel: Dave Goldberg. Hat einen Eintrag bei VIAF und der LOC, keinen in der DNB. Der ist aber auch möglich, aber wie soll man das ändern, wenn die leere Vorlage im Artikel ist und der Artikel wegen der fehlenden Wartungskategorie eben nicht bei Kategorie:Wikipedia:GND fehlt auftaucht? --Informationswiedergutmachung (Diskussion) 14:14, 27. Mär. 2018 (CEST)Beantworten
wenn die Vorlage leer eingefügt werden kann, diese Dich aber bei der nützlichen Aufgabe hindert, könnte man die Vorlage entsprechend so umbauen, dass bei leerer Einfügung oder leerem Parameter GND die Wartungskategorie dann zumindest ohne Datum befüllt wird, z.B. bei Kategorie:Wikipedia:GND fehlt (ohne Datum). Das geht. – Doc TaxonDisk.WikiMUCWikiliebe?! 16:46, 27. Mär. 2018 (CEST)Beantworten
Und warum sollte ich Botarbeiten machen? Und warum sollte bei jedem Artikel, bei dem eine leere Vorlage drin ist, das Überprüfungs-Datum eingefügt werden? Auch das ist Botarbeit. Letzteres landet dann allerdings eh bei der entsprechenden Monatskategorie in Kategorie:Wikipedia:GND fehlt. Allerdings ungeprüft, ob die Person je Normdaten bekommt, bspw. die meisten Sportler werden nie einen Eintrag haben, auch die meisten ausländischen Politiker nicht. Die Kategorie hat jetzt schon 77.800 Einträge, die muss nicht weiter unkontrolliert geflutet werden. Die Personensuche wäre links am besten aufgehoben, dann hat sie JEDER Personenartikel. Was die Wikipedia am allerallerallerwenigsten gebrauchen kann ist im übrigen eine weitere Wartungskat. --Informationswiedergutmachung (Diskussion) 17:12, 27. Mär. 2018 (CEST)Beantworten
Lass Botarbeiten doch Bots machen. Aber Du hast schon recht, nicht jeder bekommt einen Eintrag. Wir dürfen aber LCCN und VIAF nicht vergessen. Ausländische Politiker hätten diese eher als unsere GND und sollten diese Vorlage dann auch erhalten. Sportler sind deutlich seltener, schon klar. Man kann die Personensuche aber schon bei Werkzeuge reinbasteln, es muss halt nur erkenntlich sein, welcher Artikel denn nun eine Person darstellt, um dieses Werkzeug in der Werkzeugliste anzuzeigen oder eben nicht. Dazu solltest Du Dich bei Wikipedia:Technik/Werkstatt melden, dass die das da reinzimmern oder Dir verklickern, wie das geht. Wenn Du einen Bot brauchst, melde Dich einfach noch mal, – Doc TaxonDisk.WikiMUCWikiliebe?! 21:57, 27. Mär. 2018 (CEST)Beantworten
@Informationswiedergutmachung: Soll ich die leeren Vorlagen per se entfernen? – Doc TaxonDisk.WikiMUCWikiliebe?! 01:35, 29. Mär. 2018 (CEST)Beantworten
@Doc Taxon: Ne, besser nicht, ich guck die alle selber durch, es sind zu viele dabei, die vermutlich Einträge in der VIAF, der LOC oder der DNB haben. Aber man könnte einen Bot basteln, der zukünftige leere ND löscht, verbunden mit dem Hinweis an den Benutzer, der das eingestellt hat, nur noch Vorlagen mit mindestens einem Normdatum zu verwenden. Willst du das übernehmen? Kannst dich ja an Benutzer:CamelBot/maintenance list/ASIN orientieren. So als Beispiel Benutzer Diskussion:Diego de Tenerife#Hinweis auf Katalog-Nummern von Amazon. MfG --Informationswiedergutmachung (Diskussion) 11:08, 29. Mär. 2018 (CEST)Beantworten
@Informationswiedergutmachung: Zukünftig heißt also, erst wenn Du sie alle einmal durchgeguckt hast? Dann kontaktiere mich einfach, wenn es so weit ist. – Doc TaxonDisk.WikiMUCWikiliebe?! 16:47, 29. Mär. 2018 (CEST)Beantworten
Warum kann man das nicht sofort machen? Nur für Neuanlagen ab z.B. eben heute, ist das ein technisches Problem? --Informationswiedergutmachung (Diskussion) 16:59, 29. Mär. 2018 (CEST)Beantworten
@Informationswiedergutmachung: Ach für Neuanlagen, ja gut, kann ich machen. Muss ich aber erst programmieren. Kannst Du dafür einen guten Benutzerhinweis entwickeln? Du bist mehr im Thema drinnen und könntest dem Hinweis vielleicht noch Tipps oder ähnliches beisteuern. Wäre gut, wenn Du helfen könntest. – Doc TaxonDisk.WikiMUCWikiliebe?! 17:14, 29. Mär. 2018 (CEST)Beantworten
Ja, ich laß mir die Tage was einfallen, es dürfen aber auch gerne andere helfen. So für den Anfang: Hey, du, laß mal die Pfoten von den ND, du Pappnase!? <scnr> --Informationswiedergutmachung (Diskussion)

== Hinweis auf die richtige Verwendung der Normdaten-Vorlage == Hallo [Benutzer]!
Mir ist aufgefallen, dass Du im Artikel Artikel die Vorlage {{Normdaten}} unausgefüllt eingefügt hast. Da dies zu einer aufwändigen Korrekturarbeit führt, wurde diese Vorlage automatisch entfernt.
Da aber Normdaten existieren könnten, bitte ich Dich, die Vorlage von vornherein korrekt auszufüllen oder sie ganz wegzulassen. Auf der Seite Hilfe:Normdaten ist es sehr gut erklärt, wie man die Vorlage ausfüllt, und wo man die Daten herbekommt.
[Signatur und so]

Hallo @Informationswiedergutmachung! Ich hab mal einen kleinen noch ziemlich nackigen Hinweis oben ausgebrütet. Was meinst Du, wie kann man das noch verbessern? – Doc TaxonDisk.WikiMUCWikiliebe?! 20:01, 29. Mär. 2018 (CEST)Beantworten

Das reicht doch völlig, aber eins hätte ich noch gerne: das das auf Wikipedia Diskussion:Normdaten übertragen wird, damit das auch von anderen gesehen und letztendlich gutgeheißen wird. Das sollte keine Entscheidung zwischen dir und mir sein. Und das hier ist mehr oder weniger Wurgls private Unterseite. Ich bitte daher ausdrücklich dich, das auf die ND-Disk zu übertragen, weil es zeigt, dass das nicht nur meine Idee ist, sondern auch deine. Das erhöht die Akzeptanz. MfG --Informationswiedergutmachung (Diskussion) 20:05, 29. Mär. 2018 (CEST)Beantworten
erledigtErledigt
Bearbeiten

Ich hab der DNB und dem Filmportal eine Nörgelmail bzgl. der kaputten Links geschickt. Laut Dump sind 173.317 Personen verlinkt und bei allen fehlt der Name im Link, so dass alle diese Links im 404er-Nirvana enden. Bei uns sind übrigens (laut Datenbank-Query) 6.266 Personen mit dem Filmportal verlinkt, wobei mir nicht ganz klar ist, ob die deWP-Datenbank auch bei solchen Artikeln ein Record hat, wo der Filmportal-Link aus Wikidata kommt. --Wurgl (Diskussion) 12:29, 28. Mär. 2018 (CEST)Beantworten

Darüber kann Queryzo Auskunft geben. Siehe auch: Wikipedia:Redaktion Film und Fernsehen#Vorlage:Filmportal. Besserung ist jedoch wie gesagt in Sicht.? Guter Witz, Queryzo... --Informationswiedergutmachung (Diskussion) 14:04, 28. Mär. 2018 (CEST)Beantworten
Nach Ostern soll alles wieder funktionieren. Hoffen wirs. –Queryzo ?!     14:10, 28. Mär. 2018 (CEST)Beantworten
Aha! Okay. Doppelt hält besser, ich hab übrigens in meiner Nörgelmail nichts von Wiki-Irgendwas erwähnt, nur das Zusammenspiel von DNB und Filmportal. --Wurgl (Diskussion) 14:17, 28. Mär. 2018 (CEST)Beantworten
Okay. Hätte ich mir sparen können. Gibt (momentan) keinen Artikel mit Filmportal und ohne GND-Nummer. --Wurgl (Diskussion) 08:00, 29. Mär. 2018 (CEST)Beantworten
Danke, das beantwortet meine Frage, die ich gerade zu dem Thema stellen wollte. Das Filmportal hat vor einiger Zeit seine Artikel mit der GND abgeglichen, aber ein paar Personen übersehen. --Kolja21 (Diskussion) 17:32, 29. Mär. 2018 (CEST)Beantworten
Wenn man es richtig macht, dann findet man schon ein paar. 75 Stück, davon sicher ein paar falsche. Falsche kommen raus, wenn nicht zum Lemma passende Links auf das Filmportal im Artikel sind (und der Filmportal-Artikel nicht auch im richtigen Artikel verlinkt ist). Hier mal ein echter Treffer als Beispiel:
  1. GND 106200244X und VIAF 311677513 bei Tino Hillebrand Filmportal: http://www.filmportal.de/person/tilo-hillebrand_9bc0e6ed92e14bd5b057740020047d17
Der Testlauf hat ca. 200 ausgeworfen. Da sind noch solche darunter, die zwei DNB-Datensätze enthalten und derjenige ohne Filmportal-Link ist eingetragen. --Wurgl (Diskussion) 20:24, 30. Mär. 2018 (CEST)Beantworten
Ich könnte ja Vorschläge für Fehlermeldungen an die DNB daraus generieren … natürlich gefiltert um die schon gemeldeten, aber ich glaub, dass die DNB dann am Rad dreht. --Wurgl (Diskussion) 19:49, 31. Mär. 2018 (CEST)Beantworten

Neuer Abschnitt "GND könnte ergänzt werden"

Bearbeiten

Ich glaub es nicht, aber es gibt tatsächlich ca. 800 Fälle, wo einem WP-Artikel eine VIAF zugeordnet ist, aber keine GND-Nummer (weder Tn, noch Tp), im GND-Dump aber diese VIAF als Verweis bei einer GND enthalten ist. Beispiele: Tp: Jens Schroth GND: Forum Gut Gödelitz Tn: James Elton. Beim nächsten Update der Liste sind die dann auch enthalten. --Wurgl (Diskussion) 09:24, 30. Mär. 2018 (CEST)Beantworten

   doch ich kann mir das schon erklären. Die tollen Skripte von Schnark gibt es erst seit 2011. Alles was vorher eingefügt wurde, musste mühsam zu Fuß zusammengesucht und eingetragen werden. Dazu hatte auch ich damals nicht immer Lust... Ich meine mich auch zu erinnern, dass die Normdatenvorlage erst 2011 oder 2012 die Erweiterung für die Wartungskategorien erhalten hat. Es kann also schon sein, dass wir im alten Artikelbestand noch so einige Ungereimtheiten finden könnten. Umso feiner ist es, dass Du diese Ungereimtheiten aufspüren und uns zur Wartung zur Verfügung stellen kannst. Danke deshalb und Frohe Ostern, --Silke (Diskussion) 20:50, 31. Mär. 2018 (CEST)Beantworten
Gibt ja heute noch Leute, die immer noch per Hand einfügen… Sieht man an der führenden Null bei der letzten Zahlengruppe der LCCN. Und die Ungereimtheiten/Fehlerchen sind bei einem so großen Datenbestand ganz normal, da denk ich nicht viel drüber nach. Nur wie ich die 30.000 und die 80.000 (vordere Seite, jeweils Ende der Abschnitte) abackere, weiß ich noch nicht. Die 800 Fehlenden dieser Gruppe sind ein Klacks, die sind nach ein paar Sitzungen erledigt. --Wurgl (Diskussion) 12:19, 1. Apr. 2018 (CEST)Beantworten
Guck mal hier bei der DNB Da war wohl irgendwann man die Musikgruppe Kraftwerk mit dem Kraftwerk in Wilhelmshaven in einem gemeinsamen Datensatz … Bei einem großen Datenbestand ist sowas ganz normal. --Wurgl (Diskussion) 13:59, 1. Apr. 2018 (CEST)Beantworten

Parameter der Normdaten

Bearbeiten

Hab mal geguckt was für Parameter ist so finde:

Parametername Okay
2 Falsch
3 Falsch
4 Falsch
7 Falsch
BNF Wikidata
GKD Okay / Veraltet
GND Okay
GND1117479935 Falsch
GNDCheck Okay
GNDfehlt Okay
GNDName Okay
LCCN Okay
LCCNCheck Nicht vergeben
LCCNfehlt Nicht vergeben
LCN Falsch
LCNN Falsch
LLCN Falsch
NDL Okay
REMARK Okay
SELIBR Wikidata
SWD Okay / Veraltet
TYP Okay
ULAN Wikidata
VIAD Falsch
VIAF Okay
VIAFfehlt Nicht vergeben

@Kolja21: Kannst du die Fragezeichen bitte aufklären? Diese sind mir unklar. Ich erweitere dann diese Liste entsprechend. --Wurgl (Diskussion) 21:49, 9. Apr. 2018 (CEST)Beantworten

Gerne --Kolja21 (Diskussion) 21:54, 9. Apr. 2018 (CEST)Beantworten
Interessant wären auch die Fälle, in denen eine SWD oder GKD eingetragen ist, aber keine GND. Ich habe dunkel in Erinnerung, dass sie bereits abgearbeitet wurden. --Kolja21 (Diskussion) 21:57, 9. Apr. 2018 (CEST)Beantworten
Also in erster Linie will ich mal die falschen Parameter rausfinden. Verstehe ich das richtig, dass "Wikidata" & "Nicht vergeben" okay sind, also nicht benörgeln? Die SWD/GKD ohne GND mach ich gerne. --Wurgl (Diskussion) 22:00, 9. Apr. 2018 (CEST)Beantworten
Wikidata = diese Normdaten gehören nicht hierher, sondern nach Wikidata; Nicht vergeben = falsch. Eigentlich sollten diese Fehler bereits in der Liste "fehlerhafte Parameter der Vorlage:Normdaten" erfasst sein. --Kolja21 (Diskussion) 22:45, 9. Apr. 2018 (CEST)Beantworten
Passt! Ich finde 18 Stück, die beiden mit "Parameter Remark" hab ich nicht. Dann mach ich vorne nur einen Hinweis auf die Liste … --Wurgl (Diskussion) 22:53, 9. Apr. 2018 (CEST)Beantworten
Ich mach das anders. Ich lasse den Bot einen Abschnitt hier in dieser aktualisieren. Ist bequemer als eine nicht klickbare Textdatei.

Vorlage DNB-Portal

Bearbeiten

Anlässlich dieser Änderung von Informationswiedergutmachung und der wunderbaren Erklärung von Silke werde ich nicht individualisierte DNB-Nummern (aka Tn's) in dieser Vorlage ebenfalls benörgeln. Ebenso wenn die GND darinnen eine Weiterleitung auf eine andere ist. Gibt es noch irgendwelche Fälle? Bestimmte Kombinationen der Inhalte dieser Vorlage mit den Normdaten? (Dunkel erinnere ich mich da an was.) --Wurgl (Diskussion) 21:21, 12. Apr. 2018 (CEST)Beantworten

Danke für die Blumen, aber ich hatte mit Kolja21 auch einen geduldigen Lehrer. Hier hat er es auch einmal mit Beispielen erklärt. Benutzer_Diskussion:Gymel/DNB-Portal#Nicht_erfasste_Fehler wäre eventuell noch einmal ein neuer Ansatz, oder ganz unbekannte Nummern? @Kolja21: fällt bestimmt noch etwas ein. Viele Grüße --Silke (Diskussion) 21:49, 12. Apr. 2018 (CEST)Beantworten
Mensch, das ist ja gleich ein ganzer Blumenstrauß ;) Gebe die Komplimente gerne zurück und bin mit den vorhandenen Wartungslisten vollauf zufrieden = beschäftigt. Nächtliche Grüße --Kolja21 (Diskussion) 23:51, 12. Apr. 2018 (CEST)Beantworten
Tolle Sachen findet man da: (Direkter Link in den Quellcode-Editor) Das ist eine von insgesamt 32 Seiten mit seltsamen Parametern in der Vorlage. --Wurgl (Diskussion) 15:37, 18. Apr. 2018 (CEST)Beantworten
Da würde mich mehr interessieren, ob jeder, der auf Wikisource in der ADB vorkommt und hier einen Artikel hat, auch bei Wikisource verlinkt ist und hier die Vorlage:ADB hat. Gilt auch für das BLKÖ. --Informationswiedergutmachung (Diskussion) 15:43, 18. Apr. 2018 (CEST)Beantworten
@Kolja21: Ich bin in den letzten Zügen beim Basteln der Liste. Hab das Zeugs von PHP in C++ umgeschrieben, jetzt dauert der Schmarrn nicht 9 Stunden, sondern ist in grob einer Stunde durch. Läuft zwar nicht auf den Toolservern, aber erstmal bei mir zu Hause. Deswegen die Verzögerung. Bei der Vorlage DNB-Portal sind ja ebenfalls GND-Ids drinnen. Und dort gibt es im Dump für Sinntal bzw. GND 4242473-2 so eine Zeile:
<gndo:oldAuthorityNumber rdf:datatype="http://www.w3.org/2001/XMLSchema#string">(DE-588b)2027438-5</gndo:oldAuthorityNumber>
Beim Klick auf 2027438-5 im Katalog der Deutschen Nationalbibliothek kommt nix besonders hilfreiches raus. Besser wäre ein Klick auf 042424739 im Katalog der Deutschen Nationalbibliothek
Aber wie komme ich zu der Nummer 042424739? Im Dump kommen so Nummern mit führenden Nullen nicht vor? Wenn kein Minus-Zeichen in der GND-Id ist, dann scheint eine Ersetzung zu funktionieren und damit wäre das hilfreich. Wenn aber so ein Minus drinnen ist, dann weiß ich nicht. --Wurgl (Diskussion) 15:50, 9. Mai 2018 (CEST)Beantworten
Sorry, ich verstehe das Problem nicht, da ich alles händisch mache. Gebe ich die dublette GND 2027438-5 (ehemals GKD) ein, sehe ich, dass der Datensatz gelöscht bzw. mit der ehemaligen SWD 4242473-2 zusammengeführt wurde. Das entspricht der Angabe "oldAuthorityNumber" = Datensatz nicht mehr verwenden. --Kolja21 (Diskussion) 02:17, 12. Mai 2018 (CEST)Beantworten
Ich kann zwei Dinge nicht machen: 1.) Einen Vorschlag womit die Nummer zu ersetzen ist und 2.) vorhandene Einträge auf sinnvollen Link überprüfen. Sinnvoll im Sinne von: Liefert tatsächlich Publikationen und nicht nur einen Normdatensatz oder wegen Copy-Paste-Lose gar nichts?. – Okay, ich kann schon, aber nur mit HTTP-Zugriffen und das sind sehr viele, beim Überprüfen auf Sinnhaftigkeit wären das über 100.000 Zugriffe (ca. 104.000 mal ist die Vorlage DNB-Portal eingebunden), das ginge schon in Richtung DDoS und sowas will ich unbedingt vermeiden. --Wurgl (Diskussion) 13:03, 12. Mai 2018 (CEST)Beantworten
APPER hat mir eine Mail von der DNB weitergeleitet. Der Inhalt ist sinngemäß auf Vorlage_Diskussion:DNB-Portal --Wurgl (Diskussion) 22:35, 21. Mai 2018 (CEST)Beantworten

Wo hol ich da "Sachbegriff" raus?

Bearbeiten

Hallo @Kolja21: Es geht um den Artikel: Schwarze Hundert Dort sind die Normdaten vom TYP=s / Sachbegriff eingetragen. Bei der GND 4394586-7 lese ich "Sachbegriff Schwarze Hundertschaften" und weiter unten dann "Typ Personengruppe (siu)".

Im Dump-File sieht das so aus:

<rdf:Description rdf:about="http://d-nb.info/gnd/4394586-7">
       <rdf:type rdf:resource="http://d-nb.info/standards/elementset/gnd#GroupOfPersons"/>
       <gndo:gndIdentifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">4394586-7</gndo:gndIdentifier>
       <gndo:oldAuthorityNumber rdf:datatype="http://www.w3.org/2001/XMLSchema#string">(DE-588c)4394586-7</gndo:oldAuthorityNumber>
       <gndo:relatedDdcWithDegreeOfDeterminacy2 rdf:resource="http://dewey.info/class/363.3250947090/"/>
       <gndo:relatedDdcWithDegreeOfDeterminacy2 rdf:resource="http://dewey.info/class/947.083/"/>
       <gndo:variantNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Černye sotni</gndo:variantNameForTheSubjectHeading>
       <gndo:variantNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Černaja sotnja</gndo:variantNameForTheSubjectHeading>
       <gndo:variantNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Černosotency</gndo:variantNameForTheSubjectHeading>
       <gndo:variantNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Schwarze Hundert</gndo:variantNameForTheSubjectHeading>
       <gndo:variantNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Die @Schwarzen Hundert</gndo:variantNameForTheSubjectHeading>
       <gndo:preferredNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Schwarze Hundertschaften</gndo:preferredNameForTheSubjectHeading>
       <gndo:gndSubjectCategory rdf:resource="http://d-nb.info/standards/vocab/gnd/gnd-sc#16.5"/>
       <gndo:geographicAreaCode rdf:resource="http://d-nb.info/standards/vocab/gnd/geographic-area-code#XA-RU"/>
       <gndo:definition xml:lang="de">Rechtsradikale Terrorgruppen in Rußland, 1905-ca.1914</gndo:definition>
</rdf:Description>

Der einzige Hinweis auf den Typ ist GroupOfPersons und das würde ich auf entweder auf TYP=p oder TYP=k mappen, aber nicht auf einen Sachbegriff. Diese Links auf dewey.info liefern bei mir nichts, sind aber hier en:List of Dewey Decimal classes erklärt. 363 bedeutet Russland und 947 soziale Probleme, hilft auch nicht richtig weiter. Hast du da eine Idee oder einen Ansprechpartner? --Wurgl (Diskussion) 19:01, 22. Apr. 2018 (CEST)Beantworten

Der GND-Typ siu ist zwar ungewöhnlich, da man bei Personengruppe, wie du schreibst, an Typ p (z.B. Familie) oder k (z.B. Musikgruppe) denkt, aber eindeutig definiert:
Label (English) Group of persons
MARC 21 Equivalent 079 $v=siu
Has superclass Subject heading
Insofern müssen wir damit leben. Gruß --Kolja21 (Diskussion) 22:07, 22. Apr. 2018 (CEST)Beantworten
Das ist teilweise sowas von verwirrend! Diese GND 7546544-9 ist was? Eingetragen ist bei Dyna-Soar Sachbegriff. Aber unten steht "Projekt (kip)", laut Dump das hier: https://d-nb.info/standards/elementset/gnd#ProjectOrProgram --Wurgl (Diskussion) 22:54, 22. Apr. 2018 (CEST)Beantworten
In diesem Fall ist es schlicht ein Fehler: Typ kip = Köperschaft. Siehe Benutzer:Gymel/GND-Probleme#Kommentierte Altfälle / Fehler der GND-Redaktion. --Kolja21 (Diskussion) 00:39, 23. Apr. 2018 (CEST)Beantworten

Neue Liste [2018]

Bearbeiten

@Kolja21: Ich schieb mal eine kleine Liste hoch. Klein, weil erstmal gucken was alles nicht so ganz toll richtig ist. So in 10 Minuten ist die fertig. Bitte um Kritik. --Wurgl (Diskussion) 15:51, 15. Mai 2018 (CEST)Beantworten

+1. Sieht gut (= hilfreich) aus! --Kolja21 (Diskussion) 16:15, 15. Mai 2018 (CEST)Beantworten
Bei dem Teil mit dem Abgleich vom Parameter TYP mit den bei der DNB hinterlegten Typen bin ich nicht ganz sicher. Kann sein, dass da noch Fehlerchen drinnen sind, hab mir zwar die Augen wundgeguckt, aber wer weiß. Übrigens: Wenn bei der DNB zwei Typen wie Geographikum und Körperschaft hinterlegt ist (gibt tatsächlich so Fälle), dann ist TYP=g genauso okay wie TYP=k. --Wurgl (Diskussion) 19:14, 15. Mai 2018 (CEST)Beantworten

Gemurmel bei der GKD:

Ist ja richtig. Aber die dort eingetragene GND ist ein Geographikum. Die VIAF wiederum bezieht sich auch die GKD. Wie löst man das auf? REMARK=GND für das Schloss GND 4289435-9 und die GKD ins Feld GND verschieben? --Wurgl (Diskussion) 23:19, 15. Mai 2018 (CEST)Beantworten

Das sind zwei paar Schuh: Das Schloss als Bauwerk (GND 4289435-9, Typ g) und GND 2149346-7 (Typ k) für die Forschungsstätte und das Novalis-Museum. --Kolja21 (Diskussion) 01:41, 16. Mai 2018 (CEST)Beantworten
Ja eben demwegenhalb! Die GKD wird niemals nie nicht mit der GND "vereinigt". Aber du hast das ja genauso gelöst. --Wurgl (Diskussion) 08:38, 16. Mai 2018 (CEST)Beantworten

Parameter VIAF

Bearbeiten

Hallo Wurgl, ich bin gerade beim Abschnitt "Parameter GKD". Die Korrektur von GKD in GND ist einfach, aber müssen wir den Parameter VIAF einzeln von Hand hinzufügen? Imho können wir die Arbeit einem Bot überlassen, da die Zuordung GND -> VIAF eindeutig ist. Gruß --Kolja21 (Diskussion) 15:02, 16. Mai 2018 (CEST)Beantworten

Ich schrubte ja, dass ich das in C++ mit Qt geschrieben habe. Nicht ohne Hintergedanken. Und der Hintergedanke war eben ein interaktives Dingens bei dem ich mit gerötetem Auge die Zuordnung überprüfe und dann meinen Sanktus gebe, die eigentliche Änderung aber von jenem Dingens übernommen wird. Also sowas wie ein Halbbot. Bot mag ich nicht gar so, manchmal passen die Zuordnungen nicht, speziell wenn es Nachfolgerecords gibt. Da passt dann zwar die Zuordnung von der GND zu uns, aber der umgekehrte Weg sollte zum Nachfolger gehen. Daher ist das gerötete Auge wohl notwendig.
Die über 100.000 Viafs und die 80.000 GNDs die möglich sind, sind jedenfalls von uns paar nicht in endlicher Zeit zu schaffen – vielleicht mit 100+ Ameisen, die Tag für Tag am ackern sind. --Wurgl (Diskussion) 15:43, 16. Mai 2018 (CEST)Beantworten
So, die heutigen Normdatenergänzungen sind mit meinem selbstgeschriebenen Tool gemacht. Im Prinzip öffnet das drei Fenster mit DNB-Datensatz, VIAF-Datensatz und dem Wikipedia-Fenster, ich kontrolliere per Auge ob der DNB-Datensatz zum Wikipedia-Artikel passt und klick dann auf Okay. Das Zusammenkramen der Normdaten-Ids macht das Tool. Kannst ja gucken, ob ich irgendwo was zerstört hab oder falsch gemacht hab. Ich hab so 30 Unterschiede angeguckt und nix böses gefunden. Die übriggebliebenen auf der Vorderseite müssen vorerst per Hand zugeordnet werden oder (bei machen) gar nix. Bei denen passt irgendwas nicht, entweder falsche Zuordnung oder unklare Sache. --Wurgl (Diskussion) 19:24, 1. Jul. 2018 (CEST)Beantworten

Vorlage Tp und Tn im ANR

Bearbeiten

Ich frage mich, ob diese beiden Vorlagen überhaupt in den ANR reinsollen? Laut Beschreibung der Vorlagen wohl nicht, die Vorlage GND sollte das eigentlich abdecken. 63 Vorkommen (in 20 Artikeln) von Tp und ein Vorkommen von Tn zähle ich außerhalb der Feldes REMARK der Vorlage Normdaten (okay, jetzt noch 61 bzw. 18). @Kolja21, Silewe: Was meint ihr? --Wurgl (Diskussion) 15:46, 28. Mai 2018 (CEST)Beantworten

Hallo Wurgl, die Tns sollten auf jeden Fall raus, da sie keine zitierfähige Quelle sind. (Leider gibt es einige User, die alles, was sie unter einem Namen finden, ungeprüft der gleichen Person zuordnen. Mein Highlight war ein Artikel, in dem die beschriebene Person im Abstand von 30, 40 Jahren in zwei unterschiedlichen Fächern promoviert wurde. Der "Beweis" dafür war ein Tn.) Die Umwandlung der Vorlage {{Tp}} in {{GND}} ist dagegen nur kosmetischer Natur. --Kolja21 (Diskussion) 15:56, 28. Mai 2018 (CEST)Beantworten
Der einsame Tn ist vorne gelistet. --Wurgl (Diskussion) 16:41, 28. Mai 2018 (CEST)Beantworten
Bearbeiten

Wenn jemand eine Idee hat, wie man automatisiert diese Links wieder zum Leben erwecken kann, dann bitte her damit. In den Artikeln sind die noch mit dem Host portal.dn-b.de und teilweise vom IABot als defekt markiert. Wenn man die im Artikel sucht, dann Browsersuche nach "atr%253D". --Wurgl (Diskussion) 15:40, 5. Jun. 2018 (CEST)Beantworten

Hmm
Kaputt: https://portal.dnb.de/opac.htm?method=showFullRecord&currentResultId=atr%253D133512428%2526any&currentPosition=16
Gemeint sein könnte: https://portal.dnb.de/opac.htm?method=showFullRecord&currentResultId=133512428%26any&currentPosition=23
Nur aus 16 wird auf magische Art eine 23. Das funktioniert nicht automatisch. Eigentlich bräuchte man ein Aufpasserscript welches so Links mit currentPosition nicht zulässt, wenn die DNB ein Werk zusätzlich aufnimmt, dann gibt es einen Treffer mehr und diese Position verschiebt sich, entsprechend geht der Link dann irgendwohin. --Wurgl (Diskussion) 15:47, 5. Jun. 2018 (CEST)Beantworten
Mit dem Parameter currentPosition sind dann nochmals ca. 1405 Links zu finden … --Wurgl (Diskussion) 15:58, 5. Jun. 2018 (CEST)Beantworten
Um meine Überlegung nachvollziehbar zu machen ein Beispiel: Im Artikel Über_Friedrich_den_Großen_und_meine_Unterredung_mit_ihm_kurz_vor_seinem_Tode ist der Link https://portal.dnb.de/opac.htm?method=showFullRecord&currentResultId=Zimmermann,+and+Johann+and+Georg,+and+%C3%BCber%26any&currentPosition=17 zu finden Der Link geht nach Zimmermann, Johann Georg: Ueber die Einsamkeit gemeint ist aber wohl Treffer 20 (einfach am Ende vom Link die 17 gegen 20 tauschen), also Fragmente über Friedrich den Grossen zur Geschichte seines Lebens, seiner Regierung, und seines Charakters / von [Johann Georg] von Zimmermann --Wurgl (Diskussion) 19:02, 5. Jun. 2018 (CEST)Beantworten
Vermutlich ist viel Schrott dabei. Ein Eintrag unter Weblinks wie:
gehört in die Rubrik: 'Ich habe da irgendwas im Netz gefunden, aber ich weiß weder, wie man zitiert, noch kenne ich mich mit Vorlagen aus.' --Kolja21 (Diskussion) 21:51, 5. Jun. 2018 (CEST)Beantworten
Okay, dann motz ich auch mal: Nach 9 Jahren immer noch keine Ahnung von Vorlagen? --Wurgl (Diskussion) 21:57, 5. Jun. 2018 (CEST)Beantworten
Das wäre nicht schlimm, wenn der betreffende User wenigsten den ersten Satz seiner Fundstelle gelesen hätte: "Link zu diesem Datensatz: http://d-nb.info/1003735983" Wer dann trotzdem die URL mit Angaben wie "currentPosition=17" in den Artikel reinkopiert, dem ist nicht zuzutrauen, dass er einen lexikontauglichen Text verfassen kann. Im Grunde sollte ein Bot alle betreffenden Artikel in der QS melden. --Kolja21 (Diskussion) 22:16, 5. Jun. 2018 (CEST)Beantworten
Guck mal hier: Wikipedia_Diskussion:Technik/Werkstatt#Linkfix_–_Ideensuche Ich hoffe ja, dass der überwiegende Teil der Suchergebnisse sich nicht verändert hat, bzw. dass ich da einen sinnvollen Ersatz finde. Dann geht das recht schnell. Ein paar werden übrigbleiben. Aber sowas nervt einfach. --Wurgl (Diskussion) 22:26, 5. Jun. 2018 (CEST)Beantworten
Also ich hab jetzt mal ausgewertet. Es sind 135Die Zahl war falsch58 Links die keinen Treffer liefern, 1189 wo ich aus dem Kontext nicht sagen kann, was verlinkt werden sollte (mehrere Treffer mit vollkommener Übereinstimmung bzw. kein Treffer mit solcher) und 225203 bei denen der gemeinte Datensatz eindeutig aus dem Kontext herausgepfriemelt werden kann. Mit Bot kann ich direkte Links ersetzen, aber nicht die 4 denkbaren Vorlagen Tn, Tp, GND und DNB und das eben leider nur bei 225 Fällen. --Wurgl (Diskussion) 17:13, 9. Jun. 2018 (CEST)Beantworten


2 Beispiele für Fälle wo der Link im Artikel keinen Treffer liefert. Wenn es Ideen gibt, was das für eine Nummer gewesen sein könnte und wie ich diese in eine funktionierende umwursteln kann, dann nur her damit.(das == hab ich am Zeilenende weggemacht damit hier nicht noch mehr Abschnitte entstehen)
== Rudolf_Schwarzkogler

== Alexander_Saftig


2 Beispiele für Fälle wo das Script nicht entscheiden kann, welcher Datensatz genommen werden soll.
== Jasper_Hanebuth

== Atanas_Kareev


2 Beispiele für Fälle wo die Treffer wohl eindeutig sind.
== Terpene

== Kochbuch

Ein bissl hasse ich die DNB

Bearbeiten

Jetzt hab ich ganz toll ein Programm um diese Datei GND.rdf auszuwerten, nun gibt es unter https://data.dnb.de/opendata/ eine Datei GND.hdt.gz Argh! --Wurgl (Diskussion) 20:22, 1. Jul. 2018 (CEST)Beantworten

Aarg! Die haben die Datei wohl gesplittet:
  • Tbgesamt1806gnd.rdf.gz 2018-06-28 11:24 132M 1491029 Datensaetze / 14574825 Tripel / GND, Entitaeten Koerperschaft, Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
  • Tfgesamt1806gnd.rdf.gz 2018-06-28 11:25 60M 794129 Datensaetze / 6667707 Tripel / GND, Entitaeten Kongress, Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
  • Tggesamt1806gnd.rdf.gz 2018-06-28 11:26 25M 302893 Datensaetze / 3150306 Tripel / GND, Entitaeten Geografikum, Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
  • Tngesamt1806gnd.rdf.gz 2018-06-28 11:30 300M 7037189 Datensaetze / 54403264 Tripel / GND, Entitaeten Personenname (nicht indiv.), Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
  • Tpgesamt1806gnd.rdf.gz 2018-06-28 11:43 620M 4869852 Datensaetze / 83576136 Tripel / GND, Entitaeten Person (indiv.), Format RDF (RDF/XML) (Stand: 14:20 Uhr UTC)
  • Tsgesamt1806gnd.rdf.gz 2018-06-28 11:47 14M 209892 Datensaetze / 1833398 Tripel / GND, Entitaeten Sachbegriff, Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
  • Tugesamt1806gnd.rdf.gz 2018-06-28 11:47 23M 348957 Datensaetze / 304730 Tripel / GND, Entitaeten Werk, Format RDF (RDF/XML) (Stand: 13.06.2018 14:20 Uhr UTC)
Okay, die Werke brauch ich wohl eher nicht. --Wurgl (Diskussion) 20:29, 1. Jul. 2018 (CEST)Beantworten

REMARK-Feld

Bearbeiten

@Wurgl: Mit dem Abschnitt "Ersetzen einer weiterleitenden GND" bin ich durch. Vermutlich gibt es im Feld REMARK noch etliche Hinweise auf Dubletten, die bislang nicht über WP:GND/F gemeldet wurden. Sind diese Fälle irgendwo erfasst? (Hätten wir geahnt, dass eines Tages so viele Archive und Bibliotheken ihre Normdaten größtenteils ungeprüft zusammenwerfen, hätte man in der Vorlage:Normdaten analog zu GNDName einen Parameter GNDDublette einfügen können.) --Kolja21 (Diskussion) 18:50, 22. Aug. 2018 (CEST)Beantworten

Ich mach mal mit der Ergänzung der VIAF etc. weiter, hab noch ca. 2000 Stück bei der einen Suche und 400 bei der zweiten (die Suchen sind auf meiner Benutzerseite verlinkt). Wenn ich damit durch bin, dann guck ich mal, wie ich diese Liste erneuere, wobei ich so manche der Kommentare erhalten will. Nicht dass bei jeder Erneuerung die gleichen Nicht-Fehler nochmals auftauchen, und blacklisten will ich auch nicht so richtig. Im Zuge dieses Umbaus schau ich dann, wie ich das mit den Dubletten lösen kann. --Wurgl (Diskussion) 19:37, 22. Aug. 2018 (CEST)Beantworten
@Kolja21: Wenn nix dazwischenkommt, dann mach ich das morgen fertig, spätestens übermorgen. Willst du alle haben, bei denen GND gefüllt ist und REMARK gefüllt ist und die GND nicht in einer der Fehlermeldungslisten vorhanden ist, oder willst du nur die haben, bei denen im Feld REMARK auch eine GND/Tp/Tn zu finden ist. Im ersten Fall kämen halt auch die raus, wo sowas wie "VIAF vermischt" oder "unsicher" drinnen steht, im zweiten Fall nur die nicht gemeldeten. --Wurgl (Diskussion) 17:07, 18. Sep. 2018 (CEST)Beantworten
@Wurgl: Danke. Die "kleine" Liste mit GND/Tp/Tn reicht mir vollkommen. --Kolja21 (Diskussion) 17:22, 18. Sep. 2018 (CEST)Beantworten
Ui! Von wegen "kleine Liste", das werden ca. 1100 Einträge :-( Die ersten paar Stichproben scheinen zu passen. --Wurgl (Diskussion) 11:11, 19. Sep. 2018 (CEST)Beantworten

VIAF ergänzen

Bearbeiten

Also momentan stellt sich das so dar: 41000 VIAF mit weiteren Bibliothekseinträgen wären händisch zu ergänzen, 65000 sind solche die verzichtbar sind oder automagisch ergänzt werden können. Diese 65.000 haben nur einen Link auf die DNB und ev. einen auf ISNI oder auf Wikidata. --Wurgl (Diskussion) 22:02, 3. Okt. 2018 (CEST)Beantworten

Hat VIAF mittlerweile alle Tn's rausgeschmissen? --Kolja21 (Diskussion) 23:33, 3. Okt. 2018 (CEST)Beantworten
Letzte Woche hab ich noch welche gesehen. Ich hab so das Gefühl, das sind alles Überbleibsel von Tns die bei Wikidata mal dran waren. Ist aber nur so ein Gefühl.
So nebenbei: VIAF hat auch direkte Links auf Wikipedia. Die werden nicht angezeigt, ebenso auf z.B. bei VIAF:133156117 ist im Dump ein Link auf http://www.geonames.org/3164697 zu sehen oder bei VIAF:101916432 auf http://orcid.org/0000-0001-6757-9211 oder bei VIAF:308265063 ein Link auf http://www.imj.org.il/imagine/thesaurus/artists/T76901.htm … muss das irgendwann mal genauer erforschen. --Wurgl (Diskussion) 23:44, 3. Okt. 2018 (CEST)Beantworten

Neue Dumps

Bearbeiten

Es gibt neue Dumps, sowohl von VIAF als auch von DNB. Ich werde daher morgen eine neue Liste erstellen. --Wurgl (Diskussion) 23:53, 6. Nov. 2018 (CET)Beantworten

Gibt schon seit ein paar Tagen einen neuen Dump der VIAF. Ich muss morgen noch ganz wichtig und ganz weit weg Weihnachten feiern und werde Samstag am Abend oder am Sonntag die Liste neu erzeugen. Hab dieses Monat ca. 2000 VIAFs zu Tps ergänzt und mich weniger hier aufgehalten. --Wurgl (Diskussion) 16:48, 13. Dez. 2018 (CET)Beantworten
Die DNB hatte einen neuen Dump, die haben jetzt Verwandtschaftsverhältnisse (Eltern/Kinder/Geschwister,Großeltern/Enkel,Onkel&Tanten/Neffen&Nichten,Lehrer/Schüler,Kollegen,Freund) bei einigen Datensätzen. Beispiel: GND 100000193, GND 100065457 oder GND 128704020. Eventuell mag @MisterSynergy: da mit Wikidata was machen?
Die VIAF hat natürlich auch einen neuen Dump.
Und meine Scripte auf toolforge sind nach dem Crash der Datenbank neu geschrieben, verwenden jetzt platzsparendere Datenstrukturen und haben kleine Unterschiede (HTML-Kommentare etc. in Parametern bleiben erhalten bzw. stehen jetzt auch in der Datenbank). Und ich bin bei ziemlich allen Daten nur ein paar Minuten hintennach (auch auf der persondata-Webseite).
Kann sein, dass jetzt leichte Unterschiede auftreten und ein paar Sachen nicht gar so toll sind, hab die Liste nur ganz grob angeguckt. --Wurgl (Diskussion) 22:02, 19. Mär. 2019 (CET)Beantworten
Danke für den Ping. Ich müsste dann User:Jneubert mal fragen (hiermit getan), ob der neue Dump auch bereits im experimentellen SPARQL-Endpoint zur Verfügung steht. Wenn das so ist, würde ich (in absehbarer Zeit) erneut mit Wikidata abgleichen und dort ein paar Korrekturen einspielen. Wegen der Verwandtschaftsverhältnisse könnten wir weitere Abfragen schreiben, mit denen das in Wikidata abgebildet oder verglichen werden könnte. —MisterSynergy (Diskussion) 23:01, 19. Mär. 2019 (CET)Beantworten
Eins neues Update gibt's noch nicht. Ich versuche, das in der Woche vom 8.-12.4. unterzubringen - oder sonst Ende Mai/Anfang Juni. Geplant ist dabei, das Ganze so zu scripten, dass es automatisiert ausgeführt werden kann. Jneubert (Diskussion) 11:18, 20. Mär. 2019 (CET)Beantworten
Ui das mit dem scripten ist so eine Sache. Bisher haben sich so ziemlich jedesmal die Namen des bzw. der Dumps geändert. Ich hoffe das ändert sich nicht mehr allzuoft :-( Und die Inhalte änderten sich auch jedesmal, irgendwelche neuen Felder sind jedes mal dazugekommen (okay, die unbekannten kann man ja ignorieren). --Wurgl (Diskussion) 11:37, 20. Mär. 2019 (CET)Beantworten
@Wurgl: Danke für die Arbeit! Ich freue mich vor allem darüber, dass sich die Kategorie:Wikipedia:Veraltete Normdaten langsam leert. --Kolja21 (Diskussion) 23:03, 19. Mär. 2019 (CET)Beantworten

Neue Fehlerquelle identifiziert

Bearbeiten

Bisschen schwer zu erklären, ich hatte am Vormittag so einen Fall, dass nach einer Umbenennung/Verschmelzung einer Organisation, diese auch hier ein neues Lemma bekam. Und bei der DNB einen Nachfolger. Die Normdaten blieben aber die alten und passten wohl nicht so ganz toll.

Hier könnte das irgendwann passieren: Diskussion:Ost-Ausschuss_der_Deutschen_Wirtschaft#Veraltete_Information?

Mal sehen, sowas zu entdecken ist etwas wild. Vielleicht schaff ich das irgendwann(!) ohne allzuviele False-Positive. --Wurgl (Diskussion) 18:45, 16. Dez. 2018 (CET)Beantworten

Wegen Updates …

Bearbeiten

Es ist seltsam. Der VIAF-Dump wurde zwar am 3. Juni erzeugt, bzw. das File hat den Namen "viaf-20190603-links.txt.gz", aber erst gestern (am 14. Juni) am Nachmittag war das File auf dem Webserver. Am Vormittag hab ich geguckt, da war noch nichts. --Wurgl (Diskussion) 08:17, 15. Jun. 2019 (CEST)Beantworten

Ich häng mich mal da dran.
Die DNB ist etwas schnarchnasig unterwegs. Eigentlich ist der neue Dump dieses Monat fällig, aber da ist immer noch nix: https://data.dnb.de/opendata/ --Wurgl (Diskussion) 11:04, 22. Okt. 2019 (CEST)Beantworten
Man könnte mittelfristig auf einen OAI-Harvester umsteigen, dann hätte man regelmäßige (zumindest wöchentliche, wenn ich es recht verstehe) Aktualisierungen, aber das würde wohl nicht unerhebliche technische Umstellungen erfordern … --emu (Diskussion) 11:55, 22. Okt. 2019 (CEST)Beantworten
Hab mal nachgefragt ob vergessen oder so. Außerdem hab ich auf Hilfe_Diskussion:GND#Webformular aufmerksam gemacht und dann war noch was mit Weiterleitungen von zusammengeführten GNDs vom Typ "Werk" die nicht zur neuen Werks-GND weiterleiten, sondern zum Autor des Werk. Mal sehen. --Wurgl (Diskussion) 10:58, 28. Okt. 2019 (CET)Beantworten
Argh! Ein Abschnitt darunter steht ja das Problem mit den Weiterleitungen. --Wurgl (Diskussion) 12:14, 28. Okt. 2019 (CET)Beantworten
So in einer halben Stunde kommt eine neue Liste, GND-Dump ist gekommen. --Wurgl (Diskussion) 21:47, 5. Nov. 2019 (CET)Beantworten
Dauert etwas länger, die VIAF hat auch neue Dumps und bei denen dauert das runterladen ewig :-( --Wurgl (Diskussion) 22:10, 5. Nov. 2019 (CET)Beantworten
Keine Eile (es gibt noch genug abzuarbeiten) & danke schon mal. BTW: Kennst du dich dem Import von Daten in Wikidata aus? Im Grund könnte wir - analog zu anderen Datenbanken - individualisierte GNDs (z.B. jene für Personen mit Sterbejahr vor 1850), auch ohne dass ein Wikipediaeintrag zu der Person vorliegt, in Wikidata übernehmen. @Magnus Manske: Was hälst du davon? Du hast, wenn ich mich recht erinnere, entsprechende Erfahrungen mit der CERL-Kennung (P1871). --Kolja21 (Diskussion) 22:55, 5. Nov. 2019 (CET)Beantworten
Bei Wikidata hab ich nur ein paar sehr kleine Schritte unternommen, von Auskennen bin ich meilenweit entfernt und an einen Import mag ich mich nicht rantrauen. --Wurgl (Diskussion) 23:04, 5. Nov. 2019 (CET)Beantworten
Ich verwende seit einigen Wochen ein selbstprogrammiertes Skript, das aus GNDs Quickstatements für den Import in Wikidata erzeugt. Auch aus den Erfahrungen damit bin ich skeptisch bezüglich Massenimporten. Ich befürchte, dass die zu schwer wartbaren Einträgen führen, wenn sie nicht intellektuell bearbeitet werden --emu (Diskussion) 23:09, 5. Nov. 2019 (CET)Beantworten
Danke für das schnelle Feedback. Ich denke auch, dass wir das koppeln müssten (Quickstatements mit intellektueller Überprüfung). Andererseits fällt mir immer wieder auf, wie viele Einträge bei Wikidata eine VIAF-ID haben, aber die GND (obwohl in VIAF erfasst) fehlt. --Kolja21 (Diskussion) 00:53, 6. Nov. 2019 (CET)Beantworten
Es gibt auf Wikidata erstaunlicherweise auch über 13.000 Personendatensätze mit GND, aber ohne VIAF. Langweilig wird uns nicht. --emu (Diskussion) 12:18, 6. Nov. 2019 (CET)Beantworten
Hab heute per Mail erfahren, dass der Dump voraussichtlich noch diese Woche erstellt wird *schenkleklopf* Manchmal ist E-Mail eben doch noch schnarchlangsam. Das Fehlerchen vom Absatz darunter ist auch bekannt *seufz* und zum Webformular gabs ebenfalls nur den Satz dass daran gearbeitet wird. Aber Rom ist ja auch nicht an einem Tag erbaut worden. --Wurgl (Diskussion) 10:32, 8. Nov. 2019 (CET)Beantworten

Bot-Edits in Wikidata

Bearbeiten

@Wurgl: Wie kommt es, dass deine Liste schlauer ist als d:User:KrBot?

Wertest du den GND-Typ mit aus oder wie bist du auf den richtigen Datensatz gekommen? Gruß --Kolja21 (Diskussion) 03:33, 19. Jul. 2019 (CEST)Beantworten

Seltsam. Ich hab nur diese Id: 300602847. Ich werte in https://data.dnb.de/opendata/ diese sieben authorities-<TYP>_lds.rdf.gz Dateien aus. Und da ist nur beim Datensatz 300602847 ein Verweis auf die alte 4780154-2. (So ähnlich, wie bei GND 300602847 rechts: MARC21-XML und dort dann Typ 035, subfield a und z / bzw. Zeilen 13-26 im File). Ich hab nochmals das 12 GB-Monster authorities-person_lds.rdf.gz (ausgepackt: 12.113.955.030 Byte) nach der Id 4780154-2 durchsucht und da gibt es nix. Ich denke, ich frage da meinen Kontaktmann, das ist jedenfalls seltsam. --Wurgl (Diskussion) 07:59, 19. Jul. 2019 (CEST)Beantworten
Ich guck grad nochmals in dieses File authorities-werk_lds.rdf.gz. Ein anderes Werk: GND 7615448-8 (Sinfonien op. 10) sollte nach GND 300600690 umlenken, zeigt aber auf die Person GND 119057077. Stich ins Wespennest? Gleiche Sache bei GND 7595271-3 Sollte nach GND 300611153 gehen. --Wurgl (Diskussion) 08:15, 19. Jul. 2019 (CEST)Beantworten
Danke, dass du die DNB und Ivan in WD angeschrieben hast. Bin gespannt, was sie sagen. Ich dachte, die alten SWD-Einträge für musikalische Werke würde jetzt einfachheitshalber auf die Komponisten umgeleitet, aber offenbar liegt ein technisches Problem vor. OGND 119057077 vermerkt GND 7615448-8 nicht als Weiterleitung, sondern GND 7615448-8 ist korrekt unter OGND 300600690 eingetragen. --Kolja21 (Diskussion) 21:32, 19. Jul. 2019 (CEST)Beantworten
Hat wohl Urlaub, aber bis 2021 wird er schon zurück kommen *g* --Wurgl (Diskussion) 21:46, 19. Jul. 2019 (CEST)Beantworten

2 oder mehr Wikidata-Objekte zu einer VIAF

Bearbeiten

Ich kopier mal das von vorne:



Ich hab mal flott 477 solche VIAF identifiziert, davon 33 Stück mit 3 oder mehr Wikidata-Objekten, 3 VIAFS mit 5 Wikidata-Objekten sind Rekordhalter: VIAF:122012094, VIAF:149849706 und VIAF:155855229 (Norwegen!?). Eventuell mag das MisterSynergy interessieren. --Wurgl (Diskussion) 19:04, 3. Nov. 2019 (CET)Beantworten
Eine Stichprobe: Norway (Q7060816), Oregon ist in Wikidata mit der (korrekten) VIAF:177721085 verknüpft. Dort steht in der Versionsgeschichte "WKP|Q7060816 delete 2019-02-10". Der Algorithmus probiert immer wieder neue Verknüpfungen aus, und das geht in Einzelfällen schief. Für uns sehe ich keinen Handlungsbedarf. --Kolja21 (Diskussion) 20:05, 3. Nov. 2019 (CET)Beantworten
Ich papp mal die Personen rein. Mehr als ignorieren kann ja nicht passieren. Datenbestand ist vom 9. Oktober.

--Wurgl (Diskussion) 08:17, 4. Nov. 2019 (CET)Beantworten

Auslagerung - Kommentierte Fälle

Bearbeiten

Moin Moin Wurgl, ich glaube die kommentierten Fälle sollte man tatsächlich mal auslagern, da sie die Seite unnötig füllen. Wo wäre denn ein geeigneter Ort? "/Fehler GND - Kommentierte Fälle"? mfg --Crazy1880 20:38, 4. Dez. 2019 (CET)Beantworten

Beim nächsten Lauf mach ich das. --Wurgl (Diskussion) 21:09, 4. Dez. 2019 (CET)Beantworten

Parameter GND ergänzen (TYP=p) – alle Einträge

Bearbeiten

@Wurgl: Ich habe bemerkt, dass die Arbeit an Parameter GND ergänzen (TYP=p) rationeller und weniger mühsam ist, wenn man in Blöcken nach erstanlegenden Bibliotheken arbeitet (also zB nur welche von der Stabi statt bunt gemischt). Gibt es eine Möglichkeit, alle betroffenen GND und Artikel zu bekommen (also alle ~15.000)? Die ISIL der anlegenden Bibliotheken kann ich dann selbst mit Skript ermitteln (kann man wohl nicht dazuschreiben, weil sie zwar in den Marc-Daten, aber nicht in den RDF-Daten verzeichnet sind). Danke! --emu (Diskussion) 14:59, 13. Dez. 2019 (CET)Beantworten

Wenn ich eine Möglichkeit schaffe, dann gibt es die ;^)
Ich kann die volle Liste in ein File schreiben und dir dann den Teil mit den Personen zukommen lassen. Wäre das okay? --Wurgl (Diskussion) 15:39, 13. Dez. 2019 (CET)Beantworten
+1. Gute Idee. --Kolja21 (Diskussion) 16:26, 13. Dez. 2019 (CET)Beantworten
https://tools.wmflabs.org/persondata/data/Parameter-p-ergaenzen.txt
Wenn du Scripte schreiben kannst, dann kannst auch die VIAF-Ergänzungen rausfiltern *denk*
Hinweis zu "gute Übereinstimmung"/"schlechte Übereinstimmung" Da werden unsere Namen (aus Personendaten) mit einem der Namen (auf der Webseite der GND: Felder "Person" und "Andere Namen") verglichen. Mehr wird nicht verglichen. --Wurgl (Diskussion) 17:54, 13. Dez. 2019 (CET)Beantworten
Herzlichen Dank, ich werde schauen, wie ich die Daten elegant konvertieren kann. Bei der Gelegenheit: Fällt euch eine Möglichkeit ein, elegant zur GND auch die PPN-Nummer zu bekommen (außer jedes Mal bei OGND nachzuschauen)? --emu (Diskussion) 16:15, 14. Dez. 2019 (CET)Beantworten
@Wurgl, Kolja21: Ich habe auf Benutzer:Emu/GND (vorläufig mit Herumgebastel) etwas probiert. Wenn es sich bewährt, kann ich versuchen, mein Sammelsurium aus diversen teilautomatischen Skripten zu verbessern. Die Seite kann natürlich bearbeitet werden! --emu (Diskussion) 01:53, 15. Dez. 2019 (CET)Beantworten
Sieht gut aus. Ich schau' mal, wie viele der Tp6 ich erg. kann. --Kolja21 (Diskussion) 01:55, 15. Dez. 2019 (CET)Beantworten
Ich denke, mal es wäre schlau, wenn ich die Liste neu generiere und dabei die Links auf der Emu-Seite filtere … Einwände? --Wurgl (Diskussion) 12:35, 15. Dez. 2019 (CET)Beantworten
Gerne, wenn dir das nicht zu viel Arbeit macht. --Kolja21 (Diskussion) 14:03, 15. Dez. 2019 (CET)Beantworten
Ebenfalls gerne, eventuell wird die Seite aber noch erweitert – speziell die Unterteilung in Katalogisierungslevels scheint sich zu bewähren --emu (Diskussion) 14:06, 15. Dez. 2019 (CET)Beantworten
Vor allem die Tp6 sind ein Gewinn. Ist schon interessant, wie die Stabi Berlin Quellen zitert. Da wird aus dem Geburtsort Klagenfurt "Klagenfurth" (Quelle: Wikipedia) oder aus Bernard de L’Escaille de Lier ein "Bernard de 3/4' Escaille de Lier" (Quelle: WBIS). BTW: Das GND-Webformular bietet uns jetzt die Möglichkeit an, auch Datensätze zu Organisationen zu korrigieren. --Kolja21 (Diskussion) 15:51, 16. Dez. 2019 (CET)Beantworten
Det jibbet! http://www.zeno.org/DamenConvLex-1834/A/Klagenfurth (PS: Besser als Klagenfurz)  Vorlage:Smiley/Wartung/teufel  --Wurgl (Diskussion) 16:02, 16. Dez. 2019 (CET)Beantworten
Kolja21, kannst du in GND 1055833943 die Vorgänger/Nachfolger-Kette auflösen? Siehe The Surfaris und The Original Surfaris --Wurgl (Diskussion) 10:22, 17. Dez. 2019 (CET)Beantworten
Nein, leider nicht. Beide Datensätze haben den Katalogisierungslevel 1 und sind damit für Änderungen über das Webformular gesperrt. --Kolja21 (Diskussion) 14:06, 17. Dez. 2019 (CET)Beantworten

@Wurgl: Nachdem die Listen vermutlich in der nächsten Zeiten abgearbeitet werden können (nur noch ca. 240 Fälle), wollte ich fragen, ob die Liste https://tools.wmflabs.org/persondata/data/Parameter-p-ergaenzen.txt in nächster Zeit (zB gemeinsam mit dem nächsten Lauf, damit die Dopplungen möglichst ohne viel Arbeit verhindert werden) neu erstellen könntest? Dann könnte ich meine Seite wieder neu erstellen. --emu (Diskussion) 17:45, 19. Jun. 2020 (CEST)Beantworten

@Emu: https://tools.wmflabs.org/persondata/data/Parameter-p-ergaenzen2.txt
Das sind jetzt *ALLE* restlichen, die (ersten) überschneiden sich mit der Vorderseite. Also eventuell nimm dir zuerst die am Ende vor. Aber es sind nunmal nur noch 9.434. --Wurgl (Diskussion) 00:13, 26. Jun. 2020 (CEST)Beantworten

Neue Liste

Bearbeiten

@Crazy1880, Silewe, Wurgl, Kolja21: Danke, Wurgl! Auf Benutzer:Emu/GND gibt es nun 8445 (= alle außer die ersten 1000) nach anlegenden Bibliotheken und Katalogisierungslevel geordnete mögliche Zuordnungen. --emu (Diskussion) 20:28, 26. Jun. 2020 (CEST)Beantworten

VIAF wechsle dich?

Bearbeiten
@Kolja21: Was ist da los? Am 18. Februar hab ich VIAF:7194152503063910800000 gegen VIAF:2307152451235806650004 getauscht, und jetzt wieder VIAF:7194152503063910800000?
Archivversion der VIAF 2307152451235806650004 vom 5. März 2020: http://archive.is/mVBXL
Archivversion der VIAF 7194152503063910800000 vom 5. März 2020: http://archive.is/pKRVu
Mit den Archivversionen kann ich bei nochmaligem Wechsel gezielt nachfragen. Gibts für die VIAF einen Ansprechpartner in der Wikipedia-Welt? --Wurgl (Diskussion) 11:01, 5. Mär. 2020 (CET)Beantworten
@Wurgl: In den genannten Fällen liegen keine regulären Normdatensätze vor. Extended VIAF Authority (xA) und Extended Relationships (xR) sind Hilfseinträge oder Testläufe von OCLC. Diese Datensätze würde ich ignorieren und nicht in die Normdatenvorlage übernehmen. Einen Ansprechpartner bei VIAF gibt es leider nicht. Gruß --Kolja21 (Diskussion) 14:11, 5. Mär. 2020 (CET)Beantworten
Ich werde mal die Anzahl solcher Fälle auswerten. Eventuell könnte man da einen Satz in Hilfe:Normdaten#VIAF ergänzen. --Wurgl (Diskussion) 17:16, 5. Mär. 2020 (CET)Beantworten
VIAF ist halt vom Prinzip her strenggenommen keine Normdatei, sondern eher eine Suchmaschine. Die Cluster werden ständig neu zusammengestellt. Was xA und xR betrifft, ist das meine persönliche Meinung und keine offizielle Mitteilung, die man in Hilfe:Normdaten#VIAF ergänzen könnte. OCLC/VIAF hält sich leider mit Informationen über ihrer Arbeitsweise bedeckt. --Kolja21 (Diskussion) 18:08, 5. Mär. 2020 (CET)Beantworten
255 solche VIAFs haben wir zugeordnet. --Wurgl (Diskussion) 18:36, 5. Mär. 2020 (CET)Beantworten

Noch einer, den ich archiviere:

Archivversion der VIAF:309285222 vom 5. März 2020: http://archive.is/D97ln
Archivversion der VIAF:4230158309838806690007 vom 5. März 2020: http://archive.is/H12jN
--Wurgl (Diskussion) 11:19, 5. Mär. 2020 (CET)Beantworten

Und weil es so schön ist:

Archivversion der VIAF:3937156990990061180007 vom 5. März 2020: http://archive.is/W2JSo
Archivversion der VIAF:7149158188273220260008 vom 5. März 2020: http://archive.is/O8EEP
--Wurgl (Diskussion) 11:32, 5. Mär. 2020 (CET)Beantworten
Archivversion der VIAF:9664151051971733530001 vom 5. März 2020: http://archive.is/HYvnB
Archivversion der VIAF:9006158188197420260008 vom 5. März 2020: http://archive.is/uQ66z
--Wurgl (Diskussion) 11:38, 5. Mär. 2020 (CET)Beantworten

Das geht schon seit Jahren so. Danke für die Doku! Bibliotaker (Diskussion) 21:59, 16. Mär. 2020 (CET)Beantworten

Tp Tachometer

Bearbeiten

Mein bestes war 20 min für 25 [1]. Die waren aber alle sehr einfach. Gerundet 1 min/Tp. Aber die reine Entscheidungszeit sind vielleicht 6 Sekunden. D.h. 90% geht mit Klicken und Scrollen drauf. Bibliotaker (Diskussion) 21:56, 16. Mär. 2020 (CET)Beantworten

Abbau Rückstand Eintragung GND TYP=p

Bearbeiten

Ich überlege immer noch, wie sich die GND TYP=p schneller auffüllen lassen, ist ja nicht nur der derzeitige Bestand, sondern kommt immer wieder etwas hinzu. Ca. 1/3 der WP sind Personenartikel (code=piz), täglich 100+ neue P-Artikel. Die umseitige Liste bezieht sich wohl nur auf Fälle wo VIAF vorhanden, Kolja21 hat mir petscan geschickt wo gar keine ND in WP vorliegen, aber GND in Wikidata vorhanden. Hatte da Fälle, da verweist die DNB/GND-Seite im HTML unter Quelle direkt auf den WP-Artikel mit Stand 2018. Die GND liegt also schon lange und einfach findbar und hochgradig sicher vor.

Es gibt sicher mehrere Stellschrauben, davon einiges als Vereinfachung für den einzelnen Bearbeiter, anderes nur als Animation zum Mitmachen. Brainstorming:

  • Artikel und DNB-Portal öffnen:
    • in der Liste mit einem Klick zwei Tabs öffnen lassen, einer für Artikel, einer für GND-Link
    • oder mehrere Artikel mit einem Klick
    • oder beides zusammen, wobei Artikel und zugehörige GND-Seite immer nebeneinander
  • Runterscrollen im Artikel: PD+ND+ggf. Kategorien oben im Artikel anzeigen
  • Runterscrollen bei GND-Seite: mit ihren Bibliothekhinweisen - ich will nur Normdaten anschauen - nerven die,
    • ggf. durch ein anderes Tool durchziehen der nur den relevanten HTML-Block anzeigt
    • ich weiß nicht ob man ein runterscrollen per JS automatisieren kann
  • Austragung - wenn ich eine GND ergänze, könnte ein Bot, ggf. mit ~10min Verzögerung (falsch gespeichert, selbst revertiert), diese austragen
  • Benutzer:Wurgl/Fehler_GND#Parameter_GND_ergänzen_(TYP=p) : Auslagerung zumindest dieses Bereichs? Oder aller Bereiche GND-Ergänzung nach Typ in eigene Seiten? Aber zumindest GNDp
    • wenn Seite neu geöffnet muss man erst in den Abschnitt, wer schon Link mit Anker hat OK, aber mancher vielleicht nicht.
    • Ladezeit/Browserressource - es wird die gesamte Seite geladen, auf schmaler Hardware ist das Stress, ich öffne teilweise 25er-Abschnitt zum bearbeiten und gehe auf Vorschau, einfach damit weniger im Browser ist, aber manchmal muss ich was reinschreiben, dann wieder ganze Seite neu
    • Beobachtbarkeit - Es gibt wohl die Möglichkeit Seiten zu beobachten, hab ich noch nicht probiert, aber für Leute mit Fokus auf Ergänzung der GND TYP=p, Biografieverbesserer, wäre dies wohl praktisch.
    • Auch sieht man leichter wer noch an dem Thema dran ist, kann sich eventuell zu GNDp-auffüll-editathons verabreden.
    • Skripte könnten leichter genau auf die GNDp-Liste zurückgreifen, siehe oben unter Austragung.
  • mehr Leute zum Mitmachen annimieren - z.B. in Kategorienseiten die GNDp-Füllstände anzeigen. Es gibt seit gestern Vorlage:Kategorie Person, die einige Vorlagen bündelt und leicht um einen Füllstandsanzeiger erweitert werden kann - wenn man die Füllstände messen kann. Anzahl der Seiten inkl. Unterseiten ist teilweise vorhanden in {{Metadaten Artikelanzahl}}.

Bibliotaker (Diskussion) 13:51, 23. Mär. 2020 (CET)Beantworten

Nein! Du irrst. Da liegt nix sicher vor.
Der Link zur Wikipedia auf der Seite der DNB kommt von VIAF. Und VIAF bezieht diese Daten aus der eigenen Logik zum Zusammenführen. Diese Logik zum Zusammenführen übernimmt auch Daten von Wikidata. Irgendwann (ich glaub August) 2015 ist in Wikidata mal ein Bot gelaufen, der VIAF-Id bei Wikidata reingemacht hat. Ich hab keinen Schimmer wie die da reingekommen sind, halt irgendwie. Nochmals zum Weg Wikidata -> VIAF. Es genügt, dass in Wikidata eine VIAF-ID (die muss nicht die richtige sein) eingetragen ist und in Wikidata ist ein Artikel der deutschen Wikipedia eingetragen. Jetzt fehlt nur noch so eine Daumen mal Pi Logik, die diesem Cluster aus Wikidata (inkl. Links auf die Wikipedia-Artikel) und noch irgendwas mit irgendeiner halbwegs passenden GND verbindet. Schwupps ist im DNB-Datensatz ein "Link zur Wikipedia" zu lesen. Da ist nix sicher. "Recht" sind nur die Datensätze, wo in der Bemerkung die Wikipedia erwähnt wird.
Und zu den anderen Sachen: Sorry. Bei Javascript steig ich aus. Ich kann es lesen, ich kann simple Änderungen machen, aber bei komplexeren Dingen … da muss ein anderer ran. --Wurgl (Diskussion)
"Link zur Wikipedia auf der Seite der DNB kommt von VIAF" (Wurgl) und "GND nennt Wikipedia als Quelle" (Beispiel: GND 1128914190) sind zwei unterschiedliche Dinge. (@Bibliotaker: Ich denke, du meinst Fall 2.) Und was die Auslagerung betrifft: Da gibt es bereits einen interessanten Versuch Benutzer:Emu/GND. --Kolja21 (Diskussion) 15:50, 23. Mär. 2020 (CET)Beantworten
Ja. Das meinte ich ganz am Ende mit "Recht sicher". Nur diese Info werte ich nicht aus.
Aus der VIAF kommt z.B. DNB 1201444012 das muss angestarrt werden, obwohl es oft passt. --Wurgl (Diskussion) 16:02, 23. Mär. 2020 (CET)Beantworten
451 Stück wäre das, wo "Wikipedia" in der Quelle bei der DNB genannt ist und wo die GND bei uns nirgendwo zugeordnet ist. Doch da sind aber so manche dabei, die zwar ein Artikelchen in der engl. Wikipedia haben, aber nicht in der deutschen. z.B: DNB 1201844878 = en:Chen Shih-meng. oder DNB 1194672035 (Link ist im Datensatz) --Wurgl (Diskussion) 16:19, 23. Mär. 2020 (CET)Beantworten
Imho wäre es sinnvoll, bei Fällen wie GND 1194672035 = Andrew Scoble (Q16933564) die GND per Bot in Wikidata einzutragen. Anschließend tauchen die Einträge, die uns betreffen, in der Kategorie:Wikipedia:GND in Wikipedia fehlt, in Wikidata vorhanden auf. --Kolja21 (Diskussion) 18:06, 23. Mär. 2020 (CET)Beantworten
@Kolja21: wär ich auch dafür. Und wenn da statt en.wikipedia de.wikipedia.org steht? Ab wann matcht ein Mensch? Geburts/Todesort+zeit gleich? Bibliotaker (Diskussion) 07:33, 25. Mär. 2020 (CET)Beantworten
Paul Schneider (Maler) http://d-nb.info/gnd/1058770861 im HTML Quelle
Gut, der ist verschoben, nicht exakt ein Beispiel was ich meinte, aber schon seit 2014! Kommt nicht via VIAF. Rechts mit Beschriftung "Zugehöriger Artikel in Wikipedia" Link zu https://de.wikipedia.org/wiki/Paul_Schneider_%28Maler%29 .das ist der, der wohl auch in RDF/Turtle hinterlegt ist, das kommt eventuell von VIAF/Wikidata. Ich hatte da dutzende Fälle wo in HTML unter "Quelle" genau Rückverweis. Bibliotaker (Diskussion) 07:23, 25. Mär. 2020 (CET)Beantworten
@Bibliotaker: Nebenbemerkung: Ich habe den Kommentar mal etwas lesefreundlicher gestaltet. Auf die GND kannst du mit den Vorlagen {{GND}}, {{Tp}} und {{Tn}} verlinken. Fröhliches Schaffen --Kolja21 (Diskussion) 19:16, 25. Mär. 2020 (CET)Beantworten

Neue Liste [2020]

Bearbeiten

@Kolja21, Silewe: Hab gerade gesehen, die VIAF hat einen neuen Dump.

Ich würde heute so ab 23 Uhr gerne eine neue Liste erzeugen. Die Kommentare kommen dann (wie immer) auf die "Rückseite". Ich werde 1000 TYP=p und 500 bei den anderen Typen generieren. --Wurgl (Diskussion) 21:11, 11. Apr. 2020 (CEST)Beantworten

Klasse "The persist-rdf.xml file has been removed and will no longer be available." steht ganz unten auf http://viaf.org/viaf/data/
also gibt es die Liste der ungültigen VIAFs nicht mehr … --Wurgl (Diskussion) 22:39, 11. Apr. 2020 (CEST)Beantworten

Ich hab ja vorgestern auf einen neuen Dump der VIAF in den nächsten Tagen gehofft und daher erstmal nix generiert. Dump ist da … Liste in so 1-2 Stunden. --Wurgl (Diskussion) 21:57, 5. Mai 2020 (CEST)Beantworten

Danke für deine Arbeit! --Kolja21 (Diskussion) 02:43, 6. Mai 2020 (CEST)Beantworten

@Kolja21, Silewe: VIAF hat einen neuen Dump, ich generiere in 2-3 Stunden dann eine neue Liste. --Wurgl (Diskussion) 20:32, 3. Jun. 2020 (CEST)Beantworten

@Kolja21, Silewe: VIAF hat einen neuen Dump. Liste wird generiert. --Wurgl (Diskussion) 10:09, 2. Jul. 2020 (CEST)Beantworten

Ich geh mal zum Baumarkt und kauf mir 2 Glasbausteine für die Brille. *gna* Juni != Juli! --Wurgl (Diskussion) 10:50, 2. Jul. 2020 (CEST)Beantworten
@Kolja21, Silewe: Aber jetzt steht dort eindeutig Juli, also bau ich eine neue Liste! --Wurgl (Diskussion) 09:39, 8. Jul. 2020 (CEST)Beantworten

@Kolja21, Silewe, Emu: Es gibt einen neuen Dump der DNB in https://data.dnb.de/opendata/ Namensdatensätze gibt es nicht, das muss ich dann wohl bei mir anpassen (so ziemlich alles mit Tn's muss ich rausnehmen), wird wohl bis morgen/ü-morgen dauern und dann kommt eine neue Liste. Siehe auch Vorlage Diskussion:Normdaten#"14.000_Tn_werden_zu_Tp6". Alternativ könnte ich die Namensdatensätze des vorherigen Dumps nehmen, da muss ich aber die 14.000 Tn welche zu Tp wurden, rausnehmen. Mal sehen. --Wurgl (Diskussion) 14:17, 15. Jul. 2020 (CEST)Beantworten

Wenn ich es richtig sehe, hat sich die Anzahl der Tp von 5.251.171 (Feb.) auf 5.350.953 erhöht. D.h. knapp 100.000 neue Personen (incl. Dubletten) sind dazugekommen. Jetzt wäre es natürlich spannend zu wissen, wie viele davon ehemalige Tns sind. --Kolja21 (Diskussion) 17:28, 15. Jul. 2020 (CEST)Beantworten
In meinem Hirn denkt es :-) Will sagen: ich kann mich nicht wehren und das Thema verdrängen. Jedenfalls tendiere ich dazu, die Tns vom letzten Dump mit in die Auswertung zu nehmen, Dann kann ich in der Liste solche umgewandelten irgendwie anmerken. Außerdem kann es ja immer noch sein, dass ein paar Phantasie-Tns eingetragen wurden, etwas über 1 Monat lang nach de Dump gab es die ja noch. Neuzuordnungen von Tns werd ich aber sicher weglassen. Was mir nicht klar ist: Sind auch welche gelöscht worden, also so richtig weg dass beim Aufruf ein 404er kommt. --Wurgl (Diskussion) 18:10, 15. Jul. 2020 (CEST)Beantworten
Eine Komplettlöschung wäre ungewöhnlich. Das gab es zu PND-Zeiten ab und an, aber bei der GND habe ich das nicht mehr erlebt. --Kolja21 (Diskussion) 19:54, 15. Jul. 2020 (CEST)Beantworten
PS: Was meinst du mit "Phantasie-Tns"? Welche waren das? --Kolja21 (Diskussion) 20:08, 15. Jul. 2020 (CEST)Beantworten
Tippfehler oder Ids von Werken aka. Katalognummern. --20:20, 15. Jul. 2020 (CEST)
Heute wird nix mehr. Ich hab bisher aus den Typen wie "Person (piz)", "Pseudonym (pip)", "Organisation (kiz)" etc. unsere Typen "Person", "Körperschaft", "Veranstaltung", etc. gebildet. Damals als es nur eine Dumpdatei gab, war das nicht anders möglich. Jetzt trennt die DNB aber in 6 einzelne Typen (bzw. mit Namen sind es 7) und bei manchen Typen, wie "Historisches Einzelereignis (sih)" oder "Personengruppe (siu)" ist die DNB etwas freizügig, bei "sih" ist es mal ein Wer und mal eine Veranstaltung, bei "siu" mal eine Körperschaft und mal eine Person. Weitere hab ich (noch) nicht geguckt. Das bau ich auch gleich um und hol mir diesen Typ aus dem Namen des Dumpfiles. --Wurgl (Diskussion) 22:03, 17. Jul. 2020 (CEST)Beantworten
Hat keine Eile. Wir habe ja noch ein paar Fälle zum Abarbeiten. Bin auf jeden Fall auf die neue Liste gespannt. --Kolja21 (Diskussion) 22:36, 17. Jul. 2020 (CEST)Beantworten

@Kolja21, Silewe: Ich hab vorhin gesehen, dass es einen neuen DNB-Dump gibt und würde gerne neu generieren. Okay oder noch auf etwas warten? --Wurgl (Diskussion) 14:26, 6. Mär. 2021 (CET)Beantworten

Von mir aus gerne! Bin gespannt, ob seit dem 20. November wieder ein paar Dubletten ohne unser Zutun abgearbeitet wurden. Die Kategorie:Wikipedia:Veraltete Normdaten leer sich nur langsam. --Kolja21 (Diskussion) 14:41, 6. Mär. 2021 (CET)Beantworten
GND-Name leert sich ebenfalls langsam. Ich guck die "Verbrechen" des Bot ja jeden Tag an und da sind immer wieder ein paar entfernte GNDName dabei. --Wurgl (Diskussion) 14:44, 6. Mär. 2021 (CET)Beantworten

GND/F

Bearbeiten

Wegen Änderungskommentar in Spezial:Diff/203007780: Ich werde mal versuchen, REMARK mit dem Inhalt "…ND/F…" auszuwerten. Sind aktuell 764 Stück. Mal sehen, ob ich da klarkomme.

Und die andere Richtung wäre: In der Fehlermeldung kommt die GND vor, hat dort keinen Erledigt-Vermerk und in REMARK steht nix von "…ND/F…".

Hab ich das richtig verstanden? --Wurgl (Diskussion) 22:01, 22. Aug. 2020 (CEST)Beantworten

Danke! Bin gespannt auf das Ergebnis. Dürften eigenlich nur wenige Fälle sein (höchstens 10 bis 50 Artikel), aber bei den Zahlen habe ich mich schon öfters getäuscht. Bin darauf gestoßen, als ich heute die letzten PND-Einträge im ANR überprüft und in GND geändert habe.[2] --Kolja21 (Diskussion) 23:38, 22. Aug. 2020 (CEST)Beantworten

VIAF-Cluster mit mehr als einer GND

Bearbeiten

@Wurgl: Ich habe gerade das Chaos bei Dietrich Neumann (Architekt, 1929) gelichtet, und dabei ist mir aufgefallen, dass VIAF:66584278 zwei Wikidata-Objekte trotz unterschiedlicher Geburtsjahre in einem Cluster zusammenfasst. Ähnliches habe ich auch schon bei GND-Einträgen in VIAF gesehen. Hast du mal überprüft, um wie viele Fälle es sich handelt? Ich bin neugierig, ob das überwiegend Dubletten sind oder nur Datensätze, die VIAF nicht richtig zuordnen kann. --Kolja21 (Diskussion) 07:26, 8. Apr. 2021 (CEST)Beantworten

Ich hab das schon öfter gesehen. Bei kurzen Namen von Bands kommt das schon mal vor. Soweit ich mich erinnern kann, war in den Fällen in allen Wikidata-Objekten die VIAF zugeordnet. Die Abrage läuft … seit 12 Minuten *wart* --Wurgl (Diskussion) 08:35, 8. Apr. 2021 (CEST)Beantworten
4618 VIAFs dieser Art gibt es. Rekord ist VIAF:242677520 mit 11 Wikidata-Objekten. Silke hab ich mal einen anderen "Blumenstrauß" gezeigt VIAF:124541486, einen mit RISM's ;^) --Wurgl (Diskussion) 14:53, 8. Apr. 2021 (CEST)Beantworten
Danke für die Info, aber wie sieht es mit den Doppeleinträgen von GNDs aus? Das wären die Fälle, die wir vergleichsweise leicht abarbeiten könnten, falls die Zahl der Cluster unter 1000 liegt. --Kolja21 (Diskussion) 20:42, 8. Apr. 2021 (CEST)Beantworten
19.461 VIAFs, Rekord ist VIAF:13088502 mit 8 unterschiedlichen Hermann Müller. Übrigens: 8.617.067 GND-Ids sind bei der VIAF (8.596.305 VIAF-Ids) und 2.754.066 Wikidata-Objekte (2.748.422 VIAF-Ids).
Ich könnte noch nach solchen filtern, die in der deWP vorkommen. Mal sehen.
Immer noch 1.559 VIAFs, Rekord: VIAF:71367291 mit 4 eventuell identischen Cassius Felix und VIAF:136812647 mit 4 mal Deutscher Kongress für Philosophie. --Wurgl (Diskussion) 23:59, 8. Apr. 2021 (CEST)Beantworten
und 1.117 vom Typ 'p' :-( @Kolja21: --Wurgl (Diskussion) 00:04, 9. Apr. 2021 (CEST)Beantworten
Danke! Cassius Felix ist schon mal ein Volltreffer. Wenn der Abschnitt "Mögliche GND-Dubletten, die bisher nicht gemeldet wurden" abgearbeitet ist, wäre es hilfreich, die Treffer vom Typ p in die Liste mit aufzunehmen; die anderen können wir eh nicht melden. --Kolja21 (Diskussion) 00:29, 9. Apr. 2021 (CEST)Beantworten
Wenn du magst, die VIAFs mit 3 GNDs: VIAF:201437105, VIAF:215456213, VIAF:25384859, VIAF:27268077, VIAF:288838602, VIAF:290218371, VIAF:3288237, VIAF:35209121, VIAF:44578755, VIAF:62340462, VIAF:68994973 --Wurgl (Diskussion) 01:05, 9. Apr. 2021 (CEST)Beantworten
Ich habe mich erst mal dem Rekordhalter Hermann Müller angenommen: Eine Pseudo-GND individualisiert (Hermann Müller (Q106427760), Aufsichtsratsvorsitzender) und eine Dublette (Hermann Müller, Bankier in Nürnberg) gemeldet. --Kolja21 (Diskussion) 01:28, 9. Apr. 2021 (CEST)Beantworten
@Wurgl: Die VIAFS mit 3 GNDs dürfte es eigentlich gar nicht geben. Bis auf eine "Familie Walther" sind das fast alles Fälle, wo Name und Lebensdaten übereinstimmen. Da hat der halbautomatische Datenabgleich bei der DNB versagt. Ich habe die Fälle einzeln gemeldet. Eigentlich müsste es reichen, wenn du die Liste mit den 1.117 Dubletten vom Typ 'p' an die GND-Zentralredaktion schickst. Aber leider haben wir es mit einer deutsch-deutschen Behörde zu tun. Bei US-Bibliotheken gibt es mittlerweile ganze Gruppen von Bibliothekaren mit Wikidata-Account. Wenn die DNB nicht aufwacht, werden denen irgendwann die Stellen für Bibliothekare gestrichen, da die Tipparbeit kostengünstig (im Stil von Callcentern) von Fremdfirmen übernommen werden kann. --Kolja21 (Diskussion) 16:48, 9. Apr. 2021 (CEST)Beantworten
Ich hatte da einen Kontakt an der richtigen Stelle, der ist aber leider erkrankt (näheres auf Anfrage per Email, öffentlich schreib ich das nicht) und ich kenne den Status nicht, Kontakt abgebrochen. Aber wie auch immer, ich fürchte, ich muss da etwas mehr filtern (nicht nur die bereits gemeldeten). Es werden Pärchen genug für einen automagischen Merge übrig bleiben, aber auch ein paar die erst geprüft werden müssen. Nix was von jetzt auf gleich passieren wird. --Wurgl (Diskussion) 19:22, 9. Apr. 2021 (CEST)Beantworten
Das eilt nicht. Das Schöne an Bibliotheken ist, dass man dort in Dekaden denkt. Aber wo wir gerade bei dem Thema Altlasten sind: Was ist eigentlich aus den Tp6 geworden, bei denen das Feld "Typ Person" fehlt; jene Datensätze, die kurz vor der Entlinkung der Tns erzeugt wurden? (Beispiel GND 156882760.) Bis heute weiß ich nicht, nach welchen Kriterien die Tns ausgewählt wurden, die jetzt als Tp6 ohne weitere Angaben ihr Dasein fristen. --Kolja21 (Diskussion) 20:49, 9. Apr. 2021 (CEST)Beantworten
Das hier meinst du, oder? Vorlage Diskussion:Normdaten#"14.000 Tn werden zu Tp6" *kopfkratz* Ich hab damals nix gemacht, eben weil kein Ansprechpartner. Raymond so fürchte ich, hat sich wohl auf mich verlassen. Ist wohl dumm gelaufen :-( --Wurgl (Diskussion) 21:10, 9. Apr. 2021 (CEST)Beantworten
Ich muss gestehen, dass ich dei letzten Monate nicht viel im Bereich Normdaten gemacht habe. Viele andere Projekte und reale Arbeit. Wenn du/ihr mir konkrete Fragen (nochmal?) aufschreibt, leite ich diese gerne an meinen Ansprechpartner weiter. --— Raymond Disk. 21:48, 9. Apr. 2021 (CEST)Beantworten
@Wurgl: Danke für den Link. @Raymond: Ich überlege mir die wichtigsten Fragen und melde mich morgen. --Kolja21 (Diskussion) 00:05, 10. Apr. 2021 (CEST)Beantworten

Fragen an die DNB

Bearbeiten

Hallo @Raymond: Ich habe mir die neue Webseite gnd.network angeschaut, aber keine Antwort auf meine Fragen an die DNB gefunden:

  • Ein Jahr bevor die Tns entlinkt wurde, war die Rede von der Entwicklung eines Tool, das helfen soll, unverlinkte Autoren aufzufinden. Was ist aus dem Projekt geworden?
    • --Kooperation GND-Wikipedia (Diskussion) 18:33, 22. Apr. 2021 (CEST) Ja, das ist ein Projekt was angelaufen ist. Konzeptionell und in Tests sind wir da weiter vorangekommen, aber es liefert noch keine produktiven Ergebnisse. Das ganze Thema firmiert bei uns unter "Vorschlagssteuerung". Das heißt es sollen Vorschläge für Titel-Personenverknüpfungen entstehen sowie neue Personendatensätze auf Basis von Clusteringverfahren, Datenübernahmen von anderen (GND-)Anwendern. Sobald es da produktive Ergebnisse gibt, werden wir darüber sicherlich auch auf der Webseite berichten.Beantworten
  • Zahlreiche Korrekturwünsche auf WP:GND/F (z.B. bei neueren Hochschulschriften, die nur noch als Digitalisat archivert sind) gehen auf im Feld 046G genannte Werke (werden nur über OGND angezeigt) zurück, die im Katalog der DNB vorhanden, aber nicht mit einem Autor verknüpft sind. Wäre es möglich, dass die DNB die Verknüpfung automatisiert erledigt?
    • Das betrifft nur die Fällen, in denen ein einzelnes Werk verknüpft ist; bei mehreren muss man erst recherchieren, ob der Tp6 nicht als Tn genutzt wurde. Beispiel: GND 1146587171 = Jörg Kühne (* 1968).
    • Falsche Zuordnung: VIAF:507151246511644130260 = Jörg Kühne (Politiker) + Verfasser von DNB 97246915X
      • --Kooperation GND-Wikipedia (Diskussion) 18:33, 22. Apr. 2021 (CEST) In 046G werden auch Titel angegeben, die sich nicht im DNB-Bestand befinden. So oder so müssten wir einen maschinellen Abgleich der Angaben aus 046G mit den vorhandenen DNB-Titeldaten machen. Das ist durchaus ein Feld, das wir im o. g. Projekt "Vorschlagssteuerung" berücksichtigen, u. a. deshalb haben wir das Feld auch weiter strukturiert und es nicht bei einem Freitextfeld belassen.Beantworten
  • Nach welchen Kritierien wurden Tns in Tp6 umgewandelt? (Betrifft rund 14.000 Datensätze.) Offenbar gab es einen "Fehler beim Upgrade der Tns zu Tps" (Wurgl auf Vorlage Diskussion:Normdaten/Archiv/4#"14.000 Tn werden zu Tp6"). Der Typ "Person (piz)" fehlt, daher lassen sich die Neu-Tp6 nicht per GND-Webformular bearbeiten. Diesen Fehler könnte man imho leicht beheben. Beispiel: GND 103328513.
    • --Kooperation GND-Wikipedia (Diskussion) 18:33, 22. Apr. 2021 (CEST) Die ca. 14.000 Tn-Datensätze der Bibliotheksverbünde BVB und des KOBV wurden maschinell zu Tp6-Sätzen umgewandelt, um deren „Aufbewahrung“ zu gewährleisten. Diese waren ursprünglich lokale vor allem bayerische Namenssätze, die in die überregionale GND abgegeben worden sind. Die Kriterien waren folgende, um lediglich die Datensätze zu selektieren, die vorrangig lokal verwendet wurden: Tn-Sätze mit bayerischem Verbund-ISIL, die Originalschrift enthalten (Menge: ca. 11.100), Tn-Sätze mit bayerischem Verbund-ISIL und mit Feld 667 "Grundbestand" und mit mehr als einem abweichenden Namen und mit Sprachkennzeichen (Menge: ca. 1.300), Tn-Sätze mit bayerischem Verbund-ISIL und mit Feld 667 "Grundbestand" und mit Quelle "Altkarten" (Feld 670) (Menge: ca. 1.500). Diese Datensätze wurden vorher, wenn nicht bereits vorhanden, um Titelangaben ergänzt. Um das Risiko der falschen Titelzuordnungen in den Bibliothekskatalogen zu vermeiden wurden zunächst alle Tn-Datensätze entknüpft. Was noch aussteht ist ein sogenannter Selfmatch (Tp-Datensätze untereinander). Erst danach stehen ggf. weitere Datenmanipulationen an, wie z. B. die Ergänzung des Entitätencodes "piz".Beantworten

@Wurgl, Silewe, Emu: Streicht oder ergänzt bitte, falls euch noch etwas einfällt. --Kolja21 (Diskussion) 01:58, 14. Apr. 2021 (CEST)Beantworten

@Kolja21 ich warte nochmal bis Sonntagabend, ob noch weitere Fragen/Anmerkungen kommen, dann gebe ich den Fragenblock weiter. --— Raymond Disk. 14:00, 15. Apr. 2021 (CEST)Beantworten
@Kolja21 ich habe soeben die Fragen an 3 Leute der DNB weitergeben. --— Raymond Disk. 18:11, 19. Apr. 2021 (CEST)Beantworten
@Raymond: Danke! Bin gespannt auf die Antwort. Und noch eine Frage: Was ist eigentlich aus der Zusammenarbeit mit der Bayerischen Staatsbibliothek geworden? Wenn ich es richtig sehe, haben die sich das letzte Mal im August gemeldet. --Kolja21 (Diskussion) 18:46, 19. Apr. 2021 (CEST)Beantworten
@Kolja21 Hmm ja, die BSB.. habe ich wirklich länger nichts von gehört. Frage ich mal nach. --— Raymond Disk. 18:49, 20. Apr. 2021 (CEST)Beantworten
@Kolja21 Die Antwort auf meine Mail an unsere BSB-Kontaktperson kam heute: "Aktuell, der allgemeinen Lage geschuldet, unterstütze ich auch eine andere Abteilung im Haus. Deshalb ist die Wikipedia-Bearbeitung etwas ins HIntertreffen geraten.
Ich hoffe auf Ihr Verständnis." --— Raymond Disk. 17:22, 28. Apr. 2021 (CEST)Beantworten
@Kooperation GND-Wikipedia Danke für die Antworten. Ping @Kolja21, @Silewe, @Emu zur Kenntnis. --— Raymond Disk. 20:04, 22. Apr. 2021 (CEST)Beantworten
Danke! --emu (Diskussion) 20:27, 22. Apr. 2021 (CEST)Beantworten

Neue Liste [2021]

Bearbeiten

Hab vorher gesehen, es gibt neuen VIAF-Dump (am Vormittag gabs noch keinen). Momentan lädt der gerade. So in einer/eineinhalb Stunde(n) bau ich die Liste neu. --Wurgl (Diskussion) 16:03, 9. Jun. 2021 (CEST)Beantworten

Danke für den Hinweis! --Kolja21 (Diskussion) 16:40, 9. Jun. 2021 (CEST)Beantworten

Es gibt einen frischen Dump der DNB, ich bau mal eine neue Liste. --Wurgl (Diskussion) 14:43, 2. Jul. 2021 (CEST)Beantworten

… und einen frischen VIAF-Dump. Der lädt gerade. So in einer Stunde gibt es eine neue Liste. --Wurgl (Diskussion) 00:17, 7. Jul. 2021 (CEST)Beantworten
@Silewe, Kolja21: Ich Dummerchen! Ich hab vergessen die aktuellen Normdaten beim Neugenerieren zu laden. Ich mach am späten Abend eine neue Liste. --Wurgl (Diskussion) 17:20, 9. Dez. 2021 (CET)Beantworten
@Wurgl: kann passieren :-) Danke für die Info, --Silke (Diskussion) 17:37, 9. Dez. 2021 (CET)Beantworten

November 2022

Bearbeiten

Ganz seltsam!

Also erstmal haben sich die Namen der Dumpfiles geändert. da ist ein "gnd-" reingekommen, statt authorities-person_lds.rdf.gz nennt sich die Datei authorities-gnd-person_lds.rdf.gz

Dann gab es in 3 Dateien ungültiges XML, also Syntax-Fehler. Konnte ich auch noch fixen.

Aber jetzt staune ich: https://data.dnb.de/opendata/authorities-gnd-werk_lds_20221013.rdf.gz enthält Geographika? Und zwar (bis auf 59 Werke, nur Geographika?) Mail ist raus. Mal sehen. --Wurgl (Diskussion) 14:25, 5. Nov. 2022 (CET)Beantworten

Danke, bin gespannt auf die Antwort. Eine andere seltsame Sache, über die ich gestolpert bin: Bei 1.188 Datensätzen ist unter weitere Angaben "gnd3" eingetragen. Wenn man einen Namen recherchiert, wird in diesen Fällen statt der eigentlichen Tätigkeit oft "gnd3" als Beruf angezeigt: Beispiel Lewins, Clare. Vermutlich wurde hier der GND-Typ doppelt (und im falschen Feld) eingetragen. --Kolja21 (Diskussion) 15:06, 5. Nov. 2022 (CET)Beantworten
Es ist immer wieder erstaunlich was es so an "Daten" gibt. ;^) 1.181 Treffer bei Suche nach gnd3. Hab mal im Dump den GND 1246722682 (Nguyen, Hong Chuong) angeguckt. Der hat so ein "gnd3". Im File authorities-gnd-person_lds.rdf.gz sehe ich nix, das "gnd3" sein könnte.
Es gibt auch 18 gnd2, 61 gnd1 und 2 gnd6 (einfach danach suchen) Seltsam, echt seltsam. --Wurgl (Diskussion) 15:52, 5. Nov. 2022 (CET)Beantworten
Die zwei "gnd6"-Datensätze waren bereits aufgearbeitet und keine Tp6 mehr. Auch bei Clare Lewins habe ich die Anm. "gnd3" gestrichen, aber jetzt erscheint in der Übersicht immer noch nicht ihr Beruf (Regisseurin), sondern das Feld bleibt leer. --Kolja21 (Diskussion) 03:41, 6. Nov. 2022 (CET)Beantworten
Sie reagieren schnell. Die Dateien wurden neu bereitgestellt und jetzt sind auch Werke in der entsprechenden Datei. --Wurgl (Diskussion) 11:18, 7. Nov. 2022 (CET)Beantworten
@Kolja21, Silewe: Nachdem die Datei mit den Werken jetzt passt, erzeug ich eine neue Liste. So in einer Stunde wird die auftauchen. --Wurgl (Diskussion) 16:08, 7. Nov. 2022 (CET)Beantworten
Kolja21, hast du bei der DNB nachgefragt was dieses "gnd3" sein soll? Oder soll ich? --Wurgl (Diskussion) 09:28, 8. Nov. 2022 (CET)Beantworten
Ich habe keinen Ansprechpartner bei der DNB. Wenn du nachfragen würdest, wäre das super! --Kolja21 (Diskussion) 19:36, 8. Nov. 2022 (CET)Beantworten

Neue Liste – 2023

Bearbeiten

@Kolja21, MisterSynergy: Es gibt einen neuen GND-Dump. Die Vorderseite wird gleich aktualisiert. --Wurgl (Diskussion) 19:16, 11. Mär. 2023 (CET)Beantworten

Danke für den Hinweis.
Einer meiner Bots nutzt /data/project/persondata/public_html/data/GNDs.txt.gz als Input. Kannst Du das auch erneuern? Dankeschön! —MisterSynergy (Diskussion) 22:34, 11. Mär. 2023 (CET)Beantworten
[X] done --Wurgl (Diskussion) 23:04, 11. Mär. 2023 (CET)Beantworten

Update 00:57, 5. Apr. 2023‎

Bearbeiten

Hallo Wurgl, das letzte Update scheint nicht auf dem neuesten Stand zu sein. Der Fehler in C. G. Boerner wurde bereits am 14. März korrigiert, taucht in der neuen Liste aber wieder auf. --Kolja21 (Diskussion) 01:18, 5. Apr. 2023 (CEST)Beantworten

Jo! Ich bau noch einmal. Sorry. --Wurgl (Diskussion) 01:29, 5. Apr. 2023 (CEST)Beantworten

Artunshof

Bearbeiten

Ich hab eine Antwort bekommen:


Im vorliegenden Werk "Collegium Maximum of Nicolaus Copernicus University in Toruń : the old building of the Reichsbank and National Polish Bank" geht es um das Gebäude der ehemaligen Reichsbank, das 2003 an die Nikolaus-Kopernikus-Universität übergeben wurde und den Namen Collegium Maximum erhielt.

Der Datensatz https://d-nb.info/gnd/7603241-3 "Collegium maximum (Toruń)" wurde von uns aufgearbeitet und um die entsprechenden Informationen ergänzt sowie mit dem 2. polnischen Wikipedia-Artikel als Quelle https://pl.wikipedia.org/wiki/Collegium_Maximum_Uniwersytetu_Mikołaja_Kopernika_w_Toruniu versehen.

Den Artushof haben wir nicht in der GND, da wir keine Literatur zu dem Gebäude des Artushof in Toruń haben. Es besteht daher keine Notwendigkeit zu der Ansetzung eines Datensatzes.

Wir danken Ihnen für Ihre aufwendigen Recherchen.


Jetzt muss ich mich nochmals reindenken. --Wurgl (Diskussion) 16:55, 15. Jun. 2023 (CEST)Beantworten

Also ganz laaangsam.
VIAF:311279359 vermischt.
Ich warte über Nacht auf ein Gemurmel und trag das morgen ein. -Wurgl (Diskussion) 17:09, 15. Jun. 2023 (CEST)Beantworten
Besser wäre es, Kulturinstitut und Bauwerk in Wikidata zu trennen. In Artushof Toruń (Bauwerk) wird das Kulturinstitut nicht erwähnt. --Kolja21 (Diskussion) 22:49, 15. Jun. 2023 (CEST)Beantworten
Also damit hab ich ein Problem, zwei Probleme. Ein sprachliches, ich müsste mir da was ausschwitzen und meine Null-Erfahrung beim Anlegen von Wikidata-Körperschaften. Das einzige was aich da sagen könnte: Eventuell ist die poln. Weiterleitung pl:Centrum Kultury "Dwór Artusa" Der Körperschaft GND 5299946-4 zuordenbar. --Wurgl (Diskussion) 11:14, 16. Jun. 2023 (CEST)Beantworten
Dann trag die GND ein, und wir verschieben die Trennung auf später. Solange pl:Dwór Artusa w Toruniu Kulturinstitut und Bauwerk in einem gemeinsamen Artikel beschreibt ist das ok. --Kolja21 (Diskussion) 16:03, 16. Jun. 2023 (CEST)Beantworten

Parameter GND ergänzen (TYP=p)

Bearbeiten

Hallo Wurgl, danke für das Update. Ich habe den Abschnitt TYP=p aus der Liste verglichen mit:

316 results. Die meisten Personen fehlen in der Liste. Kannst du die Abfrage beim nächsten Update mit berücksichtigen? --Kolja21 (Diskussion) 00:41, 11. Nov. 2023 (CET)Beantworten

@Wurgl: Spezial:Beiträge/89.15.238.113 hat hier offenbar mitgelesen. @Johannnes89: Danke, dass du die IP gesperrt hast. @Emu, Kresspahl: Es geht darum, bei der Normdatenwartung Tempo zu machen, d.h. Usern Hausaufgaben zu verteilen. Könnte eine Aktion von Humanisator sein (vgl. d:Talk:Q26707704#GND not in VIAF, d:Property talk:P227#GND Umleitung in Qualifier speichern etc.). --Kolja21 (Diskussion) 23:53, 19. Nov. 2023 (CET)Beantworten

Ein Umbau ist notwendig

Bearbeiten

Diese Fehlerliste war so ziemlich das erste große Ding das ich für meinen Wikipedia-Kram gemacht habe, aber das muss jetzt neu geschrieben werden. Der Dump der DNB ändert sich mit jedem mal, da kommen immer wieder neue Datentypen hinzu. Bisher hab ich da jedesmal das Programm angepasst, aber jetzt ist der Punkt wo ich so richtig eingreifen müsste. Es gibt zwar einen neuen Dump der DNB, aber den kann ich erstmal nicht laden. Ein weiterer Grund ist: Dieses Programm ist in C++ geschrieben und hat eine interaktive Oberfläche, also Mausschubserei und sowas geht in der Toolforge-Cloud nicht. Ich hab schon vor Monaten ein wenig angefangen, aber fertig ist das noch lange nicht. Wenn es einen neuen VIAF-Dump gibt, dann kann ich den laden und dann gibts eine neue Liste, aber der DNB-Dump klappt nicht, da bleibt es beim alten Datenbestand. --Wurgl (Diskussion) 17:02, 1. Dez. 2023 (CET)Beantworten

Danke für die Info. --Kolja21 (Diskussion) 19:14, 1. Dez. 2023 (CET)Beantworten
Zur Info: 12846 Tn sind in Tp verwandelt. --Wurgl (Diskussion) 01:49, 11. Dez. 2023 (CET)Beantworten
Wo (hier oder im DNB-Katalog) und wann? --Kolja21 (Diskussion) 03:33, 11. Dez. 2023 (CET)Beantworten
Im DNB-Dump. Also 12846 GND-IDs die damals (März 2020) im Dump-File authorities-name_lds.rdf.gz waren (Typ UndifferentiatedPerson) sind jetzt im Dumpfile authorities-gnd-sachbegriff_lds.rdf.gz (Typ DifferentiatedPerson). --Wurgl (Diskussion) 08:47, 11. Dez. 2023 (CET)Beantworten
Das muss im Rahmen der Löschvorbeitungen der Tns geschehen sein. @Wurgl: Kannst du ein paar Beispiele nennen? Ist Wikipedia (Parameter "GNDName") davon betroffen? @MisterSynergy: In Wikidata müsste entsprechend nicht individualisierter Datensatz (Q68648103) gestrichen und die Zuordnung überprüft werden. Weißt du, welche Dumps für die Kennzeichnung herangezogen wurden? Auch ein Abgleich mit den Listen in d:Wikidata:WikiProject Authority control/Tn wäre interessant. --Kolja21 (Diskussion) 21:45, 11. Dez. 2023 (CET)Beantworten
Ich hab momentan keine Liste, aber GND 15882735X, GND 153866810, GND 153509864, GND 142887137, GND 142515426, GND 10405865X sind ein paar Beispiele die ich aus der Browserhistory herausgefischt habe. --Wurgl (Diskussion) 21:58, 11. Dez. 2023 (CET)Beantworten
Mein Bot verlässt sich auf diese Dumps von Wurgl:
In der Annahme, die Tn-Liste sei statisch, entfernt der Bot den Q68648103-Qualifikator und den missbilligten Rang von allen GND-Identifikatoren, die nicht in der Tn-Liste vorkommen (falls das mal jemand aus irgendeinem Grund fälschlich ergänzt hat).
Bei einer größeren Umwidmungsaktion GND-seitig würde ich den Automatismus erstmal deaktivieren und dann abgleichen, wieviele von den 12846 "Tn->Tp"-Fällen in Wikidata enthalten sind. Da könnte man eine Liste zum manuellen Überprüfen machen.
Zeit ist aber wahnsinnig knapp gerade. Könnte sein, dass das bis mindestens zu den Weihnachtsferien dauert. —MisterSynergy (Diskussion) 21:59, 11. Dez. 2023 (CET)Beantworten
Achso, wenn irgendwo eine vollständige Liste der 12846 umgewidmeten Fälle vorhanden ist, könnte ich das relativ schnell mit dem Wikidata-Bestand abgleichen. Wenn ich irgendwelchen Code anfassen muss, wirds ein bisschen dauern. —MisterSynergy (Diskussion) 22:01, 11. Dez. 2023 (CET)Beantworten
Ende der Woche … --Wurgl (Diskussion) 22:22, 11. Dez. 2023 (CET)Beantworten
Danke euch beiden! Die Beispiele sind gräuslich. Bei keinem der in Tps umgewandelten Tns wurde der Datensatz individualisiert. Bin sehr auf die vollständige Liste gespannt. "Eigentlich" sind die Namensdatensätze seit Juli 2020 Geschichte, d.h. nach Erstellung der Liste dürfte es keine böse Überraschungen mehr geben. @Raymond: Kannst du bei der GND-Red. nachfragen, ob im Mai 2021, also quasi posthum, noch ein Schwung Tns umgewandelt wurde? --Kolja21 (Diskussion) 00:01, 12. Dez. 2023 (CET)Beantworten
@MisterSynergy: Die Liste der zu einer "individualisierten" Person umgewandelten ist gzip-komprimiert unter https://persondata.toolforge.org/data/TnToTp.txt.gz abrufbar. (wenn du auch https://persondata.toolforge.org/data/Tns.txt.gz aktualisiert haben willst … das dauert noch, Datenbankindizes werden angelegt.) Und ja Kolja21, die ich geprüft habe, die sind ziemlich alle gruselig. --Wurgl (Diskussion) 22:37, 12. Dez. 2023 (CET)Beantworten
Was ist hier genau los? 438 davon sind in Wikidata, alle ohne Ausnahme haben normalen Rang, keinen Qualifikator, und das ist nach stichprobenartiger Überprüfung weit überwiegend auch immer so gewesen. Bist Du sicher, dass das Tns waren? Kannst Du sehen, wann das geändert worden sein dürfte? —MisterSynergy (Diskussion) 22:53, 12. Dez. 2023 (CET)Beantworten
Das Datum der letzten Änderung kannst bei https://d-nb.info/gnd/1175029300 und dann entweder MARC21-Datensatz so 5. Zeile: <controlfield tag="005"> bzw. RDF und dann dcterms:modified suchen. bei der genannten (die letzte in der Liste) ist das Datum 2022-12-30T15:14:55 --Wurgl (Diskussion) 23:07, 12. Dez. 2023 (CET)Beantworten
Ich kann mich dunkel erinnern, dass ein Schwung Tns vor Juli 2020 in Tps umgewandelt wurde, wenn in den Metadaten, die nur in OGND angezeigt werden, Literatur verknüpft ist. Das hatten wir damals bemerkt, und es müsste auf einer der Diskussionsseiten zu finden sein. --Kolja21 (Diskussion) 23:12, 12. Dez. 2023 (CET)Beantworten
wenn jezt die VIAF auch nicht mehr aktualisiert wird, wirst du den GND part mit dem DNB dump reparieren können - oder schwierig? gruss, --Wetterwolke (Diskussion) 14:50, 31. Mai 2024 (CEST)Beantworten
Schon vor langem vorgeschlagen: entweder Neuanlagen in der GND über die Schnittstelle der DNB oder ein Skript systematisch durchiterieren und gegen die Wikipedia abgleichen oder den gesamten Personenbestand der Wikipedia ohne GND einmal nachts vollständig gegen die Schnittstelle laufen lassen. Treffer dann in Tagesfrist. Das Herumschubsen von Artikeln von einer Monatskategorie in die andere, wie es Silewe und andere betreiben, mit einem Rückstau von 6 1/2 Jahren (!) erscheint mir eher eine anachronistische ABM zu sein, die Software viel effizienter und fehlerfreier lösen kann. Dann fallen auch halluzinierte GNDs wie [3] [4] sofort auf. Personen ohne Normdatenvorlage - allein heute zwei Dutzend altorientalische Herrscher und weitere zwei Dutzend Sportler - rasseln ohnehin durch dieses altertümliche Wartungsraster. Wenn ich jeden Tag 30, 50, 100 GND-Datensätze finde, könnte man ja eigentlich meinen, dass irgendjemand auf die Idee käme, den bisherigen Ansatz zu hinterfragen. --2A02:3030:600:DDF1:517:4D05:381A:2BB1 23:54, 31. Mai 2024 (CEST)Beantworten
Deine Trefferquote ist beeindruckend, aber die Art wie du die Artikel herumschubst und die Kategorie:Wikipedia:GND fehlt 2001-01 zum Überlaufen bringst, behindert unsere Arbeit. Alle Artikel, die du als IP in die Sofort-Zu-Erledigen-Kat verschiebst, müssen zusätzlich gesichtet werden. Da du das technische Know-How hast, wäre es das Beste, die GNDs per Skript in Wikidata einzutragen, dann können wir sie bequem mit einem Klick in Wikipedia übernehmen. (Übrigens werden die meisten GNDs nicht über die Kategorie:Wikipedia:GND fehlt eingetragen, insofern ist die Zeitangabe 6 1/2 Jahren irreführend.) In Wikidata stehen bekanntlich auch Personen, die in deWP nicht erfasst sind. Dort könntest du daher viel mehr erreichen. User:MisterSynergy ist imho ein guter Ansprechpartner für technische Fragen. --Kolja21 (Diskussion) 02:33, 1. Jun. 2024 (CEST)Beantworten
Gegenfrage: Wirklich der richtige Ton wie man Personen mit großen Datenspenden entgegnet? Vermutlich ist Wikipedia das einzige kollaborative Projekt, in dem man sich für Datenspenden rechtfertigen und beleidigen lassen muss. Angesichts der erodierenden Qualität der Wikipedia, würde ich anderes empfehlen.
Die Kategorie:Wikipedia:GND fehlt 2001-01 ist seit fünf Jahren die Wartungskategorie, in die - mitunter sogar per Spezial:Beiträge/TaxonBot - zu überprüfende Artikel gelegt werden. Wenn sie "überläuft" (was ist denn überlaufen? ist die Größe denn begrenzt?) dann entspricht das dem Tempo, mit dem derzeit neue GNDs angelegt werden. Neue GNDs, die aktuell aufgrund der oben beschriebenen technischen Probleme auf absehbare Zeit nicht mehr systematisch gefunden werden. Viele der von mir gefundenen Datensätze sind über ein Jahr alt, dort wo das Wurgl-Skript mit fehlenden Geburtsdaten oder Namenszusätzen, abweichenden Transkriptionen nicht umgehen konnte, sogar noch älter.
Anstatt auf Software zu setzen, die tagesaktuell Treffer liefert, verbringen Silewe & Co. tagein tagaus Stunden damit, Artikel ohne Treffer von einer Monatskategorie in die andere zu schieben. Jeder in der Wirtschaft, der sich halbwegs mit IT und Skriptprogrammierung auskennt, würde einen solchen Wartungsansatz, eine solch dramatische Vergeudung von Ressourcen schlicht als irre bezeichnen.
Nun gut, ich muss niemand bekehren. Meine Anregungen für einen "notwendigen Umbau" - so lautet die Kapitelüberschrift - sind oben hinterlegt. Und zum wiederholten Male: Ich habe die GNDs auch nicht, nur die Wikipedia-Artikel mit Übereinstimmung als Treffer und der Datenmüll auf Wikidata ist keine Option. --2A02:3030:600:DDF1:FCAC:9E27:8276:14D9 09:16, 1. Jun. 2024 (CEST)Beantworten
Gruß an das BBLD. --Wurgl (Diskussion) 11:32, 1. Jun. 2024 (CEST)Beantworten
ich wollte jetzt wirklich nicht, dass es zum streit kommt, ich denke wir haben alle das gleiche ziel: möglichst viele korrekt zugeordnete GNDs in wikipedia. es gibt verschiedene ansätze und arbeitsweisen, und jeder trägt das bei was er kann und will. ich denke hier machen wirklich viele eine klasse arbeit in ihrer freizeit: Wurgl mit seinem bot und scripts, ohne die es viel mehr fehler (generell) und fehlende GNDs (im speziellen) geben würde, Kolja21 der emsig GNDs einträgt und fehler korrigiert, Silewe die spezialistin für personen, und auch eine gewisse IP die gezielt artikel mit noch nicht eingetragener GND meldet, und viele viele mehr...
  • ich interessiere mich schwerpunktmäßig für körperschaften, nicht für personen, darum hilft mir die Kategorie:Wikipedia:GND fehlt nicht
  • darum ging es mir prinzipiell um die vorderseite und nicht die wartungskat
  • IP, so wie du dich im ton falsch angesprochen fühlst, geht es anderen, die gerne die kategorie abarbeiten (ob das der effizienteste weg ist, ist eine andere sache, aber jeder arbeitet hier so mit wie er will und kann), sich aber von der anzahl deiner funde erschlagen fühlen und nicht deine "arbeitsaufträge" auf zuruf abarbeiten wollen
    • effizient ist es auch nicht, dass alle deine edits gesichtet werden müssen, es gibt keine pflicht ein benutzerkonto anzulegen, aber in deinem fall wäre es arbeitsersparend für die angemeldeten benutzer ;)
    • könntest du nicht deine funde in eine wartungsliste schreiben? (als unterseite von Wikipedia:GND oder auch in benutzernamensraum, da liegen eh schon viele Normdaten-Wartungslisten bei bedarf kannst du meinen nehmen) die würde bestimmt abgearbeitet, mit dem gleichen ergebnis und ohne die kategorieliebhaber zu "stören"
gruss, --Wetterwolke (Diskussion) 17:35, 1. Jun. 2024 (CEST)Beantworten
Hinweis: Der User ist mehrfach infinit gesperrt. --Wurgl (Diskussion) 18:53, 1. Jun. 2024 (CEST)Beantworten
Dieses überdramatische Vokabular immer. "erschlagen fühlen" ... geht es zur Abwechslung auch mal eine Nummer kleiner? In den Monatskategorien von Kategorie:Wikipedia:GND fehlt liegen über 138.000 Personenartikel, die von Silewe & Co manuell(!) durchgegangen werden. Trefferquote vielleicht 2 %. Und von aktuell 300 Personenartikeln, also 2 Promille der Gesamtzahl, serviert auf dem Silbertablett mit Trefferquote 100 % fühlt man sich "erschlagen"? Echt jetzt???
Es sind auch keine "Arbeitsaufträge", die Artikel mit gefundener GND sind lediglich getaggt. Niemand wird gezwungen, sie zu recherchieren. Sie liegen eben nur in einer Wartungskategorie, so wie die 138.000 anderen Artikel auch.
Wenn es darum geht, die Artikel in eine andere Kategorie einzusortieren, z.B. Kategorie:Wikipedia:GND fehlt 2001-02. D'accord. Aber eine Separierung von den Monatskategorien braucht es.
Im übrigen lassen sich alle Entitäten über die DNB-Schnittstelle suchen, auch Körperschaften. Per HTTP-Request ohnehin. Jedoch gibt es nur für Personen entsprechende Wartungskategorien. --2A02:3035:E13:4AA9:643A:A30A:34F1:CB79 18:11, 1. Jun. 2024 (CEST)Beantworten
@IP: Wie Wetterwolke schon sagte, eine Wartungsliste, keine Kategorie, vgl. Kategorie Diskussion:Wikipedia:Normdaten-Wartung#Historische Listen. Du brauchst einfach nur deine Trefferliste hier verlinken und sie wird zeitnah abgearbeitet. Vergiss die Kategorie:Wikipedia:GND fehlt. Sie ist nicht die Hauptgrundlage für unsere Arbeit. Sie dient lediglich als Überblick, in welchen Artikeln GNDs fehlen, die wir gegebenenfalls bei der DNB beantragen (wenn Literatur vorliegt) oder selbst anlegen. --Kolja21 (Diskussion) 18:50, 1. Jun. 2024 (CEST)Beantworten
"Kategorie:Wikipedia:GND fehlt ist nicht die Hauptgrundlage für unsere Arbeit." Achso!! Dann verstehe ich nicht den Aufriss, den einige hier machen, nur weil ein paar Artikel von einer in eine andere Kategorie wandern. Für meine Arbeit ist es übrigens die Hauptgrundlage. --2A02:3035:E13:4AA9:643A:A30A:34F1:CB79 18:59, 1. Jun. 2024 (CEST)Beantworten

Nächstes Problem

Bearbeiten

Auf der Seite https://viaf.org/viaf/data/ steht ganz am Ende der lapidare Satz " The links.txt file has been removed and will no longer be available. " und genau das File hab ich bisher verwendet.

Ich müsste das umbauen, so dass https://viaf.org/viaf/data/viaf-20240517-clusters.xml.gz verwendet wird. Langsam hab ich vor lauter umbauen und nachbessern keine Lust mehr. --Wurgl (Diskussion) 15:42, 24. Mai 2024 (CEST)Beantworten

Ach VIAF, der/das Problem-Cluster ... Einfach mal ne Pause machen und tief durchatmen. Mit den Original-Normdaten haben wir genug zu tun. --Kolja21 (Diskussion) 15:55, 24. Mai 2024 (CEST)Beantworten
PS: Vielleicht hast du es schon gesehen. Auf Wikidata funktioniert zzt. "Add More Identifiers from VIAF" nicht. Fehlermeldung: "Warning: Unable to load links. Looks like VIAF has dismissed an API service at the core of this gadget. We will try to patch it ASAP (2024.05.23)." --Kolja21 (Diskussion) 15:58, 24. Mai 2024 (CEST)Beantworten
*kicher* Ist höchstwahrscheinlich das selbe Problem. --Wurgl (Diskussion) 16:40, 24. Mai 2024 (CEST)Beantworten
Ach ja: diese oben genannte Ersatzliste: bei mir zu Hause dauert der Download voraussichtlich 14 Stunden, in der Toolserver-Cloud nur 2 Stunden. Frag nicht warum, ich kann es nicht beantworten. --Wurgl (Diskussion) 16:42, 24. Mai 2024 (CEST)Beantworten
So, da ist erstmal so halbwegs gelöst. Halbwegs weil manchmal der Download abbricht und das muss ich noch irgendwie hinbekommen. --Wurgl (Diskussion) 17:08, 8. Jun. 2024 (CEST)Beantworten
Prima, ich danke Dir, --Silke (Diskussion) 17:43, 8. Jun. 2024 (CEST)Beantworten

Auch die LCCN verändert sich

Bearbeiten

Aktuell haben wir ca. 800 die es einfach nicht gibt. Manche sind schlicht nicht-existent, manche haben sich wohl geändert, zum Beispiel in Otto Spamer von https://lccn.loc.gov/no98070437 nach https://lccn.loc.gov/no2008028688

Nachdem das ca. 800 sind, sollte wohl der Bot ran. Wenn also so eine LCCN eine Weiterleitung (wie das Beispiel oben) ist und diese Weiterleitung im bei uns eingetragenen VIAF-Cluster steckt, dann ändert das der Bot, die anderen, also nicht existenten oder wo das Weiterleitungsziel in einem anderen VIAF Cluster steckt kommt dann vorne raus. --Wurgl (Diskussion) 17:07, 8. Jun. 2024 (CEST)Beantworten

Erstaunlich, dass das so viele sind. Man müsste sich mal ein paar Beispiele ansehen, da es auch nicht individualisierte LCAuths gibt. Wurde überwiegend Dubletten zusammengeführt? --Kolja21 (Diskussion) 02:57, 9. Jun. 2024 (CEST)Beantworten
Beispiele: Der Text "hat unbekannten Fehler" ist noch Quark, da hab ich noch ein Fehlerchen im Code. --Wurgl (Diskussion) 08:03, 9. Jun. 2024 (CEST)Beantworten
Aha! 10 Zugriffe je Minute sind Maximum, daher kommt das Problem. --Wurgl (Diskussion) 08:17, 9. Jun. 2024 (CEST)Beantworten

Beispiele

Bearbeiten

(Liste von Wurgl)

@Wurgl: Laut Stichproben scheint nichts gegen einen Botlauf zu sprechen. (Wikidata scheint übrigens auf dem neueren Stand zu sein. Dort konnte ich allerdings keinen Botlauf erkennen, sondern die Aktualisierungen wurden per Hand vorgenommen.) --Kolja21 (Diskussion) 18:47, 9. Jun. 2024 (CEST)Beantworten

Okay. ca. 380 davon erstmal mit dem Bot. Das sind diejenigen wo ein Redirect passiert ist und wo die VIAF welche bei uns eingetragen ist auch diese neue LCCN enthält. Das sind meiner Meinung nach die ganz sicheren. --Wurgl (Diskussion) 19:16, 9. Jun. 2024 (CEST)Beantworten
Auf die Liste pack ich momentan 200 Stück, 120 sind ungültige IDs und 80 sind Weiterleitungen (aber, siehe oben, entweder keine VIAF im Normdatensatz (weil diese z.B. vermischt) oder aber in der VIAF ist die LCCN nicht enthalten (weil z.B. die eingetragene VIAF SUDOC & BNF umfasst)). Ich kann mehr reinpappen.
Wenn alles gut läuft, dann gibts morgen eine neuer Vorderseite, generiert auf dem Toolserver-Cluster und mit ein paar weiteren Prüfungen (hoffentlich mit wenig Fehlern) --Wurgl (Diskussion) 19:37, 9. Jun. 2024 (CEST)Beantworten
@Wurgl:, da gibt es wieder viel zu tun, vielen lieben Dank für die Liste! --Silke (Diskussion) 12:51, 10. Jun. 2024 (CEST)Beantworten
@Kolja21: ich hab da sehr viele entdeckt wo die Buchstaben am Anfang (n, nb, nr, no) nicht passen, aber die nummerische Id übereinstimmt und die sind auch alle im Cluster. Ich denke, die kann ich ebenfalls per Bot korrigieren. Beispiele: Spezial:Diff/245923803, Spezial:Diff/245923808, Spezial:Diff/245923795, Spezial:Diff/245923777, Spezial:Diff/245923762 usw. --Wurgl (Diskussion) 07:38, 16. Jun. 2024 (CEST)Beantworten
Das sind dann keine Weiterleitungen, sondern Tippfehler? --Kolja21 (Diskussion) 07:52, 16. Jun. 2024 (CEST)Beantworten

Quelle: PND

Bearbeiten

Hallo Wurgl, kannst du das Feld "Quelle" in der GND auslesen? Bin gerade über GND 172302838 gestolpert: Quelle PND = Dublette. Es würde mich interessieren, wieviele Datensätze das betrifft, und ob der Großteil davon Dubletten sind. --Kolja21 (Diskussion) 20:17, 10. Jun. 2024 (CEST)Beantworten

Nee, leider gibt es das nicht. Es gibt auch etliche Datensätze wo "Quelle de.wikipedia.org/..." zu finden ist, die hätte ich gerne, weil leicht zuzuweisen. --Wurgl (Diskussion) 20:28, 10. Jun. 2024 (CEST)Beantworten

Normdaten auskommentiert

Bearbeiten

Hallo @Wurgl: In einigen Artikel finden sich im Quelltext Hinweise auf Normdaten, die auskommentiert wurden. Beispiel:

<!-- aber auch GND=122522249 VIAF ebenfalls auch andere Nrn. --> [5]

Gibt es eine Möglichkeit, diese versteckten Nachrichten aufzuspüren? --Kolja21 (Diskussion) 17:46, 10. Jul. 2024 (CEST)Beantworten

PS: Finden würde ich gerne auch die Fälle, in denen im REMARK-Feld eine URL eingetragen wurde (z.B. "auch http://d-nb.info/gnd/...").[6] --Kolja21 (Diskussion) 17:54, 10. Jul. 2024 (CEST)Beantworten
Das erste … aber fällt ins Timeout: insource:GND insource:/\<!--[^<>]*GND/
Das zweite: https://persondata.toolforge.org/vorlagen/?tmpl=Normdaten&param=REMARK&value=%25http%25&value_op=lk&with_wl&show_param&show_value --Wurgl (Diskussion) 19:21, 10. Jul. 2024 (CEST)Beantworten
Besten Dank! Abfrage 1 klappt: 69 Treffer. (Damit habe ich erstmal genug zu tun.) Abfrage 2: Kein Treffer? --Kolja21 (Diskussion) 22:05, 10. Jul. 2024 (CEST)Beantworten
Da hat mich der Browser ausgetrickst und die 25 verdoppelt. Link ist gefixt. 260 Treffer, Eventuell statt %http% nach %http%gnd% einschränken, dann sind es 37 Treffer. --Wurgl (Diskussion) 22:13, 10. Jul. 2024 (CEST)Beantworten
@Wurgl: Danke noch mal für die Suchlinks! Da hat sich im Laufe der Jahre einiges angesammelt. Schon der erste Eintrag, eine BKL mit Rotlinks, war ein Volltreffer mit drei Tns, die ich durch GNDs ersetzt und mit Wikidata abgeglichen habe.[7] --Kolja21 (Diskussion) 00:25, 11. Jul. 2024 (CEST)Beantworten

GND kaputt: Nikolai Semjonowitsch Nadiraschwili

Bearbeiten

hallo, weiss jemand was hier los ist, bei Nikolai Semjonowitsch Nadiraschwili funktioniert die GND 1066454159 nicht, sie ist auch im VIAF cluster VIAF:309825606 eingetragen, bei OGND finde ich sie auch [8] und die DNB verlinkt sie bei disem titel. gruss --Wetterwolke (Diskussion) 15:09, 12. Aug. 2024 (CEST)Beantworten

BITTE NICHT ANFASSEN. ICH MELDE DAS DER DNB, DAMIT DIE DEN FEHLER SYSTEMEATISCH FÜR ALLE BEHEBT. DANKE. --Wurgl (Diskussion) 17:01, 12. Aug. 2024 (CEST)Beantworten
Siehe hier: https://www.wikidata.org/wiki/User_talk:Kolja21#Some_strange_404_errors Zwei Tage später hab ich eine Antwort der Art "Wieso? Funktioniert doch alles" bekommen. --Wurgl (Diskussion) 17:10, 12. Aug. 2024 (CEST)Beantworten
@Wurgl: Danke, dass du die DNB informiert hast. Weißt du, wie der Stand in Bezug auf deren neuen Katalog ist? --Kolja21 (Diskussion) 19:31, 12. Aug. 2024 (CEST)Beantworten
Zitat: "bezüglich https://katalog.dnb.de/: wie dort angegeben handelt es sich um eine BETA-Version, d. h. inhaltlich und funktional noch nicht für den produktiven Einsatz geeignet." --Wurgl (Diskussion) 21:55, 12. Aug. 2024 (CEST)Beantworten
Ja, aber der Hinweis steht dort schon seit Monaten. --Kolja21 (Diskussion) 00:52, 13. Aug. 2024 (CEST)Beantworten
1.) die GND geht wieder
2.) Den Hinweis hab ich nicht von der Webseite, sondern aus einer ganz frischen Mail, aber ich frag nochmals nach. --Wurgl (Diskussion) 08:59, 14. Aug. 2024 (CEST)Beantworten
Mehr als "Leider können wir noch kein zuverlässiges Zeitfenster „verraten“, ich bitte um Verständnis." wurde mir auch nicht geflüstert, wobei ich gar nicht nach einem konkreten Datum, sondern nur nach dem Quartal gefragt hab. --Wurgl (Diskussion) 12:15, 14. Aug. 2024 (CEST)Beantworten
danke dir. gruss --Wetterwolke (Diskussion) 13:54, 14. Aug. 2024 (CEST)Beantworten