Wikipedia Diskussion:Normdaten/Archiv/003
Dieses Diskussionsarchiv hat die empfohlene Seitengröße erreicht und gilt damit als abgeschlossen. Sein Inhalt sollte nicht mehr verändert werden (ausgenommen Kleinbearbeitungen wie Link- und Vorlagenfixe). Verwende für die Archivierung von Diskussionsbeiträgen bitte das aktuelle Archiv und benutze bitte für aktuelle Diskussionen die aktuelle Diskussionsseite.
Um einen Abschnitt dieser Seite zu verlinken, klicke im Inhaltsverzeichnis auf den Abschnitt und kopiere dann Seitenname und Abschnittsüberschrift aus der Adresszeile deines Browsers, beispielsweise
[[Wikipedia Diskussion:Normdaten/Archiv/003#Abschnittsüberschrift]] https://de.wikipedia.org/wiki/Wikipedia_Diskussion:Normdaten/Archiv/003#Abschnittsüberschrift |
GND-Server
Was ist eigentlich mit der DNB los? Seit Wochen häufen sich die HTTP-423-Fehlermeldungen (Aufgrund der hohen Systemauslastung...), jetzt gerade geht mal wieder gar nichts. So macht das Arbeiten mit den Normdaten keinen Spaß. --AndreasPraefcke (Diskussion) 09:49, 10. Jan. 2013 (CET)
- Kann ich bestätigen. Bei mir wirkt es so, als ob alle 15 Minuten für 'ne Minute die Server überlastet sind (das sind keine gemessenen Zahlen, nur Gefühl). Übrigens auch vier Uhr nachts. Und ja, das nervt tierisch und Spaß macht das ganze nicht. Ich schreib mal 'ne Mail an meinen DNB-Kontakt. --APPER\☺☹ 10:05, 10. Jan. 2013 (CET)
- Vermutlich ballern da einfach irgendwelche Leute rund um die Uhr Massenabfragen gegen die Download-Links, die ja seit Juli verfügbar sind. Oder gegen das Portal selbst: Ich musste im Dezember auch schon intervenieren, weil plötzlich 80% des Traffics auf beacon.findbuch.de vom GiftBot stammte... -- Thomas Berger (Diskussion) 11:20, 10. Jan. 2013 (CET)
- Habe eine Antwort von der DNB bekommen - das Problem sei bekannt. Dir Ursache "vielschichtig" und die Behebung in Arbeit. Also das klingt so, als obs noch dauern könnte ;). Grüße --APPER\☺☹ 16:36, 10. Jan. 2013 (CET)
Ergänzung: Laut der DNB sollte das DNB-Portal seit gestern nachmittag wieder störungsfrei arbeiten. --APPER\☺☹ 14:13, 24. Jan. 2013 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: APPER\☺☹ 01:19, 22. Feb. 2013 (CET)
Vorlage doppelt gesetzt
Gestern habe ich den Fall gefunden, dass die Normdaten-Vorlage in einem Artikel doppelt gesetzt war (seit 2 Jahren). Ist vermutlich alles andere als ein häufig auftretendes Phänomen, aber eventuell wäre einmalig eine gezielte Suche nach betroffenen Artikeln sinnvoll. --Mai-Sachme (Diskussion) 14:58, 14. Jan. 2013 (CET)
- Im letzten Dump waren es nicht viele (die folgenden enthalten Normdaten u.U. auch nur als Kommentar):
(auskommentiert, da erledigt --FA2010 (Diskussion) 14:12, 21. Jan. 2013 (CET))
- Ende der Liste. -- Thomas Berger (Diskussion) 00:02, 15. Jan. 2013 (CET)
- Danke, hilfreiche Liste! --Kolja21 (Diskussion) 12:09, 15. Jan. 2013 (CET)
Danke auch von mir. Habe jetzt die Personenartikel durch, mal ein paar Erfahrungswerte: Der Großteil der doppelten Vorlageneinbindungen entstammt mit einzelnen Ausnahmen (nicht nachvollziehbare Fehler, Behandlung von Person und Körperschaft in einem Artikel, Normdaten in Anmerkungen) folgenden Ursachen:
- a) Nebeneinander von mehreren Tp-Sätzen bzw. von Tp- und "guten" Tn-Sätzen, vereinzelt auch von gleichermaßen mächtigen VIAF-Clustern,
- b) Einfügungen eines einzelnen Benutzers letzten Herbst, der mit Magnus' Tool prinzipiell alle gefundenen VIAF-Sätze (mehrmals gleich drei verschiedene) in die Artikel eingefügt hat,
- c) falsche Positionierung der Vorlage, was bei hastigem Hinsehen zum Übersehen derselben und zur doppelten Einbindung geführt hat (typischerweise: Normdatenvorlage jeweils vor und nach einer großen Navigationsleiste). --Mai-Sachme (Diskussion) 14:56, 15. Jan. 2013 (CET)
- Ich hab den Rest erledigt. Bei Mödlareuth (ein zusammen besprochener Ort in zwei Bundesländern mit zwei Geografikum-GND) stößt unser Konzept allerdings mal wieder an seine Grenzen. Ich hab mal Redirects be-normdatet, aber so ganz elegant ist das auch nicht. --FA2010 (Diskussion) 15:32, 15. Jan. 2013 (CET)
Aktuelle Liste:
Samwer-BrüderElisabethpfadSukyun_Yang_&_Insook_JuKonsistorium_der_Provinz_PommernHermann_Eulenberg
--APPER\☺☹ 18:44, 17. Jan. 2013 (CET)
- done --Kolja21 (Diskussion) 23:35, 17. Jan. 2013 (CET)
Doppelte Vorkommen der Vorlage sollten ab sofort (einmal täglich aktualisiert) hier zu finden sein. --APPER\☺☹ 07:28, 18. Jan. 2013 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: APPER\☺☹ 01:19, 22. Feb. 2013 (CET)
Doppelte GND?
Haben wir eigentlich einen Mechanismus zur Entdeckung von GND, die in mehr als einem Artikel gesetzt sind? Das würde vor allem die so beliebten Copy&Paste-Fehler aufdecken. --FA2010 (Diskussion) 09:24, 25. Jan. 2013 (CET)
- Ich werte regelmäßig die BEACON-Datei auf Dubletten und syntaktisch nicht mögliche Nummern aus und handle dann entsprechend. Siehe aber auch Benutzer:Gymel/Hartnäckige PND-Dubletten. Und bei Geographica ist es ziemlch hoffnungslos, manchmal hat die Wikipedia für mehrere zeitliche Schichten je einen Artikel (Brandenburg, Land Brandenburg (1947–1952), Provinz Brandenburg, Mark Brandenburg ...) und mir zumindest ist nicht klar, wie die GND sich da entwickelt: GND 4007955-7 ist angeblich alles (und könnte evtl. mit Geschichte Brandenburgs korrelieren), es gibt aber auch GND 25679-1 für die Provinz und GND 254359-X für den zu drei separaten Zeiten bestandenen "Staat". Aktuell gibt es ca. 60 dublette Nummern, davon etwa 50 zu Personen, sehr viele davon (Bsp. "118640968") sind aber Artefakte, weil APPERs Datenbank im Herbst wohl eine längere Zeit lang nicht alle Änderungen mitbekommen hat. -- Thomas Berger (Diskussion) 10:56, 25. Jan. 2013 (CET)
- Danke für die Info. Ich finde nur manchmal welche in schnell angelegten neuen ähnlichen Artikeln (das sind dann eben die Copy&Paste-Fehler), und dachte mir, wieviele da wohl durchrutschen. Aber jetzt bin ich beruhigt. --FA2010 (Diskussion) 19:55, 25. Jan. 2013 (CET)
Datum
Mir ist nicht so ganz klar, warum man im Parameter "GNDCheck" der Vorlage:Normdaten ein tagesgenaues Datum angeben muss, obwohl die Wartungskategorien nur monatsweise sortieren. Wofür ist eine so genaue Spezifizierung nötig? Steak 16:44, 13. Feb. 2013 (CET)
- Derzeit für nichts. Hätte man auch nur monatsgenau einrichten können, aber wieso nicht gleich genauer? Die Datumsangabe verrät den Normdatenbearbeitern, dass an dem und dem Tag jemand nach einer GND gesucht hat. Hypothetisch ergeben sich natürlich Fälle, wo das dann vielleicht mal hilfreich sein kann, etwa wenn die DNB an einem 15. April neue Datensätze einspielt. Stünde dann im Parameter GNDCheck 2013-04, was hieße das dann? Vor dem Einspielen der Datensätze oder danach oder vielleicht sogar während? Wie gesagt, nur hypothetisch, aber wenn sich jemand die Mühe macht, den Monat einzutragen, dann ist der Tag wohl auch keine Zusatzbelastung mehr. --Mai-Sachme (Diskussion) 08:55, 14. Feb. 2013 (CET)
- Den genauen Tag erhält man über die Versionsgeschichte. Steak 11:13, 14. Feb. 2013 (CET)
- Ja, ich kenne die Funktionalität von Versionsgeschichten bei Wikipedia-Artikeln. Nochmal deutlicher: Das Datum dient nicht nur dem Zweck der Kategorisierung (das war eigentlich eher auch ein sekundärer Effekt, wenn ich mich recht erinnere), sondern in erster Linie als Hinweis für Normdaten-Bearbeiter: An dem und dem Tag hat zuletzt jemand nach einer GND gesucht -> Lohnt es sich, erneut zu suchen? Ist es plausibel, dass sich die Lage geändert hat? Zu diesem Zweck wurde der Datumsparameter eingeführt, tagesgenau eben, wieso auch nicht? Dass das tagesgenaue Datum auch irgendwo mehrere Klicks später in der Versionsgeschichte eruierbar ist, kann nicht wirklich als Ersatz für die präzise und vor allem transparente und auf Anhieb ersichtliche Information zur letztmaligen intellektuellen Prüfung des Sachverhalts in der Datenbank angesehen werden. --Mai-Sachme (Diskussion) 11:29, 14. Feb. 2013 (CET)
- Den genauen Tag erhält man über die Versionsgeschichte. Steak 11:13, 14. Feb. 2013 (CET)
Die Normdaten sollen eh nicht mit Hand eingetragen werden. Es ist ganz egal, was da für ein Format steht. Wer viel mit Normdaten arbeitet, verwendet das Skript, wer nicht, sollte sich um so etwas wie GNDfehlt lieber gar keine Gedanken machen. --FA2010 (Diskussion) 16:25, 16. Feb. 2013 (CET)
Vielleicht bin ich ja verspätet dran, aber habt ihr Benutzer:AuCoBot schon bemerkt? --Mai-Sachme (Diskussion) 22:10, 14. Feb. 2013 (CET)
- Es ist ja kein Bot im eigentlichen Sinne, er führt nur die Aktionen eines menschlich bedienten Tools aus. Das Tool fand ich bislang bei eigenen Versuchen nie sonderlich hilfreich (zu viel Schrottvorschläge). Gibt es Fehler, die der Bot ausführte? --89.247.156.212 11:28, 16. Feb. 2013 (CET)
- Ich hab mir das jetzt mal angesehen. Mehrfach wurde VIAF eingetragen, eine durchaus vorhandene GND oder LCCN aber nicht. Das finde ich nicht hilfreich, dann lieber gar kein so ein Bot. --FA2010 (Diskussion) 16:38, 16. Feb. 2013 (CET)
- Außerdem fügt das Tool von der Vorlage gar nicht unterstützte BNF-Daten ein und hält auch die vorgeschlagene Reihenfolge der Parameter nicht ein. GNDName ignoriert es anscheinend völlig. Doppelte Tp-GND findet es anscheinend auch nicht. Ich sehe keinen Vorteil gegenüber unserer bewährten skriptunterstützten menschlichen Arbeitsweise. Wenn uns Magnus unterstützten würde, mögliche Treffer zu erkennen (à la Benutzer:APPER/GND) und dafür Wartungslisten, gerne z. B. nach Nationalitätenkategorie oder auch grob nach Berufen gegliedert, wäre das hilfreicher als diese etwas unfertigen Normdatenedits. ---FA2010 (Diskussion) 16:48, 16. Feb. 2013 (CET)
- http://de.wikipedia.org/w/index.php?title=Brenda_Hale,_Baroness_Hale_of_Richmond&diff=114282889&oldid=114232344 ist auch nicht gerade lustig. Wenn man jeden Mist, den VIAF vorschlägt, glaubt, kommt dabei eine popsong-trällernde Verfassungsrichterin raus... dabei gibt es durchaus einen GND-Eintrag für die Juristin. --FA2010 (Diskussion) 17:06, 16. Feb. 2013 (CET)
- Ich denke, jeder, der regelmäßig Normdaten recherchiert, weiß, dass bei einem allein arbeitenden Bot zu viele Fehlzuordnungen rauskommen. Passiert schon oft genug menschlichen Bearbeitern... Man sollte das Magnus auch mitteilen. --Mai-Sachme (Diskussion) 17:19, 16. Feb. 2013 (CET)
unerwünscht?
Meine Einfügung in Reaktionsmechanismus wurde zweimal von Benutzer:Rainald62 zurückgesetzt. Ich soll "die Einfügung, und zwar mit einem Mehrwert für die Leser" begründen diff. Gibt es keinen Konsens zum Einfügen dieser Vorlage? Gruß Matthias 09:48, 16. Feb. 2013 (CET)
Kurz: Es gibt ein paar Querulanten, die dagegen sind. --89.247.156.212 11:26, 16. Feb. 2013 (CET)
- Siehe auch Wikipedia:Fragen zur Wikipedia/Archiv/2012/Woche 53#„Normdaten“ für Sachbegriffe? --Schnark 11:30, 16. Feb. 2013 (CET)
Dann schlage ich vor diese mit CSS-switch wie unter Hilfe:Personendaten#Ansicht einschalten zu belegen. Das Entfernen der Metadaten-Vorlage durch Querulanten ist nur ärgerlich, wenn man sich schon die Mühe macht diese händisch aus Datenbanken zu ziehen. Gruß Matthias 19:08, 16. Feb. 2013 (CET)
Auf gar keinen Fall. Die Normdaten geben der Wikipedia in der bibliothekarischen Welt Vertrauen und Professionalität. Sollen die paar Querulanten sich die Normdaten halt ausschalten. ---89.244.175.229
- Dass sind nicht ein paar Querunlanten, sondern Rainald62, mit dem wir lange diskutiert haben und der für Ansprachen schwer erreichbar ist. Er beklagt, dass nicht alle Bücher, die die DNB dem Thema zuordnet, seinen Ansprüchen genügen. Falls er die Löschung der Normdaten nicht einstellt, bitte auf Vandalismusseite melden. --Kolja21 (Diskussion) 01:08, 18. Feb. 2013 (CET)
Hi. Unter Benutzer:APPER/GND findet ihr einige GND-Vorschläge. Oben sind einige ältere, die mal abgearbeitet werden sollten, aber der besondere Clou an der Seite ist: Jede Nacht prüft ein Script von mir die Artikel, die am letzten Tag angelegt wurden und macht GND-Vorschläge, die jeweils ans Ende der Seite angefügt werden. Erledigte bitte einfach löschen (auch wenn der Vorschlag falsch war). --APPER\☺☹ 04:18, 6. Jan. 2013 (CET)
- Könnte man dieses Skript auch mal über alle Artikel ohne die Normdatenvorlage in den Kategorien (mit Unterkat) "Autor" und "Komponist" drüberlaufen lassen? Dann könnte man zumindest mal alle ohne "Allerweltsnamen" rauspicken und anschauen, was sicher vielversprechender ist als das sonstige Suchen nach Normdaten ohne die Gewissheit, dass es wenigstens irgendeinen Treffer gibt. Gerne auch "Sportler" und "Politiker", weniger gerne "Filmschauspieler" (frustrierend, denn es gibt für fast jeden etwas, aber eben immer nur Tn mit Einträgen im B3Kat). --FA2010 (Diskussion) 14:11, 21. Jan. 2013 (CET)
Hi. Es ist sicher möglich, das ganze irgendwann für einzelne Kategorien laufen zu lassen. Es gibt auf jeden Fall noch lange Listen von einem alten Lauf, die ich grad noch auf der Platte entdeckt habe, siehe Benutzer:APPER/GND2. Dort habe ich mal 800 Stück platziert. --APPER\☺☹ 00:51, 1. Mär. 2013 (CET)
NDB
Das hat nicht direkt mit den Normdaten zu tun, aber es ist ein Ergebnis der Normdaten: Benutzer:FA2010/NDB möglich. Diese Liste enthält Kopiervorlagen für tausende von Artikeln. Wer möchte, darf sich gerne daran versuchen. --FA2010 (Diskussion) 16:42, 21. Feb. 2013 (CET)
auch für LAGIS machbar?
- Hallo, eine guter Service und eine Frage: ist so eine Liste auch für die Hessische Biografie möglich? Die verlinken von sich aus ja immer zu den Wikipedia-Artikeln, Beispiel. Oder sind die Artikel dort zu dürftig, um verlinkt zu werden? Eine Vorlage {{LAGIS}} gibt es nämlich, die könntest Du ähnlich wie in der o.g. Liste als Kopiervorlage erzeugen. --emha d|b 12:24, 7. Mär. 2013 (CET)
- Das ist theoretisch durchaus möglich, da die Seiten dort sehr standardisiert aussehen und sich wohl ganz gut automatisch auswerten lassen. Vielleicht finde ich am Wochenende dafür Zeit. Ein bisschen dürftig ist das ganze allerdings schon (nur stichprobenmäßig geprüft), also bitte nur bei obskureren Personen einsetzen, wo jeder Link ein wirklicher Mehrwert ist, sowie bei wirklich guten Biografien dort (soweit die bestehen, ich hab keine gesehen bei ein paaar Klicks). Solange die LAGIS-Vorlage allerdings einen Parameter "Zugriff" erfordert, ist sie momentan noch ungeeignet für den Abschnitt "Weblinks". "Stand" und "zuletzt aufgerufen" ist nur bei Einzelnachweisen sinnvoll. --FA2010 (Diskussion) 20:57, 7. Mär. 2013 (CET) PS: Die LAGIS-Vorlage baut auf der unsäglichen Internetquellen-Vorlage auf, und die ist ja auch auf "Zugriff" etc. ausgerichtet. Für eine großflächige Verlinkung unter "Weblinks" sollten wir für die Biographie eine vernünftige Datenbanklink-Vorlage erstellen ohne diesen ganzen Quatsch. --FA2010 (Diskussion) 20:59, 7. Mär. 2013 (CET)
- Zu 1: Die Liste muss ja nicht riesig öffentlich sein, dann wird sie auch nicht von Hinz und Kunz abgearbeitet, eine entsprechende Einschätzung traue ich mir schon zu.
Zu 2 (LAGIS-Vorlage): Du bist herzlich eingeladen, Dich mit konstruktiven Vorschlägen auf der dortigen Disk. zu melden. Ich fand es immer sehr praktisch zu wissen, wann auf einen Weblink zugegriffen wurde, ebenso der Stand der Information, der ja normiert vom LAGIS unten mit ausgegeben wird, aber wie gesagt: ich bin sicher, dass sich der Vorlagen-Autor guten Argumenten nicht verschließen wird. Freundliche Grüße, --emha d|b 10:55, 11. Mär. 2013 (CET)
- Zu 1: Die Liste muss ja nicht riesig öffentlich sein, dann wird sie auch nicht von Hinz und Kunz abgearbeitet, eine entsprechende Einschätzung traue ich mir schon zu.
- Das ist theoretisch durchaus möglich, da die Seiten dort sehr standardisiert aussehen und sich wohl ganz gut automatisch auswerten lassen. Vielleicht finde ich am Wochenende dafür Zeit. Ein bisschen dürftig ist das ganze allerdings schon (nur stichprobenmäßig geprüft), also bitte nur bei obskureren Personen einsetzen, wo jeder Link ein wirklicher Mehrwert ist, sowie bei wirklich guten Biografien dort (soweit die bestehen, ich hab keine gesehen bei ein paaar Klicks). Solange die LAGIS-Vorlage allerdings einen Parameter "Zugriff" erfordert, ist sie momentan noch ungeeignet für den Abschnitt "Weblinks". "Stand" und "zuletzt aufgerufen" ist nur bei Einzelnachweisen sinnvoll. --FA2010 (Diskussion) 20:57, 7. Mär. 2013 (CET) PS: Die LAGIS-Vorlage baut auf der unsäglichen Internetquellen-Vorlage auf, und die ist ja auch auf "Zugriff" etc. ausgerichtet. Für eine großflächige Verlinkung unter "Weblinks" sollten wir für die Biographie eine vernünftige Datenbanklink-Vorlage erstellen ohne diesen ganzen Quatsch. --FA2010 (Diskussion) 20:59, 7. Mär. 2013 (CET)
- Das ist wohl nicht sehr sinnvoll, denn die LAGIS-Vorlage ist nur für Einzelnachweise irgendwie sinnvoll einzusetzen. Man müsste sie von Grund auf neu programmieren. Eine zusätzliche Vorlage für Weblinks zur Biographie fände ich sinnvoller. --FA2010 (Diskussion) 09:05, 13. Mär. 2013 (CET) PS: Wenn ein "Stand" angegeben wird, was soll das für einen Weblink bringen? Sobald der "Stand" sich ändert, müssten wir unseren Weblink ändern. Bei einem Einzelnachweis: klar, da ist das wichtig, bei einem weiterführenden Weblink völlig übeflüssige Information, denn der Stand, den der User sehen wird, ist immer "der aktuelle". Das gleiche gilt für "abgerufen am".
- Hallo, es erscheint mir müßig, das hier zu diskutieren. In der Sache gebe ich Dir Recht. Willst Du es auf Vorlage Diskussion:LAGIS einbringen (da hatte gestern ohnehin jemand was angemerkt, so dass der Autor an der Vorlage was machen muss: der Zeitpunkt ist also günstig :)? Dank und Gruß, --emha d|b 09:31, 13. Mär. 2013 (CET)
- Das ist wohl nicht sehr sinnvoll, denn die LAGIS-Vorlage ist nur für Einzelnachweise irgendwie sinnvoll einzusetzen. Man müsste sie von Grund auf neu programmieren. Eine zusätzliche Vorlage für Weblinks zur Biographie fände ich sinnvoller. --FA2010 (Diskussion) 09:05, 13. Mär. 2013 (CET) PS: Wenn ein "Stand" angegeben wird, was soll das für einen Weblink bringen? Sobald der "Stand" sich ändert, müssten wir unseren Weblink ändern. Bei einem Einzelnachweis: klar, da ist das wichtig, bei einem weiterführenden Weblink völlig übeflüssige Information, denn der Stand, den der User sehen wird, ist immer "der aktuelle". Das gleiche gilt für "abgerufen am".
Fehlerhafte Werte für den Parameter LCCN
Die entsprechende Fehlerliste existiert ja seit geraumer Zeit unter dieser URL, ab morgen sollte diese Datei ein wenig voller werden, da mir heute zwei seeehr häufige Fehler im Format aufgefallen sind, die da jetzt auch auftauchen sollten: Und zwar das Format .../20/... bzw. .../200/... Dort ist immer das Jahr falsch formatiert, statt .../2009/... also .../20/09... Sollte gefixt werden, deshalb tauchen diese Fälle jetzt in der Liste auf. Sind derzeit rund 480 Stück, wobei ich grad rund 100 gefixt habe, also mal sehen, wieviele nachher, wenn die Liste aktualisiert wird, noch auftauchen. --APPER\☺☹ 01:25, 22. Feb. 2013 (CET)
- Momentan (Stand 24.2.2013) m. E. erledigt. Mal sehen, wieviele beim nächsten Lauf noch auftauchen. --FA2010 (Diskussion) 12:39, 24. Feb. 2013 (CET)
Kurz zu einer anderen Liste: Wieso taucht hier seit Tagen eigentlich konstant die Hamburger_Stadtmission auf? --Mai-Sachme (Diskussion) 13:30, 24. Feb. 2013 (CET)
- Wohl wegen dem Schreibfehler "TYp" statt "TYP", der aber schon seit dem 19. Februar korrigiert ist. Wie oft wird die Liste denn aktualisiert? --FordPrefect42 (Diskussion) 13:52, 24. Feb. 2013 (CET)
- Meines Wissens einmal täglich. --Mai-Sachme (Diskussion) 14:51, 24. Feb. 2013 (CET)
- Ja, einmal täglich. Manchmal passiert es aber, dass sich die Datenbank verschluckt (konnte leider noch nicht klären, wie es dazu kommen kann). Ich habe jetzt mal manuell die Hamburger Stadtmission upgedatet, sollte morgen nicht mehr auftauchen. --APPER\☺☹ 15:00, 24. Feb. 2013 (CET)
- Meines Wissens einmal täglich. --Mai-Sachme (Diskussion) 14:51, 24. Feb. 2013 (CET)
Bin nochmal die aktuelle LCCN-Liste durch, bis auf einen Fall alles Datenbankschluckauf. --Mai-Sachme (Diskussion) 14:38, 27. Feb. 2013 (CET)
- Ich habe das Script jetzt mal so überarbeitet, dass auch Datenbankschluckaufs (was ist die Mehrzahl von Schluckauf???) nicht mehr dauerhaft zu Problemen führen sollten bei der LCCN-Liste. Einen Tag können sie immer noch drin hängen, aber spätestens am übernächsten Tag sollten die Einträge verschwinden. Bei der aktuellen Liste sollen die Einträge morgen verschwinden. --APPER\☺☹ 15:01, 27. Feb. 2013 (CET)
- Habs jetzt mal manuell aktualisiert, Liste ist leer. --APPER\☺☹ 16:44, 27. Feb. 2013 (CET)
- Danke! --Mai-Sachme (Diskussion) 18:48, 27. Feb. 2013 (CET)
Zwei Werk-GNDs fürs selbe Werk
Wollte gerade in The Bell Curve Normdaten ergänzen, da fiel mir auf: Die DNB führt zu diesem Buch zwei Werk-GNDs, jeweils eine für die beiden Autoren, 4473609-5 für Murray und 4473612-5 für Herrnstein. Gibt es für solche Fälle Richtlinien, welche GND zu bevorzugen ist oder technische Workarounds zum Verwenden von beiden? --Widerborst 14:18, 5. Mär. 2013 (CET)
- Interessant, so einen Fall habe ich noch nicht gesehen. Da die Datensätze bereits als Dubletten erfasst sind ("Verwendungshinweis: 2. GK unter: Herrnstein, Richard J. / The bell curve") und mit den gleichen Ausgaben verlinkt sind, reicht es, wenn du die erste GND (4473609-5) einträgst. In anderen Fällen kann man die Dublette mit dem Parameter "REMARK" in der Vorlage erfassen. --Kolja21 (Diskussion) 23:46, 5. Mär. 2013 (CET)
GNDName
Hi. Wie ist eigentlich das genaue Vorgehen mit dem Parameter GNDName? Die Frage bezieht sich auf Datensätze mit Tp-GND und mit Tn-GND, wobei bei der Tn-GND KEINE Literatur bei der DNB hinterlegt ist. Sehe ich es richtig, dass diese entfernt werden kann, wenn es keine weitere Angabe unter REMARK gibt? GNDName sehe ich ja als Art "Wartungskategorie", in diesen Fällen hat sie also keinen Sinn, oder? Beispiel ist Pierre Lachambeaudie. --APPER\☺☹ 20:16, 10. Mär. 2013 (CET)
- In so einem Fall würde ich nicht den Parameter GNDName befüllen. Wenn es keine Tp gibt, dann mache ich das allerdings schon, wenn per AKS Literatur auffindbar ist. --Mai-Sachme (Diskussion) 20:23, 10. Mär. 2013 (CET)
- Ja klar, sobald kein Tp da ist, ist der Parameter sehr sinnvoll (deshalb existiert er ja auch). Aber wie ist das bei denen, bei den ein Tp existiert. Im obigen Fall existiert ja im B3Kat Literatur vorhanden, aber was bringt es uns, die GNDName da zu haben? Hat jemand eine Ahnung, ob man wenigstens die Fälle, in denen eine Tp-GND existiert und die DNB keine Literatur hat an die Bayern melden kann? Irgendwann müssen wir die Einträge ja mal loswerden ;) --APPER\☺☹ 20:32, 10. Mär. 2013 (CET)
- Zusatzfrage: Kann man bei AKS auch sagen "NUR diese GND, ohne Variant Identifiers", damit man sieht, ob der GNDName aus dem Artikel irgendwo verwendet wird? --APPER\☺☹ 20:36, 10. Mär. 2013 (CET)
Und gleich noch ein anderes Beispiel: Wie sieht es bei Walter Fisch aus. Bei der DNB ist alles korrekt zugeordnet. Trotzdem GNDName behalten, weil bestimmte Einrichtungen falsche Zuordnungen haben? Woher ermittelt AKS die "Variant Identifiers"? Durch die Wikipedia-GNDName-Eintragungen? --APPER\☺☹ 20:43, 10. Mär. 2013 (CET)
- ad weiter oben: Die kursiven Einträge kommen jeweils durch die anderen Identifier als den angefragten zustande.
- und ja: Hauptsächlich zwar sind es die Umlenkungsinformationen (etwa 183.000 zu Personen) aus der GND, die zum Auflisten mehrerer "Varianten" führen, aber weil die DNB ja bekanntlich nichts tut, wenn sie selbst keinen Bestand zum Tn hat, kommen auch noch ziemlich genau 2000 Nummern in den Dienst, die aus Auswertung der Kombination GND+GNDName in dieser Wikipedia stammen (Schnittmenge der beiden etwa 200 Nummern). -- Thomas Berger (Diskussion) 00:20, 11. Mär. 2013 (CET)
- Bei Walter Fisch habe ich den GNDName-Eintrag weggenommen, die DNB hat da noch Literatur, die womöglich den Elektroingenieur der LoC meint, der BVB kennt diesen unter der Nummer und noch einen Geologen, (das HBZ beim Tn allerdings überwiegend Literatur des Politikers, und warum die Hessische Biographie mit einem Tn verknüpft, weiss nur sie allein). Ich persönlich halte es da so ähnlich wie Mai-Sachme es schildert: Wenn die DNB und alle bei AKS unter der Nummer aufgeführten Treffer überwiegend diese Person meinen, dann trage ich auch die Tn-Nummer ein. In der Praxis bedeutet das, wenn die DNB bereits "aufgeräumt" hat mit Literaturnachweisen beim Tp und dennoch beim Tn noch etwas steht, dann meint es dort eine andere Person und die Nummer sollte nicht als GNDName vermerkt werden. -- Thomas Berger (Diskussion) 00:47, 11. Mär. 2013 (CET)
LCCN-Format ändern?
Seit ein paar Tagen ist es bei Wikidata möglich, Normdaten wie die GND (d:Property:P227) einzutragen. (Die Verlinkung muss gesondert über das Skript d:Wikidata:Tools#AuthorityControl.js aktiviert werden; sonst sieht man nur die "nackte" Nummer.) Bei der LCCN wird gerade diskutiert, ob das Format mit den Schrägstrichen, wie es die Normdatenvorlagen verwenden, aufgegeben werden soll. Kommentare erwünscht: d:Property talk:P244. --Kolja21 (Diskussion) 05:34, 11. Mär. 2013 (CET)
Normdaten aus Wikidata
Ab wann wird es denn wohl die Möglichkeit geben, Normdaten aus Wikidata zu beziehen, statt sie in die Artikel einzutragen?--84.161.195.199 18:54, 17. Mär. 2013 (CET)
- Weiter oben bei #Normdaten in Wikidata? steht etwas zum Thema. Ein konkretes Datum wird es wohl noch nicht geben (vermute ich einfach mal, ich habe jedenfalls noch keins gesehen). -- Rosenzweig δ 19:57, 17. Mär. 2013 (CET)
- Ist Teil der (bereits gestarteten) Phase 2 und soll in den nächsten Wochen freigeschaltet werden. Ein konkretes Datum gibt es aber noch nicht. --Kolja21 (Diskussion) 13:51, 18. Mär. 2013 (CET)
Nicht-individualisierte Personenidentfikationsnummern
Ich würde gerne eine Änderung der PIN-Regelung anregen bzw. ob jemand Gründe wüsste, die dagegen sprechen, die mir nicht einfallen. Es geht um Folgendes: Ich hab es schon häufiger beobachtet, dass in der Nationalbibliothek interessante Personendatensätze unter nicht-individualisierten Personenidentifikationsnummern liegen, so dass es sich rein sachlich absolut anbieten würde, diese nicht-individualisierten PIN in die Artikel einzufügen (damit der Leser über die nicht-individualisierten PIN den entsprechenden informativen Datensatz der Nationalbibliothek finden kann). Leider entfernen, jedes Mal wenn ich eine nützliche nicht-individualisierte PIN in einen Artikel einbaue andere Leute diese wieder unter Berufung darauf dass nur individualisierte PIN in den Artikeln stehen sollen, nicht-individualisierte aber nicht. Wenn es einen unter einer individualisierten PIN abgelegten Datensatz gibt, der bessere (also informativere) Daten enthält als der Datensatz unter der nicht-individualisierten PIN, ist dagegen ja auch nichts einzuwenden. Wenn aber der Datensatz der unter einer nicht-individualisierten PIN bei der Nationalbibliothek liegt deutlich informativer ist (d.h. er genauere, ausführliche und umfassendere Daten zu der betreffenden Person enthält) als derjenige, der unter der individualisierten PIN liegt, wäre es meiner Meinung nach sinnvoll (weil den Informationsgehalt des Artikels erhöhend), die nicht-individualisierte PIN zusätzlich zuder individualisierten PIN in den Artikel einzufügen, so dass der Leser den Datensatz zu dem sie führt - und der ja informativer ist als derjenige unter der individualisierten PIN - auffinden kann. Ich würde daher vorschlagen, dass man einen Passus in die PIN-Regeln einfügt ala: "Wenn ein unter einer nicht-individualisierten PIN abgelegte Datensatz zu einer Person deutlich mehr Daten über diese Person enthält als ein unter einer individualisierten PIN abgelegte Datensatz zu derselben Person, darf die nicht-individualisierte PIN zur Erhöhung des Informatiosngehalts des Artikels und seiner Nützlichkeit für den Leser ausnahmsweise bis auf weiteres in den Artikel eingefügt werden und zwar ungeachtet der Tatsache, dass sie nicht-individualisiert ist. Nach Möglichkeit sollte die nicht-individualisierte PIN jedoch wieder aus dem Artikel entfernt werden sobald die unter ihr abgelegten nützlichen Daten von der Nationalbibliothek in einen Datensatz überführt worden sind, der unter einer nicht-individualisierten PIN abgelegt ist (allerdings auch nicht eher)." Würde irgendein technischer Grund gegen so eine Regelung sprechen oder ginge das?Zsasz (Diskussion) 03:42, 27. Mär. 2013 (CET)
- Ich weiss zwar nicht, was genau Du mit Daten meinst, aber die Lösung Deines Problems ist in Hilfe:Normdaten und Hilfe:GND beschrieben: Es gibt einen Parameter GNDName speziell für die Nummern nicht individualisierter GND-Sätze, allerdings auch einige Regeln dazu, damit die Sache wartbar bleibt. -- Thomas Berger (Diskussion) 07:44, 27. Mär. 2013 (CET)
- Hallo Zsasz, was du "PIN" nennst heißt GND und solange die nicht individualisiert ist, ist sie falsch. Nicht individualiserte GND-Nummern sind nur temporär gültig. Selbst wenn heute ein Buch damit verknüpft ist, das zu der von dir gesuchten Person gehört, steht morgen vielleicht schon ein zweites dabei, das von einer anderen Person stammt. --Kolja21 (Diskussion) 05:28, 29. Mär. 2013 (CET)
- PS: Wenn ich mir den Link "PD auffinden" auf deiner Seite ansehe (zzt. ist er leider offline) könnte es sogar sein, dass du gar nicht die GND einträgst, sondern div. andere interne Bibliotheksnummern. Siehe: Hilfe:GND. --Kolja21 (Diskussion) 05:33, 29. Mär. 2013 (CET)
- Für die PND war "HBZ10" der korrekte Datenpool, der ist beim HBZ aber vermutlich schon seit vielen Monaten abgeschaltet. Die GND wäre "HBZ18". -- Thomas Berger (Diskussion) 09:10, 29. Mär. 2013 (CET)
- PS: Wenn ich mir den Link "PD auffinden" auf deiner Seite ansehe (zzt. ist er leider offline) könnte es sogar sein, dass du gar nicht die GND einträgst, sondern div. andere interne Bibliotheksnummern. Siehe: Hilfe:GND. --Kolja21 (Diskussion) 05:33, 29. Mär. 2013 (CET)
- Hallo Zsasz, was du "PIN" nennst heißt GND und solange die nicht individualisiert ist, ist sie falsch. Nicht individualiserte GND-Nummern sind nur temporär gültig. Selbst wenn heute ein Buch damit verknüpft ist, das zu der von dir gesuchten Person gehört, steht morgen vielleicht schon ein zweites dabei, das von einer anderen Person stammt. --Kolja21 (Diskussion) 05:28, 29. Mär. 2013 (CET)
zweimal PND/GND
Hola, eine neue Abfrageidee: Ich habe heute bemerkt, dass es auch Artikel geben könnte, wo innerhalb der Normdatenvorlage gleich zweimal der Parameter PND ausgefüllt wurde. Im konkreten Fall handelte es sich um einen Tp-Satz und einen eineindeutigen Tn-Satz. Anzeigeprobleme verursacht so etwas offenbar nicht, das ganze fand sich allerdings schon seit zwei Jahren so im Artikel. Mutmaßlich gibt es noch ein paar analoge Fälle mehr. --Mai-Sachme (Diskussion) 14:42, 30. Mär. 2013 (CET)
- Danke für die Korrektur und den Eintrag in Wikipedia:PND/Fehlermeldung. Im Dez. 2012 lagen 2.060 Fälle vor, in denen ein Tn mit einem Tp verwechselt wurde. Die Liste Benutzer:Gymel/GND-Probleme ist noch nicht abgearbeitet. --Kolja21 (Diskussion) 16:01, 30. Mär. 2013 (CET)
- Dass es Entitätenfehler gibt, ist mir bekannt, aber das habe ich nicht gemeint: Im von mir verlinkten Beispiel fand sich folgender String in der Normdatenvorlage: ...|PND=109846990|PND=114553904|... Es ging mir um die Aufspürung solcher Fälle. --Mai-Sachme (Diskussion) 19:17, 30. Mär. 2013 (CET)
- Sorry, das habe ich trotz der Verlinkung übersehen. Obwohl so ein Fall extrem selten ist (ich hatte ihn noch kein einziges Mal), hatte ich gedacht, dass er von den üblichen Wartungstools erfasst wird. (Was auf jeden Fall abgearbeitet wurde, waren die Einträge, in denen die Normdaten-Vorlage doppelt eingetragen war.) --Kolja21 (Diskussion) 04:23, 31. Mär. 2013 (CEST)
- Ich weiß eben nicht, ob das sooo selten ist, daher die Abfrageidee, die man vielleicht für sinnvoll, vielleicht aber auch nicht halten kann. Im Artikel fällt dieser Typ von Doppeleintrag nicht auf und bei der Bearbeitung mit dem Skript bemerkt man's auch nicht weiter, wenn man sich nicht grad genau den Difflink anschaut. --Mai-Sachme (Diskussion) 11:25, 31. Mär. 2013 (CEST)
- Sorry, das habe ich trotz der Verlinkung übersehen. Obwohl so ein Fall extrem selten ist (ich hatte ihn noch kein einziges Mal), hatte ich gedacht, dass er von den üblichen Wartungstools erfasst wird. (Was auf jeden Fall abgearbeitet wurde, waren die Einträge, in denen die Normdaten-Vorlage doppelt eingetragen war.) --Kolja21 (Diskussion) 04:23, 31. Mär. 2013 (CEST)
- Dass es Entitätenfehler gibt, ist mir bekannt, aber das habe ich nicht gemeint: Im von mir verlinkten Beispiel fand sich folgender String in der Normdatenvorlage: ...|PND=109846990|PND=114553904|... Es ging mir um die Aufspürung solcher Fälle. --Mai-Sachme (Diskussion) 19:17, 30. Mär. 2013 (CET)
Im aktuellen Dump gab es knapp 50 Fälle doppelter Attribute in der Normdatenvorlage, viele davon völlig unspektakulär (etwa doppelt TYP=p) oder Vertipper (LCCN als VIAF gelabelt), häufig auch der Versuch, mehrere VIAF-Nummern zu notieren. Ich habe alle überarbeitet und gglfs. die Doppel-Nummer im REMARK-Parameter explizit gemacht. -- Thomas Berger (Diskussion) 16:21, 7. Apr. 2013 (CEST)
Normdaten aus Wikidata (2)
- Siehe auch: Vorlage Diskussion:Normdaten#Wikidata, Phase 2
Am kommenden Mittwoch wird nach derzeitigem Planungsstand die Phase II von Wikidata für die deutschsprachige Wikipedia freigeschaltet. Die Normdaten können so künftig zentral aus der Wikidata-Datenbank eingelesen werden.
Wenn ich es richtig verstanden habe, reicht es, wenn in die Vorlage:Normdaten die entsprechenden Properties eingesetzt werden. In den einzelnen Artikeln wäre dann die Angabe von einzelnen Parametern obsolet.
Gibt es für den Bereich der Normdaten irgendeinen Arbeitsplan für die Umstellung? -- 79.168.51.74 17:29, 6. Apr. 2013 (CEST)
- Wäre es nicht sinnvoll, damit abzuwarten, bis das mit den Interwikilinks einigermaßen funktioniert? -- Aspiriniks (Diskussion) 17:51, 6. Apr. 2013 (CEST)
- Wo siehst du denn Probleme mit den Interwikis? 213.54.149.242 17:59, 6. Apr. 2013 (CEST)
- Soweit ich sehe, sind bisher keine Hilfeseiten verfügbar, die alle Aspekte der neuen, deutlich komplizierteren Abläufe beim Anlegen von interwikis erläutern. Bestehende Hilfeseiten sind noch nicht entsprechend aktualisiert, siehe Wikipedia Diskussion:Formatvorlage Biografie#wikidata. Das Vorgehen bei Interwiki-Konflikten ist noch nicht ausgereift, man kann zwar für einen Artikel die wikidata-interwikis komplett blockieren, nicht aber selektiv. Die bots stellen Seiten um, ohne bisherige selektive Blockaden zu berücksichtigen oder wenigstens eine Notiz auf der Disk zu hinterlassen (z. B. [1], wo die 5 falschen und daher auskommentierten interwikis nun angezeigt werden). Gruß, Aspiriniks (Diskussion) 18:07, 6. Apr. 2013 (CEST)
- Mangelnde Anpassung der Hilfeseiten für Interwikis, ist irrelevant für die Normdaten. Das Pendant zur selektiven Blockade wäre, dass man die nicht passenden Interwikis aus dem dt. Artikel verbunden Wikidata-Datensatz entfernt sie in einen neuen Datensatz auslagert bzw. den dt. Interwiki-Datensatz auslagert, da die Datensätze dort nur 1:1-Entsprechungen erfassen sollen. (Was man auch wieder als Vorteil zum vorherigen System sehen kann, wo häufig eine Sprachfassung A beschrieben hat und andere Sprachfassungen nur Spezialfälle von A oder Verallgemeinerungen von A, aber nicht exakt dasselbe, wozu man nun gezwungen wird.) Insgesamt, funktionieren die Interwikilinks schon mindestens „einigermaßen“.
- Zu den Normdaten: auf Grund der Tatsache das dort ein anderer Ansatz zur Datenrepräsentation gewählt wurde, liegen die Probleme dort eher woanders. Siehe zum Beispiel: http://www.wikidata.org/wiki/Q937 (Albert Einstein). Wie würde man mit Properties umgehen die mehrere Werte haben, sie z.B. das Feld LCCN wo dieselbe Property zweimal aber in unterschiedliche Schreibweise vorhanden ist (würde die Vorlagenauswertung erschweren). Oder, was wenn gar unterschiedliche Werte vorhanden wären? Ursprünglich hieß es bei der Ankündigung von Wikidata für Infoboxen, das man selektiv die Datenquelle auswählen kann. Funktioniert das momentan, da die Doku der Einbindungssyntax eher so aussieht als würde sie beide Werte (optional annotiert) zurückgeben. --Mps、かみまみたDisk. 19:07, 6. Apr. 2013 (CEST)
- Mangelnde Anpassung der IW-Hilfeseiten mag irrelevant für die Normdaten sein, überstürzen sollte man die Überführung jedoch auch nicht. Insbesondere bei den Normdaten wird viel mit Werkzeugen gearbeitet, da ist es wichtig, dass diese Werkzeuge angepasst sind, (lange) bevor der ganz große Wechsel kommt. Man sollte ausgiebig testen, ruhig mit ein paar Tausend Artikeln, um zu sehen, welche Probleme auftreten. Gleichzeitig müssen neue Hilfeseiten geschrieben werden, die parallel zu den bisherigen Gültigkeit haben.
- Wichtig ist auch, wie Fehler an wen gemeldet werden. Hier kümmert man sich bislang nur um die GND, weil das der für uns wichtigste Normdatenteil ist. In der en.WP sammelt man VIAF-Fehler, die gemeldet werden. (Als ich das vor 1–2 Jahren machte, gab es eine kurze Dankesmail, passiert ist jedoch nichts.)
- Nicht zu vergessen: Werden die Normdaten, wenn sie auf eine weitere Plattform ausgelagert werden, weiterhin fleissig eingetragen? Wird es reichen, wenn sie ganz normal hier in die Artikel getragen werden, sodass sich andere Benutzer oder Bots um die Übertragung und den Abgleich in Wikidata kümmern? Kann ich hier die leere Normdatenvorlage in einen Artikel eintragen und davon ausgehen, dass irgendwann automatisch die richtigen Normdaten abgebildet werden, wenn sie in Wikidata eingetragen werden? Wird WP:PND/F verwaisen oder sprunghaft anwachsen und wird GNDfehlt noch berücksichtigt oder wird es der Standard bei leeren Normdaten werden? Fragen über Fragen … --32X 20:16, 6. Apr. 2013 (CEST)
- Dann ist ja spätestens jetzt der Moment gekommen,sich Gedanken zu machen.
- @Mps: Der erste LCCN Identifier für Albert Einstein führt ins Leere.
- Ich würde grob folgende Schritte vorschlagen.
- Anpassung der Vorlage:Normdaten: wenn Properties aus Wikidata vorhanden, diese benutzen, sonst lokal gesetzte Parameter
- botgestützte Übertragung der Normdaten nach Wikidata
- Prüfung auf Vollständigkeit
- Anpassung/Neukonzeption von Wartungskats, externen Anbindungen (z.B. DNB-Rücklink), Hilfeseiten
- botgestützte Löschung der lokalen Parameter
- endgültige Umstellung der Vorlage:Normdaten auf Wikidata
- -- 79.168.51.74 20:40, 6. Apr. 2013 (CEST)
- Soweit ich sehe, sind bisher keine Hilfeseiten verfügbar, die alle Aspekte der neuen, deutlich komplizierteren Abläufe beim Anlegen von interwikis erläutern. Bestehende Hilfeseiten sind noch nicht entsprechend aktualisiert, siehe Wikipedia Diskussion:Formatvorlage Biografie#wikidata. Das Vorgehen bei Interwiki-Konflikten ist noch nicht ausgereift, man kann zwar für einen Artikel die wikidata-interwikis komplett blockieren, nicht aber selektiv. Die bots stellen Seiten um, ohne bisherige selektive Blockaden zu berücksichtigen oder wenigstens eine Notiz auf der Disk zu hinterlassen (z. B. [1], wo die 5 falschen und daher auskommentierten interwikis nun angezeigt werden). Gruß, Aspiriniks (Diskussion) 18:07, 6. Apr. 2013 (CEST)
- Wo siehst du denn Probleme mit den Interwikis? 213.54.149.242 17:59, 6. Apr. 2013 (CEST)
- Statt die Vorlage:Normdaten anzupassen, sollte man vermutlich eher eine zweite Vorlage:Normdaten-WD erstellen, mit der man experimentieren kann. Erst wenn Wikidata ausgereift ist und die WD-Vorlage einwandfrei funktioniert, sollte man die nächsten Schritte in Angriff nehmen. Allerdings würde ich vorschlagen, ab nächster Woche den Parameter "WD" in die alte Vorlage mit aufzunehmen, damit endlich die ID Nummer in den Artikeln angezeigt wird. (Wenn kein Interwikilink vorliegt, weiß man bislang nicht mal, ob der Artikel in Wikidata eingetragen ist.) --Kolja21 (Diskussion) 01:33, 7. Apr. 2013 (CEST)
- @Albert Einstein: Beide Nrn. sind korrekt. 1.) n/79/22889 (Format with "/" separating 3 parts of the number, used by Wikipadia Authority control templates); 2.) n79022889 ("Normalized LCCN" format used by Library of Congress and MARC). In Wikidata haben wir uns auf Vers. 2 geeinigt, aber d.h. natürlich nicht, dass jeder User davon weiß oder sich daran hält. --Kolja21 (Diskussion) 01:43, 7. Apr. 2013 (CEST)
- Statt die Vorlage:Normdaten anzupassen, sollte man vermutlich eher eine zweite Vorlage:Normdaten-WD erstellen, mit der man experimentieren kann. Erst wenn Wikidata ausgereift ist und die WD-Vorlage einwandfrei funktioniert, sollte man die nächsten Schritte in Angriff nehmen. Allerdings würde ich vorschlagen, ab nächster Woche den Parameter "WD" in die alte Vorlage mit aufzunehmen, damit endlich die ID Nummer in den Artikeln angezeigt wird. (Wenn kein Interwikilink vorliegt, weiß man bislang nicht mal, ob der Artikel in Wikidata eingetragen ist.) --Kolja21 (Diskussion) 01:33, 7. Apr. 2013 (CEST)
- @Kolja21: Lydia Pinscher hat beim Start der ersten Phase angekündigt, es werde in Kürze auch möglich sein, einen Link zu Wikidata einzublenden, auch wenn nur ein Artikel (hier der deutschsprachige) dort in der Datenbank hinterlegt ist. Im Augenblick hilft nur der Umweg über die "Seiteninformationen" in der linken Werkzeugleiste. Dort gibt es einen Abschnitt mit Links zu "Schwesterprojekten".
- Waa ist Deiner Meinung nach nicht ausgereift? Wikidata hat seit diesem Wochenende mehr als eine Million Datensätze mit dem GND-Typ. Auf diese Daten zurückzugreifen wird ab Mitwoch möglich sein. -- 79.168.51.74 10:07, 7. Apr. 2013 (CEST)
- Ich würde auch empfehlen, eine separate Vorlage Vorlage:Normdaten-WD anzulegen und an mehreren hunderten Artikeln zu testen. Wenn alles passt, kann das ja per Bot in die Standardvorlage überführt werden. 213.54.163.150 10:31, 7. Apr. 2013 (CEST)
- Ich habe aktuell – ähnlich wie 32X oben – Fragen über Fragen und sehe eine Umstellung als langfristiges Projekt. Einige (unsortierte) Fragen:
- (a) Was machen wir mit den Wartungsparametern in der Normdaten-Vorlage?
- (b) Weil im Fall von zB Personengruppen Normdaten bei uns auch auf Weiterleitungsseiten hinterlegt sind, muss man zunächst abwarten, bis Weiterleitungen in Wikidata als Sitelink hinterlegt werden können/dürfen. Wann wird das sein?
- (c) Wie sichert man die Qualität? Die Identifier aus den de:Normdaten sind hochgradig per Hand erfasst/kontrolliert. Diese müssten zB davor geschützt werden, dass sie "irgendein" Bot, etwa durch algorithmisch ermittelte Zuordnungen aus VIAF, überschreibt.
- Meine Idee für die nächsten Tage und Wochen: In unserer bestehenden Normdatenvorlage könnte in der erweiterten Ansicht ergänzt werden (sobald die Funktionalität aus Phase II verfügbar ist): Wikidata-Link und die beim Wikidata-Item hinterlegten Normdaten. – Interessant wäre auch eine Mini-Statistik wieviele de:Artikel mit Normdaten-Vorlage bereits einen Wikidata-Eintrag haben und vielleicht eine Aufschlüsselung der Wikidata-Items mit der Property "GND main type" bzgl. der Werteverteilung und Schnittmenge mit de:Artikeln. -- Make (Diskussion) 17:31, 7. Apr. 2013 (CEST)
- Den letzten WD und de:WP-Dump kombiniert komme ich auf 244.631 Wikidata-Items "mit" GND-Normdaten. -- Thomas Berger (Diskussion) 18:10, 7. Apr. 2013 (CEST)
- D.h. Objekte (items), denen eine GND zugeordnet werden könnte. Wikidata selbst hat bislang nur 2.226 GND-Einträge (d:Wikidata:Database_reports/Popular_properties). Der VIAFbot, der auch GNDs von de:WP übernehmen wird, befindet sich noch in der Testphase. --Kolja21 (Diskussion) 23:44, 7. Apr. 2013 (CEST)
- Items, denen in irgendeiner Wikipedia ein Artikel mit Normdaten-Vorlage oder Äquivalent zugeordnet ist, das einen Parameter PND oder GND oder GNDfehlt enthält. Das dürfte normalerweise nur de:WP sein und zumindest eine gute Näherungsantwort auf die Frage ermöglichen, wieviele de:WP-Artikel mit Normdaten bereits in Wikidata repräsentiert werden. -- Thomas Berger (Diskussion) 01:02, 8. Apr. 2013 (CEST)
- Vorlage:NORMDATENCOUNT liefert aktuell 235.840 Artikel in de:Wikipedia mit GND-identifier (Artikel mit GNDfehlt sind darin nicht enthalten.) Die Abdeckung in Wikidata ist damit doch ganz ermutigend. -- Make (Diskussion) 08:22, 8. Apr. 2013 (CEST)
- in en:Wikipedia sind derzeit 5654 GND-IDs per en:Template:authority control erfasst. (in en ist die Normdaten-Vorlage so programmiert, dass jede Normdaten-ID (VIAF, LCCN, etc) in einem Mini-Template gekapselt wird. Dadurch ist die Schnell-Statistik mit dem templatecount-Tool möglich). -- Make (Diskussion) 11:46, 9. Apr. 2013 (CEST)
- Items, denen in irgendeiner Wikipedia ein Artikel mit Normdaten-Vorlage oder Äquivalent zugeordnet ist, das einen Parameter PND oder GND oder GNDfehlt enthält. Das dürfte normalerweise nur de:WP sein und zumindest eine gute Näherungsantwort auf die Frage ermöglichen, wieviele de:WP-Artikel mit Normdaten bereits in Wikidata repräsentiert werden. -- Thomas Berger (Diskussion) 01:02, 8. Apr. 2013 (CEST)
- D.h. Objekte (items), denen eine GND zugeordnet werden könnte. Wikidata selbst hat bislang nur 2.226 GND-Einträge (d:Wikidata:Database_reports/Popular_properties). Der VIAFbot, der auch GNDs von de:WP übernehmen wird, befindet sich noch in der Testphase. --Kolja21 (Diskussion) 23:44, 7. Apr. 2013 (CEST)
Unsere Normdaten-Vorlage möchte ich derzeit vor allem wegen der Wartungsmöglichkeiten nicht missen. Die Einträge sind durch die ständige Wartung so gut wie formal fehlerfrei (bis auf ein paar hundert Tn unter "GND"). Ich sehe keinerlei Möglichkeit, das zur Zeit bei Wikidata zu erreichen (bei entsprechenden Tools dann später gerne). --AndreasPraefcke (Diskussion) 09:53, 8. Apr. 2013 (CEST)
- +1. Testen und überlegen, wie Wikidata sinnvoll (im Sinne der Qualitätskontrolle) genutzt werden kann. Da dort auch Dubletten gesammelt werden, können wir die Daten eh nicht 1:1 übernehmen. --Kolja21 (Diskussion) 18:02, 8. Apr. 2013 (CEST)
[2] demnach wird die für den 10. April geplante Einführung der Infobox-Funktionalität verschoben. Neues Datum kommt noch. -- Make (Diskussion) 23:41, 8. Apr. 2013 (CEST)
Zwei Fragen die den VIAFbot betreffen:
- (a) Beim Abgleich von GND-Nummern müssten zunächst Redirect-Einträge (Fachbegriff fehlt mir grad) aufgelöst werden. Weiß jemand, ob es eine entsprechende Tabelle gibt? (Hintergrund: Beim Lauf des VIAFbots in en:Wikipedia war mir damals aufgefallen, dass VIAF-Redirects nicht berücksichtigt wurden, was zu vielen Pseudo-Fehlern geführt hat. Der neue Bot-Algorithmus ist bei VIAF-IDs jetzt Redirect-aware, wär doch nicht schlecht, wenn auch GND-IDs entsprechend "intelligent" verglichen würden.)
- (b) (Betrifft vermutlich nicht den aktuellen VIAFbot-Algorithmus, der hauptsächlich die Einträge der Normdatenvorlage aus diversen Wikipedias abgleicht.) Lizenzkompatibilität zwischen Open Data Commons Attribution License für VIAF und 1.0 Universal (CC0 1.0) Public Domain Dedication für Wikidata (laut Wikidata Introduction (Unterpunkt "Free") – Für größere Imports, etwa alternative Namensformen aus VIAF, sehe ich hier mögliche Probleme. Gibt es Einschätzungen dazu? -- Make (Diskussion) 20:15, 10. Apr. 2013 (CEST)
- "redirections within the VIAF dataset" finden sich auf viaf.org/viaf/data/ ganz unten als viaf-YYYYMMDD-persist.rdf.xml.gz. Hier gibt es dann aber möglicherweise auch ein Lizenzproblem wg. Nicht-CC0.
- Zu Umlenkungen in der GND gibt es m.W. keine offizielle Bereitstellung (außer den Komplettabzügen), die folgende BEACON-Datei ist meist recht aktuell und spiegelt fast exakt den Stand der GND: [3]. Lizenztechnisch ist das sauber, da CC0-Aufbereitung aus CC0-Daten.
- Bei allem, was sich durch den VIAFbot in en:WP niedergeschlagen hat, dürfte es kein Lizenzproblem geben (die Sache ist ja seinerzeit aktiv von OCLC unterstützt worden). Das heißt aber wohl wirklich nicht, dass man den inhaltlich identischen oder fortgeschrieenen Stand der VIAF-Wikipedia-Mappings von viaf.org/viaf/data/ (dort als viaf-YYYYMMDD-links.txt.gz) benutzen dürfte: Der fällt unter die ominöse ODC Attribution License. In den Fällen, wo man mittels VIAF-Auszügen ein Mapping herstellt, nutzt und proliferiert, sehe ich derzeit gar keine Möglichkeit, das lizenzkonform hinzubekommen: Das Ganze ist zwar recht liberal, es genügt die kanonischen VIAF-URLs zu nutzen, aber was ist, wenn man die im Verlauf des Prozesses "weggekürzt" hat? (Für "Importe" von irgendwelchen Datensammlungen nach Wikidata kommt man vielleicht davon, evtl. sollte Wikidata allerdings nicht die VIAF-Nummer verzeichnen sondern auf die jeweilige VIAF-URL umstellen). IANAL -- Thomas Berger (Diskussion) 22:24, 10. Apr. 2013 (CEST)
Personensuche-Tool vs. AKS
Hallo, wieso ist der Digitale Portraitindex Frühe Neuzeit nicht mehr beim Personensuche-Tool, sondern nur noch per AKS vorhanden? --Mai-Sachme (Diskussion) 15:22, 17. Apr. 2013 (CEST)
- In der Personensuche haben derzeit sieben Datenquellen 0 Nachweise, d.h. beim wöchentlichen(?) Reload hat etwas nicht geklappt. Das kann schon mal passieren. -- Thomas Berger (Diskussion) 16:52, 17. Apr. 2013 (CEST)
FIDE
Wessen Idee war es eigentlich, die FIDE-ID zu den Normdaten aufzunehmen? Das ist meiner Meinung nach alles andere als sinnvoll. Aus der FIDE-Datenbank werden verstorbene Schachspieler entfernt, außerdem sind die wenigsten Schachspieler in der Datenbank relevant (nämlich nur ungefähr 6000 von was weiß ich wievielen). Ich würde empfehlen, die FIDE-ID hier zu streichen. Steak 13:22, 20. Apr. 2013 (CEST)
- Ich hab das irgendwann auf Anfrage von irgendwem zum NORMDATENCOUNT hinzugefügt (ja, sehr präzise *g*). Ich stimme dir aber zu, dass das hier auf der Seite weg sollte. --APPER\☺☹ 13:58, 20. Apr. 2013 (CEST)
- Aber bitte diskret streichen: Bevor sich hier daraufhin jemand bemüßigt fühlt, die Daten zu löschen sollte Wikidata eine Chance bekommen, das einzusammeln. -- Thomas Berger (Diskussion) 15:32, 20. Apr. 2013 (CEST)
- Was meinst du mit "Daten löschen"? NORMDATENCOUNT zählt, wenn ich das richtig sehe, nur die Einbindungen der Vorlage:FIDE. Und die Vorlage soll ja nicht gelöscht werden, das ist nämlich ein Datenbanklink (dessen Aufgabe mittlerweile in einigen Artikeln durch die Vorlage:Infobox Schachspieler übernommmen wird). Steak 15:45, 20. Apr. 2013 (CEST)
- Es geht nur darum, die Anzahl hier auf der Seite nicht mehr anzuzeigen. --APPER\☺☹ 15:47, 20. Apr. 2013 (CEST)
- Was meinst du mit "Daten löschen"? NORMDATENCOUNT zählt, wenn ich das richtig sehe, nur die Einbindungen der Vorlage:FIDE. Und die Vorlage soll ja nicht gelöscht werden, das ist nämlich ein Datenbanklink (dessen Aufgabe mittlerweile in einigen Artikeln durch die Vorlage:Infobox Schachspieler übernommmen wird). Steak 15:45, 20. Apr. 2013 (CEST)
- Aber bitte diskret streichen: Bevor sich hier daraufhin jemand bemüßigt fühlt, die Daten zu löschen sollte Wikidata eine Chance bekommen, das einzusammeln. -- Thomas Berger (Diskussion) 15:32, 20. Apr. 2013 (CEST)
aus Wikidata: Bot mit Prüfauftrag
ru:Участник:Ivan_A._Krestinin betreibt einen Bot, der auf Wikidata Format- und Dublettenprüfung für Eigenschaften (Properties) durchführt. Elegant ist, dass der Prüfauftrag über die Diskussionsseite zum Property erteilt wird. Anschaulich am Beispiel der VIAF-ID:
- d:Property:P214 ist die property für "VIAF identifier"
- d:Property_talk:P214 auf der Diskussionsseite sind per Vorlagen drei "constraints" für Format und erlaubte Dopplungen formuliert
- d:Wikidata:Database_reports/Constraint_violations/P214 Bot prüft täglich und erstellt/aktualisiert eine Liste mit den vorgefundenen Regelverletzungen. (Im konkreten Fall ist es weiter unten interessanter wenn auch nicht überraschend.) – Ich fand die Umsetzung der Bot-Schnittstelle in ihrer Einfachheit so schön, dass ich hier diesen kurzen Hinweis hinterlasse. Zur Inspiration oä. --LG Make (Diskussion) 12:07, 8. Mai 2013 (CEST)
- Danke für den Hinweis, die Umsetzung gefällt mir sehr gut! — Raymond Disk. 14:50, 8. Mai 2013 (CEST)
Mehrere VIAF-Records für corporate: Kloster Vivarium?
Hallo, ich wollte gerade den Eintrag zum spätantiken Kloster Vivarium um Normdaten erweitern. Bei der VIAF-Recherche habe ich nun vier Einträge gefunden, die — wenn ich es recht sehe — alle dieses Kloster betreffen. Gibt es feste Regeln dafür, welche ID den Vorrang erhalten soll, oder gibt es akzeptierte Möglichkeiten, dem WP-Nutzer mehrere IDs anzubieten, z.B. unter Weblinks? Bin für jede Hilfestellung dankbar! --Fl.schmitt (Diskussion) 20:07, 21. Mai 2013 (CEST)
- Hallo Fl.schmitt, in dem Fall dürfte es keine gute Lösung geben: Die Stätte wird von vier Normdateien jeweils in ihrer Lieblingssprache angesetzt und die zugehörige Literatur wird entweder gar nicht an VIAF geliefert oder hat ebenfalls keine Überschneidungen. Ich glaube daher nicht, dass VIAF in absehbarer Zeit in der Lage sein wird, diese vier irgendwie zusammenzubringen (Wenn die Hoffnung besteht, dass Sätze zusammenfinden ist es eigentlich egal welche Nummer du wählst, zumindest auf lange Sicht). Manche hier tragen vorzugsweise die VIAF-Nummer zur GND-Nummer ein (sozusagen als Bekräftigung), andere die zur LCCN (damit en:WP bekräftigt wird?), dritte möglichst keine der beiden sondern eine davon ganz unabhängige (damit VIAF möglichst breit getroffen wird) und vierte eher gar nichts (weil der Mehrwert von VIAF erst da anfängt, wo Einzeleinträge zu Clustern kondensieren). Im Hinblick auf Wikidata, wo Artikel zusammengeführt werden und Normdaten zusammengezogen ist aber jede der vier Herangehensweisen eigentlich noch einmal frisch zu überdenken (ja: In Wikidata könntest Du alle vier VIAF-Nummern eintragen). Vom Eintrag bei den Weblinks würde ich absehen, VIAF bietet zu den meisten Normdateien selbst keine interessanten Links, nur solche auf "internal processing record(s)" und wenn Du meinst, dass etwa die Vaticana besonders viel zu Vivarium hat, solltest Du eher versuchen, einen direkten Link drauf zu legen. Und das REMARK-Feld der Normdatenvorlage mit Hinweisen auf weitere VIAF-Nummern zu versehen lohnt nach meiner Meinung auch nicht: Die Wikipedia ist ja doch eher eine Enzyklopädie und nicht unbedingt die Dokumentationsstelle für die Unzulänglichkeiten der VIAF-Algorithmen... -- Thomas Berger (Diskussion) 22:38, 21. Mai 2013 (CEST)
- Hallo Thomas, herzlichen Dank für Deine ausführliche und hilfreiche Antwort! Der Hinweis auf Wikidata ist prima, das werde ich weiterverfolgen. MfG --Fl.schmitt (Diskussion) 07:58, 22. Mai 2013 (CEST)
Wikidata-Feedback nutzen!?
Auch wenn vieles in Wikidata für meinen Geschmack noch arg ungeordnet und vielleicht sogar konzeptlos abläuft, gibt es doch konstruktive Perspektiven: Das automatische Zusammenführen von Normdaten-IDs aus den verschiedenen Wikipedien per Bot führt mit den täglich aktualisierten Kollisions-Berichten (siehe #aus_Wikidata:_Bot_mit_Pr.C3.BCfauftrag) dazu, dass Fehler in "unseren" IDs aus der Vorlage:Normdaten sichtbar werden. Einzig sinnvoll, wenn auch etwas nervig, ist in solchen Fällen die Korrektur an zwei Stellen: Einmal im betroffenen Wikidata-item (was durch die dortige Benutzerschnittstelle für menschliche Bearbeiter kein echtes Vergnügen ist). Und zweitens an der Fehlerquelle, also in den Normdaten-Vorlagen einzelner Wikipedia-Sprachableger.
Etwas zufällig ergab sich ein Kontakt mit d:User_talk:Hsarrazin#Your_Authority_Control_edits_on_de.wikipedia, der/die in letzter Zeit Korrekturedits in de:Wikipedia einbringt. Erstaunlich(?) gut klappt es mit der Nachsichtung der Beiträge. Der Sichtungsmechanismus ist soweit ich weiß nur in de:wikipedia aktiviert und es wäre schade, wenn solche nützlichen Ergänzungen wg. fehlender Sichtung untergehen würden und dann ist es für einen fremden Benutzer auch ein irgendwie frustiges Erlebnis, wenn Korrekturen wg. der Sichtung "hängenbleiben". Ich gucke dashalb bei Spezial:Beiträge/Hsarrazin etwas "über die Schulter", damit das glatt durchgeht. In meinen Augen wäre es eine schöne Entwicklung, wenn man in Sachen Normdaten in Zukunft mit Benutzern aus anderen Sprachversionen und Projekten (Commons, Wikisource) enger in Kontakt käme und sich austauschen und dann koordinieren könnte.
Eine Überlegung, wo ich eure Einschätzung bräuchte: Für fremde Benutzer wäre es hilfreich, wenn sie in Fragen zu Normdaten in de:wikipedia und zur GND eine Anlaufstelle hätten. Ich denke dabei an diese Diskussionsseite. Wg. Sprachbarrieren kann das nicht immer in Deutsch erfolgen, was aber in meinen Augen kein Hindernis sein sollte. Aber wie seht ihr das: Gibt es Bedenken, wenn auf dieser Seite auch internationale Anfragen eintreffen? Und welche Sprachen könnten wir abdecken? Bei Englisch bin ich sicher, bei Französisch habe ich die starke Vermutung, dass es genügend Kompetenz gibt. Vielleicht können wir das Sprachspektrum sammeln und dann duch Hinweis am Kopf der Seite auch Benutzer ohne deutsche Sprachkenntnisse einladen, hier anzufragen. Weiterentwickelt könnte sich ein kleines Netzwerk ergeben, wo dann gegenseitig kompetente Ansprechpartner bekannt und in Kontakt sind in Sachen Normdaten und den jeweiligen nationalen Normdateien (etwa BNF, SUDOC. Zu LCAuth und NDL (Japan) habe ich auf Wikidata auch schon sehr kompetente und interessierte Benutzer bemerkt.) -- Make (Diskussion) 12:09, 29. Mai 2013 (CEST)
- Ich denke auch, dass diese Seite die geeignete Anlaufstelle sein könnte: Immerhin sind das ja "unsere" Normdaten und/oder Artikel aus de:WP, die in Wikidata in irgendeinen Kontext geraten, der anderen dann Anlass zu (auf Normdaten speziell oder allgemein bezogenen) Rückfragen etc. gibt. -- Thomas Berger (Diskussion) 12:17, 29. Mai 2013 (CEST)
- Lieber (holpriges) Englisch als computerübersetztes Deutsch, dessen Inhalt man überhaupt nicht mehr versteht. „Meine Meinung, auf Deutsch gesagt.“ :)
- Ein Admin kann ihm übrigens auch das passive Sichterrecht zuweisen, dann musst du nicht mehr hinterhersichten. Das geht in der Regel auf dem kurzen Dienstweg und so habe ich mir auch Sichterrechte als Commonsadmin in den polnisch- und russischsprachigen Wikipediae geholt. --32X 20:43, 29. Mai 2013 (CEST)
Normdaten and Wikidata
Hello, sorry I don't read/write German at all :) - I leave a message here, after Make told me to…
I work on Authority Control (VIAF/ISNI, etc.) on Commons and Wikidata, and as a professionnal librarian.
Sometimes, I find an erroneous VIAF on wikidata that is marked "imported from wp de" - so, after a thorough checking in VIAF, I change it in wikidata, and also come to de wikipedia to change it, because the bots would automatically re-import the wrong value, which reproduces the error…
there is a problem because of your system of checking all contributions before admitting them. If a bot passes "before" the checking, it will take the previous value (the wrong one), and reimport it to wikidata.
Could someone who knows VIAF please check my contributions, that are very thoughtful and seriously checked before doing (I don't want to vandalize wp, only to secure wikidata) ?
That would be nice of you…
If you want to discuss with me, please leave a message on my wikidata page - thank you very much :) --Hsarrazin (Diskussion) 07:57, 7. Jun. 2013 (CEST)
- Now you have the user right AutoReviewer, that should solve the problem for most of your edits. --32X 16:16, 7. Jun. 2013 (CEST)
LCCN für Nicht-Personen
Hallo, bei den täglich ausgeworfenen LCCN-Mängeln finden sich die Artikel Suda, Common_Struggle und Gesetz-_und_Verordnungsblatt_für_das_Land_Hessen. Ich bin leider nicht in der Lage das zu reparieren, weil nirgendwo was über die korrekte Formatierung dieser Art von LCCN-Sätzen steht (oder täusche ich mich?). Kann mir das jemand vorturnen? @APPER: Seit Tagen hängen in der Liste für allgemeine Normdatenparameterfehler dieselben drei Artikel fest. --Mai-Sachme (Diskussion) 18:49, 3. Jul. 2013 (CEST)
- 1* Normdaten korrigiert (Common Struggle), 1* gelöscht (Verordnungsblatt) und 1* wohl ein Validierungsfehler: "n42..." ist ganz exotisch (" In name authority records that were converted retrospectively by an agency under contract to LC, [...] the digits 42 were used for series authority records"), aber legal... -- Thomas Berger (Diskussion) 19:12, 3. Jul. 2013 (CEST)
- Habe die 42 zum Check hinzugefügt. Außerdem die Meldung der fehlerhaften Normdaten-Parameter so überarbeitet, dass in Zukunft sich da nichts länger stauen sollte (höchstens ein bis zwei Tage). --APPER\☺☹ 16:55, 4. Jul. 2013 (CEST)
FRAD - Volltext nun online
Das Dokument Functional Requirements for Authority Data (FRAD), zuerst 2009 erschienen bei Saur, liegt nun in einer korrigierten Form Online vor: Functional Requirements for Authority Data : A Conceptual Model / IFLA Working Group on Functional Requirements and Numbering of Authority Records (FRANAR). Final Report, December 2008. Approved by the Standing Committees of the IFLA Cataloguing Sections and IFLA Classification and Indexing Section, March 2009. As amended and corrected through July 2013 (leider ohne URN). Zu anderen Versionen siehe die IFLA-Publikationsseite. -- Thomas Berger (Diskussion) 12:16, 4. Aug. 2013 (CEST)
Doppelte GND für Geographikum
Hallo zusammen, der Weiler Gütighofen gehört zu zwei Orten und hat daher zwei GNDs: [4] und [5]. Wie gehe ich damit um? Soll ich sie irgendwo melden oder soll ich sie beide einpflegen? Gruß, --Flominator 10:28, 13. Mai 2013 (CEST)
- Das fällt wohl in die Problemklasse Bonnie und Clyde: Die GND erfasst den Begriff zerlegt, de:Wikipedia bescheibt unter gemeinsamem Lemma. Bei Personen wird das (wenn auch nicht schön) wie folgt gelöst: Redirects einrichten und die GND-IDs jeweils dort einzutragen. Analog zu Bonnie und Clyde. – Vielleicht erstmal abwarten, ob hier nicht ein besserer Vorschlag kommt. – Ist das evtl. an anderer Stelle schon ver-Regelwerk-t (solche Fälle kommen ja öfters vor)? Wartungskategorie: "Siedlung, die mehr als einer Verwaltungseinheit angehört" ;-) ? -- Make (Diskussion) 13:29, 13. Mai 2013 (CEST)
- Eine erstmal theoretische Überlegung ist, ob in solchen Fällen die Anlage eines kombinierenden Datensatzes in der GND zulässig ist. Unter http://www.dnb.de/DE/Standardisierung/Regelwerke/regelwerke_node.html müsste das irgendwo in den RSWK plus GND-Übergangsregeln beschrieben sein. Habe beim Diagonallesen aber keine passende Regel gefunden. -- Make (Diskussion) 14:15, 13. Mai 2013 (CEST)
- Ich bin mir nicht sicher, es könnte auch ein Problem von rechter und linker Hand zu sein... Nach meinem Verständnis ist ein Weiler gerade keine Gebietskörperschaft und/oder Verwaltungseinheit. Aber vielleicht gibt es tatsächlich Literatur, die die spezifischen Probleme von Gütighofen links der Strasse thematisiert, dann wären die GND-Sätze sogar legitim (Suche nach "Weiler" im GND-Portal nach Präzedenzfällen liefert v.a. Wüstungen, möglicherweise gibt es also eine Redaktionsregel, nach der jeder besiedelte Ort unterhalb der Gemeindeschwelle nur einer Gemeinde zugeordnet werden darf). Das ist aber alles Spekulation, und offizielle Kontaktmöglichkeiten zu Geo-Sätzen gibt es weder hier noch im DNB-Portal. Die Sätze scheinen 2011 vom BSZ angelegt worden zu sein, möglicherweise für die Landesbibliographie BW: Vielleicht könnte man da mal nachfragen... -- Thomas Berger (Diskussion) 17:43, 13. Mai 2013 (CEST)
- Ah ja! Ich war naiv erstmal davon ausgegangen, dass die vorhandenen GND-Sätze im positiven Sinne regelgemäß sind, also eine Redaktionsregel wie von Dir beschrieben gilt (Siedlungen dürfen/sollten nicht Verwaltungseinheit-übergreifend erfasst werden). Die von Flominator verlinkten Einträge ins Ortslexikon zeigen auch, dass die Aufsplittung in der Anwendung unpraktisch ist: gegenseitige textliche Querverweise, Ortsgeschichte unter Gütighofen (Bollschweil) nicht vorhanden. Könnte interessant/hilfreich sein, einen Ansprechpartner zu ermitteln (Landesarchiv?), nach dem Warum zu fragen, die praktischen Probleme der Nutzung zu erläutern und eine Zusammenlegung vorzuschlagen. – Behandlung in Wikipedia: Sofern kein Protest der anderen Straßenseite von Gütighofen ;-) zu befürchten ist, könnte man den (im Ortslexikon besser ausgestatteten) Datensatz zu Gütighofen (Ehrenstetten/-kirchen) in die Vorlage:Normdaten aufnehmen und die andere Weilerhälfte in REMARK notieren. Meinen ersten Vorschlag mit Weiterleitungen ziehe ich zurück: Das wäre unverhältnismäßig und würde eine unpraktikable Verschlagwortung/Kleinst-Systematisierung unterstützen. -- Make (Diskussion) 11:21, 14. Mai 2013 (CEST)
- Ist das bei Mödlareuth eigentlich auch ein Problem? 213.54.164.153 20:23, 17. Mai 2013 (CEST)
- Tja, die beiden Teile gehörten also schon seit mehr als 400 Jahren durchgehend zu verschiedenen Staaten bzw. Ländern. Ob es wirklich Dorf war oder ist, kann ich nicht beurteilen: anscheinend gab es ja nicht einmal eine Kirche und lt. Google Earth scheint es eine Ansammlung von Bauernhöfen zu sein. Anhand der topographischen Karte http://d-nb.info/1021529702 des bayerischen Landesvermessungsamts (als Verlag, verantwortlich sind wohl die einzelnen Landesvermessungsämter und diese schein vom thüringischen betreut zu werden) wird allerdings klar, dass solche Trennungen anscheindend Absicht sind: Abgebildet sind die Region um Gefell, der Stadteil Mödlareuth von Gefell in Thüringen, die Region um Mödlareuth in Bayern und die Gemeinde Töpen... In Wirklichkeit scheinen Gefell und Töpen etwa gleich gross und auch gleich weit entfernt von Mödlareuth und aufgrund der Krümmung der Grenze ist der thüringische Teil der Region um Mödlareuth größer als der bayrische... Also, ich würde sagen dass es derselbe Fall ist, nur ist die Grenze viel drastischer. Man könnte höchstens argumentieren, dass hier zwei gleichnamige Weiler unmittelbar nebeneinander liegen, das dürfte aber eine ziemlich ahistorische Deutung sein. -- Thomas Berger (Diskussion) 22:11, 17. Mai 2013 (CEST)
- Aber auch hier gibt es zwei GND [6], [7], die beide in den Artikel müssten. 213.54.164.153 11:03, 18. Mai 2013 (CEST)
- Nein: keiner der vier GND-Sätze darf in den Artikel, denn jeder davon betrifft entweder deutlich mehr oder deutlich (= einige Häuser) weniger als Mödlareuth (also doch ein Unterschied, weil wir bei Gütighofen noch einen Flüchtigkeitsfehler der GND unterstellen und bei Mödlareuth ist das m.E. ausgeschlossen: Mann kann nicht einmal darauf hinweisen, dass das Deutsch-Deutsche Museum nicht in Töpen (GND 16051534-8)) liegt und auch nicht in Mödlareuth <Töpen> (GND 4554197-8) sondern auch in Mödlareuth <Gefell, Saale-Orla-Kreis>, denn das Museum hat nur eine Postanschrift, und das ist Mödlareuth 13 (in Bayern). -- Thomas Berger (Diskussion) 16:54, 18. Mai 2013 (CEST)
- Aber auch hier gibt es zwei GND [6], [7], die beide in den Artikel müssten. 213.54.164.153 11:03, 18. Mai 2013 (CEST)
- Tja, die beiden Teile gehörten also schon seit mehr als 400 Jahren durchgehend zu verschiedenen Staaten bzw. Ländern. Ob es wirklich Dorf war oder ist, kann ich nicht beurteilen: anscheinend gab es ja nicht einmal eine Kirche und lt. Google Earth scheint es eine Ansammlung von Bauernhöfen zu sein. Anhand der topographischen Karte http://d-nb.info/1021529702 des bayerischen Landesvermessungsamts (als Verlag, verantwortlich sind wohl die einzelnen Landesvermessungsämter und diese schein vom thüringischen betreut zu werden) wird allerdings klar, dass solche Trennungen anscheindend Absicht sind: Abgebildet sind die Region um Gefell, der Stadteil Mödlareuth von Gefell in Thüringen, die Region um Mödlareuth in Bayern und die Gemeinde Töpen... In Wirklichkeit scheinen Gefell und Töpen etwa gleich gross und auch gleich weit entfernt von Mödlareuth und aufgrund der Krümmung der Grenze ist der thüringische Teil der Region um Mödlareuth größer als der bayrische... Also, ich würde sagen dass es derselbe Fall ist, nur ist die Grenze viel drastischer. Man könnte höchstens argumentieren, dass hier zwei gleichnamige Weiler unmittelbar nebeneinander liegen, das dürfte aber eine ziemlich ahistorische Deutung sein. -- Thomas Berger (Diskussion) 22:11, 17. Mai 2013 (CEST)
- Ist das bei Mödlareuth eigentlich auch ein Problem? 213.54.164.153 20:23, 17. Mai 2013 (CEST)
- Ah ja! Ich war naiv erstmal davon ausgegangen, dass die vorhandenen GND-Sätze im positiven Sinne regelgemäß sind, also eine Redaktionsregel wie von Dir beschrieben gilt (Siedlungen dürfen/sollten nicht Verwaltungseinheit-übergreifend erfasst werden). Die von Flominator verlinkten Einträge ins Ortslexikon zeigen auch, dass die Aufsplittung in der Anwendung unpraktisch ist: gegenseitige textliche Querverweise, Ortsgeschichte unter Gütighofen (Bollschweil) nicht vorhanden. Könnte interessant/hilfreich sein, einen Ansprechpartner zu ermitteln (Landesarchiv?), nach dem Warum zu fragen, die praktischen Probleme der Nutzung zu erläutern und eine Zusammenlegung vorzuschlagen. – Behandlung in Wikipedia: Sofern kein Protest der anderen Straßenseite von Gütighofen ;-) zu befürchten ist, könnte man den (im Ortslexikon besser ausgestatteten) Datensatz zu Gütighofen (Ehrenstetten/-kirchen) in die Vorlage:Normdaten aufnehmen und die andere Weilerhälfte in REMARK notieren. Meinen ersten Vorschlag mit Weiterleitungen ziehe ich zurück: Das wäre unverhältnismäßig und würde eine unpraktikable Verschlagwortung/Kleinst-Systematisierung unterstützen. -- Make (Diskussion) 11:21, 14. Mai 2013 (CEST)
- Kann diese Nachfrage beim Landesarchiv bitte jemand von euch übernehmen, da ich zu wenig in der Thematik drin bin? Danke und Gruß, --Flominator 08:59, 23. Jun. 2013 (CEST)
- Mail ist raus. --Flominator 11:11, 14. Jul. 2013 (CEST)
- Eine Dame von dort, die nicht genannt werden möchte, hat geantwortet und mir erlaubt, diesen Text hier unter CC-BY-SA 3.0 zu posten:
„Die Einteilung des Ortslexikons des landeskundlichen Informationssystems LEO-BW beruht auf amtlichen Vermessungsdaten, die das Landesarchiv Baden-Württemberg vom Landesamt für Geoinformation und Landentwicklung (LGL) bezieht. Die Vergabe der SWD-/GND-IDs für bislang nicht erfasste Orte des historischen Ortslexikons wurde durch das Bibliotheksservice-Zentrum (BSZ) vorgenommen.
In der Tat sind Gütighofen zwei Gemeindekennziffern (GKZ) zugeordnet: die GKZ für die Gemeinde Bollschweil (Amtl. Gemeindeschlüssel Bollschweil: 08315014) und die GKZ für die Gemeinde Ehrenkirchen (Amtl. Gemeindeschlüssel Ehrenkirchen: 08315131). Gütighofen selbst besitzt keine eigene GKZ, da der Ort nicht als Gemeinde, sondern nur als Wohnplatz geführt wird. Die Vermessungsgrenze zwischen den beiden Gemeinden Bollschweil und Ehrenkirchen verläuft mitten durch Gütighofen.
Bei der Erstellung der Datenbank Orte-BW (ONDB) wurden die Vermessungsdaten des LGL zur Grundlage genommen. Auf diese Weise wurden für den Ort zwei ONDB-IDs, analog zur GKZ, vergeben. Bei der Einspielung der Daten in das Informationssystem LEO-BW wurde eine Konkordanz zwischen den GKZ, der ONDB-ID und den SWD-/GND-IDs hergestellt. Da viele Orte in Baden-Württemberg bis zu diesem Zeitpunkt noch nicht in der GND vertreten waren, wurden neue GND-IDs vergeben und über die hergestellten Konkordanzen maschinell zugeordnet und eingespielt.
Dies erklärt, warum es im Falle von Gütighofen zwei GND-IDs gibt. Nach der Logik der GND ist die Vergabe von zwei IDs für einen Ort unüblich. Bei der maschinellen Vergabe der GND-IDs für Orte in der Ortsnormdatenbank des Landesarchivs war dies jedoch aus personellen Gründen nicht anders leistbar.“
- Archivierung dieses Abschnittes wurde gewünscht von: 84.161.179.231 12:32, 30. Nov. 2013 (CET)
SWD
Ich hatte da offenbar einen falschen Stand im Kopf: Ich dachte es gibt keine Artikel mehr, die den Parameter GKD oder SWD enthalten, aber siehe Nationalkonvent. --Mai-Sachme (Diskussion) 14:11, 1. Aug. 2013 (CEST)
- Da bist du tatsächlich auf dem falschen Stand ;). Ich glaube, das wurde noch nicht abgearbeitet, da vieles zwei Nummern hat (GKD und SWD) und die Zusammenführung bei der DNB noch läuft. SWDs gibt es noch 1264, GKDs 1354. Von den 1354 GKDs stehen 106 zusammen mit einer SWD im Artikel und 1143 zusammen mit einer GND. Von den SWDs stehen logischerweise auch 106 zusammen mit einer GKD im Artikel und 1159 zusammen mit einer GND. Es gibt sogar 14 Artikel mit GND, SWD und GKD... (siehe z.B. Oberrieden (Bad Sooden-Allendorf)). --APPER\☺☹ 14:47, 1. Aug. 2013 (CEST)
- Ja, das Beispiel war ich ;-) Wie sinnvoll bzw. -los ist das? Ich dachte mir, dass dadurch auf die Möglichkeit einer Zusammenführung hingewiesen wird… --emha d|b 16:13, 1. Aug. 2013 (CEST)
- Der Hinweis ist sicherlich gut gemeint, aber wer soll ihn lesen? Die GND-Redaktion ist genug mit sich und unserer Fehlerliste beschäftigt und geht sicherlich nicht einzelne Artikel von sich aus durch. Im Grunde reicht es, wenn wir bei Dubletten die "Gewinner-GND" eintragen, sonst haben wir doppelte Arbeit. (Eine Ausnahme ist beispielsweise, wenn mit der Verlierer-GND wichtige Literatur verknüpft ist.) --Kolja21 (Diskussion) 00:13, 25. Sep. 2013 (CEST)
Hier die Übersicht, wie die GND-Reaktion Dubletten handhabt:
- GND, TYP=p - Gewinner: PND-Datensatz (bereits zusammengeführt)
- GND, TYP=k - Gewinner: GKD-Datensatz
- GND, TYP=v - Gewinner: GKD-Datensatz
- GND, TYP=s - Gewinner: SWD-Datensatz
- GND, TYP=g - Gewinner: SWD-Datensatz
--Kolja21 (Diskussion) 00:13, 25. Sep. 2013 (CEST)
- Danke, das hilft mir schon. Bisher wusste ich nicht, wer der "Gewinner" ist. --emha d|b 10:35, 25. Sep. 2013 (CEST)
- Sehr hilfreich, ja. Wer übrigens mal herzhaft lachen möchte, darf sich diese verunglückte Zusammenfassung anschauen: http://d-nb.info/gnd/2142242-4 --AndreasPraefcke (Diskussion) 14:13, 8. Nov. 2013 (CET)
- Großartig! --APPER\☺☹ 14:45, 8. Nov. 2013 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: 84.161.179.231 12:32, 30. Nov. 2013 (CET)
Die Normdatensituation in de.wikipedia sieht m. E. inzwischen sehr gut aus, das einzige, was wirklich noch extrem stört, sind die vielen Namensdatensätze, die nicht so gekennzeichnet sind. Ich bitte daher um freundliche Beachtung der Listen unter Benutzer:Gymel/GND-Probleme. Wenn jeder in den nächsten Wochen sich ein paar Abschnitte vornimmt, müsste das doch zu schaffen sein. Es sind ja keine Unmengen. --AndreasPraefcke (Diskussion) 09:22, 16. Jul. 2013 (CEST)
- ich bin da zugegeben wenig motiviert: Wenn ich etwas Meldungswürdiges sehe, dann möchte ich es melden. Systematisches Melden wurde mir aber durch die langen Bearbeitungszeiträume ausgetrieben. Die Bearbeiterin der Monate Dezember 2011 bis August 2012 ist ja leider auf unbestimmte Zeit krank und auch bei den jüngeren Monaten wird der zeitliche Abstand erneut immer größer anstatt geringer. --Mai-Sachme (Diskussion) 14:15, 1. Aug. 2013 (CEST)
- Ich finde das Melden völlig überflüssig bei den zahlreichen Routinefällen (also einfach nur: Tn kann individualisiert werden; oder: Werke aus Tn können zu Tp zugeordnet werden). Die kann sich die DNB eigentlich selbst raussuchen, einfach über die "GND-fehlt-Kategorien". So etwas trage ich schon lange nicht mehr ein. Die DNB ist so erzlangsam, das bringt doch eh nichts. Wichtiger sind wirkliche Fehler und Dubletten, das trage ich ein. Und wichtig ist mir auch unsere eigene Datenbank: dass eben nur Tp im GND-Feld stehen. Die Liste haben wir abld abgearbeitet, und dann sehen wir mal, wieviele neue inzwischen noch in der Datenbank schlummern. --FA2010 (Diskussion) 12:47, 18. Sep. 2013 (CEST)
- Interessanterweise laufen diesen Monat unheimlich viele "doppelte-Tp"-Meldungen auf. Ein grosser Teil davon beruht vermutlich darauf, dass bis gestern alle doppelten GND-Nummern auf Wikidata abgearbeitet worden sind: Der Rest von 52 sind ein paar Körperschaften etc. und ein paar nicht meldbare Fälle (kein Artikel hier), überwiegend sind es aber Doppel-Tp's die nun auch alle gemeldet sind. Vielen Dank für das Abarbeiten (ich glaube Benutzer:APPER hat die Hauptarbeit geleistet). -- Thomas Berger (Diskussion) 17:46, 18. Sep. 2013 (CEST)
- Ich habe bei Wikidata noch nie GNDs oder so eingetragen, also ich habe da nichts gemacht, das Lob gebührt jemand anderem ;). Ich bin in letzter Zeit auf einige Dubletten gestoßen, die ich wie immer melde, aber das war unabhängig von Wikidata oder Wartungslisten. --APPER\☺☹ 23:59, 24. Sep. 2013 (CEST)
Ich trage bei Wikidata auch mehrere Tp ein, wenn mehrere da sind. (Und vor allem: mehrere VIAF-IDs). Löscht das dann etwa wieder jemand, bevor die DNB zusammenwirft (bzw. VIAF im anderen Fall)? Das fände ich total daneben. --FA2010 (Diskussion) 19:03, 24. Sep. 2013 (CEST)
- Ich denke unsere Vorlage ist für die Erfassung von Dubletten besser geeignet als Wikidata, denn dort sind alle Einträge gleichwertig, aber das kann natürlich jeder halten wie er will. Die Liste Benutzer:Gymel/GND-Probleme abzuarbeiten, lohnt sich in jedem Fall, damit Tn's nicht als vollwertige GND's in den Artikel stehen. Die Meldung an die GND-Redaktion ist ein zweiter Schritt mit dem wir uns imho Zeit lassen können. --Kolja21 (Diskussion) 00:04, 25. Sep. 2013 (CEST)
- VIAF-Einträge sind gleichwertig... und VIAF kann Wikidata auswerten, unsere Vorlage und das komplexe PND/F jedoch sicherlich nicht. --FA2010 (Diskussion) 09:27, 25. Sep. 2013 (CEST)
- @oben (mehrere Tp): Doppelvermerke tauchen in der Wikidata-Wartungsliste auf, da habe ich Tn's konsequent entfernt, alle anderen jedoch in den Wikidata-Items drin gelassen (sofern sachlich richtig), nur eben auch noch alle diese Fälle auf WP:PND/F gemeldet, sofern es sich um Personen handelte und ein hiesiger Artikel ins Spiel gebracht werden konnte. -- Thomas Berger (Diskussion) 23:13, 25. Sep. 2013 (CEST)
- Ah, jetzt versteh ich das "Abarbeiten". Sehr gut. Wenn ich mehrere Tp in Wikidata eintrage, dann natürlich nur, wenn ich gleichzeitig auch bei PND/F melde. Doppelte Tp und sachliche Fehler melde ich selbstverständlich immer, sobald mir welche über den Weg laufen. (Nur das Routinegeschäft "Tn kann individualisiert werden" ist mir inzwischen zu doof, das hält nur auf beim Ziel, unseren Bestand sauberzuhalten.) --AndreasPraefcke (Diskussion) 11:56, 26. Sep. 2013 (CEST)
- Jeder hier leistet ausgezeichnete und im wahrsten Sinne des Wortes unbezahlbare Arbeit. Das es unterschiedliche Vorgehensweisen gibt, schmälert das Ergebnis nicht im Geringsten. Der eine nutzt die PND/F-Liste, der andere wendet sich direkt per Mail an die GND-Redaktion (Nebenbemerkung: die Sachbearbeiterin ist offenbar seit einem Monat im Urlaub), ein dritter verschiebt die Tn "nur" nach GNDName, aber auch das hilft, da wir für diesen Fall die Kategorie:Wikipedia:GND fehlt haben. Also: Danke an alle, die hier mitarbeiten! --Kolja21 (Diskussion) 16:54, 26. Sep. 2013 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Make (Diskussion) 11:35, 1. Dez. 2013 (CET)
Diskussion auf Wikidata um die dortige Verwendung des GND-Typs
Die Diskussion ist zwar schon einige Tage alt, aber ich habe sie erst jetzt bemerkt, daher nun ein Hinweis: d:Wikidata:Requests for comment/Primary sorting property. --UV (Diskussion) 13:10, 4. Aug. 2013 (CEST)
- Die Diskussion läuft seit Monaten. Eine kleine, äußerst fanatische Gruppe, will den GND-Typ (d:Property:P107) löschen, da die von ihnen favorisierten Eigenschaften zu selten genutzt werden. Um ihr Ideal vom Semantischen Web durchzusetzen, greifen sie auf stalinistische Mittel zurück und haben den Löschantrag in modifizierter Weise so oft wiederholt, bis alle "Gegner" eliminiert waren. Nicht gerade die feine englische Art, aber erfolgreich. --Kolja21 (Diskussion) 07:19, 19. Sep. 2013 (CEST)
- PS: FA2010 hat den Sachverhalt treffend auf den Punk gebracht: "It is impertinent to first capture this well-defined and useful property, and then wanting to delete it" (d:Property talk:P107) --Kolja21 (Diskussion) 07:30, 19. Sep. 2013 (CEST)
- Zuerst haben Leute beim GND-Typ die gefundenen GND-Nummern hinterlegt, weil es die entsprechende Property noch nicht gab. Inzwischen ist es umgekehrt, P107 ist deprecated, also wird irgendwelcher typisierender Klartext in der Property für die GND-Nummer verklappt. Dem kann man natürlich hinterherredigieren. Ernst ist aber, dass die Property GND-Typ inzwischen völlig verbrannt ist, da für Items ohne GND-Nummer (und auch ohne Nachweis in der GND) tausendfach der Code selbst ausgedacht und hinterlegt wurde: Wenn da die GND irgendwann nachzieht und aufgrund ihrer eigenen, fast unmöglich zu vermittelnden Regeln einen anderen Code spendiert, gibt es maschinell nicht mehr auflösbare Konflikte. FA210 hat völlig recht mit seinem Einwand (obwohl ich nicht glaube, dass er dort verstanden werden kann, so verfahren ist die Sache). Bereits LoC-NAF und GND haben keine 100%ige Überdeckung der jeweiligen Konzepte für "Person" (wo man das am ehesten noch erwarten könnte) und m.E. hat sich das auch auf die Wikipedien der jeweiligen Sprachen durchgeschlagen. Aber auch auf Wikidata gibt es den Bedarf nach einer "einfachen" Gröbst-Klassifikation (irgendwie soll erkennbar sein, dass es sich um eine "Person" handelt, damit die Präsentation einer "Infobox Person" automatisiert veranlasst werden kann), wobei man glücklicherweise sofort eingesehen hat, dass man keine eigene entwickeln sollte, weil es eben doch nicht so einfach ist. Und es gibt auch nicht die eine, überzeugende fremde Klassifikation oder Codierung, das ist inzwischen auch klar geworden. Das "Kapern" des GND-Typs ist dabei ein Nebenschauplatz: Einige wollen sofort etwas "einfaches" (= intuitiv vergebbares) nutzen, und weil alle Versuche, eine genuine Wikidata-Property dafür zu schaffen, abgeschmettert worden sind, nehmen sie den GND-Typ dafür. Bekämpft werden sie dabei wiederum mit dem Argument, dass die erlaubten Werte "Person", "Körperschaft", "Konzept", "Begriffsklärung" (das war mal Tn ;-) abwegig sind, bzw. einzelne Vergaben (etwa "Person" für Götter) Murks. M.E. sind das Argumente auf falschen Ebenen, der wahre Konflikt liegt darin, dass eine Property nicht gleichzeitig ein Fremdsystem nachvollziehen kann und (in Wikidata oder einzelnen Wikipedien) selbst ausgedachtes (dazu noch das Problem, dass Wikidata gar nichts "selbst ausgedachtes" enthalten darf, die Bequellung von AuthorityControl-Properties ist subtil anders zu verstehen als die von anderen Attributen, denn die Identifikation von Artikel und Normdatum wird fast immer von Wikipedia-Bearbeitern geleistet, nicht aus externen Quellen übernommen). Im Prinzip veranstalten wir übrigens hier in de:WP denselben Kuddelmuddel, indem der Parameter "TYP" für die Vorlage:Normdaten Pflicht ist, auch wenn es keinen GND-Datensatz gibt. Weil VIAF aber keine "Schlagworte" listet und daher bei nicht in der GND vorhandenen Begriffen normalerweise keine (dann bis auf den TYP leere) Normdaten-Vorlage ausgefüllt wird, sind wir von analogen Kämpfen bislang verschont worden (Ein weiterer Grund liegt darin, dass Vorlagenparameter "lokal" sind, andere Vorlagen etc. im gleichen Artikel können nicht darauf zugreifen und das Potential etwa eines Normdaten-Parameters "TYP", für den ganzen Artikel etwas zu "regeln" ist dementsprechend gering. Wikdidata-Properties sind da wesentlich apodiktischer). -- Thomas Berger (Diskussion) 11:31, 19. Sep. 2013 (CEST)
- In den meisten Punkten stimme ich dir zu, aber warum ein Autor xy erst dann eine Person genannt werden darf, wenn ihm eine GND zugeteilt wurde, erschließt sich mir nicht. Was mich auf Wikidata in erster Linie stört, ist der Absolutheitsanspruch, den eine kleine Gruppe auf ihre Sicht des Semantic Web erhebt und rücksichtslos durchdrückt. Es ist ja weder technisch noch inhaltlich ein Problem, mehrere Eigenschaften zu vergeben. Und bei der Ersterfassung und dem Auffinden von Fehlern hat sich nun mal die Eigenschaft P107 (GND-Typ) bewährt. (Das gilt vor allem im Hinblick auf die Vielsprachigkeit: Wenn du weißt, ob mit "पैरिस" eine Person, ein Ort oder ein Werk gemeint ist, hilft das enorm.) Nicht umsonst ist GND-Typ die am meisten vergebene Eigenschaft und wird bereits in zahlreichen Infoboxen genutzt. Und trotzdem pappt auf ihr jetzt der absurde Hinweis: Nicht benutzen! Unsere Eigenschaften besser! --Kolja21 (Diskussion) 21:16, 19. Sep. 2013 (CEST)
- Strenggenommen muss man die Personeneigenschaft anhand der GND-Redaktionsanleitung bestimmen. Und in Grenzbereichen (Sammelpseudonyme, fiktive Personen als Autoren) kommt die zu anderen Ergebnissen als etwa die Library of Congress (die aber wiederum viel häufiger einer Person mehrere Normsätze zuteilt). D.h. im internationalen Kontext können (und wollen) sich selbst "die Biblioteken" nicht einigen, obwohl sie die Lufthoheit über die eigenen Regelwerke haben und ungleich straffer organisiert sind als die Wikipedianer. Wir reden hier über Personenartikel oder Biographie-Artikel, wenn hier ein Grüppchen durchsetzen wollte, dass das dann und nur dann solche Artikel sind (und die Personendaten-Vorlage tragen dürfen), wenn bei Anwendung der Regeln der Nationalbliothek xy irgendwo ein 'p' herauskommt, wäre die K. ziemlich am dampfen. Die hier praktikable Alternative ist, dass man ungestraft ein 'p' als Normdaten-TYP eintragen darf, wenn es ohnehin ein Biographieartikel (kenntlich an diversen Formalia ist). Das ist dann Entscheidung des Artikelautors bzw. kann am individuellen Artikel diskutiert werden. Für Wikidata klappt aber gerade das nicht, weil man ja eine projektübergreifende Kennzeichnung sucht, aus der man dann etwa rückschliessen kann: wenn es einen Artikel in de:WP gäbe, dann wäre das ein Biographie-Artikel, genau wie die existierenden Artikel in jeder anderen Wikipedia Biographie-Artikel sind. Allerdings hat Wikidata hier allmächlich schon Fakten geschaffen: Fiktionale Charaktere gelten dort als Unterklasse von Person, d.h. durch konkrete Nutzung bildet sich da von innen eine Präzisierung der Semantik heraus: Das kommt ohne ein externes Konzept aus und kann daher durch Wikidata-interne Diskussionen weiterentwickelt werden. -- Thomas Berger (Diskussion) 23:05, 19. Sep. 2013 (CEST)
- Ich finde es durchaus nachvollziehbar, dass der GND-Typ nicht zur Klassifikation auf Wikidata verwendet werden soll. Schließlich ist Wikidata keine DNB 2.0, insofern gibt es gar keinen Grund, deren Klassifikationsrichtlininen zu übernehmen. 213.54.147.109 19:16, 25. Sep. 2013 (CEST)
- Und nicht zu vergessen, das Argument: "It's German." Mehrmals vorgebracht und genauso nichtssagend. Es gibt mittlerweile auf WD über 900 Eigenschaften. Der Mehrheit vorzuschreiben, diese eine Eigenschaft (GND-Typ) nicht zu verwenden, weil sie populär ist, ist und bleibt indiskutabel. --Kolja21 (Diskussion) 20:45, 25. Sep. 2013 (CEST)
- Ich finde es durchaus nachvollziehbar, dass der GND-Typ nicht zur Klassifikation auf Wikidata verwendet werden soll. Schließlich ist Wikidata keine DNB 2.0, insofern gibt es gar keinen Grund, deren Klassifikationsrichtlininen zu übernehmen. 213.54.147.109 19:16, 25. Sep. 2013 (CEST)
- Strenggenommen muss man die Personeneigenschaft anhand der GND-Redaktionsanleitung bestimmen. Und in Grenzbereichen (Sammelpseudonyme, fiktive Personen als Autoren) kommt die zu anderen Ergebnissen als etwa die Library of Congress (die aber wiederum viel häufiger einer Person mehrere Normsätze zuteilt). D.h. im internationalen Kontext können (und wollen) sich selbst "die Biblioteken" nicht einigen, obwohl sie die Lufthoheit über die eigenen Regelwerke haben und ungleich straffer organisiert sind als die Wikipedianer. Wir reden hier über Personenartikel oder Biographie-Artikel, wenn hier ein Grüppchen durchsetzen wollte, dass das dann und nur dann solche Artikel sind (und die Personendaten-Vorlage tragen dürfen), wenn bei Anwendung der Regeln der Nationalbliothek xy irgendwo ein 'p' herauskommt, wäre die K. ziemlich am dampfen. Die hier praktikable Alternative ist, dass man ungestraft ein 'p' als Normdaten-TYP eintragen darf, wenn es ohnehin ein Biographieartikel (kenntlich an diversen Formalia ist). Das ist dann Entscheidung des Artikelautors bzw. kann am individuellen Artikel diskutiert werden. Für Wikidata klappt aber gerade das nicht, weil man ja eine projektübergreifende Kennzeichnung sucht, aus der man dann etwa rückschliessen kann: wenn es einen Artikel in de:WP gäbe, dann wäre das ein Biographie-Artikel, genau wie die existierenden Artikel in jeder anderen Wikipedia Biographie-Artikel sind. Allerdings hat Wikidata hier allmächlich schon Fakten geschaffen: Fiktionale Charaktere gelten dort als Unterklasse von Person, d.h. durch konkrete Nutzung bildet sich da von innen eine Präzisierung der Semantik heraus: Das kommt ohne ein externes Konzept aus und kann daher durch Wikidata-interne Diskussionen weiterentwickelt werden. -- Thomas Berger (Diskussion) 23:05, 19. Sep. 2013 (CEST)
- In den meisten Punkten stimme ich dir zu, aber warum ein Autor xy erst dann eine Person genannt werden darf, wenn ihm eine GND zugeteilt wurde, erschließt sich mir nicht. Was mich auf Wikidata in erster Linie stört, ist der Absolutheitsanspruch, den eine kleine Gruppe auf ihre Sicht des Semantic Web erhebt und rücksichtslos durchdrückt. Es ist ja weder technisch noch inhaltlich ein Problem, mehrere Eigenschaften zu vergeben. Und bei der Ersterfassung und dem Auffinden von Fehlern hat sich nun mal die Eigenschaft P107 (GND-Typ) bewährt. (Das gilt vor allem im Hinblick auf die Vielsprachigkeit: Wenn du weißt, ob mit "पैरिस" eine Person, ein Ort oder ein Werk gemeint ist, hilft das enorm.) Nicht umsonst ist GND-Typ die am meisten vergebene Eigenschaft und wird bereits in zahlreichen Infoboxen genutzt. Und trotzdem pappt auf ihr jetzt der absurde Hinweis: Nicht benutzen! Unsere Eigenschaften besser! --Kolja21 (Diskussion) 21:16, 19. Sep. 2013 (CEST)
- Zuerst haben Leute beim GND-Typ die gefundenen GND-Nummern hinterlegt, weil es die entsprechende Property noch nicht gab. Inzwischen ist es umgekehrt, P107 ist deprecated, also wird irgendwelcher typisierender Klartext in der Property für die GND-Nummer verklappt. Dem kann man natürlich hinterherredigieren. Ernst ist aber, dass die Property GND-Typ inzwischen völlig verbrannt ist, da für Items ohne GND-Nummer (und auch ohne Nachweis in der GND) tausendfach der Code selbst ausgedacht und hinterlegt wurde: Wenn da die GND irgendwann nachzieht und aufgrund ihrer eigenen, fast unmöglich zu vermittelnden Regeln einen anderen Code spendiert, gibt es maschinell nicht mehr auflösbare Konflikte. FA210 hat völlig recht mit seinem Einwand (obwohl ich nicht glaube, dass er dort verstanden werden kann, so verfahren ist die Sache). Bereits LoC-NAF und GND haben keine 100%ige Überdeckung der jeweiligen Konzepte für "Person" (wo man das am ehesten noch erwarten könnte) und m.E. hat sich das auch auf die Wikipedien der jeweiligen Sprachen durchgeschlagen. Aber auch auf Wikidata gibt es den Bedarf nach einer "einfachen" Gröbst-Klassifikation (irgendwie soll erkennbar sein, dass es sich um eine "Person" handelt, damit die Präsentation einer "Infobox Person" automatisiert veranlasst werden kann), wobei man glücklicherweise sofort eingesehen hat, dass man keine eigene entwickeln sollte, weil es eben doch nicht so einfach ist. Und es gibt auch nicht die eine, überzeugende fremde Klassifikation oder Codierung, das ist inzwischen auch klar geworden. Das "Kapern" des GND-Typs ist dabei ein Nebenschauplatz: Einige wollen sofort etwas "einfaches" (= intuitiv vergebbares) nutzen, und weil alle Versuche, eine genuine Wikidata-Property dafür zu schaffen, abgeschmettert worden sind, nehmen sie den GND-Typ dafür. Bekämpft werden sie dabei wiederum mit dem Argument, dass die erlaubten Werte "Person", "Körperschaft", "Konzept", "Begriffsklärung" (das war mal Tn ;-) abwegig sind, bzw. einzelne Vergaben (etwa "Person" für Götter) Murks. M.E. sind das Argumente auf falschen Ebenen, der wahre Konflikt liegt darin, dass eine Property nicht gleichzeitig ein Fremdsystem nachvollziehen kann und (in Wikidata oder einzelnen Wikipedien) selbst ausgedachtes (dazu noch das Problem, dass Wikidata gar nichts "selbst ausgedachtes" enthalten darf, die Bequellung von AuthorityControl-Properties ist subtil anders zu verstehen als die von anderen Attributen, denn die Identifikation von Artikel und Normdatum wird fast immer von Wikipedia-Bearbeitern geleistet, nicht aus externen Quellen übernommen). Im Prinzip veranstalten wir übrigens hier in de:WP denselben Kuddelmuddel, indem der Parameter "TYP" für die Vorlage:Normdaten Pflicht ist, auch wenn es keinen GND-Datensatz gibt. Weil VIAF aber keine "Schlagworte" listet und daher bei nicht in der GND vorhandenen Begriffen normalerweise keine (dann bis auf den TYP leere) Normdaten-Vorlage ausgefüllt wird, sind wir von analogen Kämpfen bislang verschont worden (Ein weiterer Grund liegt darin, dass Vorlagenparameter "lokal" sind, andere Vorlagen etc. im gleichen Artikel können nicht darauf zugreifen und das Potential etwa eines Normdaten-Parameters "TYP", für den ganzen Artikel etwas zu "regeln" ist dementsprechend gering. Wikdidata-Properties sind da wesentlich apodiktischer). -- Thomas Berger (Diskussion) 11:31, 19. Sep. 2013 (CEST)
- PS: FA2010 hat den Sachverhalt treffend auf den Punk gebracht: "It is impertinent to first capture this well-defined and useful property, and then wanting to delete it" (d:Property talk:P107) --Kolja21 (Diskussion) 07:30, 19. Sep. 2013 (CEST)
VIAF
Hallo Normdaten-Freunde ;). Schon häufiger wurde ja die Dauerhaftigkeit von VIAF-Nummern besprochen. Weil mir in letzter Zeit immer häufiger aufgefallen ist, dass VIAF-Nummern hier nicht mehr aktuell sind sondern auf neue Nummern weiterleiten, habe ich das mal durchgetestet und bin auf ein erschreckendes Ergebnis gekommen: Der Check läuft zwar noch, aber schon jetzt ist klar, dass über 5% aller VIAF-Nummern, die wir hier eingetragen haben, inzwischen auf eine neue Nummer weiterleiten, wir reden von einer fünfstelligen Anzahl. Die Frage ist nun, wie ihr zu einer automatisierten Aktualisierung steht. Also: Sollte ein Bot losgeschickt werden, der diese Artikel aktualisiert, also die alte VIAF durch die neue ersetzt? Da die VIAF-Nummern ja glücklicherweise weiterleitet auf die neuen ist das unproblematisch möglich. Veraltete VIAF-Nummern sind ja auch nicht so schön... Also wie steht ihr dazu? --APPER\☺☹ 18:12, 28. Sep. 2013 (CEST)
- Was ich mir problemlos vorstellen könnte, wäre ein Bot, der auf Wikidata die alten Nummern austrägt, wenn deren Umlenkungs-Zielnummer ebenfalls bereits vermerkt ist. Aber das war nicht Deine Frage, schon klar... -- Thomas Berger (Diskussion) 18:28, 28. Sep. 2013 (CEST)
Hi APPER, wenn dich Weiterleitungen schon erschrecken, was sagt dein Testlauf zu den ganzen toten VIAF-Links? ;)
- "Das Cluster wurde entfernt und ist nicht mehr in VIAF enthalten":
Ich korrigiere die VIAF-Fehler nur in WP (bei der GND auch in WD). Aber zu deiner eigentlichen Frage mit dem Botlauf: Was die/das VIAF betrifft jederzeit gerne! Es ist eh nur eine Sammlung, die maschinell erstellt wurde, da können und sollten wir auch mit Bots arbeiten. Das hält uns den Rücken für die Detailarbeit frei. --Kolja21 (Diskussion) 18:35, 28. Sep. 2013 (CEST)
- Mit WD habe ich mich ehrlich gesagt bisher kaum beschäftigt, die Abfragemöglichkeiten fehlen da eh noch. Durch das Ersetzen von Weiterleitungen wird ja auf jeden Fall nichts "falscher" hier - die Frage ist nur, ob die Tausenden Bearbeitungen gerechtfertigt sind. Ich persönlich würde es schon sagen, eine Bearbeitung kostet ja im Prinzip kaum was, aber ich wollte vorher mal andere Meinungen hören. --APPER\☺☹ 18:41, 28. Sep. 2013 (CEST)
- Ich befürworte auch eine Korrektur per Bot. --Mai-Sachme (Diskussion) 18:53, 28. Sep. 2013 (CEST)
- Ich halte den Botlauf, wie schon gesagt, ebenfalls für hilfreich. Aber noch mal zu den toten Links: Wie geht dein Bot mit diesen Fällen um? --Kolja21 (Diskussion) 19:02, 28. Sep. 2013 (CEST)
- In diesem Botlauf habe ich nur gegen Weiterleitungen getestet (Header). Gelöschte Einträge würde ich ein anderes Mal testen. --APPER\☺☹ 19:21, 28. Sep. 2013 (CEST)
- Ich halte den Botlauf, wie schon gesagt, ebenfalls für hilfreich. Aber noch mal zu den toten Links: Wie geht dein Bot mit diesen Fällen um? --Kolja21 (Diskussion) 19:02, 28. Sep. 2013 (CEST)
Inzwischen ist der Lauf übrigens beendet und wir reden über 13.900 VIAF-Einbindungen oder 5,86%... --APPER\☺☹ 03:33, 29. Sep. 2013 (CEST)
- Danke für die Arbeit! --Kolja21 (Diskussion) 21:37, 29. Sep. 2013 (CEST)
- Danke! Wichtige Arbeit! --AndreasPraefcke (Diskussion) 11:40, 30. Sep. 2013 (CEST)
- Auch mein Dank. Aber warum hat Dein Test so lange gedauert, dass Du zwischenzeitlich hier einen Beitrag schreiben konntest? Auf der VIAF-Dataset-Seite wird monatsaktuell die "persist-rdf.xml"-Datei mit den VIAF-internen Umlenkungen angeboten, daraus sollten sich die nicht mehr aktuellen Nummern günstig extrahieren und recht schnell mit der Menge aller in de:WP erwähnten VIAF-Nummern oder -Links in Beziehung setzen lassen. -- Thomas Berger (Diskussion) 12:36, 30. Sep. 2013 (CEST)
- Weil ich faul war und der Meinung, dass die VIAF-Seite 240.000 Header-Anfragen über ein/zwei Tage mal verkraften kann. Um ein XML-Parsing zu schreiben hätte ich länger gebraucht als die paar Zeilen, die der Check jetzt hat. Mir ist schon bewusst, dass die VIAF-Daten glücklicherweise zum Download stehen, aber bisher habe ich sehr wenig mit VIAF gemacht, weshalb ich bisher keine Zeit hatte, mich mit dem Downloadformat zu beschäftigen. --APPER\☺☹ 13:24, 30. Sep. 2013 (CEST)
- Hinzu kommt das die XML-Datei aufgrund der multiplen XML-Deklarationen kein gültiges Format hat, sondern es ist ein konkatenierter Datenstrom von einzelnen XML-Dateien. Das lässt sich zwar leicht lösen, aber trotzdem als Hinweis wenn man die Datei verwenden will. --Mps、かみまみたDisk. 13:58, 30. Sep. 2013 (CEST)
- Weil ich faul war und der Meinung, dass die VIAF-Seite 240.000 Header-Anfragen über ein/zwei Tage mal verkraften kann. Um ein XML-Parsing zu schreiben hätte ich länger gebraucht als die paar Zeilen, die der Check jetzt hat. Mir ist schon bewusst, dass die VIAF-Daten glücklicherweise zum Download stehen, aber bisher habe ich sehr wenig mit VIAF gemacht, weshalb ich bisher keine Zeit hatte, mich mit dem Downloadformat zu beschäftigen. --APPER\☺☹ 13:24, 30. Sep. 2013 (CEST)
- Wurden die VIAF-Nummern im Botlauf eigentlich lokal oder in Wikidata korrigiert? 213.54.145.100 09:23, 4. Okt. 2013 (CEST)
- Wenn ich APPER richtig verstanden habe, nur in deWP. Das ist ein Grundproblem von WD: Die Daten werden als Dubletten angelegt und erst in einem zweiten Schritt macht man sich Gedanken um die Wartung. --Kolja21 (Diskussion) 16:14, 4. Okt. 2013 (CEST)
So, das Projekt ist jetzt abgeschlossen. Alle VIAF-Nummern der de.wikipedia sollten nun keine Weiterleitungen sein. --APPER\☺☹ 16:02, 31. Okt. 2013 (CET)
- Super, gute Arbeit! --Kolja21 (Diskussion) 17:20, 31. Okt. 2013 (CET)
Wie sieht es mit gelöschten VIAF-Clustern aus, die sind meiner Meinung nach kritischer als funktionierende Weiterleitungen. Beispiel: http://viaf.org/viaf/3380768/ war bis eben noch in Oskar Seyffert eingetragen und auch im Zeitraum von Appers Korrektur kam mir solch ein Cluster unter. -- 32X 09:49, 1. Nov. 2013 (CET)
- Gelöschte Cluster etc. kommen demnächst... --APPER\☺☹ 13:40, 1. Nov. 2013 (CET)
VIAF-Probleme durch Tn am Beispiel Kurt Kusenberg
aus dem vorangehenden Abschnitt von FA2010: »... am nachgelagerten Fehler, sie [die Tn] dann auch noch in VIAF aufzunehmen.« – Ja genau, als außenstehender Beobachter fragt man sich, warum sich vor allem VIAF das Leben seit Jahren so schwer macht. Konkretes Beispiel (hat jemand ein anderes/besseres?): Ich hatte vor knapp einem Jahr unter en:Wikipedia:VIAF/errors#Parallel_VIAF_clusters_for_one_identity die Probleme bei Kurt Kusenberg angemerkt. Der "gute" VIAF-Cluster dazu ist http://viaf.org/viaf/9863753/ – Was ich immer noch nicht verstanden habe: Der Tn lagert (derzeit) im Mini-Cluster http://viaf.org/viaf/273373029/ , und dort sind diverse Werke mit Herkunft GND aufgelistet, obwohl die DNB unter dem Tn keine Werke (mehr) verzeichnet: http://d-nb.info/gnd/176261710
Konkret gefragt: (1) Hat jemand eine Idee, woher die Werkliste in http://viaf.org/viaf/273373029/ stammt? Es könnte sich schlicht (gleichwohl schlecht) um "vergessene" Reste bei VIAF-Umclusterungen handeln. Andere Möglichkeit ist HBZ: http://193.30.112.134/F/-?func=find-a&local_base=HBZ01&find_code=PGI&request=(DE-588)176261710 wo der Tn noch immer in falscher Benutzung ist. Jedenfalls dürfen nach meinem Verständnis unter "Selected Titles" in http://viaf.org/viaf/273373029/ keine Werke mit Herkunftsvermerk "DNB" gelistet sein.
Und zwecks möglicher Klärung weiter gefragt: (2) Hat jemand hier Kontakt mit VIAF? Ich kann mir zwar schlecht vorstellen, dass die Problematik der DNB-Tn dort nicht bekannt ist, aber man weiß ja nie.
Und schließlich: (3) Hat jemand hier Kontakt zu / Erfahrung mit dem HBZ? Oder wen sollte man ggf wg. Tn 176261710 kontakten? (PND/F = GND-Redaktion bei der DNB scheint mir nicht zuständig und selbst wenn zuständig angesichts des Rückstands nicht die erste Adresse.)
Zur Klarstellung: Kein VIAF-Bashing, bin hauptsächlich neugierig, wo es hakt = Frage (1) -- Make (Diskussion) 19:23, 29. Okt. 2013 (CET)
- Hallo Make, der Tn 176261710 wurde vom hbz (Sigel DE-605) angelegt, daher stammt vermutlich auch die Werkliste vom Hochschulbibliothekszentrum des Landes Nordrhein-Westfalen. VIAF zu kontaktieren ist sinnlos: 1. bekommt man in der Regel keine Antwort, 2. fühlen sie sich nur für den Algorithmus, der die Daten zusammenfügt, zuständig. (Immerhin haben sie mittlerweile die Tn's mit "undifferentiated" gekennzeichnet; anfangs war ihnen offenbar nicht mal das Problem bewusst). Die regionalen GND-Redaktionen sind ebenfalls nicht besonders an Rückmeldung interessiert, da sie offenbar zu wenig Personal für solche Korrekturen haben. Ich hatte unter "aleph-betreu-AT-bz-nrw.de" Glück: Die betreffenden Werke wurden zum Tp umverknüpft und anschließend der Tn von der Zentralredaktion (DNB) in eine Weiterleitung umgewandelt. Aber stelle dich auf eine mehrmonatige Bearbeitungszeit ein. --Kolja21 (Diskussion) 21:56, 29. Okt. 2013 (CET)
- Schonmal schnell rückgefragt: Wie hast Du das mit Sigel DE-605 herausbekommen? – Ich hab noch etwas beim hbz gestöbert: Kontakte http://www.hbz-nrw.de/angebote/verbunddatenbank/kontakt/ und Stichpunkte zu GND-Praxisfragen als Punkt 8 in einem Vortrag vom letzten November [8] ... -- Make (Diskussion) 08:48, 30. Okt. 2013 (CET)
- Danke, da hatte ich damals mit der Mail an die allgemeine Adresse "hbz-Verbundsystem" wirklich Glück. Ich vermute, dass der E-Mail-Kontakt "Normdaten" neu ist, sonst hätte ich mich direkt an die lokale GND-Redaktion gewendet. Das Sigel steht im PICA-Datensatz:
- Normdatenvorlage Kurt Kusenberg: "GND: 119052040 (PICA, AKS)"
- PICA: Feld 047A (DE-101 = der Datensatz wurde von der DNB in Frankfurt angelegt)
- --Kolja21 (Diskussion) 19:46, 30. Okt. 2013 (CET)
- Danke, da hatte ich damals mit der Mail an die allgemeine Adresse "hbz-Verbundsystem" wirklich Glück. Ich vermute, dass der E-Mail-Kontakt "Normdaten" neu ist, sonst hätte ich mich direkt an die lokale GND-Redaktion gewendet. Das Sigel steht im PICA-Datensatz:
- Schonmal schnell rückgefragt: Wie hast Du das mit Sigel DE-605 herausbekommen? – Ich hab noch etwas beim hbz gestöbert: Kontakte http://www.hbz-nrw.de/angebote/verbunddatenbank/kontakt/ und Stichpunkte zu GND-Praxisfragen als Punkt 8 in einem Vortrag vom letzten November [8] ... -- Make (Diskussion) 08:48, 30. Okt. 2013 (CET)
VIAF-Komplettcheck
Auf Anregung hin habe ich jetzt - nachdem APPERbot 13.000 umgebogene VIAFs korrigiert hat - einen Komplettcheck der VIAF-Identifier in der de.wikipedia laufen lassen. Getestet wurden 243.893 VIAFs. Sie wurden nach dem Check in sechs Töpfchen aufgeteilt:
- (0) Alles Getestete soweit korrekt: Der VIAF-Eintrag ist keine Weiterleitung, kein gelöschter Cluster und die angegebene GND entspricht unserer.
- (1) VIAF ist Weiterleitung auf andere VIAF
- (2) Gelöschter VIAF-Cluster
- (3) Soweit alles okay, aber im VIAF ist eine GND angegeben, bei uns ist jedoch keine angegeben
- (4) Soweit alles okay, aber bei uns ist eine GND angegeben, bei der VIAF keine
- (5) Soweit alles okay, aber die bei der VIAF angegebene GND weicht von unserer ab
Das gute vorweg: 224.873 (das sind immerhin 92,2%) sind in Töpfchen 0. Im Töpfchen 1 sind 115, vermutlich neu aufgelaufen seit meinem letzten Check. Töpfchen 3 ist halbwegs übersichtlich (710), aber anscheinend sehr sinnvoll (oder ich hatte Glück): Vier zufällig getestete waren allesamt so, dass hier eine GND nachgetragen werden kann, oft eine recht neu angelegte. Liste 4 ist riesig (14038 Einträge), aber da lohnt sich anscheinend keine Arbeit - das sind die Datensätze, bei denen VIAF zwei Cluster hat und das Nicht-GND-Cluster im Artikel eingetragen ist. Außerdem gibt es dort Fälle wie [9], die ich bisher fehlerhafterweise nicht abgefangen habe (kommt nächstes Mal) und solche Sachen, die man automatisiert erkennen könnte: Der verlinkte Cluster enthielt nur eine undifferenzierte GND, wohingegen im Artikel eine richtige GND eingetragen ist -> da lohnt sich wohl eine Extra-Liste ;). In der Liste 5 finden sich 2404 Einträge. Vier zufällig gecheckte waren sämtlichst DNB-Dubletten! Ich werde bzgl dieser Liste mal Kontakt mit der DNB aufnehmen, das können wir ja nicht alles manuell melden. Bleibt noch Liste 2, nach der ja explizit gefragt wurde (und um es spannend zu machen, kommt die zum Schluss), die gelöschten VIAF-Cluster: Das sind 1753 Stück - ordentlich Arbeit für uns.
Folgende Listen habe ich soeben in die Wikipedia gestellt: Benutzer:APPER/VIAF2 enthält die gelöschten Cluster; Benutzer:APPER/VIAF3 enthält die Artikel, bei denen die VIAF eine GND enthält, die bei uns nicht verzeichnet ist
Grüße --APPER\☺☹ 01:20, 4. Nov. 2013 (CET)
- Habs schon getestet: Vor allem Liste VIAF 3 ist eine große Hilfe. --Kolja21 (Diskussion) 03:17, 4. Nov. 2013 (CET)
- Sehr schön, ja. Liste 3 ist in vielen Fällen sehr schnell zu bearbeiten, aber leider nicht immer (manchmal ist VIAF eben bekanntermaßen fehlerhaft, oder es ist auch schlicht ein falscher VIAF-Satz eingetragen bei uns). --FA2010 (Diskussion) 10:31, 4. Nov. 2013 (CET)
- "solche Sachen" von oben sind ein beliebter Trick: Die GND-Nummer des Namenssatzes ist nicht eintragswürdig, die DNB hat keinen Bestand, aber über die VIAF-Nummer des Tn-Satzes lässt sich dann doch etwas eintragen (Der Tp ist zwar von 1995, gibt als Quelle aber "Wikipedia" an, er ist also in den letzten Jahren kraeftig ausgebaut worden). Am besten wäre es also, in den Faellen, wo der Bot beschließt, dass er ein besseres VIAF-Cluster kennt als im Artikel eingetragen (ich gehe davon aus, dass er da ohnehin sehr konservativ vorgeht, denn es gibt sehr viele Fälle, wo der Tn in einem wesentlich größeren Cluster wohnt und einem eventuell existierenden Tp die Aufnahme verwehrt), den im alten Cluster referenzierten Tn-Satz nach GNDName überführt. -- Thomas Berger (Diskussion) 12:36, 4. Nov. 2013 (CET)
Ich hatte jetzt ein paar Mal die Situation, dass ich einen Artikel mit einer VIAF-Nummer hatte, die falsch war, aber auch bei einem anderen Artikel korrekt bereits eingetragen war. Eine (hoffentlich kurze) Liste "Artikel mit VIAF-ID, die in de.wikipedia mehrfach verwendet wird" wäre daher wohl auch hilfreich. --FA2010 (Diskussion) 11:45, 6. Nov. 2013 (CET)
- Mir sind auch hin und wieder schon Artikel untergekommen, in die offensichtlich ausgefüllte Normdatenvorlagen aus anderen Artikeln hineinkopiert und dann nicht alle Parameter nicht angepasst wurden. Da wäre eine generelle Überprüfung auf doppelte Parameter mal tatsächlich sehr hilfreich. --Kam Solusar (Diskussion) 18:27, 6. Nov. 2013 (CET)
- Für den GND-Parameter mache ich das zeitnah, es gibt einen Bodensatz von etwa einem Dutzend Personen (stellenweise nur Artefakte der BEACON-Datei) und ca. 40 Nicht-Personen, dort ist die Tendenz steigend: Typisch etwa historisches gegen aktuelles oder Region gegen politisches Gebilde, wie etwa bei Pitcairn und Pitcairninseln. Wikidata kennt aktuell 97 dublette VIAF-Nummern, die Zahl dürfte hier geringer sein. -- Thomas Berger (Diskussion) 19:24, 6. Nov. 2013 (CET)
- Ah, danke. Das sind ja weit weniger als ich befürchtet hatte. --Kam Solusar (Diskussion) 14:56, 8. Nov. 2013 (CET)
Wikidata: Unsere Daten sind dort nicht sicher
Mit den Kommentaren von Wikidata-Oberdepp Izno bei d:Property_talk:P107 hat sich die Möglichkeit, die Normdaten mittelfristig auf Wikidata umzustellen, wohl endgültig erledigt. Die machen da, was sie wollen, lokale Communities sind völlig egal, und was man nicht versteht, ist automatisch unnötig und falsch. Wir sollten also unbedingt die Daten hier bei uns auch langfristig auf de.wikipedia halten und warten und damit auch in unserer Verfügungsmacht behalten, Wikidata ist da keine Lösung (war ja eigentlich klar, bei Commons ist das ja ähnlich; ähnlich wie ein de.commons wg. der Rechtslage wäre auch ein de.wikidata wegen der technischen Schwächen und der Volldeppen, die dort das Sagen haben, notwendig). Ich werde jedenfalls keine Fehler in den GND-Daten auf Wikidata mehr korrigieren. Sollen die mit ihrem unwartbaren und ungewarteten Datenfriedhof doch machen, was sie wollen. --FA2010 (Diskussion) 10:22, 5. Nov. 2013 (CET)
- Man kann eine Diskussion – bei allem Ärger – kaum sachlich halten, wenn man andere als Oberdepp oder Volldepp tituliert. Das solltest du Halbidiot eigentlich wissen. -- 32X 12:13, 5. Nov. 2013 (CET) PS: Aus jahrelanger Erfahrung bei den Löschkandidaten der de.WP weiß ich, dass eine Argumentation mit dem Wort „Zensur“ recht lächerlich wirkt und den eigenen Standpunkt keinesfalls festigt.
- Klar geht es auch freundlicher, aber die Diskussionen auf WD (einschließlich der Kommentare von Izno) wurden extrem autoritär geführt und die Grenzen des Zumutbaren regelmäßig überschritten. Es ist schade, dass eine fruchtbare Zusammenarbeit leider nur eingeschränkt möglich ist. Was die Normdaten betrifft, trennen deWP und WD Welten. Während deWP seit Jahren auf Qualitätssicherung und regelmäßige Überprüfung der Normdaten setzt, hat Wikidata per Bot "Harvesting" betrieben und alle Normdatennummer, oder was der Bot dafür hielt, zusammengewürfelt. Statt die Quellen wie LCCN und GND durch VIAF zu ergänzen, wird dort der umgekehrte Weg beschritten. VIAF, als Normdatensammlung notgedrungen oft veraltet, fehlerhaft und unvollständig, gilt als Hauptquelle, von der die anderen Datensätze abgeleitet werden. Tn's (Namenseinträge) werden wie Tp's behandelt, Pseudo-GND-Nummern, die VIAF z.B. erzeugt, wenn Bindestriche in der GND enthalten sind, als originale GNDs eingetragen etc. pp. --Kolja21 (Diskussion) 19:11, 5. Nov. 2013 (CET)
- Es geht ums Prinzip. Und das Sprichwort mit dem "Wald -> Ruf -> Schall" gilt auch hier. Die sind dort so merkbefreit, dass nur mit klaren Worten klar gemacht werdne kann, dass das so nicht geht. M. E. ist Wikidata bereits komplett vor die Wand gefahren. Und natürlich ist das eine Art Zensur (gut, nicht staatlich, aber sie wirkt so). Wikidata-Admins mischen sich gerade nach Gutdünken in Inhalte ein, obwohl Wikidata nur eine sinnvolle Infrastruktur bereitstellen sollte. In der Wikipedia ist das etwas anderes: die Löschkandidaten sind eine von der hiesigen Community gewünschte inhaltliche Kontrolle. --FA2010 (Diskussion) 11:48, 6. Nov. 2013 (CET)
- Wofür wurden eigentlich die Adminrechte auf WD großzügig mit der Gießkanne verteilt? Es gibt dort genügend deutschsprachige Admins und Kinderadmins, setzt die auf die Problematik an. -- 32X 12:11, 6. Nov. 2013 (CET)
- Was soll ein Admin da machen? 213.54.163.3 21:40, 6. Nov. 2013 (CET)
- Wofür wurden eigentlich die Adminrechte auf WD großzügig mit der Gießkanne verteilt? Es gibt dort genügend deutschsprachige Admins und Kinderadmins, setzt die auf die Problematik an. -- 32X 12:11, 6. Nov. 2013 (CET)
Hat jemand eine gute GND-Datenbank parat?
Falls ja, wäre ich für folgendes dankbar, sofern einfach möglich: Ich bräuchte eine Liste (txt, CSV, Excel o. ä.), von allen GND-Sätzen, die im Feld "Quelle" das Wort "OEML" enthalten. Benötigte Hilfreiche Felder wären: Person (also der Name), das Feld "Quelle" (oder auch nur die URL darin), und natürlich der GND-Identifier. Schlimm genug, dass wir eine externe BEACON-Datei brauchen, da dieses Projekt zwar GND bietet (absurderweise außer bei einigen Probeartikeln nur in einer "Premium-Version") und wohl offenbar sogar an der Redaktion beteiligt ist, aber keine BEACON-Datei anbietet. Da wäre es einfacher, neben dem bereits vorhandenen Grundstock aus nach Plausibilität verifizierten Wikipedia-Daten und vielen, die ich schon manuell herausgesucht habe, wenigstens noch die genannten Datensätze halbautomatisch zu haben. Aus dem DNB-Portal (und auch aus OGND) kann ich leider keine Liste hervorzaubern, da die Datei dort nicht nach Quelle durchsuchbar ist. Und diesen riesigen downloadbaren XML-Dateien fange ich leider nichts an. --AndreasPraefcke (Diskussion) 14:35, 10. Nov. 2013 (CET)
- Da niemand bislang geantwortet hat: Ich habe hier leider nur den RDF-Abzug (per OAI fortgeschrieben), und da sind die Angaben zur Quelle leider nicht enthalten (nur im MARC21-Abzug). Ich habe außerdem ausprobiert, ob sich das Feld bzw. der konkrete Inhalt über die (registrierungspflichtige) SRU-Schnittstelle recherchieren lässt: Ebenfalls Fehlanzeige. -- Thomas Berger (Diskussion) 16:16, 13. Nov. 2013 (CET)
- Danke. Hätte ja sein können, und hätte vielleicht ein wenig Arbeit gespart. Es geht aber auch "per Hand". --AndreasPraefcke (Diskussion) 12:06, 14. Nov. 2013 (CET)
404 NOT FOUND
Hallo, was ist den bei der GND von Marcantonio Giustinian los? --Mai-Sachme (Diskussion) 23:45, 15. Nov. 2013 (CET)
- Das gleiche Problem hatten wir gerade mit zwei anderen Datensätzen. Leider finde ich nicht die Seite, wo der Fall diskutiert wurde. Aus dem Gedächtnis: a) der Fehler betrifft Datensätze, die von einer lokalen GND-Redaktion stammen (hier: Marburg Kunstgesch.Bildarchiv), b) Über O-GND wird der Datensatz korrekt angezeigt. Die Fehler wurde per Mail an die DNB gemeldet und waren nach 24 Std. verschwunden. --Kolja21 (Diskussion) 02:44, 16. Nov. 2013 (CET)
- Die Stelle ist Fehlermeldungen vom 4. November 2013. Fazit: Über den Kontakt zur Administration von einer beliebigen Seite aus melden (unter Angabe der GND-Nummer des fraglichen Satzes natürlich). -- Thomas Berger (Diskussion) 10:49, 16. Nov. 2013 (CET)
- Mag jemand per Mail diesen Fall weiterreichen? Ich schreib sehr ungern mit Pseudonym Mails, trenne aber gleichzeitig auch strikt meinen Klarnamen von meiner Wikipedia-Tätigkeit (auch im weitesten Sinne). --Mai-Sachme (Diskussion) 14:56, 16. Nov. 2013 (CET)
- Ich habe die Fehlermeldung abgesetzt. Ralf G. Diskussion 16:30, 16. Nov. 2013 (CET)
- Danke! --Mai-Sachme (Diskussion) 16:51, 16. Nov. 2013 (CET)
- Antwort von DNB kam eben, der Datensatz ist jetzt sichtbar. Ralf G. Diskussion 11:52, 19. Nov. 2013 (CET)
- Danke, aber woran lag es? Die einzige Änderung im PICA-Datensatz ist Feld 060R (Relationierte Zeit):
- $a02.03.1619$b23.03.1688
- $a02.03.1619$b23.03.1688$4datx
- Macht der Zusatz "$4datx" die Daten mit dem DNB-Portal kompatibel? --Kolja21 (Diskussion) 12:24, 19. Nov. 2013 (CET)
- Keine Ahnung wie die technischen Auswirkugen sind, aber da die GND viele Zeitangaben kennt, dürfte die Angabe von $4 zumindest per Redaktionsanleitung zwingend sein. -- Thomas Berger (Diskussion) 13:29, 19. Nov. 2013 (CET)
- Danke, aber woran lag es? Die einzige Änderung im PICA-Datensatz ist Feld 060R (Relationierte Zeit):
- Antwort von DNB kam eben, der Datensatz ist jetzt sichtbar. Ralf G. Diskussion 11:52, 19. Nov. 2013 (CET)
- Danke! --Mai-Sachme (Diskussion) 16:51, 16. Nov. 2013 (CET)
- Ich habe die Fehlermeldung abgesetzt. Ralf G. Diskussion 16:30, 16. Nov. 2013 (CET)
- Mag jemand per Mail diesen Fall weiterreichen? Ich schreib sehr ungern mit Pseudonym Mails, trenne aber gleichzeitig auch strikt meinen Klarnamen von meiner Wikipedia-Tätigkeit (auch im weitesten Sinne). --Mai-Sachme (Diskussion) 14:56, 16. Nov. 2013 (CET)
- Die Stelle ist Fehlermeldungen vom 4. November 2013. Fazit: Über den Kontakt zur Administration von einer beliebigen Seite aus melden (unter Angabe der GND-Nummer des fraglichen Satzes natürlich). -- Thomas Berger (Diskussion) 10:49, 16. Nov. 2013 (CET)
Aktualisiert: Benutzer:Gymel/GND-Probleme
In den letzten Wochen ist das fast unglaubliche passiert, die Liste vom letzten Dezember mit tausenden(!) Einträgen zu falschen Entitäten etc. ist abgearbeitet worden. Anhand aktueller Dumps habe ich diese Wartungsliste nun neu generiert, glücklicherweise ist sie nun viel kleiner (sie sollte ja auch nur Probleme umfassen, die in den letzten 10 Monaten neu entstanden sind). Es fällt auf, dass nun die Zusammenführung von Ex-GKD und Ex-SWD-Sätzen bei den Geographika im vollen Gange ist, d.h. in dem Bereich enorm viele Umlenkungen zu beobachten sind. Es fällt aber leider auch auf, dass fast 1.000 Neuprobleme bei Personen verzeichnet sind, wo die Nummer eines nicht-Individualisierten Datensatzes als GND-Parameter (statt als GNDName) in der Normdaten-Vorlage erfasst wurde. Das ist natürlich besser als gar nichts und ich vermute, dass diese Einträge über "Vorschläge" von VIAF-basierenden Tools in die Wikipedia-Artikel geraten sind, also gewiss nicht falsch sind, aber eben auch nicht optimal und Nacharbeit daher erforderlich bleibt. -- Thomas Berger (Diskussion) 19:33, 27. Okt. 2013 (CET)
- Danke! Habe die Neufassung vorhin schon entdeckt. Leider hat sich VIAF (via enWP und WD) so erfolgreich durchgesetzt, dass viele nur noch dort recherchieren und uns mit veralteten und fehlerhaften Tn/Tps eindecken. (Was wir hier abarbeiten wird uns später über Wikidata noch einmal aufgetischt werden.) Aber es gibt noch eine positive Meldung: Die Vorlage:SWD ist nicht mehr im Artikelnamensraum verlinkt; bis vor kurzem gab es noch ein paar Treffer, die nicht in Benutzer:Gymel/NDmiss aufgeführt waren. Bleibt noch die Vorlage:GKD mit über 500 Einträgen. --Kolja21 (Diskussion) 06:06, 28. Okt. 2013 (CET)
- Ebenfalls: danke, sehr hilfreich! Ich bin schon dabei… Dass immer wieder Tn eingetragen werden statt Tp, liegt sicher hauptsächlich am Grundfehler, diese Namensdatensätze überhaupt in die GND aufzunehmen, und am nachgelagerten Fehler, sie dann auch noch in VIAF aufzunehmen. --FA2010 (Diskussion) 13:00, 29. Okt. 2013 (CET)
Alle GKD- und SWD-Einträge in der Normdaten-Vorlage scheinen jetzt in Kategorie:Wikipedia:Veraltete Normdaten auf. Die Zusammenführung GKD/SWD ist zwar recht weit gediehen, aber so obskure Orte wie Frankfurt am Main oder Polen sind weiterhin zweigleisig... --AndreasPraefcke (Diskussion) 13:52, 29. Okt. 2013 (CET)
- Vorlage:SWD kann doch eigentlich jetzt gelöscht werden, oder? Die paar Links darauf kann man eh nicht sinnvoll umbiegen. 213.54.142.190 19:30, 29. Okt. 2013 (CET)
- Das eilt nicht; vielleicht sucht doch noch mal jemand die alte Vorlage oder liest die Diskussionen, in denen sie verlinkt ist. Wer die "geleerte" Vorlage:SWD verwendet, bekommt den gleichen Fehlerhinweis wie bei der Vorlage:PND. --Kolja21 (Diskussion) 21:35, 29. Okt. 2013 (CET)
- @IP: Bitte auch nicht einfach die SWD-Vorlage aus Diskussionsseiten oder Entwürfen löschen. Wenn, dann muss sie, wie in der Dokumentation erläutert, durch Normdaten und/oder DNB-Portal ersetzt werden. --Kolja21 (Diskussion) 22:11, 29. Okt. 2013 (CET)
- Bei den nicht-individualisierten GNDs bin ich bzw. Benutzer:Schnark/js/personendaten.js/normdaten.js sicher nicht ganz unschuldig. Ursprünglich wurde das Skript ja nur von Leuten verwendet, die wissen, was sie tun, aber mit der Zahl der Anwender steigt natürlich auch die Zahl derer, die den Vorschlägen blind vertrauen, und dann eben auch eine nicht-individualisierte GND ohne Überprüfung übernehmen, statt sie nach GNDName zu verschieben. Ich bin für Vorschläge offen, wie ich das Skript ändern sollte, damit das nicht mehr oder zumindest seltener passiert. Mir ist aber kein Weg bekannt, von JavaScript aus einfach herauszufinden, ob eine GND individualisiert ist oder nicht. Was einfach machbar wäre: Statt die GND mit der Bemerkung "(automatisch übernommen)" direkt in das Feld einzufügen, könnte ich sie als Vorschlag hinter das Feld schreiben (so wie die ALTERNATIVNAMEN beim Personendaten-Skript, die auch nicht direkt eingefügt werden). Das würde dann einen zusätzlichen Klick erfordern, vielleicht hilft das ja ein bisschen. Weitere Vorschläge sind willkommen, falls sie machbar sind, werde ich sie umsetzen. --Schnark 10:58, 13. Nov. 2013 (CET)
- Ich sehe da keinen Handlungsbedarf (auch beim ähnlich gelagerten Problem der Übernahme der von VIAF als GND-Nummern präsentierten DNB-PPNs für Nicht-Personen). Der ungeübte Nutzer (relativ ungeübt, immerhin hat er sich normdaten.js besorgt, was einen überdurschnittliche Bereitschaft zum Engagement und zur Einarbeitung zeigt) hat seinen Beitrag geleistet und das (in vielerlei Hinsicht) Richtige in VIAF ausfindig gemacht (hier sehe ich Verbesserungspotential, vgl. den Detailreichtum der Vorschläge von authoritycontrol.js in Wikidata, der eine echte Entscheidung ermöglicht): Er sollte nun nicht aus formalen Gründen daran gehindert werden, das auch im Artikel zu hinterlegen. Dass manche Einträge "falsch" sind, sind Erfahrungswerte (GND-Nummern für Körperschaften) oder letztendlich Einschätzungssache (im VIAF-Kontext werden Tn-Sätze wie individualisierte verarbeitet, entscheidend ist die konkrete Nutzung in Bibliotheksdaten, nicht ob in einem PICA-Datensatz ein "a" oder "b" steht), wir haben hier die Werkzeuge, durch Offline-Abgleiche oder formale Konsistenztests herauszufinden, ob ein formales Problem vorliegt, die weniger ungeübten Normdaten-Aktivisten arbeiten dann gerne nach und veranstalten dann u.U. sogar einen Eintrag bei WP:PND/F, was der Sache dann noch mehr nutzt, dem gelegentlichen Normalanwender von normdaten.js aber nun wirklich nicht zugemutet werden kann. -- Thomas Berger (Diskussion) 13:06, 13. Nov. 2013 (CET)
Mit etwas Verspätung hab ich mir Benutzer:Gymel/GND-Probleme#Tp_zu_Tn_.28Vorlagenparameter_GND.29 angeschaut. Das sind Fälle, wo der Artikel einen individualisierten GND-Eintrag behauptet, die GND aber nur einen Namenssatz hat. Mit den Worten von Thomas Berger: „Hier behauptet die Wikipedia vorauseilend eine Individualisierung. Hoffentlich sind alle bei WP:PND/F eingetragen.“ – die Hoffnung scheint trügerisch ... primitive manuelle Stichprobe mit 25 Personen aus Block 51-100, genauer GND-IDs mit Anfangsziffern 101294... bis 101594... → 0 (null) Einträge unter PND/F. (Methode: Ich hab ausgehend vom jeweiligen Artikel geschaut, ob PND/F unter "Links auf diese Seite" auftaucht.) Das Spektrum der Fälle, die ich angeschaut hab, ist buntgemischt. Teilweise unproblematisch, da (per exotischem Namen) pseudo-individualisiert, aber auch zB Gustav_Richter_(Physiker) wo die GND Werke zu zwei Personen mit dem Namenssatz verknüpft. – Betroffen sind insgesamt 871 850+ Artikel, eine schnelle Lösung ist wg. der Warteschlange vor der GND-Redaktion nicht zu erwarten. Sollte man nur im Hinterkopf haben, dass die Mehrzahl der Fälle noch angefasst werden muss. -- Make (Diskussion) 21:40, 30. Nov. 2013 (CET)
- Das "hoffentlich" war von mir immer schon etwas sarkastisch gemeint gewesen. Inzwischen habe ich festgestellt, dass Gadgets dazu übergegangen sind, den Parameter "PND" von sich aus in "GND" und "TYP=p" zu wandeln (WikiSyntaxTextMod hat anscheinend bereits kurz nach der Umstellung der Vorlagen die entsprechenden Umsetzungen berücksichtigt). Insofern bedeutet ein monierter GND-Parameter in der Liste auch nicht unbedingt wie behauptet, dass im fraglichen Artikel in den zwölf Monaten vor September ein bewusster Normdateneintrag erfolgt ist. -- Thomas Berger (Diskussion) 00:57, 1. Dez. 2013 (CET)
- Was die Zielrichtung des "hoffentlich" betrifft: Hätte ich auch von selbst drauf kommen können. Und noch eine kleine Nachfrage, um sicherzustellen, dass ich nichts missverstanden habe: hinter "zwölf Monaten vor September" steht (a) die Überlegung, dass nachdem der letzte Abgleich aus Dezember 2012 [10] abgearbeitet war, zumindest theoretisch nur Neuprobleme auflaufen sollten. (b) irgendwo hakt es noch mit den Zeiträumen, warum nicht "10 Monaten vor Oktober" (= ca. 2012-12-20 – 2013-10-24). (Bitte um Nachsicht für die Nachfrage, bin dieser Tage aber stellenweise etwas verpeilt.) VG -- Make (Diskussion) 12:18, 1. Dez. 2013 (CET)
Fundsachen
- Till Kreutzer (2011): Open Data – Freigabe von Daten aus Bibliothekskatalogen [11] uA auch Aufdröselung der spez. urheberrechtlichen Aspekte bei Datenbanken. Ergänzung 07:03, 28. Nov. 2013 (CET) unter meta:Wikilegal/Database_Rights eine ziemlich frische, für die Foundation erarbeitete Einschätzung zur Rechtslage.
- Christoph Böhme (2013): Vortragsfolien Culturegraph [12] – auf S. 13 sind 150.000 GND-Wikipedia-Personenidentifikationen gezählt. Vorlage:NORMDATENCOUNT hat grob
250.000230.000 (TYP p). Wie kommt die Diskrepanz wohl zustande? Interessant auch die gezählten 5.500 Widersprüche bei den Lebensdaten.
culturegraph kannte ich bislang garnicht, die nutzen BEACON und Wikipedia-Kategorien, zB http://hub.culturegraph.org/about/11850391X/html VG -- Make (Diskussion) 01:48, 27. Nov. 2013 (CET)
- Danke, beides spannend zu lesen. Was die Anzahl der Datensätze betrifft, geht es in der Folie um GND-Einträge mit Lebensdaten; das könnte ein Grund für die unterschiedliche Zählung sein. --Kolja21 (Diskussion) 06:37, 27. Nov. 2013 (CET)
- Hmm, die Lebensdaten in Wikipedia schienen mir immer fast bestmöglich, idS dass, wenn die DNB (oder eine andere Quelle) Lebensdaten aufführt, dann sind sie auch in Wikipedia. Mir ist aber eine andere möglich Erklärung für die zahlenmäßige Diskrepanz eingefallen: 150.000 GND-Verknüpfungen entspricht etwa dem Stand Mitte 2011, siehe File:Normdatenentwicklung-de-wikipedia.png. Vielleicht benutzen die einen Wikipedia-Dump von damals und/oder haben schlicht ihre Folien nicht aktualisiert, denn 150.000 Verknüpfungen wurden auch schon im letzten Jahr gezählt: [13] (Folie 10). -- Make (Diskussion) 07:03, 28. Nov. 2013 (CET)
- Zu den Lebensdaten kurz: Mir ist in letzter Zeit mehrfach aufgefallen, dass es vorkommt, dass wir nur ein Geburtsjahr haben, die DNB aber auch den genauen Geburtstag (auch wenn dieser ja nicht über das Portal angezeigt wird). Ich hatte schon mehrfach überlegt, das man zu checken, bin aber derzeit nicht dazu gekommen. Als alleinige Quelle würde die DNB wohl auch kaum ausreichen, aber das Datum zu kennen macht die Recherche ja oft um einiges einfacher ;). --APPER\☺☹ 16:20, 28. Nov. 2013 (CET)
- quetsch Keine genaue Ahnung, ob das für einen Abgleich nützlich wäre: Im Export-Release 01/2014 sind folgende Änderungen in der GND-Konversion vorgesehen: - Änderung: Exakte Lebensdaten individualisierter Personen (Tp-Sätze) werden mit ausgeliefert. aus Änderung im Format RDFxml im Export-Release 01/2014, DNB-Datendienst, 2013-10-25. --Make (Diskussion) 12:32, 1. Dez. 2013 (CET)
- (1) apropos exakte Lebensdaten: aus [14] (Folie 22 zu hbz-Infoveranstaltung GND-Personendaten, November 2012):
- → Angabe exakter Lebensdaten bei lebenden Personen entfällt künftig
- betrifft Feld 548 … $4 datx
- Hintergrund: rechtliche Probleme
- gilt ab sofort, ELF wird angepasst
- → Angabe exakter Lebensdaten bei lebenden Personen entfällt künftig
- (2) So ein Abgleich der Lebensdaten wäre auch aus anderen Gründen spannend: Ich frag mich zB was hinter den 5.500 Personen mit Abweichungen zwischen GND und Wikipedia (Quote 3,7%) steckt: (a) Kann man die Zahlenverhältnisse reproduzieren? (b) Es wird dort echte Fehler geben, dabei wäre aufschlussreich, welches "Team" zuverlässiger gearbeitet hat. (c) Dann gibt es Abweichungen, die keine Fehler sind, sondern durch unterschiedliche Quellen begründet sind. (d) Ein weiterer Aspekt, der unter [15] angedeutet wird (dort Isolierung des Erscheinungsjahres): für einen gewissen Prozentsatz der Datensätze wird man die Lebensdaten vermutlich nicht automatisiert ermitteln können: 1% oder 0,1%? – Ein guter Grund, einen solchen Abgleich nicht durchzuführen, lauert ;-) bei (b) in Form von hunderten Fehlern in GND-Datensätzen. Was soll man damit machen? -- Make (Diskussion) 20:26, 28. Nov. 2013 (CET)
- Zu den Lebensdaten kurz: Mir ist in letzter Zeit mehrfach aufgefallen, dass es vorkommt, dass wir nur ein Geburtsjahr haben, die DNB aber auch den genauen Geburtstag (auch wenn dieser ja nicht über das Portal angezeigt wird). Ich hatte schon mehrfach überlegt, das man zu checken, bin aber derzeit nicht dazu gekommen. Als alleinige Quelle würde die DNB wohl auch kaum ausreichen, aber das Datum zu kennen macht die Recherche ja oft um einiges einfacher ;). --APPER\☺☹ 16:20, 28. Nov. 2013 (CET)
- Hmm, die Lebensdaten in Wikipedia schienen mir immer fast bestmöglich, idS dass, wenn die DNB (oder eine andere Quelle) Lebensdaten aufführt, dann sind sie auch in Wikipedia. Mir ist aber eine andere möglich Erklärung für die zahlenmäßige Diskrepanz eingefallen: 150.000 GND-Verknüpfungen entspricht etwa dem Stand Mitte 2011, siehe File:Normdatenentwicklung-de-wikipedia.png. Vielleicht benutzen die einen Wikipedia-Dump von damals und/oder haben schlicht ihre Folien nicht aktualisiert, denn 150.000 Verknüpfungen wurden auch schon im letzten Jahr gezählt: [13] (Folie 10). -- Make (Diskussion) 07:03, 28. Nov. 2013 (CET)
- mehr aus obigem PDF zur GND-Info auf Folie 13: Bearbeitungsrückstau bei den Personendaten: 2.000 Anträge. (Ich verstehe es so, dass sich die Zahl auf die Personenredaktion des/innerhalb hbz bezieht.) – Perspektive dazu aus Redaktionsbericht 2012 [16]: In 2012 hat die (nach meinem verständnis) gleiche Redaktion 2.891 Personen-Korrekturvorgänge durchgeführt (= 174 Korrekturen im Datensatz + 1599 Dublettenzusammenführungen + 816 Individualisierungen + 302 Datensatzlöschungen) = ca. 240 Vorgänge/Monat, 55 je Woche. Die Größenordnung passt genau zu "unserer" PND/F (und ist ähnlich ernüchternd ...) -- Make (Diskussion) 20:26, 28. Nov. 2013 (CET)
Kleine Änderungen bei VIAF
Nur als kleiner Hinweis: VIAF hat mal wieder die Benutzeroberfläche der Website leicht geändert. In den VIAF-Datensätzen sind jetzt wieder alle Einträge (auch GND und LCCN) mit den von VIAF übernommenen Inhalten der Normdatensätze ("Internal VIAF processed record") verlinkt. Die externen Datenbankeinträge bei GND und LoC sind jetzt über einen Klick auf die Flagge erreichbar. Außerdem ist VIAF jetzt auch via HTTPS erreichbar. --Kam Solusar (Diskussion) 02:22, 1. Dez. 2013 (CET)
- Danke für den Hinweis, mein Skript greift jetzt auf VIAF unter dem Protokoll zu, unter dem man bei Wikipedia angemeldet ist. --Schnark 09:23, 2. Dez. 2013 (CET)
- Auch von mir danke für den "Flaggen-Trick". -- Jesi (Diskussion) 12:57, 2. Dez. 2013 (CET)
- Ich hatte den auch nicht entdeckt, nur wahrgenommen, dass der "internal processing Record" nun einen Link auf "original authority source" anbietet.
- @Schnark: Weiterhin ist es so, dass die gezeigte Normdatennummer in VIAF bei Nicht-Personen (und Nicht-Neuen) die falsche ist (nämlich die "PICA-PPN" des Satzes), die verlinkte hingegen ist korrekt (enthält dann eine "Nummer" mit Bindestrich). Das war jahrelang nicht aufgefallen, weil für Personen PICA-PPN und Normdatennummer identisch sind. -- Thomas Berger (Diskussion) 13:05, 2. Dez. 2013 (CET)
- Die Webschnittstelle für menschliche Benutzer und die von meinem Skript verwendete Datenschnittstelle haben erstaunlich große Abweichungen. Zum einen bekommt mein Skript über viaf.org die NDL nicht heraus, obwohl sie angezeigt wird. Zum anderen sind die Angaben bei Nicht-Personen dort noch merkwürdiger. Abgesehen davon, dass http://viaf.org/viaf/AutoSuggest?query=Deutschland nicht die Daten von Deutschland enthält, sind die Angaben zur GND grundsätzlich die ohne Bindestrich, etwa beim Eintrag "Deutschland" (der für die DDR steht) und nur ein "dnb":"040118908" hat, während GND 4011890-3 verschwiegen wird. Gleich der erste Eintrag zu "Deutschland. Presse- und Informationsamt" hat übrigens zwei Einträge "dnb", zugreifen könnte ich nur auf den, der als zweiter kommt. Insofern kann (und sollte) mein Skript bei Nicht-Personen nichts mit viaf.org tun. --Schnark 09:48, 3. Dez. 2013 (CET)
LCCN mit oder ohne führende Null?
Unter Vorlage:LCCN#Parameter steht, dass man die führende Null nicht angeben soll, nun ist aber ein Benutzer unterwegs, der die Null wieder einfügt, siehe Spezial:Beiträge/Пробегающий. Die Links funktionieren bei LCCN auch mit der Null. Ist das okay so? Wenn nicht: kann jemand, der sich mit der Vorlage besser auskennt, den Benutzer anschreiben? Grüße, ElRakı ?! 23:24, 6. Dez. 2013 (CET)
- Ich habe ihn mal angesprochen. --Mai-Sachme (Diskussion) 15:47, 21. Dez. 2013 (CET)
Ich versuche gerade mit dem Kollegen zu kommunizieren, leider scheint er ausschließlich Russisch zu können (kann das hier jemand?). Seine Einfügungen mit führender 0 kann er aber offenbar inhaltlich begründen, Google Translate übersetzt mir seine Antwort so: Hallo! Keine in einer anderen als russische , sorry Sprache. Wechselfälle der maschinellen Übersetzung zu verfälschen Gedanken. Ich bin mir bewusst, was Sie schreiben. Aber lassen Sie mich zu streiten. 1) Die Änderungen werden durchgeführt, um Fehlermeldungen zu beseitigen. 2) Die Nullstellen sind in den Links auf der Website, ISNI , LCCN , NDL und andere. Wiki verkürzt Aufnahme innerhalb ungeschriebenen Zugabe von Nullen. Warum machen für das Auto das Leben schwer ? 3) In einigen Fällen die Beseitigung von Nullstellen zu Fehlern führt , fehlerhafte Verbindungen . 4) Bei der Ausrichtung von Text -Dump der Probleme können mismatch " 362 " nicht gleich " 00362 " entstehen . 5) Als ein Mann , Akribie , bevor ich kategorisch nicht ausstehen kann Ungereimtheiten. Mit freundlichen Grüßen. --Mai-Sachme (Diskussion) 12:03, 24. Dez. 2013 (CET)
- Es wäre schön, wenn ihm jemand inhaltlich begründen könnte, wieso wir die 0en streichen (kann ich leider nicht). In einfachem Deutsch sollte das wohl auch funktionieren, Übersetzungsmaschinen kann er wohl bedienen. --Mai-Sachme (Diskussion) 12:06, 24. Dez. 2013 (CET)
- Auch in der russischen Wikipedia ist der Vorlagenparameter noch dreigeteilt. Ansonsten siehe die Diskussion d:Property_talk:P244#Format_Summary: Für Wikidata wurde dieses Jahr entschieden, dass man gefahrlos die Nummernform der Vorlage nehmen kann, ohne zusätzliche Bereinigungen und Kennzeichnungen. Ich glaube auch nicht mehr, dass wir je eine andere Form als für die derzeitigen Links benötigen, die Dreiteilung ist damit obsolet. Der fragliche Benutzer scheint aber durchaus dreizuteilen, und es geht nur um die führenden Nullen im dritten Abschnitt der aufbereiteten Nummer? Das scheint die Normdaten-Vorlage zu tolerieren und ich denke, wir können das auch. Das dürfte übrigens auch fehlertoleranter sein, wenn der mittlere Teil falsch vier- statt zweistellig oder umgekehrt erfasst ist. -- Thomas Berger (Diskussion) 14:37, 24. Dez. 2013 (CET)
Denkmalnummer als Normdaten?
Siehe Wikipedia Diskussion:WikiProjekt Denkmalpflege#Denkmalnummer als Normdatensatz.--Leit (Diskussion) 20:51, 8. Jan. 2014 (CET)
Geburtsdatum abweichend in der GND
Am Beispiel Şiir Eroğlu bitte mir erläutern, was man tun muss, damit das abweichende Geburtsjahr in der DNB hier dokumentiert wird. Hier steht 1961, dort 1965, aber es ist schon ein- und dieselbe Person. --Norma Daten (Diskussion) 15:24, 15. Feb. 2014 (CET)
- Also ich sehe erstmal das Problem, dass der komplette Artikel nicht belegt ist. Die DNB gibt bei ihrem Eintrag zu Siir Eroglu einen Link auf die Homepage von Siir Eloglu [17]. Hierbei handelt es sich aber um ein Schauspielerin und keine Autorin. Zur Autorin Eroğlu, habe ich nichts gefunden, außer dem von mir gefixten Weblink. Dort wird übrigends 1961 als Geburtsjahr angegeben--Varina (Diskussion) 16:13, 15. Feb. 2014 (CET)
- :-) Hallo Varina, durch die Homepage habe ich mich auch zuerst irritieren lassen, auf der Seite Biographie gibt es aber einen Schalter "Weiter" und dort wird dann auch über die Autorin berichtet. Die Normdaten gehören eindeutig zu der Person Şiir Eroğlu.
- Und nun die Antwort auf die ursprüngliche Frage. Solche Korrekturen kannst Du auf der Seite WP:PND/F eintragen. Da ich aber Deine Bearbeitungen von unten nach oben gesichtet habe. Habe ich erst jetzt bemerkt, dass Du diese Frage hier gestellt hast und bereits alles notwendige erledigt :-( Ich Hoffe, Du fühlst Dich jetzt von mir nicht beformundet. Viele Grüße Silke (Diskussion) 16:26, 15. Feb. 2014 (CET)
- Offenbar handelt es sich um einen Tippfehler (1965 ist das Jahr, in dem die Autorin nach Dtl. gezogen ist). Ich habe die Quelle, auf die sich die GND-Personenredaktion bezieht, nachgetragen. --Kolja21 (Diskussion) 23:53, 15. Feb. 2014 (CET)
Falsches Geschlecht
Die DNB macht Constance Collier zum Mann, siehe hier. Was kann man da machen? --Jack User (Diskussion) 14:26, 16. Feb. 2014 (CET)
- Hallo Jack User, melde solche falschen Zuordnungen auf der Seite WP:PND/F, kommt leider öfter mal vor... Viele Grüße --Silke (Diskussion) 14:41, 16. Feb. 2014 (CET)
- Danke. --Jack User (Diskussion) 14:43, 16. Feb. 2014 (CET)
Nicht-personalisierter LCCN-Datensatz?
Bin gerade hier zum ersten Mal auf einen VIAF-Datensatz gestossen, wo ein LCCN-Datensatz den Zusatz "(undifferentiated)" hat. Der dortige Link zu id.loc.gov klappt bei mir jedenfalls nicht, lccn.loc.gov und errol.oclc.org dagegen schon. Gibt es das öfters? --Kam Solusar (Diskussion) 23:01, 28. Mär. 2014 (CET)
- LoC (undifferentiated): Nein zum Glück nicht; habe noch keinen vergleichbaren Fall gesehen. (Der id.loc-Link lässt sich bei mir problemlos aufrufen.) --Kolja21 (Diskussion) 04:34, 30. Mär. 2014 (CEST)
- Ah, jetzt klappt der Link bei mir auch. Hatte an dem Tag irgendwie nur Timeouts beim Aufrufen des Links bekommen. --Kam Solusar (Diskussion) 19:35, 31. Mär. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: APPER\☺☹ 17:29, 12. Jun. 2014 (CEST)
VIAF-Weiterleitungen
Hi, unter Benutzer:APPER/VIAF gibt es noch einige VIAF-Weiterleitungen, die von Hand gefixt werden müssen. --APPER\☺☹ 00:19, 21. Mai 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: APPER\☺☹ 17:30, 12. Jun. 2014 (CEST)
Leere Normdatenvorlage
Nachdem ich auf WP:FZW hierher verwiesen wurde, stelle ich meine Frage hier nochmal: Welchen Mehrwert bringt es, wenn eine leere Normdatenvorlage ({{Normdaten|TYP=p|GND=|LCCN=|NDL=|VIAF=}} in einen Personenartikel eingefügt wird (leer, weil es keine entsprechenden Einträge in den Datenbanken gibt)? Mir erscheint das irgendwie sinnlos. Es erscheint dann zwar ein Link zur Personensuche auf toolserver.org, aber ich sehe nicht, inwiefern das eine Verbesserung von Artikeln sein soll. --JLKiel 08:51, 9. Mär. 2014 (CET)
- Dazu gibt es sicher unterschiedliche Meinungen, ich denke, eine komplett leere Vorlage ist nicht nötig. Wenn GNDfehlt/GNDCheck angegeben ist, dann ist ersichtlich, dass geprüft wurde und keine GND gefunden wurde. So oder so wird ein Link auf die Personenzusammenfassung der Personensuche angezeigt, aber wenn es keine Normdaten gibt, sind die Zusatzinfos dort auch marginal. Also die Kurzantwort: Das rechtfertigt keine Bearbeitung, weder zum Einfügen noch zum Entfernen... --APPER\☺☹ 12:16, 9. Mär. 2014 (CET)
- In der Regel steht {{Normdaten|TYP=p}} dafür, dass der Eintrag auf Normdaten hin überprüft wurde, aber ohne Zeitangabe ist der Hinweis natürlich wenig aussagekräftig. --Kolja21 (Diskussion) 02:21, 10. Mär. 2014 (CET)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Erneut aktualisiert: Benutzer:Gymel/GND-Probleme
Anhand des aktuellen Dumps 2014-03-20 habe ich die Auswertungen erneut vorgenommen, Vergleichsdatenbestand ist der GND-Abzug vom Februar, fortgeschrieben ebenfalls bis zum 20.3. Dabei erst fiel auf, dass der vorige Abzug vom Oktober 2013 wohl nicht ganz komplett gewesen war...
Lt. Vorlage:NORMDATENCOUNT sind inzwischen nur noch etwa 10% der GND-Nummern über den auslaufenden Vorlagenparameter "PND" erfasst, allerdings wird die Umwandlung wohl weitestgehend mit Gadgets betrieben, möglicherweise auch VIAF-basierend, diese Bearbeitung finde ich jedenfalls irritierend.
Die gelisteten 650 Zuordnungen von Tn-Sätzen im GND-Parameter sind jedenfalls seit Oktober in die Artikel eingetragen worden, ich nehme an, dass es sich überwiegend um neue Artikel bzw. Ersteinträge von Normdaten handelt und wir auch in Zukunft mit Irrtümern in dieser Größenordnung umzugehen haben. Besserung dürfte erst dann entstehen, wenn in der GND die Tn-Sätze zahlenmäßig in den Hintergrund treten (derzeit 4.675.000 Tn gegen 3.043.000 Tp). -- Thomas Berger (Diskussion) 00:45, 23. Mär. 2014 (CET)
- Hm, hast du Pelz darauf angesprochen? --Mai-Sachme (Diskussion) 20:35, 23. Mär. 2014 (CET)
- Nein, ich glaube nicht, dass er sich erinnern würde und warte lieber, ob noch mehr "irritierende" Bearbeitungen (durch wen auch immer) auffallen: Vielleicht ergibt sich ja ein Bild. -- Thomas Berger (Diskussion) 01:06, 24. Mär. 2014 (CET)
- Aufgrund des heutigen Postings auf meiner Disk von Benutzer:FA2010 bin ich auch hier gelandet. Es tut mir leid, wenn ich in einigen Fällen (unbewußt) Normdaten falsch verändert habe. Entschuldigung, denn es war natürlich nicht meine Absicht, irgendjemand hier zusätzliche Arbeit zu machen. Mein persönlicher Ansatz für die Abarbeitung der Wartungsliste sind die PD. Ich habe mal meine Änderungen von einem Tag nachträglich angesehen und komme dabei zu dem Ergebnis, dass ca. 60,5% meiner Edits auch Änderungen an den Personendaten, Kats oder im Artikel waren. Wenn ich den Artikel mal auf dem Schirm habe und offensichtlich keine sonstigen Änderungen notwendig sind, dann scheint mir doch die Änderung von "PND" auf "TYP=p|GND" zunächst unproblematisch zu sein. Gerne werde ich ab sofort darauf achten, dass irgendwelche Änderungen an den Nummern durch das Script von Schnark nicht mehr vorkommen. Viele Grüße in die Runde --Pelz (Diskussion) 21:55, 3. Apr. 2014 (CEST)
- O.k., halten wir also fest, dass es sich wohl um einen Effekt von normdaten.js im Zusammenhang mit dem veralteten "PND"-Parameter in der Normdatenvorlage handelt. Ich will einmal versuchen das zu reproduzieren, 20.000 Artikel mit dieser Konstellation in der Vorlage sind ja noch vorhanden. -- Thomas Berger (Diskussion) 00:35, 4. Apr. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Wollen wir wirklich
abertausende Einträge, in denen in der Vorlage nichts außer "keine gefunden" steht? Das sollte doch eine Ausnahme bleiben, bei denen, für die wirklich dringend Normdaten sinnvoll erscheiunen. Benutzer:Jack User fügt das aber bei allen Schauspielern ein, die er gerade systematisch durchgeht. Das ist m. E. völlig nutzlos und nervt nur (wie auch alle anderen Normdaten-Edits dieses Benutzers). Sollten wir dafür eine Regel entwerfen? --FA2010 (Diskussion) 11:35, 2. Apr. 2014 (CEST)
- Ja, das war eigentlich der Plan: Zu dokumentieren, dass jemand bereits gesucht hat, damit das im Fall von "nicht gefunden" nicht ständig und in Unkenntnis der Akivitäten anderer unabhängig voneinander wiederholt wird. Es sollte uns also Doppelarbeit sparen. 2012 haben wir dann angefangen, das durch die Kategorisierung monatsweise zu gliedern und damit quasi auf Wiedervorlage zu setzen. Die Altlasten gingen da bis 2007 oder 2009 zurück und wurden dann systematisch nachkontrolliert. Lange Zeit auch von mir. In letzter Zeit - vor allem durch das unermüdliche Wirken von @Trier1954: - ist die Abarbeitung in zeitliche Regionen vorgestossen, die nahe am GND-Umstellungsdatum April/Mai 2012 liegen, ab wo die Zahlen explodieren, und zudem beginnen, mit dem Backlog der PND-Fehlermeldungen zu interferieren. Ich denke auch, dass wir einen frischen Plan brauchen, wie es weitergehen soll, möchte aber auf den expliziten Vermerk, dass und wann die GND im Hinblick auf die Person überprüft wurde, eigentlich nicht verzichten. -- Thomas Berger (Diskussion) 12:43, 2. Apr. 2014 (CEST)
- Konkret zu Schauspielern: Da ist ja gerade ein Projekt IN2N angelaufen, das alle Personen aus http://filmportal.de/ in die GND überführen soll (ausdrücklich als Pilotprojekt im Hinblick auf weitere Personengruppen und andere Dokumentationseinrichtungen). Das sind mindestens die hier durch die Vorlage:filmportal.de Name abgedeckten, die werden damit demnächst alle garantiert eine GND-Nummer besitzen, dabei die knapp 300, die derzeit noch gar keine Normdaten-Vorlage haben sowie die ca. 1150, die derzeit Normdaten ohne GND tragen (ermittelt über catscan unter Abzug von [18]). D.h. Strategien wie "filmportal" (oder Kategorie deutscher Filmschauspieler) plus "GNDCheck vor 2015-01-01" sind dann m.E. genau die richtigen um solche Pauschalerweiterung der Normdatei um gewisse Personengruppen hier systematisch nachzuvollziehen. -- Thomas Berger (Diskussion) 12:57, 2. Apr. 2014 (CEST)
- Ja, das klingt doch gut. Entsprechende Wartungslisten sind kein Problem. Weißt du, wann die ersten GNDs eingespielt werden sollen? Ab wann sich der Aufwand lohnt? --APPER\☺☹ 13:06, 2. Apr. 2014 (CEST)
- Nach Gemeinsame_Normdatei#Institutionenüergreifende_Integration_von_Normdaten, http://in2n.de/ und [19] sind sie im Dezember 2014 fertig. Abgleich (mit Resultat entweder Identifikation oder Anlage eines Neusatzes in der GND) ist demnach Teil von AP 4, ich denke aber, dass das parallel läuft und mindestens bis Projektende dauert (danach kommt ja der "Regelbetrieb"). Mir scheint, dass das auch im Projektzeitraum als kontinuierlicher Prozess gedacht ist und sich nicht in Masseneinspielungen äußert, offen bleibt die Frage, ob damit schon begonnen wurde. -- Thomas Berger (Diskussion) 14:47, 2. Apr. 2014 (CEST)
- Ja, das klingt doch gut. Entsprechende Wartungslisten sind kein Problem. Weißt du, wann die ersten GNDs eingespielt werden sollen? Ab wann sich der Aufwand lohnt? --APPER\☺☹ 13:06, 2. Apr. 2014 (CEST)
- (BK) Ich finde das nicht wirklich schlimm, aber für nötig halte ich es auch nicht. Ich hatte das früher in Artikel gemacht, bei denen es GND-Einträge gab, die recht ähnlich waren (Namensgleichheit und gleiches Geburtsjahr z.B.). Damit war klar, dass man bei erneuter Recherche vorsichtig sein muss. Dadurch, dass die leeren Vorlagen jetzt im großen Stil in Artikeln sind, funktioniert das aber sowieso nicht mehr. Insofern erhöhen die vielen Vorlagen für mich eher die Arbeit, aber es geht hier ja nicht um mich ;).
- Was mit den ganzen Einträgen in den Wartungskategorien geschehen soll, weiß ich aber auch nicht. Da sind wir wohl ein wenig konzeptionslos... --APPER\☺☹ 13:03, 2. Apr. 2014 (CEST)
- Danke auch vom Benutzer, dessen alle anderen Normdaten-Edits gewisse andere Benutzer nerven, die von Normdaten und deren Zweck wenig bis keine Ahnung haben, aber draufloskrakeelen. Vielleicht erspart er sich ja ab sofort das Trümmerfeld aufzuräumen (eine übrigens dumme Aussage). Wenn er sich dann noch einen freundlichen Tonfall zulegt - umso besser. Zudem sind die (leider derzeit) leeren Normdatenvorlagen genau deswegen von mir gemacht worden: um Zu dokumentieren, dass jemand bereits gesucht hat. Aus sonst keinem anderen Grund. --Jack User (Diskussion) 18:52, 2. Apr. 2014 (CEST)
- Noch ein Zusatz: ich editiere hauptsächlich die Normdaten bei Stummfilmschauspielern plus-minus ein paar Filmakteuren um den Zeitdreh. Dabei achte ich auch ausdrücklich darauf, die Filmportal.de-Namensvorlage einzubinden. Entweder, indem ich alte Einbindugen aktualisiere (siehe hier oder ganz einfach neu hinzfüge. Das das jemanden nicht paßt - ein Späßchen... --Jack User (Diskussion) 19:00, 2. Apr. 2014 (CEST)
- Ich weiss nicht genau, wem Du weiter oben wofür dankst, aber beim der von Dir gezeigten Trümmerfeld-Aussage geht es wohl darum, dass Du allzu leichtfertig ein "nichts gefunden" dokumentiert hast. Auch das würde wegen der Wiedervorlage-Funktion nach einigen Jahren wahrscheinlich irgendwann von einem anderen Benutzer gerichtet werden, ohne Deinen Eintrag in der Vorlage würde es aber vielleicht schneller auffallen. Dein "nichts gefunden" mag ja subjektiv sogar gestimmt haben, es muß aber ganz deutlich gesagt werden, dass ein GNDfehlt-Eintrag in der Normdatenvorlage eine gewisse Gründlichkeit der Recherche erfordert, sonst wird der Mechanismus insgesamt entwertet. -- Thomas Berger (Diskussion) 19:12, 2. Apr. 2014 (CEST)
- Und woher kommt die Aussage, dass ich allzu leichtferig nichts gefunden dokumentiert habe. Weil dir der eine oder andere Fehler aufgefallen ist und weil du (und andere) fehlerfrei bist (bzw. sind)? Die allermeisten Artikel, die ich mit Normdaten versehen habe, verstauben seit Jahren vor sich hin. Welche Wiedervorlage mit welchem Datum meinst du? Wiedervorlage: "Sankt Nimmerlein"? Ich verwende die Schnarksche Personendatenvorlage, die Vorschläge auswirft. Wenn ich da nichts finde bzw. unsicher bin, dann schreibe ich eben fehlt rein, denn besser eine leere Vorlage in einem ewig unberührten Artikel als eine falsche GND-Nummer drin. Das reicht als gewisse Gründlichkeit. Außerdem hatte ich letzten Monat 3718 Edits im ANR. Und wenn meine Fehlerquote beim leichtfertigen Dokumentieren nur zwei Prozent betrüge, wären das 74 Fehler. Du kannst ja alle meine Edits des letzen Monats durchgucken, oder aber besser: akzeptieren, dass eine gewisse Fehlerquote im Toleranzbereich liegt. Was aber meiner Meinung gar nicht geht, ist der oben genannte Vorwurf des leichtfertigen Dokumentierens. Genau das mache ich nämlich nicht. --Jack User (Diskussion) 19:46, 2. Apr. 2014 (CEST)
- Im übrigen bin ich genau der gegenteiligen Meinung würde es aber vielleicht schneller auffallen. Denn ohne Eintrag in einer Wartungskategorie gibt es keine Wiedervorlage bzw. nur eine umständliche. Wartungskategorien können schneller abgearbeitet werden als Artikel ohne selbige. Und die Diskussion hier beweist mir auch das ich Recht habe: denn wenn ich keine Vorlage einbinden würde, würden die Artikel weiter unnormgedatet vor sich hindümpeln. Aktuelles Beispiel siehe diese Verso: seit zwei Jahren hat da niemand nachgeschaut. Bei den Vorschlägen war kein "Herbert Nitzscke" dabei, deswegen von mir mit einer leeren Vorlage ausgestattez, zudem die Filmportal.de-Name-Vorlage werwendet. --Jack User (Diskussion) 19:54, 2. Apr. 2014 (CEST)
- Nächstes Beispiel: soll ich bei Rudolf Pfenninger etwa die Tn 125537093 eintragen, nur weil es zeitlich paßt? Nö, nicht sicher. Normdaten fehlen. --Jack User (Diskussion) 20:01, 2. Apr. 2014 (CEST)
- Vor allem solltest Du - das ist nämlich der Bereich, wo ich Dir seit zwei Monaten systematisch hinterherkorrigieren muss - dir die Zeit nehmen, Hilfe:GND zu lesen und den Unterschied zwischen Tn und Tp verstehen. Sowohl Deine Argumentation oben als auch Deine Betätigung auf WP:PND/F (die Gesamtschau Deiner Normdateneinträge kann ich nicht einschätzen, dazu hat FA2010 sich geäußert) zeigen m.E. dass Du sehr wenig Ahnung von den Hintergründen und auch den Formalia dieses Bereichs hast. Das verlangt auch niemand von Dir, aber es wird Dir umgekehrt auch nicht gelingen, Deine Edits als besonders qualifizert darzustellen. -- Thomas Berger (Diskussion) 22:15, 2. Apr. 2014 (CEST)
- Oder auch Hilfe:Normdaten. --Mai-Sachme (Diskussion) 22:20, 2. Apr. 2014 (CEST)
@FA2010 Ich trage das "Kein GND-Personendatensatz" nur ein, damit andere nicht zeitnah und somit sinnlos ebenfalls in der DNB nach den entsprechenden Normdaten suchen müssen. Das es Wartungskategorien dazu gibt, die von manchen abgearbeitet werden, war mir nicht bekannt. Unausgegorener Vorschlag: Eventuell (um die Wartungskategorien zu entlasten) könnte man bei "Kein GND-Personendatensatz" ja zusätzlich mit angeben, dass ein entsprechender Eintrag in der DNB nicht nur fehlt, sondern auch eingerichtet werden sollte (z.B. weil die Person sehr bekannt ist oder so). Das ist natürlich alles etwas Ansichtssache würde aber vielleicht helfen. Ich persönlich jedenfalls versehe auch Personenartikel mit "Kein GND-Personendatensatz" bei denen ich nicht unbedingt auf einen Eintrag in der DNB bestehen müsste.--Eddgel (Diskussion) 04:18, 29. Apr. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Nonnweiler
Nonnweiler hat wie es aussieht zwei Einträge: [20] und [21]. Welcher soll mit der Vorlage:Normdaten im Artikel verlinkt werden? 85.212.38.87 21:30, 3. Apr. 2014 (CEST)
- Nochwas: Schwabsoien hat keinen Normdaten-Eintrag. Könnte das jemand melden? 85.212.38.87 17:12, 5. Apr. 2014 (CEST)
- Bei Geografika kommt es noch relativ häufig vor, dass es zwei Datensätze gibt. Das kommt daher, dass es früher getrennte Datensätze der Gemeinsamen Körperschaftsdatei und der Schlagwortnormdatei gab und diese jetzt nach und nach zusammengeführt werden. Wenn ich mich recht erinnere, "gewinnt" dabei i.d.R. der Datensatz, dessen Nummer mit einer "4" beginnt, hier wäre das also der zweite Eintrag. Falsch machen kann man im Grunde genommen aber nichts dabei, da der "unterlegene" Datensatz nach der Zusammenführung auf den "Gewinner" weiterleiten wird. Ist im Artikel der "unterlegene" Datensatz angegeben, landet der Artikel ggf. dann auf einer Wartungsliste hier in der Wikipedia und wird zeitnah aktualisiert werden. Gruß, --Kam Solusar (Diskussion) 22:07, 5. Apr. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Links von der DNB auch bei Nicht-Personendatensätzen
Hab gerade gemerkt, dass auf d-nb.info neben Personen jetzt ja auch alle anderen Arten von Normdatensätzen Links zu den entsprechenden Wikipedia-Artikeln haben. Hatte ich bis das jetzt nur nie gemerkt (schaue mir den rechten Rand aber auch seltenst genauer an) oder ist das relativ neu? --Kam Solusar (Diskussion) 21:54, 5. Apr. 2014 (CEST)
- Ich weiß es nicht 100%ig, aber die entsprechenden GNDs sind schon eine Weile in meinen BEACON-Dateien (die die DNB nutzt) und da das DNB-Portal für Personen nicht wirklich anders programmiert ist als für andere, denke ich, dass das schon länger der Fall ist. --APPER\☺☹ 02:10, 6. Apr. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Unser besonderer Freund Benutzer:Jack User hat da schon 2013 geschrieben "ich lösche die DNB-Portal-Vorlage eigentlich immer". Wie kann man diese seine Edits pauschal herausfinden und revertieren? Dieser Typ macht mich noch verrückt mit seiner stetigen Arbeitsbeschaffung. --AndreasPraefcke (Diskussion) 18:29, 20. Apr. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Parameter GNDfehlt bei Nicht-Personen
Gerade gesehen, könnte es die Eintragung des Parameters GNDfehlt bei Nicht-Personen öfter geben?
Zusätzliche Frage: Tauchen diese Fälle inzwischen in Wartungslisten/-kategorien auf oder könnte es da ebenfalls neue Fälle geben? --Mai-Sachme (Diskussion) 16:40, 23. Apr. 2014 (CEST)
- Ich habe selber bereits den Parameter GNDfehlt (oder war es GNDCheck?) bei Nicht-Personen eingetragen. Einerseits ist es ja analog - jemand hat gesucht und dokumentiert, dass nichts zu finden war - andererseits gibt es durchaus Unterschiede: Bei Personenartikeln ist recht klar, dass es einen GND-Satz geben bzw. jederzeit einer entstehen könnte, bei anderen Artikeln hingegen ist das oft pure Spekulation, insbesondere wenn sich auch in allen VIAF bekannten Normdateien nichts einschlägiges finden lässt.
- Zu den Vorlagenparametern: M.W. ist das in der Vorlagensprache nicht vorgesehen / nicht erlaubt und insofern bietet sie leider auch keine Mittel, darauf zu reagieren. Im letzten Dump waren es knapp 60 Dopplungen bei den Parametern, meist harmlose wie gedoppelter TYP, nicht unbedingt harmlose wie übriggebliebene leere Platzhalter, aber eben auch die Versuche, mehr als eine Nummer zu notieren. Die meisten habe ich soeben korrigiert, 20 sind noch übrig:
- Max Glatt - |TYP=p|LCCN=n/50/29898|VIAF=79316885|GNDName=108824020|GNDName=153182962|GNDfehlt=ja|GNDCheck=2013-06-24
- Elisabeth Steup - |TYP=p|VIAF=42382391|GNDName=108475751|GNDfehlt=ja|GNDCheck=2012-03-16|VIAF=74847860
- Nis Bank-Mikkelsen - |TYP=p|TYP=p|GND=137456034|LCCN=n/95/076971|VIAF=73105501
- Jan Jaszczanin - |TYP=p|GND=|LCCN=no/2002/11453|VIAF=303670833|VIAF=163781673|GNDName=179448803|GNDfehlt=ja|GNDCheck=2013-10-23
- Richard Thomas Baker - |TYP=p|LCCN=nb/90/695310|VIAF=56100555|GNDName=179111078|GNDName=153149469|GNDfehlt=ja|GNDCheck=2013-05-27
- Frank A. McClintock - |TYP=p|LCCN=no/2010/38166|VIAF=108034821|GNDName=180351176|GNDName=187571481|GNDfehlt=ja|GNDCheck=2013-06-21
- Lasse Werner - |TYP=p|LCCN=nr/93/20230|VIAF=67589402|GNDName=131079263|GNDName=104536756|GNDfehlt=ja|GNDCheck=2013-05-29
- Sächsischer Kunstverein - |TYP=k|GND=16314259-2|GND=4415567-0|GND=508973-6
- Felix Landois - |TYP=p|GND=116677996|VIAF=52447797|VIAF=34853600
- H. Dieter Dahlhoff - |TYP=p|VIAF=173007337|VIAF=76876452|GND=1013444078|GND=1020721707|LCCN=n/79/143278</text>
- Brigitte Haar - |TYP=p|GND=113764340|LCCN=|NDL=|VIAF=nr/2007/10350|VIAF=30221200|GNDName=1013564898
- Georg Gruber (Komponist) - |TYP=p|GND=|LCCN=no/2006/104842|VIAF=56374489|VIAF=56374489|GNDfehlt=ja|GNDCheck=2013-09-21
- Angela Hartley Brodie - |TYP=p|GND=|LCCN=n/85/158906|VIAF=93366710|GNDName=152097732|GNDfehlt=ja|GNDCheck=2013-10-06|GNDName=179852310|VIAF=285984582
- Hans-Günter Gießmann - |TYP=p|GND=|LCCN=|NDL=|VIAF=32460660|GNDName=105459550|GNDName=128284897|GNDfehlt=ja|GNDCheck=2013-11-22|REMARK=
- Fritz Mietzsch - |TYP=p|GND=117028754|LCCN=|NDL=|VIAF=274703738|GNDName=101188870|GNDCheck=2013-11-22|REMARK=|VIAF=64773260
- Margarethe Klinckerfuß - |TYP=p|GND=116228547|LCCN=n/2004/063610|NDL=|VIAF=1862496|VIAF=57361185|GNDCheck=2013-11-25|REMARK=
- Konstantinos Minas - |TYP=p|GND=104327995|LCCN=nr/97/018121|VIAF=61986166|VIAF=292257451
- Hildegard Westerkamp - |TYP=p|GND=121538079|LCCN=|VIAF=8245310|LCCN=no/97/061373
- Eric Warren Singer - |TYP=p|GND=|LCCN=|LCCN=n/96/45926|VIAF=263158069
- Lisa Herzog - |TYP=p|GND=1035836599|LCCN=|NDL=|VIAF=223804516|GNDName=1019395877|GNDfehlt=|GNDCheck=2014-04-06|REMARK=|LCCN=no/2012/9404
- Danke, ich kümmer mich gleich darum.
- Zu den Nicht-Personen: Wenn das zulässig ist, dann sollte aber auch der Text in der Vorlage angepasst werden. Hier lese ich Kein GND-Personendatensatz. Wäre bei einer japanischen Erzählung auch etwas überraschend ;-) --Mai-Sachme (Diskussion) 09:21, 24. Apr. 2014 (CEST)
- Bitte GNDfehlt drinlassen, wie sollte man sonst diese Abfrage durchführen? 85.212.38.87 20:48, 27. Apr. 2014 (CEST)
- Kann man machen, aber erneut: Der aktuelle Anzeigetext nach Eintragung von GNDfehlt lautet Kein GND-Personendatensatz (bitte Fettschrift beachten). Es ist schon recht seltsam, wenn wir so etwas in Städteartikeln vermerken. --Mai-Sachme (Diskussion) 21:29, 27. Apr. 2014 (CEST)
- Was für ein Anzeigetext? In Artikeln? Seh ich nix. 85.212.38.87 22:50, 27. Apr. 2014 (CEST)
- Seufz, bereits gepostet und verlinkt, aber gerne noch mal:
- Ochikubo Monogatari ist eine japanische Erzählung aus der Heian-Zeit.
- Bereits in der Erstversion hatte der Artikelersteller mittels GNDfehlt=ja vermerkt, keinen GND-Satz gefunden zu haben.
- Daraufhin erschien in der Normdatenvorlage (bitte hier draufklicken und runterscrollen) der Vermerk Kein GND-Personendatensatz. Ich halte das für inhaltlichen (pardon) Quatsch, weil eine Erzählung per se keinen Personendatensatz haben kann.
- Daraus ergab sich für mich die Vermutung, dass der Parameter GNDfehlt=ja nur bei Personen eingesetzt werden sollte. Falls er auch für Werke, Körperschaften usw. gedacht ist (nichts dagegen), müsste der Anzeigetext angepasst werden. --Mai-Sachme (Diskussion) 23:06, 27. Apr. 2014 (CEST)
- Ach, gerade fällt's mir auf: Du bist ja ne IP, den Anzeigetext sehen nur angemeldeten Benutzer. Änderungsbedarf besteht trotzdem. --Mai-Sachme (Diskussion) 23:10, 27. Apr. 2014 (CEST)
- Definitiv. Welchen Sinn hat es, im Anzeigetext zwischen angemeldeten und nicht angemeldeten Benutzern zu unterscheiden? 85.212.38.87 21:59, 28. Apr. 2014 (CEST)
- Ach, gerade fällt's mir auf: Du bist ja ne IP, den Anzeigetext sehen nur angemeldeten Benutzer. Änderungsbedarf besteht trotzdem. --Mai-Sachme (Diskussion) 23:10, 27. Apr. 2014 (CEST)
- Seufz, bereits gepostet und verlinkt, aber gerne noch mal:
- Was für ein Anzeigetext? In Artikeln? Seh ich nix. 85.212.38.87 22:50, 27. Apr. 2014 (CEST)
- Kann man machen, aber erneut: Der aktuelle Anzeigetext nach Eintragung von GNDfehlt lautet Kein GND-Personendatensatz (bitte Fettschrift beachten). Es ist schon recht seltsam, wenn wir so etwas in Städteartikeln vermerken. --Mai-Sachme (Diskussion) 21:29, 27. Apr. 2014 (CEST)
- Bitte GNDfehlt drinlassen, wie sollte man sonst diese Abfrage durchführen? 85.212.38.87 20:48, 27. Apr. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Happy Birthday GND
Heute vor zwei Jahren wurde die Gemeinsame Normdatei erstmals in der deutschsprachigen Wikipedia eingesetzt. Mittlerweile sind rund 260.000 Artikel mit der GND verlinkt. Die meisten davon (219.261) sind Biografien. To-Do-Liste mit veralteten Normdaten:
- Kategorie:Wikipedia:PND mit VIAF: 19.324 Artikel mit PNDs
- Benutzer:Gymel/NDmiss: 419 Artikel mit GKDs
--Kolja21 (Diskussion) 02:48, 28. Apr. 2014 (CEST)
- In Nr. 1 gibt es eigentlich kein "to do", im Gegenteil: "do not!". Die Abarbeitung nur zur Umwandlung (ohne Botflag) ist ja ausdrücklich unerwünscht. Oder sollen wir jetzt doch mal einen Bot drüberlaufen lassen und den Rest noch raushauen? --AndreasPraefcke (Diskussion) 13:48, 28. Apr. 2014 (CEST)
- Prinzipiell sehe ich bei einem Bot-Lauf kein Problem. Diese Politik der Versionsgeschichtenschonung ist zwar gut gemeint, aber ich sehe in einer verschleppten Inkonsistenz eigentlich das größere Problem. Deswegen wurden ja auch die eigentlich harmlosen Interwikilinks per Großaktion aus den Quelltexten entfernt: lieber gut und ordentlich auf einen Schlag gemacht als auf unbestimmte Zeit zweigleisig zu fahren. Wenn mir inzwischen irgendwo eine PND über den Weg läuft, dann muss ich gestehen, dass ich mir ohnehin den Fall genauer anschaue (da offenbar länger nicht mehr begutachtet) und nach kurzer Prüfung in jedem Fall auf die neue Version umstelle. Beschwert hat sich noch nie jemand. --Mai-Sachme (Diskussion) 14:11, 28. Apr. 2014 (CEST)
- Beim "irgendwo über den Weg laufen" natürlich nicht. Wenn jemand aber hunderte auf einmal umstellt, ist das sicher wieder anders. Seit die Interwiki-Edits endlich weg sind, haben wir von den Normdaten wohl das Monopol auf nervige Edits, die die Leute in der Beobachtungsleiste nicht sehen wollen. Deshalb bitte als systematische Aktion nur mit Botflag machen. Wir sollten nicht vergessen, dass die meisten Wikipedianer mit den Normdaten immer noch schlicht nichts anzufangen wissen, und daher bitte weiterhin möglichst vorsichtig bei reiner Kosmetik agieren. --AndreasPraefcke (Diskussion) 14:39, 28. Apr. 2014 (CEST) PS: Die Interwiki-Links waren nicht ganz so harmlos, weil sie den Links aus Wikidata ja vorgezogen werden und daher das ganze schnell zu einem totalen Chaos geführt hätte, das das Ändern _nur_ in Wikidata sinnlos gemacht hätte. --AndreasPraefcke (Diskussion) 14:41, 28. Apr. 2014 (CEST)
- Da bei der Einführung der GND bekanntlich mehrere Normdateien zusammengelegt wurden, lohnt es sich auf jeden Fall, die alten PNDs zu überprüfen. Ob per Bot oder intellektuell ist eine andere Frage. Ich persönlich hätte - nach 2 Jahren Karenzzeit - nichts gegen einen Botlauf einzuwenden. Bei einem Großteil der Edits habe ich festgestellt, dass eigentlich immer etwas zu verbessern ist, z.B. Ergänzung der LCNAF (Parameter: LCCN) etc. --Kolja21 (Diskussion) 14:59, 28. Apr. 2014 (CEST)
- Wenn immer was zu verbessern ist (und das heißt ja immer: intellektuell geprüft zu verbessern, sonst haben wir eine Problematik wie mit so manchem User hier) , dann ist ein Botlauf aber eh das falsche. Gerade habe ich mal wahllos auf 5 Namen geklickt: 4 mal war nichts zu verbessern, bei einem konnte man NDL nachtragen. US-Amerikaner mit PND, aber ohne LCCN habe ich, wenn ich mich recht erinnere, schon vor Monaten (Jahren?) mal alle abgearbeitet (nun sind in LCCN aber natürlich nicht nur US-Amerikaner enthalten, und auch sonst sind sicher einige durchgerutscht). --AndreasPraefcke (Diskussion) 19:06, 28. Apr. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Was vom Tage bleibt
- Es gibt also zwei Möglichkeiten für mich: entweder ich stelle die Arbeit im Bereich der Normdaten ganz ein, damit würde ich aber zugeben, dass ich Fehler mit Absicht gemacht hätte und dem ist nicht so. Oder ich arbeite weiter mit, habe dann aber das Damoklesschwert über mir, dass einer hinter mir herrennt und bei jedem Fehler, der nun mal passieren kann, verrissen werde. Eine Win-Win-Situation für die Ankläger, denn egal, was ich mache, es ist falsch: ich bin auf Grund der haltlosen Vorwürfe eh schon gebrandmarkt. --Jack User (Diskussion) 00:00, 29. Apr. 2014 (CEST)
- Zeigt mir einer 20 fehlerhafte Normdatenedits in den letzten 5 Tagen und dann reden wir weiter. Wird nur schwer zu finden sein, aber es ist wie bei den Artikeln: we eine Behauptung aufstellt, muss sie auch belegen. Kommt mir nur im Metabereich andersrum vor. Also: belegt mir eure Behauptungen
- Massenhaftes Eintragen von GNDfehlt nach oberflächlicher Prüfung
- massenhaftes Löschen der Vorlage DNB-Portal
- Also, wo sind eure Beweise? --Jack User (Diskussion) 00:29, 29. Apr. 2014 (CEST)
- Möglichkeit nr. 3: Mach nur die Hälfte der Edits und arbeite dafür gründlicher. Jeder macht mal Fehler, aber deine sind halt nun mal besonders krass aufgefallen. Es geht nicht darum, dich zu dissen, sondern Normdaten erfordern eine besondere Sorgfalt. Gruß --Kolja21 (Diskussion) 03:06, 29. Apr. 2014 (CEST)
- @Kolja21: Ich glaube dir, das du es gut meinst. Aber wem sind sie denn "krass aufgefallen"? Dir? Nö. Wem sonst? Siehe weiter oben, ich sage es auch dir: sie sind nicht annähernd so oft und so angeblich wild ausgefallen. Ich habe eben gerade einen Artikel geschrieben, siehe Julie Abich. Natürlich kann ich händisch immer noch die Normdaten einfügen, was ich da auch getan habe. Das mich Schnark auf Zuruf von wem eigentlich (?) vom automatischen Zugriff auf das Skript aussperrt und in der ZF noch was von potentiell gefährlichen Werkzeugen (also sein Skript) absondert, zeigt mir eins: es geht nur, und nur ums Dissen bzw. Mobbing. Sonst gar nichts. Übrigens: meine letzte Fehlermeldung steht da auch nach wie vor unbeanstandet, weil richtig. Und die ist noch keine 24 Stunden alt. Dieses Aussperren von Skripten ist ganz üble Schublade, denn Schnark fragt nicht mal nach, was da los ist, er sperrt mich einfach aus, ohne jedwede Nachfrage. Solches Vorgehen sehe ich ansonsten nicht mal bei den Admins. Und hier soll es nicht ums Dissen gehen? --Jack User (Diskussion) 04:16, 29. Apr. 2014 (CEST)
- Möglichkeit nr. 3: Mach nur die Hälfte der Edits und arbeite dafür gründlicher. Jeder macht mal Fehler, aber deine sind halt nun mal besonders krass aufgefallen. Es geht nicht darum, dich zu dissen, sondern Normdaten erfordern eine besondere Sorgfalt. Gruß --Kolja21 (Diskussion) 03:06, 29. Apr. 2014 (CEST)
- Zeigt mir einer 20 fehlerhafte Normdatenedits in den letzten 5 Tagen und dann reden wir weiter. Wird nur schwer zu finden sein, aber es ist wie bei den Artikeln: we eine Behauptung aufstellt, muss sie auch belegen. Kommt mir nur im Metabereich andersrum vor. Also: belegt mir eure Behauptungen
- Fehler machen wir natürlich alle, tagtäglich, das ist doch selbstverständlich. Ich sehe in den letzten Tagen doch eine gewisse "Lernkurve", die Fehler sind von 50% auf 10% runtergegangen (gefühlt, ich habe wohl verständlicherweise keine Lust, da auch noch eine Statistik zu erstellen). Damit kann man schon eher leben, aber "Mach nur die Hälfte der Edits" fände ich auch eine gute Idee. Wichtig: Eine falsche Eintragung ist deutlich schlechter als gar keine Eintragung. Wenn Du das verinnerlichst, ist gegen eine gelegentliche Normdaten-Mitarbeit m. E. nichts zu sagen. --AndreasPraefcke (Diskussion) 09:44, 29. Apr. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Fehler
Weiß jemand, wo man Nicht-Personen-Fehler wie GND 4075347-5 melden kann? Die Kirche St. Étienne ist nicht der Dom, und der Dom heißt nicht St. Étienne... --AndreasPraefcke (Diskussion) 14:36, 15. Mai 2014 (CEST)
- Das geht bislang nur per Mail an "Info DBL" <linfo-at-dnb.de>. --Kolja21 (Diskussion) 03:19, 17. Mai 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Highlight
Qualität trumpft!--Eddgel (Diskussion) 05:37, 25. Mai 2014 (CEST)
- Why not - immerhin ist gerade für diesen Personenkreis in Bälde das Eintreffen umfassender Tp-Sätze zu erwarten. Häufigeres Kontrollieren lohnt sich hier also mehr als bei Sportlern oder Chemikern. -- Thomas Berger (Diskussion) 22:19, 25. Mai 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Falsches Geschlecht in der Gemeinsamen Normdatei
Unter https://www.wikidata.org/wiki/Wikidata:Database_reports/Constraint_violations/P21#.22Single_value.22_violations gibt es eine Zusammenstellung von Items, denen mehr als ein Geschlecht zugeordnet wurde. Häufig ist die Quelle für das falsche zusätzliche Geschlecht die Gemeinsame Normdatei. Beispiele Friedrike Pannewick ist in der Normdatei [22] als "männlich" bezeichnet, auch so Sophie von Tedesco [23].
Ich kann da jetzt schon die Wikidata-Datensätze korrigieren. Aber vermutlich lesen da Bots automatisch die GND aus und setzen die Infos ein. Was ist da der beste Weg, das in den Griff zu bekommen? -- Pütz M. (Diskussion) 20:41, 27. Mai 2014 (CEST)
- "Datensatz im Katalog aufrufen" anklicken und Fehler unter @Korrekturanfrage melden. Wahlweise kannst du den Fehler auch in der Liste WP:PND/F eintragen, aber dort beträgt die Bearbeitungszeit mittlerweile über 2 Jahre. (Mit der E-Mail dauert es oft nur 24 Std.) --Kolja21 (Diskussion) 06:41, 28. Mai 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
Meinungen
Kniffliger Fall, bei John Chancellor vermerkt Wikidata VIAF 113853247, aber ich hab den starken Verdacht, dass in dem Satz mehrere Namensvetter durcheinandergeworfen werden (seltsame Publikationen, leicht abweichender Geburtstag). --Mai-Sachme (Diskussion) 18:29, 6. Jun. 2014 (CEST)
- Hm. Sah da eigentlich nur VIAF 66481988 und der war korrekt. Auf Monat und Tag heruntergebrochene Geburtsdaten in den LCNAF-Ansetzungen sind übrigens ein ganz klarer Hinweis darauf, dass in der Normdatei noch eine gleichnamige und im gleichen Jahr geborene Person exisitiert - über VIAF war die auch sofort findbar, und selbst der Link von dort zur englischsprachigen Wikipedia war der korrekten Person zugeordnet. -- Thomas Berger (Diskussion) 22:55, 6. Jun. 2014 (CEST)
- Hmpf, hab da offenbar konsequent danebengeguckt. Jedenfalls danke! --Mai-Sachme (Diskussion) 01:02, 7. Jun. 2014 (CEST)
- Archivierung dieses Abschnittes wurde gewünscht von: Mai-Sachme (Diskussion) 17:40, 28. Jun. 2014 (CEST)
GNDName - Vorgehen
Das Ideal sollte ja sein, dass zu einer Person eine individualisierte GND eingetragen ist und sämtliche Literatur überall im GND-Universum (und vor allem bei der DNB) korrekt dieser GND zugeordnet ist. Sollten Werke einer Person einer Tn-GND zugeordnet sein, wird diese bei uns im Parameter GNDName eingetragen. Aber in welchen zusätzlichen Fällen ist der Parameter angebracht. Ich stoße immer wieder auf GNDName-Einträge mit Tns, bei denen es bei der DNB keine Literatur gibt (sowohl bei zusätzlicher Tp-GND als auch ohne). Nicht selten auch in der Kombination mit der VIAF-Nummer der (leeren) Tn-GND (ohne weitere Normdaten). Was ist der Sinn solcher Einträge? Kurzform meiner Frage: Wann ist ein GNDName-Parameter mit einer Tn ohne Literatur bei der DNB sinnvoll und sollte nicht entfernt werden? --APPER\☺☹ 00:04, 30. Apr. 2014 (CEST)
- Über Sinnhaftigkeit kann ich nicht urteilen, aber ich erzähl mal kurz, welche Privatregeln ich so circa befolge:
- 1) Tp vorhanden, eine zusätzliche Tn wird nur eingetragen, wenn die DNB Literatur verzeichnet;
- 2a) keine Tp vorhanden, Tn (+ GNDfehlt) wird eingetragen, wenn die DNB Literatur verzeichnet;
- 2b) keine Tp vorhanden, Tn (aber nicht GNDfehlt) wird eingetragen, wenn im VIAF-Satz der Tn zugeordnete Literatur sichtbar ist. --Mai-Sachme (Diskussion) 07:36, 30. Apr. 2014 (CEST)
- Dagegen ich:
- 1') Tn wird möglichst dann immer eingetragen, wenn sie in VIAF mit (und nur mit) Nicht-GND-Sätzen geclustert ist (und womöglich deswegen ein Tp daran gehindert wird, dort ebenfalls zusammengefasst zu werden). Ich folge dazu dem (hypothetischen) AKS-Link zur Tn-Nummer, d.h. wenn eine Nutzung des Tn manifest ist (typischerweise in den Bibliotheksverbünden HBZ oder BVB) und die dort überwiegend die fragliche Person betrifft, halte ich den Tn-Eintrag für verantwortbar.
- 2a') analog (aber - vermutlich tut Mai-Sachme das auch - die verzeichnete Literatur sollte stark überwiegend der Person zuordnbar sein)
- Einschub: Natürlich, stark überwiegend der Person zuordenbar, so hatte ich's gemeint. --Mai-Sachme (Diskussion) 10:52, 30. Apr. 2014 (CEST)
- 2b') bei mir eher wie 1'), denn ich habe nie herausgefunden, wie "frisch" die Titelbestände sind (und von wem sie stammen), anhand derer VIAF matcht und anzeigt. Daher verifiziere ich lieber selbst und lasse die Tn u.U. weg.
- Generell besetze ich stets GNDfehlt (Wenn kein Tp) und GNDCheck (Wenn kein Tp oder auch Tn) bzw. lasse das von normdaten.js regeln: Wenn ich mich recht erinnere, hatten wir 2012 diverse Modelle diskutiert, wie die Funktionalität der alten Vorlage PNDfehlt in der Normdaten-Vorlage weitergeführt werden könnte (in etwa: soll "nicht perfekt" dokumentiert und wiedervorgelegt werden oder nur "Handlungsbedarf durch DNB wird gesehen (von uns - die DNB mag sich sträuben)"; wie stark sollen Dokumentation und Wiedervorlage miteinander gekoppelt sein), je nach Modell sind GNDfehlt und GNDCheck+Abwesenheit von GND äquivalent oder nicht. Es gab keine klare Erwartung an die Funktionen der Vorgängervorlage und daher ist das auch bei den Normdaten etwas vage, die Anwendung von normdaten.js führt aber zu einer gewissen Einheitlichkeit der Form.
- VIAF-Nummern im Zusammenhang mit Tn's sind hier (oder den Schwesterseiten) schon häufiger Thema gewesen, die einen geben gerne eine VIAF-Nummer an, die nicht aus PND oder LCCN oder NDL ableitbar ist (möglichst breite Abdeckung also), die anderen präferieren eine möglichst hohe Kohärenz und folgen mit VIAF möglichst GND bzw. GNDName. VIAF zeigt zwar seit einiger Zeit "undifferentiated" bei GND und LCCN-Sätzen an, hat aber m.W. nicht das Konzept eines "undifferentiated cluster". D.h. auch wenn in einem Cluster nur ein Tn sitzt, dürfen wir daraus nicht schließen, dass VIAF keine Person meint. Insofern ist der VIAF-Parameter ein attraktives Vehikel, eine "echte" Nummer in die Vorlage zu bekommen, auch wenn ansonsten nur ein Tn bekannt ist. Man muss das aber verantworten können, d.h. - aber da waren wir schon - ein Tn als GNDName darf nicht leichtfertig eingetragen sein. -- Thomas Berger (Diskussion) 09:54, 30. Apr. 2014 (CEST)
- Dass bei GNDName automatisch nicht-individualisierte VIAFs hinzugefügt werden, ist ein Fehler in Benutzer:Schnark/js/personendaten.js/normdaten.js, der imho dringend behoben werden sollte. Leider wurden diese Nicht-Normdaten bereits nach Wikidata exportiert (aber das ist ein anderes Thema). Hilfreich wäre auch, wenn die DNB in ihrem OPAC optisch deutlich Tns von Tps trennen würde. --Kolja21 (Diskussion) 17:08, 30. Apr. 2014 (CEST)
- Verstehe ich nicht (ist der Bug nicht umgekehrt, nämlich dass das Tool beim Eintrag von VIAF u.U. automatisch eine dazu gehörende Tn-Nummer ins GND-Feld überträgt oder zumindest vorschlägt?), bzw. halte ich für völlig legitim: Wenn es GNDname und LCCN gibt, dann ist die gemeinsame VIAF-Nummer in Ordnung, angenommen nun es gäbe keinen LCCN-Satz in der Gleichung, könnte VIAF immer noch (und gegen die GND) behaupten, es sei individualisiert und wir übernehmen das dann so. Es ist ja nur (historische) Schludrigkeit, dass es Tn's gibt und keine Aussage damit verbunden, dass es einen Tp dazu gibt, oder mehrere, oder keinen oder niemals einer existieren darf (da mehrere Personen). -- Thomas Berger (Diskussion) 18:36, 30. Apr. 2014 (CEST)
- Wenn weitere Normdaten wie die LCCN vorliegen, ist es natürlich korrekt, die dazugehörige VIAF einzutragen. Das Tool trägt, selbst nachdem ich sie per Hand gelöscht habe, aber auch VIAFs ein, die nur mit einem Tn verbunden sind und den Vermerk "undifferentiated" tragen. (Die Tns sind strenggenomme keine Schludrigkeit, sondern historische Bequemlichkeit. Man dachte, es spart Zeit, wenn man Werke nicht umverknüpfen muss, sondern einen Tn nachträglich individualisiert kann und, die gleiche Nr. beibehaltend, in einen Tp umwandelt. Das klappte zu PND-Zeiten auch halbwegs, ist heute, wo die Verbundkataloge mit einbezogen sind, allerdings Murks. Außerdem hat sich das Verständnis von Normdaten gewandelt. Früher reichte ein griffiges Unterscheidungsmerkmal wie Geburtsjahr oder Beruf, heute legt selbst die LoC, die früher nicht mal das Sterbejahr nachgetragen hat, Kurzbiografien an.) --Kolja21 (Diskussion) 01:28, 1. Mai 2014 (CEST)
- Da musst Du weiter zurückgehen: Bis in die 1970er Jahre wurden die Namen nicht ausdifferenziert, nur bei der Einsortierung in den Kartenkatalog waren sie nach Personen zu gruppieren: Man brauchte also jemand ziemlich umfassend gebildeten für eine Tätigkeit, die man gerne an Hilfskräfte delegieren oder am besten ganz abschaffen wollte. Man dachte dann (bei der Einführung der RAK, besonders schlau zu sein, indem man einerseits mechanisch sortiert und andererseits anders als die Amis und andere die Namen immer noch nicht ausdifferenzierte. Da verorte ich die Schludrigkeit. Seit etwa 20 Jahren dann ist klar, dass man in den Normdateien möglichst alles erfasst (und nicht nur die besonders komplizierten, besonders alten, besonders wichtigen) und kurz darauf begann zu dämmern, dass Nachweise zu Personen doch viel brauchbarer sind als nur eine Sammlung von Namensformen. Seit nunmehr 15 Jahren wird versucht, diese Sicht Top-Down durchzusetzen, 2006 hat sie sich in einer wenig wahrgenommenen Regelwerksänderung niedergeschlagen, 2016 wird wohl mit RDA durchgesetzt werden, dass Tn-Sätze normalerweise nicht mehr erzeugt werden dürfen (ausser von den Verlagen im Rahmen des CIP-Programms?), und auf den Ebenen unterhalb der Verbünde dürfte es dann ca. 2030 ankommen. Das Aufnorden von Tn zu Tp wird unterschiedlich gehandhabt: Die nutzen die Normdateien ja seitdem es sie gibt, und bei ihren Änderungen sind sie verpflichtet, die Datenbestände der anderen Verbünde im Blick zu behalten (das machen sie m.W. nicht mit BEACON oder anderen Mechanismen, die sich an den Nummern orientieren, sondern über KVK-Recherchen, der Aufbau eines Nicht-ganz-so-virtuellen Gesamtkatalogs aller Verbünde scheitert ja regelmäßig bereits im Vorfeld, derzeit scheint aber Culturegraph auf einem guten Weg). Umwandlung von Tn in Tp kommt auch derzeit durchaus häufig vor, einzig die DNB denkt auch an die GND-Anwender jenseits der Verbundsysteme, deren Nutzung spezifischer Sätze niemand im Blick haben kann und legt deswegen lieber neue Tp-Sätze an als bestehende Tn-Sätze zu schärfen. Das Problem, dass ein von Literatur leergeräumter Tn-Satz überhaupt nicht mehr offenbart, wofür er einmal benutzt worden ist, ist auch in der DNB bekannt. Geplant ist, über mechanische, VIAF-artige Methoden Literatur, die irgendwo Tn's zugeordnet ist und irgendwo anders bereits Tps, in allen Verbünden ebenfalls dem Tp-Satz zuzuordnen, so dass dann große Mengen (die Hoffnung ist: Millionen!) von Tn-Sätzen in allen Verbünden leergeräumt sind. Die Nummern sollen dann veröffentlicht (den unbekannten Auch-Nutzern der GND zur Kenntnis) und nach einer gewissen Übergangszeit gelöscht werden. -- Thomas Berger (Diskussion) 02:51, 1. Mai 2014 (CEST)
- Wenn weitere Normdaten wie die LCCN vorliegen, ist es natürlich korrekt, die dazugehörige VIAF einzutragen. Das Tool trägt, selbst nachdem ich sie per Hand gelöscht habe, aber auch VIAFs ein, die nur mit einem Tn verbunden sind und den Vermerk "undifferentiated" tragen. (Die Tns sind strenggenomme keine Schludrigkeit, sondern historische Bequemlichkeit. Man dachte, es spart Zeit, wenn man Werke nicht umverknüpfen muss, sondern einen Tn nachträglich individualisiert kann und, die gleiche Nr. beibehaltend, in einen Tp umwandelt. Das klappte zu PND-Zeiten auch halbwegs, ist heute, wo die Verbundkataloge mit einbezogen sind, allerdings Murks. Außerdem hat sich das Verständnis von Normdaten gewandelt. Früher reichte ein griffiges Unterscheidungsmerkmal wie Geburtsjahr oder Beruf, heute legt selbst die LoC, die früher nicht mal das Sterbejahr nachgetragen hat, Kurzbiografien an.) --Kolja21 (Diskussion) 01:28, 1. Mai 2014 (CEST)
- Verstehe ich nicht (ist der Bug nicht umgekehrt, nämlich dass das Tool beim Eintrag von VIAF u.U. automatisch eine dazu gehörende Tn-Nummer ins GND-Feld überträgt oder zumindest vorschlägt?), bzw. halte ich für völlig legitim: Wenn es GNDname und LCCN gibt, dann ist die gemeinsame VIAF-Nummer in Ordnung, angenommen nun es gäbe keinen LCCN-Satz in der Gleichung, könnte VIAF immer noch (und gegen die GND) behaupten, es sei individualisiert und wir übernehmen das dann so. Es ist ja nur (historische) Schludrigkeit, dass es Tn's gibt und keine Aussage damit verbunden, dass es einen Tp dazu gibt, oder mehrere, oder keinen oder niemals einer existieren darf (da mehrere Personen). -- Thomas Berger (Diskussion) 18:36, 30. Apr. 2014 (CEST)
- Dass bei GNDName automatisch nicht-individualisierte VIAFs hinzugefügt werden, ist ein Fehler in Benutzer:Schnark/js/personendaten.js/normdaten.js, der imho dringend behoben werden sollte. Leider wurden diese Nicht-Normdaten bereits nach Wikidata exportiert (aber das ist ein anderes Thema). Hilfreich wäre auch, wenn die DNB in ihrem OPAC optisch deutlich Tns von Tps trennen würde. --Kolja21 (Diskussion) 17:08, 30. Apr. 2014 (CEST)
Nur nochmal nachgefragt: GND-Namenseinträge wie bei Alexandra Kyle sind also Unsinn und können gelöscht werden?--Eddgel (Diskussion) 17:12, 4. Mai 2014 (CEST)
- Im konkreten Fall wäre es unsinnig, denn die im B3Kat genutzte Tn 1015005527 bezieht sich auf die gemeinte Person. (Es wäre schön, wenn du zukünftig deine Beispiele nicht kurz vor dem Speichern der Antwort änderst. ;) ) -- 32X 18:45, 4. Mai 2014 (CEST)
- OK, ist korrigiert (sry, mach ich)--Eddgel (Diskussion) 19:08, 4. Mai 2014 (CEST)
- @32X, ich nehme an, du wolltest sagen, eine Löschung der Tn sei unsinnig, nicht die Eintragung der Tn. Oder? --Mai-Sachme (Diskussion) 20:29, 4. Mai 2014 (CEST)
- Stimmt.--Eddgel (Diskussion) 01:19, 5. Mai 2014 (CEST)
- @32X, ich nehme an, du wolltest sagen, eine Löschung der Tn sei unsinnig, nicht die Eintragung der Tn. Oder? --Mai-Sachme (Diskussion) 20:29, 4. Mai 2014 (CEST)
- OK, ist korrigiert (sry, mach ich)--Eddgel (Diskussion) 19:08, 4. Mai 2014 (CEST)
Ich trage Tn, die in der GND keine weiteren deutlichen Angaben wie Alternativnamen etc. haben, dann ein, wenn in einem Verbundkatalog (B3Kat oder HBZ) die Daten eindeutig (oder fast eindeutig) auf die betreffende Person zutreffen. Fast immer handelt es sich um Filmschauspieler, die B3Kat mit seinen vielen DVDs und CDs ausufernd enthält, leider aber nur mit Tn-Sätzen versehen hat. --AndreasPraefcke (Diskussion) 11:22, 6. Mai 2014 (CEST)
Kann man folgende Wartungsliste aus Wikidata und de.WP extrahieren?
Alle Artikel, die VIAF in Wikidata enthalten und einen deutschen Artikel betreffen, in dem aber entweder keine Normdatenvorlage oder kein VIAF-Eintrag in der Normdatenvorlage existieren? Man müsste die dann eh nochmal anschauen, es wäre also keine Botaufgabe. (Für GND ist so eine Liste wegen der vielen Tn-GND in Wikidata hingegen wenig sinnvoll.) Grund: Mir fallen bei der Erarbeitung Munzinger-BEACON-Datei immer wieder Artikel z. B. zu ausländischen Politikern auf, bei denen in Wikidata schon eine (bislang sogar stets korrekte) VIAF-ID hinterlegt ist, bei uns aber noch keine Normdatenvorlage eingebaut wurde. --AndreasPraefcke (Diskussion) 17:31, 9. Mai 2014 (CEST)
PS: Folgendes Schmankerl möchte ich euch nicht vorenthalten: Sucht mal nach "Gabriel Lisette" in der GND. Ich kann mich nicht erinnern, jemals so viele Tp für eine Person gesehen zu haben... --AndreasPraefcke (Diskussion) 18:08, 9. Mai 2014 (CEST)
- Hi. Ich habe grade vor einigen Wochen angefangen, Wikidata gegen de.wikipedia abzugleichen. Dabei habe ich mit der GND angefangen (und dabei jeweils geschaut, ob es sich um eine Tn-GND handelt). Den Weg Wikipedia->Wikidata habe ich dabei erstmal ausgenommen. Übrig blieb also eine Liste von GNDs, die sich in de.wikipedia und Wikidata widersprechen und eine Liste, bei denen eine GND in Wikidata angegeben ist, aber hier keine. Erstaunlich häufig handelte es sich bei beidem um Korrekturen, die hier durchgeführt wurden, aber in Wikidata nicht nachgezogen wurden. Erstaunlich häufig auch, dass es zwei GNDs gibt (daher stammen die von mir eingetragenen Dopplungen hier). Obwohl häufig hier in de.wikipedia von einer zur anderen geändert wurde, wurde WP:PND/F nicht genutzt. Die anderen Fälle von widersprüchlichen GNDs waren meist leicht zu fixen, die hier fehlenden GNDs waren zum Teil Fehler, aber auch echt fehlende GNDs. Insgesamt war die Liste aber überschaubar. Für einen erneuten Lauf müsste ich einbauen, dass Seiten, die von WP:PND/F-Seiten verlinkt sind, ignoriert werden, weil das halt häufig Doppel-Tps sind. Alternativ kann man natürlich auch in Wikidata von der einen zur anderen ändern...
- Für VIAF wird das sehr wahrscheinlich sehr viel umfangreicher. Da müsste ich aber auch solche VIAF-Datensätze ausschließen, die ausschließlich einen undifferentiated-Eintrag haben. Bin die nächsten Wochen ziemlich im Stress, also das wird wohl eher erst Ende Juni was. --APPER\☺☹ 18:29, 9. Mai 2014 (CEST)
- Nach einem ganz kleinen Mini-Testlauf kann ich sagen: Der Großteil werden Artikel sein, bei denen wir eine GND haben, aber die VIAF nicht eingetragen ist. --APPER\☺☹ 19:32, 9. Mai 2014 (CEST)
- Danke für die Ausführungen. Hm, dann sollten die vielleicht auch noch raus, die GND oder LCCN schon drin haben. --AndreasPraefcke (Diskussion) 19:37, 9. Mai 2014 (CEST)
- Habe mir jetzt ein wenig mehr angeguckt und finde die Liste tatsächlich recht sinnvoll. VIAFs ergänzen ist ja auch sinnvoll, wenn wir die GND schon haben. Einzige Fehleinträge, die ich bisher entdeckt habe, sind solche mit zwei VIAF-Identifiern. Das kann Wikidata zwar abbilden, aber ich habs noch nicht abgefangen ;). Habe jetzt einen Gesamtlauf angeschmissen und werde dann mal ein paar auf irgendeine Wartungsseite stellen ;). --APPER\☺☹ 22:22, 9. Mai 2014 (CEST)
- So, schau dir mal Benutzer:APPER/Wikidata an. --APPER\☺☹ 22:54, 9. Mai 2014 (CEST)
- Habe mir jetzt ein wenig mehr angeguckt und finde die Liste tatsächlich recht sinnvoll. VIAFs ergänzen ist ja auch sinnvoll, wenn wir die GND schon haben. Einzige Fehleinträge, die ich bisher entdeckt habe, sind solche mit zwei VIAF-Identifiern. Das kann Wikidata zwar abbilden, aber ich habs noch nicht abgefangen ;). Habe jetzt einen Gesamtlauf angeschmissen und werde dann mal ein paar auf irgendeine Wartungsseite stellen ;). --APPER\☺☹ 22:22, 9. Mai 2014 (CEST)
- Danke für die Ausführungen. Hm, dann sollten die vielleicht auch noch raus, die GND oder LCCN schon drin haben. --AndreasPraefcke (Diskussion) 19:37, 9. Mai 2014 (CEST)
- Mach ich, danke. --AndreasPraefcke (Diskussion) 10:39, 10. Mai 2014 (CEST)
- 7x Tp für Gabriel Lisette ist nicht schlecht. Mein bisheriger Rekord waren insgesamt 4 für Juan de Zumárraga. --Mai-Sachme (Diskussion) 18:33, 9. Mai 2014 (CEST):
- Ich bin auch einige durchgegangen und erstaunlich oft war der Fehler, dass hier eine VIAF-ID ist, die auf eine andere weiterleitet und auf Wikidata schon das Weiterleitungsziel stand. Habe daher mal wieder einen Testlauf gemacht und dabei weit über 3000 solche Weiterleitungen gefunden. Mein Bot korrigiert die jetzt erstmal. Schön, dass VIAF-IDs so persistent sind ;). --APPER\☺☹ 21:04, 10. Mai 2014 (CEST)
- Ein Blog-Eintrag von 2011 thematisiert das: "Originally we optimized changes to minimize the number of clusters which disappear or are created. This was important when we did not have a mechanism in place to redirect from one VIAF ID to another, but had a side effect of moving more source records from one cluster to another than we liked" und "We now optimize for minimum movement of source records between clusters, which gives us more stable clusters" (was ich zugegebenermaßen nicht wirklich verstehe, aber so interpretiere, dass eben häufiger Cluster komplett in anderen, ggfls. neuen, aufgehen und auf technischer Ebene dann ein Redirect besteht). Für mich fällt das aber noch unter "Persistenz", denn wenn eine Nummer auf eine andere weiterleitet, kann man darauf maschinell reagieren, bei "This cluster no longer exists in VIAF" hingegen kann man noch einmal komplett von vorne beginnen. -- Thomas Berger (Diskussion) 21:46, 10. Mai 2014 (CEST)
- Ja, das gute sind die Weiterleitungen: Nur so kann mein Bot das ja glücklicherweise automatisiert fixen. --APPER\☺☹ 22:10, 10. Mai 2014 (CEST)
- Soweit ich weiß, ist Wikidata den gleichen Weg gegangen. Die haben die VIAFs von WP importiert und anschließend, vermutlich durch d:User:VIAFbot, die Weiterleitungen aufgelöst. --Kolja21 (Diskussion) 23:08, 10. Mai 2014 (CEST)
- PS: Die auf VIAF fixierte enWP hat die Wartungsliste en:Category:VIAF different on Wikidata (aktuell: 12.030 Artikel). Vielleicht könnten wir analog "Category:GND different on Wikidata" ("Kategorie:Wikipedia:Andere GND auf Wikidata") anlegen. --Kolja21 (Diskussion) 23:18, 10. Mai 2014 (CEST)
- Das wäre sinnvoll, wenn es möglich ist, alle bei WD angegebenen GNDs zu "durchsuchen" keine Ahnung, wer sagen kann, ob das geht. Derzeit betreffen die meisten Unterschiede GND-Dubletten, von denen eine hier und eine andere auf Wikidata angegeben ist. --APPER\☺☹ 23:21, 10. Mai 2014 (CEST)
- Das Objekt muss per Interwiki-Link (Sitelink) mit dem entsprechenden Artikel in deWP verlinkt und in deWP die Normdatenvorlage eingetragen sein. Sonst funktiert die Abfrage, soweit ich weiß, nicht. --Kolja21 (Diskussion) 23:49, 10. Mai 2014 (CEST)
- Das wäre sinnvoll, wenn es möglich ist, alle bei WD angegebenen GNDs zu "durchsuchen" keine Ahnung, wer sagen kann, ob das geht. Derzeit betreffen die meisten Unterschiede GND-Dubletten, von denen eine hier und eine andere auf Wikidata angegeben ist. --APPER\☺☹ 23:21, 10. Mai 2014 (CEST)
- PS: Die auf VIAF fixierte enWP hat die Wartungsliste en:Category:VIAF different on Wikidata (aktuell: 12.030 Artikel). Vielleicht könnten wir analog "Category:GND different on Wikidata" ("Kategorie:Wikipedia:Andere GND auf Wikidata") anlegen. --Kolja21 (Diskussion) 23:18, 10. Mai 2014 (CEST)
- Soweit ich weiß, ist Wikidata den gleichen Weg gegangen. Die haben die VIAFs von WP importiert und anschließend, vermutlich durch d:User:VIAFbot, die Weiterleitungen aufgelöst. --Kolja21 (Diskussion) 23:08, 10. Mai 2014 (CEST)
- Ja, das gute sind die Weiterleitungen: Nur so kann mein Bot das ja glücklicherweise automatisiert fixen. --APPER\☺☹ 22:10, 10. Mai 2014 (CEST)
- Ein Blog-Eintrag von 2011 thematisiert das: "Originally we optimized changes to minimize the number of clusters which disappear or are created. This was important when we did not have a mechanism in place to redirect from one VIAF ID to another, but had a side effect of moving more source records from one cluster to another than we liked" und "We now optimize for minimum movement of source records between clusters, which gives us more stable clusters" (was ich zugegebenermaßen nicht wirklich verstehe, aber so interpretiere, dass eben häufiger Cluster komplett in anderen, ggfls. neuen, aufgehen und auf technischer Ebene dann ein Redirect besteht). Für mich fällt das aber noch unter "Persistenz", denn wenn eine Nummer auf eine andere weiterleitet, kann man darauf maschinell reagieren, bei "This cluster no longer exists in VIAF" hingegen kann man noch einmal komplett von vorne beginnen. -- Thomas Berger (Diskussion) 21:46, 10. Mai 2014 (CEST)
- Habe inzwischen die vollständige Liste. Es handelt sich um zigtausende Einträge. Ein paar habe ich auf Benutzer:APPER/Wikidata gestellt. Bitte nachfragen, wenns leer ist und mehr gewünscht ;). --APPER\☺☹ 14:12, 17. Mai 2014 (CEST)
Blüht uns da noch was?
In http://d-nb.info/gnd/4508501-8 (und anderen Flughäfen) zu finden: Verwendungshinweis: Benutzt für die Körperschaft und das Gebäude. Bei Wiederaufgreifen für die Körperschaft einen eigenen Normdatensatz anlegen. Heißt das, nachdem jetzt alle möglichen GKD und SWD-Sätze zusammengeschmissen werden, blüht das Unwesen bald wieder neu auf?? --AndreasPraefcke (Diskussion) 14:49, 14. Mai 2014 (CEST)
- Einerseits werden fleissig Körperschaften und naturräumliche Einheiten zusammengeworfen (frische "Dublette" die Identifikation der Insel Formosa mit der Republik China), aber andererseits hat man aus der Vergangenheit gelernt, dass die traditionelle Gleichsetzung von Gebäuden (als Werke der Architektur) mit den darin hausenden Körperschaften keine tragfähige Idee ist. Dein Befund deutet darauf hin, dass zumindest für Flughäfen geplant ist, die Trennung zukünftig auch durchzuziehen. -- Thomas Berger (Diskussion) 15:46, 14. Mai 2014 (CEST)
- Aha, man darf also gespannt sein. --AndreasPraefcke (Diskussion) 14:36, 15. Mai 2014 (CEST)
Vorgehen bei unklaren GNDs
Hi. Wie geht ihr mit solchen Fällen wie Nicolas Roche um? Es gibt einen korrekten LCCN-Datensatz und einen VIAF-Datensatz dazu. Dort ist die GND 1045325686 auch verlinkt. Die Wahrscheinlichkeit ist groß, dass es die Person ist, aber der Datensatz ist eigentlich zu dünn für eine sinnvolle Zuordnung. Wie geht man mit solchen "Tp" um. Das ist ja kaum mehr als ein Tn... --APPER\☺☹ 20:59, 1. Jun. 2014 (CEST)
- Die Datenarmut deutet auf einen Verbundkatalog als Quelle. In diesem Fall ist es der HBZ-Verbundkatalog, der als Werktitel Inside the peloton liefert, die Nicolas Roche#Autobiografie. Fazit: Eintragen. -- 32X 21:47, 1. Jun. 2014 (CEST)
- Danke. Werde dann öfter mal einen Blick auf die Verbundkataloge werfen. --APPER\☺☹ 22:53, 1. Jun. 2014 (CEST)
Fehler im Bundesarchiv
Im Artikel Louis Auguste Ravené (1866–1944) gibt es einen Einzelnachweis mit diesem Link zu den Akten der Reichskanzlei - soweit korrekt. Die auf dieser Seite angegebene PND-Nummer 117690872 steht aber in der DNB für eine andere Person (Wirkungsdaten 1853–1858). Mann müsste bei Verwendung der Vorlage:AdR dann eine andere Nummer als die richtige GND eintragen - was nicht schön ist. Gibt es dafür auch so etwas wie Wikipedia:PND/F?--Färber (Diskussion)
- Lt. Bundesarchiv ist es eine gemeinsame Edition mit der Historischen Kommission bei der Bayerischen Akademie der Wissenschaften. Insofern könnte es sich lohnen, statt beim Bundesarchiv einen Zuständigen auszugraben den bei [24] angegebenen "CONTACT" anzumailen. -- Thomas Berger (Diskussion) 18:29, 5. Jun. 2014 (CEST)
- Vllt. kann ich das morgen mal versuchen. Vielen Dank für die Antwort.--Färber (Diskussion) 21:52, 5. Jun. 2014 (CEST)
Ich habe mal bei der Historischen Kommission angerufen. Der zuständige Mitarbeiter hat das notiert und wird das prüfen. Die Daten würden etwa "alle halbe Jahre" mal angefasst.--194.25.30.14 08:40, 6. Jun. 2014 (CEST)
Abgleich mit Wikidata
Seit der letzten Woche gibt es bei den Bildern in Infoboxen Wartungskategorien, die automatisch den Wikipedia-Artikel mit dem Inhalt in Wikidata abgleichen. Das sind vor allem Kategorie:Local image but no image on Wikidata, Kategorie:No local image but image on Wikidata, Kategorie:Local image different from Wikidata.
So etwas wäre in meinen Augen auch für die Normdaten praktisch. In der italienischen Wikipedia gibt es schon so etwas: it:Categoria:Codice VIAF assente ma presente su Wikidata, it:Categoria:Codice VIAF differente da Wikidata, it:Categoria:Codice VIAF non presente su Wikidata. Die Implementierung ist sehr einfach. Es braucht nur eine Anpassung der Vorlage. Der jeweilige Parameter (GND, LCCN, VIAF) muss nur mit der äquivalenten Eigenschaft auf Wikidata abgeglichen werden. Befüllt werden diese Kategorien automatisch.
Das würde hier und dort helfen, die Qualität zu steigern und abweichende Angaben korrigieren zu können. -- Pütz M. (Diskussion) 13:56, 16. Jun. 2014 (CEST)
- Solange auf Wikidata (a) Botbetreiber am längeren Hebel sitzen und (b) als Quelle Wikipedia(-Kategorien) gelten dürfen, ist dies meines Erachtens ein Schritt in die falsche Richtung. -- 32X 16:27, 16. Jun. 2014 (CEST)
- Es geht doch nur darum die Unterschiede aufzulisten um überhaupt mal ein Bild zu bekommen, ob und wie hilfreich Wikidata wäre anstatt sich wie jetzt nur auf Mutmaßungen zu verlassen. --Mps、かみまみたDisk. 16:46, 16. Jun. 2014 (CEST)
- Ich gehe davon aus, dass d:User:KrBot alle Normdaten-Vorlagen von hier nach Wikidata schippt. Wenn das nicht passt, gibt es dort einen Doppeleintrag und es fällt bei d:Wikidata:Database reports/Constraint violations/P227 auf. Bzw. analog für LCCN. Bei VIAF sind abweichende Nummern ja eher die Norm. Ob umgekehrt Wikidata GND-Nummern zu Items hat, deren zugehöriger Artikel hier ohne Normdatenvorlage ist, finde ich nicht so spannend: Vielleicht sollten wir uns hier die Prioritäten lieber selber setzen. Jedenfalls wäre eine Art Marathon, wo Bots oder Benutzer aufgrund von Wartungslisten ohne weitere Prüfungen Normdatennummern möglichst schnell von Wikidata hierhin schippen, der Super-GAU, denn der Überschuss in Wikidata dürfte größtenteils auf dem automatischen VIAF-Mapping durch OCLC vor einigen Jahren beruhen. Bleibt also höchstens der Neid, dass Normdaten-Umlenkungen in Wikidata zeitnah durch Bots nachvollzogen werden, wohingegen sie hier in unregelmäßigen Abständen aus Offline-Wartungslisten abzuleiten sind. Andererseits sind Umlenkungen selbst ja wieder persistent, d.h. es ist ziemlich egal, mit welcher Verspätung man sie nachvollzieht... -- Thomas Berger (Diskussion) 18:48, 16. Jun. 2014 (CEST)
- Es geht doch nur darum die Unterschiede aufzulisten um überhaupt mal ein Bild zu bekommen, ob und wie hilfreich Wikidata wäre anstatt sich wie jetzt nur auf Mutmaßungen zu verlassen. --Mps、かみまみたDisk. 16:46, 16. Jun. 2014 (CEST)
Bitte um Hilfe
Kann mit den angegebenen Normdaten in Paris Latino nichts anfangen. --Mai-Sachme (Diskussion) 17:37, 28. Jun. 2014 (CEST)
- Habe mal den Einsteller angeschrieben. Vielleicht liest er das ja trotz seiner dauerhaften Abwesenheit.--USt (Diskussion) 17:52, 28. Jun. 2014 (CEST)
- Es handelt sich um den Eintrag zum Tonträger im Katalog der Library of Congress ("Normdaten" sind nur LCCN-Nummern, die mit "n" beginnen). Daher hat die Nummer in der Vorlage nichts zu suchen und ich habe sie gestrichen. -- Thomas Berger (Diskussion) 18:31, 28. Jun. 2014 (CEST)
- Ich danke allen Beteiligten für ihre wertvolle Mitarbeit. Liebe Grüße, --Colin (Diskussion) 19:12, 28. Jun. 2014 (CEST)
- Es handelt sich um den Eintrag zum Tonträger im Katalog der Library of Congress ("Normdaten" sind nur LCCN-Nummern, die mit "n" beginnen). Daher hat die Nummer in der Vorlage nichts zu suchen und ich habe sie gestrichen. -- Thomas Berger (Diskussion) 18:31, 28. Jun. 2014 (CEST)
Schwach individualisierte Tp
Hallo, Alexandre Collin hat einen VIAF-Satz, der GND 1038750571 enthält (der Landesbezug Deutsches Reich irritiert natürlich). Alle references verweisen tatsächlich auf den Bauingenieur, aber speisen die sich womöglich aus dem VIAF-Satz? --Mai-Sachme (Diskussion) 16:53, 30. Jun. 2014 (CEST)
- Wo jeder einzelne sagt "by http://viaf.org/viaf/37191916" ist der Schluss naheliegend (und auch korrekt). Das VIAF-Cluster enthält aber noch mehr Datensätze, und die Visualisierung zeigt, dass der GND-Satz extrem schwach mit dem Rest verbunden ist (nur über den Niederländischen Eintrag mit ebenfalls gekürztem Vornamen, und auch der wiederum nur schwach mit dem Rest). "Selected Titles" zeigt überhaupt kein GND-Fähnchen, d.h. es gibt keine nachvollziehbaren Indizien für die Zuordnung. Daher hier möglichst die Finger davon lassen, zumal die GND-Angaben "Naturwissenschaftler" und "Deutsches Reich" zwar ohne Daten, Orte und/oder Literatur nicht wirklich belastbar sind, tendenziell aber eher im Widerspruch zu Alexandre Collin stehen. -- Thomas Berger (Diskussion) 18:56, 30. Jun. 2014 (CEST)
- Naja, Naturwissenschaftler würde schon einigermaßen passen, erstens weil diese DNB-Beschreibungen oft haarscharf an der Sache vorbeizielen, zweitens weil Collin sich ja tatsächlich laut Artikel um die Hydrologie verdient gemacht hat. Aber danke jedenfalls! --Mai-Sachme (Diskussion) 19:00, 30. Jun. 2014 (CEST)
Verwendung von Normdatenvorlage
Hallo, mir sind binnen kürzester Zeit zwei Verwendungsweisen der Normdatenvorlage aufgefallen, die wir in der Form wohl nicht wollen, oder täusche ich mich? Einmal siehe hier: Ausfüllen eines Parameters GNDName=fehlt. Und einmal siehe hier: Eintragung von GNDCheck, obwohl GND, LCCN und VIAF allesamt wunderbarst vorhanden sind. Liege ich mit meinen Reklamationen richtig? Besteht Präzisierungsbedarf bei der Vorlagenbeschreibung? Besteht bei den GNDName=fehlt-Fällen Nachräumbedarf?
Und noch etwas anderes: Wer findet raus, welcher Artikel mit Bartın gemeint ist? Diesmal musste ich passen. --Mai-Sachme (Diskussion) 21:21, 12. Jul. 2014 (CEST)
- Hallo Mai-Sachme, der von Dir gesuchte Artikel lautet Bartın. Ich war mal so frei und habe die Normdaten korrigiert...
- Hm, dass GND-Name=fehlt eingetragen wird, obwohl eine GND vorhanden ist, habe ich bisher noch nicht beobachtet. Ich bin aber wie Du der Meinung, dass dieses vollkommen überflüssig ist. Da es anscheinend doch Klärungsbedarf besteht, sollte die Vorlagenbeschreibung in dieser Hinsicht angepaßt werden. Ich wünsche ein schönes Restwochenende, --Silke (Diskussion) 14:25, 13. Jul. 2014 (CEST)
- Ein Feature von normdaten.js ist, dass man "fehlt" im Feld GND einträgt, damit GNDfehlt=ja und die damit zusammenhängenden Felder generiert werden (sofern Person, sonst bleibt es so stehen...). Ein Benutzer scheint nun häufiger "fehlt" auch für GNDName einzutragen. -- Thomas Berger (Diskussion) 14:45, 13. Jul. 2014 (CEST)
210.000 neue GNDs
Hi. Die DNB hat mitgeteilt, dass ab Mitte August 210.000 neue Tp-Datensätze eingespielt werden. Weiß jemand, wo die herkommen, welche Qualität die haben und ob die für uns relevant sind? --APPER\☺☹ 12:48, 1. Aug. 2014 (CEST)
- Höre ich zum ersten Mal. Vielleicht hängt die wundersame Vermehrung mit der Umstellung auf RDA zusammen? Mitte August ist der Zeitpunkt, an dem "die für den deutschsprachigen Raum erarbeiteten Anwendungsregeln und Erläuterungen im RDA-Toolkit zur Verfügung stehen". --Kolja21 (Diskussion) 00:18, 2. Aug. 2014 (CEST)
- Nein, es ist wohl wirklich eine Offline-Einspielung, die in drei Portionen für den 14., 21. und 28. August heute angekündigt worden ist. Vielleicht sind es ja die Daten aus dem Kooperationsprojekt mit dem Deutschen Filminstitut? Vor Montag wird man niemanden fragen können... -- Thomas Berger (Diskussion) 01:23, 2. Aug. 2014 (CEST)
- Heute ist der große Tag ;) Hat jemand mittlerweile gehört/gelesen, welchen Personenkreis die Neueinspielung betrifft oder woher die Daten stammen? --Kolja21 (Diskussion) 17:48, 14. Aug. 2014 (CEST)
- Gestern abend lief die zweite Tranche ein, alle von mir bislang angesehenen Einzelfälle stammen vom IAI/PK (DE-204). -- Thomas Berger (Diskussion) 12:08, 22. Aug. 2014 (CEST)
- Danke, sieht tatsächlich danach aus. Grad mal ein paar Lateinamerikaner durchgegangen, da kann man jetzt anscheinend erstaunlich viele GNDs ergänzen. Wobei es sich vermutlich lohnt zu warten, bis alle drei Blöcke eingespielt sind. --APPER\☺☹ 13:41, 22. Aug. 2014 (CEST)
- Wobei anscheinend nicht wenige eine Qualität wie GND 1056656514 haben :(. Ohne Lebensdaten sind solche Einträge ziemlich... naja... wird schon Mireya Cueto sein, aber eigentlich habe ich bei sowas immer ein schlechtes Gewissen, die GND einzutragen. --APPER\☺☹ 13:44, 22. Aug. 2014 (CEST)
- Das IAI ist im GBV nachgewiesen, also handelt es sich bei GND 1056656514 um die dortige PPN 398495718. Wir sollten beobachten, ob im Nachklapp dieser Einspielung dieser GBV-Normdatensatz mit der GND-Nummer angereichert wird bzw. durch den GND-Satz ausgetauscht wird. Anschließend könnten wir @JakobVoss: evtl. überreden, die GBV-BEACON-Datei zu aktualisieren, und "unsere" Mechanismen wären damit in der Lage, die Bedeutung solcher GND-Nummern anhand der tatsächlichen Nutzung zu verifizieren. -- Thomas Berger (Diskussion) 15:53, 22. Aug. 2014 (CEST)
- Gestern abend lief die zweite Tranche ein, alle von mir bislang angesehenen Einzelfälle stammen vom IAI/PK (DE-204). -- Thomas Berger (Diskussion) 12:08, 22. Aug. 2014 (CEST)
- Heute ist der große Tag ;) Hat jemand mittlerweile gehört/gelesen, welchen Personenkreis die Neueinspielung betrifft oder woher die Daten stammen? --Kolja21 (Diskussion) 17:48, 14. Aug. 2014 (CEST)
- Nein, es ist wohl wirklich eine Offline-Einspielung, die in drei Portionen für den 14., 21. und 28. August heute angekündigt worden ist. Vielleicht sind es ja die Daten aus dem Kooperationsprojekt mit dem Deutschen Filminstitut? Vor Montag wird man niemanden fragen können... -- Thomas Berger (Diskussion) 01:23, 2. Aug. 2014 (CEST)
Wikidata
@APPER, Gymel: In Zusammenhang mit den Neueinspielungen sollten wir überlegen, wie wir in Zukunft mit Wikidata zusammenarbeiten. Die Daten doppelt einzugeben, ist eigentlich (hätte es auf WD nicht soviel Streitereinen gegeben) unnötig. Die Frage ist, ob wir kurz-mittel-langfristig die bestehende Vorlage ergänzen wollen oder eine getrennte Vorlage "Normdaten-Wikidata" erstellen. Welche Vorgehensweise ist für die Wartungsarbeit am besten? --Kolja21 (Diskussion) 10:55, 2. Aug. 2014 (CEST)
- PS: Es wäre auch interessant, das Angebot an Normdaten zu überprüfen. Wir hatten uns damals für die NDL entschieden, dessen Datensätze mittlerweile von VIAF erfasst werden und sich auf Autoren beschränken, die in japanischer Sprache veröffentlich haben. Die Normdaten des jap. Verbundkatalogs en:CiNii einzubinden, wäre hilfreicher. Neu könnte man Polen (NUKAT) aufnehmen. --Kolja21 (Diskussion) 14:31, 2. Aug. 2014 (CEST)
- Früher oder später wird es sinnvoll sein, die Normdaten aus Wikidata einzubinden. Man muss dann aber langsam vorgehen und sich für jede Normdatei anschauen, wie der Stand bei Wikidata ist. Für die GND ist es beispielsweise derzeit meiner Meinung nach nicht möglich, da dort Tp- und Tn-Datensätze nicht unterschieden werden und tausende Tn-Datensätze eingetragen sind. Diese jetzt hier als "GND" anzuzeigen wäre meiner Meinung nach nicht hilfreich. Ich bin der Meinung, dass man Wikidata noch ein wenig Zeit geben sollte. --APPER\☺☹ 19:32, 2. Aug. 2014 (CEST)
- Danke für das Feedback. Eigentlich sollten in WD gar keine Tn's eingetragen werden. Die gelten als Fehler und können per Bot komplett gelöscht werden. --Kolja21 (Diskussion) 20:32, 2. Aug. 2014 (CEST)
- (Nach BK) Ich denke, für die GND werden es stets andere Überlegungen sein: Wir haben hier unsere Werkzeuge in Bezug auf WP:PND/F und die "Bindung" der GND-Nummer an einen bestimmten Artikel macht auch (z.B. den Bearbeitern der Meldungen bei der DNB) klarer, wofür es steht. Wikidata hat da in etwa schon VIAF vergleichbare Probleme, Artikel kommen und gehen und haben auch u.U. widersprüchliche Angaben. (Die Qualität in Wikidata ist ganz in Ordnung, da viele Einträge von hier stammen und die interaktive "Authority control" dort anders als normdaten.js hier die "undifferentiated persons" ausschließt. Es sind aber dennoch gut 16.000 Tn's in Wikidata nachgewiesen, würde man sie durch Bots entfernen lassen, kämen sie durch andere Bots als Reimport aus en:WP zuruück?). Auch für VIAF wird es länger eine Sonderbetrachtung geben, mehrere VIAF-Nummern zu einer Person sind normal, auch wenn Wikidata derzeit nur knapp 3.000 solcher Fälle kennt.
- Gute Kandidaten wären m.E. BNF (81.000) und SUDOC (63.000), wir haben hier häufiger aus "redaktionellen" Gründen (wie kommen wir auf eine nennenswerte Anzahl, wer pflegt das, ...) entsprechende Vorschläge abgeblockt, d.h. Konflikte mit hier erfassten Daten gibt es nicht, das macht auch die Anzeige einfacher. Gescheit verlinkbar sind diese beiden Nummern auch. d:Wikidata:Database reports/Constraint violations/P268 und d:Wikidata:Database reports/Constraint violations/P269 wirken erfreulich übersichtlich, d.h. es kommt wenig Schrott nach Wikidata rein und/oder es ist unter aktiver Pflege. Natürlich dürfte das Gros der Nummern über VIAF nach Wikidata gekommen sein, das halte ich aber nicht unbedingt für ein Problem. Von der Häufigkeit die nächsten Kandidaten wären CANTIC (Katalanien) mit 15.000 Einträgen in Wikidata, NDL mit 14.000, NKC mit 8.000, BNE mit 1.800. Das oben vorgeschlagene NUKAT hat ca. 2.900 Wikidata-Items, es scheint aber keine Verlinkungsmöglichkeit bekannt zu sein. -- Thomas Berger (Diskussion) 21:14, 2. Aug. 2014 (CEST)
- Die Verlinkungsmöglichkeit ist in der Tat wichtig; bei NUKAT, das hatte ich vergessen, sind Permalinks erst für nächstes Jahr in Planung. Katalonien liegt etwas weit ab vom Schuss. Die französische (BnF) und die tschechische Nationalbibliothek (NK ČR) via Wikidata einzubinden, halte ich für die beste Idee. (Ich finde es wichtig, dass wir nicht nur West-, sondern auch Osteuropa berücksichtigen.) --Kolja21 (Diskussion) 02:17, 3. Aug. 2014 (CEST)
- Irgendwo (en.wp?) gibt es folgenden Ansatz: Wenn lokal kein Wert (z.B. für VIAF) gesetzt, wird Wikidata angezeigt, sonst der lokale Wert. Wenn beide (lokal und WP) einen Wert haben, wird von der Vorlage eine von zwei Wartungs-Kategorien erzeugt, je nachdem, ob die Werte identisch oder anders sind. Sind sie identisch, kann ein Bot den lokalen Wert entfernen, das Resultat für den Leser bleibt gleich. Normdaten-Sklaven wie wir können dann die "widersprüchliche" Kategorie abgrasen und die Konflikte auflösen. Das EInzige, was sich für den Benutzer "automatisch" ändert, ist, dass mehr Werte (von Wikidata) angezeigt werden. Das kann dann auch mal einer der "Tn's" sein, wenn lokal nicht schon ein besserer gesetzt ist. Kann man Tn's irgendwie automatisch erkennen? Wäre das wirklich ein großes Problem, wenn die (statt "nix") angezeigt werden? --Magnus Manske (Diskussion) 00:44, 5. Aug. 2014 (CEST)
- Ja, in der enWP wird das so gehandhabt. Das größere Problem als die Tn's (die müssten sich, wie gesagt, leicht mit einem Botlauf löschen lassen) sind oder waren (?) die Dubletten, vor allem was die VIAF betrifft. Da kommen leicht drei, vier Nrn. für eine Person zusammen. Ich weiß nicht, ob das Problem mittlerweile gelöst ist. --Kolja21 (Diskussion) 14:42, 5. Aug. 2014 (CEST)
- Dass es mehr als eine VIAF-Nummer zu einer Person gibt ist ja ein VIAF-Problem. Wir sollten dann halt einfach eine der Nummern anzeigen, so wie das ja derzeit auch gehandhabt wird... Also das sehe ich nicht so als großes Problem. --APPER\☺☹ 17:42, 5. Aug. 2014 (CEST)
- VIAF illustriert zwei Probleme, die ich im en:WP-Ansatz sehe: Die Einbindungsmechanismen präsentieren uns eine der tendenziell mehreren VIAF-Nummern in Wikidata (falls nicht jemand dort eine als Vorzugsnummer markiert hat), die lokal gespeicherte Nummer ist da eher "handverlesen". Und falls die VIAF-Nummer entweder aus lokaler Quelle stammt oder aus Wikidata importiert wird, müssten wir eigentlich bei der Anzeige auf die Quelle hinweisen, "hier intellektuell geprüft" gegen "von irgendwo besorgt" macht schon einen Unterschied, selbst wenn in 99% der Fälle das Ergebnis dasselbe ist. Aus diesem Grund bin ich auch dagegen, hier lokal erfasste Nummern zu löschen, sobald eine Übereinstimmung mit Wikidata festgestellt wird (Wikidata mag sie von hier haben und das auch sogar vermerken, aber irgendwann hängt alles in der Luft und rotiert um sich selbst, nicht anders als wenn man alle VIAF-Quelldatenbanken abschalten würde, weil ja nun alles in VIAF ist). -- Thomas Berger (Diskussion) 18:31, 5. Aug. 2014 (CEST)
- Dass es mehr als eine VIAF-Nummer zu einer Person gibt ist ja ein VIAF-Problem. Wir sollten dann halt einfach eine der Nummern anzeigen, so wie das ja derzeit auch gehandhabt wird... Also das sehe ich nicht so als großes Problem. --APPER\☺☹ 17:42, 5. Aug. 2014 (CEST)
- Ja, in der enWP wird das so gehandhabt. Das größere Problem als die Tn's (die müssten sich, wie gesagt, leicht mit einem Botlauf löschen lassen) sind oder waren (?) die Dubletten, vor allem was die VIAF betrifft. Da kommen leicht drei, vier Nrn. für eine Person zusammen. Ich weiß nicht, ob das Problem mittlerweile gelöst ist. --Kolja21 (Diskussion) 14:42, 5. Aug. 2014 (CEST)
- Irgendwo (en.wp?) gibt es folgenden Ansatz: Wenn lokal kein Wert (z.B. für VIAF) gesetzt, wird Wikidata angezeigt, sonst der lokale Wert. Wenn beide (lokal und WP) einen Wert haben, wird von der Vorlage eine von zwei Wartungs-Kategorien erzeugt, je nachdem, ob die Werte identisch oder anders sind. Sind sie identisch, kann ein Bot den lokalen Wert entfernen, das Resultat für den Leser bleibt gleich. Normdaten-Sklaven wie wir können dann die "widersprüchliche" Kategorie abgrasen und die Konflikte auflösen. Das EInzige, was sich für den Benutzer "automatisch" ändert, ist, dass mehr Werte (von Wikidata) angezeigt werden. Das kann dann auch mal einer der "Tn's" sein, wenn lokal nicht schon ein besserer gesetzt ist. Kann man Tn's irgendwie automatisch erkennen? Wäre das wirklich ein großes Problem, wenn die (statt "nix") angezeigt werden? --Magnus Manske (Diskussion) 00:44, 5. Aug. 2014 (CEST)
- Die Verlinkungsmöglichkeit ist in der Tat wichtig; bei NUKAT, das hatte ich vergessen, sind Permalinks erst für nächstes Jahr in Planung. Katalonien liegt etwas weit ab vom Schuss. Die französische (BnF) und die tschechische Nationalbibliothek (NK ČR) via Wikidata einzubinden, halte ich für die beste Idee. (Ich finde es wichtig, dass wir nicht nur West-, sondern auch Osteuropa berücksichtigen.) --Kolja21 (Diskussion) 02:17, 3. Aug. 2014 (CEST)
- Ein Problem sind Tn in Artikeln mitunter schon. Die meisten Leser und Wikipedianer kennen den Unterschied zwischen Tp- und Tn-Datensätzen nicht und könnten dann (verständlicherweise) annehmen, dass alle dort gelisteten Werke auch zu dieser konkreten Person gehören. Teilweise tragen Wikipedianer auch fälschlicherweise alle diese Werke blind in die Artikel ein. Das ergibt Fehlangaben in Artikeln, die gerade bei weniger bekannten Personen u. U. leider jahrelang nicht erkannt und korrigiert werden. --91.67.96.57 16:55, 7. Aug. 2014 (CEST)
- ... vor allem wo wir wiederum die Werkliste im Artikel der DNB gegenüber als Beleg dafür anbieten, anlässlich der Umwandlung in einen Tp-Satz alle möglichen Werke dieser Person zuordnen zu dürfen. -- Thomas Berger (Diskussion) 17:43, 7. Aug. 2014 (CEST)
- In diesem Punkt ist auch deWP verbesserungswürdig. Ich stoße immer wieder auf Fälle wie Erich Kloss (Autor), wo in der Vorlage:DNB-Portal ein Tn eingetragen wurde, der auf Werke eines Namensvetters verlinkt, obwohl die Normdatenvorlage den korrekten Tp nennt.[25] Außerdem wäre es hilfreich, wenn ein Bot mal die ganzen VIAF-Einträge löschen würde, die nur mit einem Tn verknüpft sind. --Kolja21 (Diskussion) 20:14, 7. Aug. 2014 (CEST)
- ... vor allem wo wir wiederum die Werkliste im Artikel der DNB gegenüber als Beleg dafür anbieten, anlässlich der Umwandlung in einen Tp-Satz alle möglichen Werke dieser Person zuordnen zu dürfen. -- Thomas Berger (Diskussion) 17:43, 7. Aug. 2014 (CEST)
- Ein Problem sind Tn in Artikeln mitunter schon. Die meisten Leser und Wikipedianer kennen den Unterschied zwischen Tp- und Tn-Datensätzen nicht und könnten dann (verständlicherweise) annehmen, dass alle dort gelisteten Werke auch zu dieser konkreten Person gehören. Teilweise tragen Wikipedianer auch fälschlicherweise alle diese Werke blind in die Artikel ein. Das ergibt Fehlangaben in Artikeln, die gerade bei weniger bekannten Personen u. U. leider jahrelang nicht erkannt und korrigiert werden. --91.67.96.57 16:55, 7. Aug. 2014 (CEST)
Zwei Vorschläge, wie man sich bei Bedarf an die Normdaten aus Wikidata herantasten könnte:
- Auswahl einer Normdatenbank, etwa BnF, die zusätzlich im Normdatenkasten für alle Benutzer angezeigt wird. Für die BnF gibt es weiter oben gute Argumente und mir fällt kein Grund ein, warum man das nicht kurzfristig ausprobieren sollte. Technisch bin ich in Punkto Wikidata überhaupt nicht auf dem Stand der Dinge, aber eine entsprechende Erweiterung unserer Normdatenvorlage dürfte relativ einfach sein?
- Direkt angehen könnte man einen einmaligen Botlauf durch Wikidata, der alle Tn löscht. Anschließend könnte man vielleicht ganz nützliche Erkenntnisse gewinnen, welche automatischen Prozesse in Wikidata aktiv sind und die Tn ggf erneut eintragen. Wie aufwendig wäre das Aufsetzen eines derartigen Bots? Könnte man vielleicht bei Ivan_A._Krestinin anfragen, dessen KrBot die tägliche Aktualisierung der P227 constraint violation reports durchführt?
Ich persönlich bin derzeit eher skeptisch was Wikidata betrifft, aber wenn man/jemand in dieser Richtung was machen möchte, sind diese beiden Kleinprojekte doch ganz gut geeignet, weil risikoarm: Der Aufwand ist überschaubar, die Auswirkungen sind klar begrenzt und es gehen keinerlei Informationen verloren. -- Make (Diskussion) 21:01, 8. Aug. 2014 (CEST)
- + 1. Plädiere, wie oben ausgeführt, für die Neuaufnahme von BnF und NK ČR via Wikidata. Wegen des Botlaufs nachzufragen, kann auch nicht schaden. --Kolja21 (Diskussion) 02:48, 9. Aug. 2014 (CEST)
Wenn die Daten aus Wikidata bezogen werden, führt das dazu, dass bei neuen Artikeln gar keine Normdaten mehr lokal, sondern auf WD eingetragen werden. Wenn es dann mehrere VIAF's zu einer Person gibt, muss eine Regel her, welche ausgewählt wird. Ich finde, es ist dann diejenige sinnvoll, zu der es auch eine GND gibt. Oder die mit "Datenherkunft = deutschsprachige Wikipedia".--Färber (Diskussion) 09:03, 12. Aug. 2014 (CEST)
- Bei WD kann man Aussagen (wie "VIAF = ...") mit einem Rang versehen: "Der Rang (rank) bezeichnet verschiedene Qualitätsstufen für die einfache Auswahl in Fällen, wo es mehrere unterschiedliche Aussagen (statements) zu einer bestimmten Eigenschaft (property) gibt" (d:Help:Ranking). Sauber programmiert, kann die Vorlage daher selbst erkennen, welcher von den dubletten Datensätzen angezeigt werden soll. (Ich wähle in der Regel die VIAF aus, die die meisten Treffer hat.) --Kolja21 (Diskussion) 17:45, 14. Aug. 2014 (CEST)
- Das Problem mit verschiedenen Einträgen gibt es gelegentlich auch bei der DNB!--Martin Se aka Emes Fragen? 15:58, 16. Aug. 2014 (CEST)
Hickey, Toves (2014): Managing Ambiguity In VIAF
[26] -- grad (zufällig) gefunden, Details zur VIAF-Konstruktion, zB:
- “Other than our ability to redact data from the database, there is no option to directly edit a VIAF record. Changes to the VIAF record are accomplished by changes to its source records, and in this way the VIAF clusters are 'virtual' authority records.”
- “Our goal is that for any two source records in a cluster, that there is less than a 1% chance that they describe two different entities, that is that the link is correct more than 99% of the time. A recent check of 300 random pairings within VIAF clusters failed to find any incorrect pairs.”
Aktualisiert: Benutzer:Gymel/GND-Probleme - Stand 2014-09-03
Ich habe die längst wunderbar abgearbeitete Wartungsliste Benutzer:Gymel/GND-Probleme anhand des aktuellen Wikipedia-Dumps 2014-09-03 einmal aufgefrischt, damit der Auswertungsstand mit dem der neuen Auswertung Benutzer:Gymel/DNB-Portal übereinstimmt. Ich habe die Zahlen jetzt nicht verglichen, mein Eindruck ist aber, dass die Zahlen der Problemartikel inzwischen massiv sinken. Probleme mit nichtindividualisierten Tn-Sätzen an Stellen, wo nur individualisierte Tp-Sätze erlaubt sind, gibt es noch viele (und wie immer bin ich mir nicht sicher, ob es sich um "frische" Fehler handelt oder ob alte erstmalig sichtbar werden). Umlenkungen wird es immer geben (je mehr, desto besser eigentlich: Sie sind ja Resultat aktiver Normdatenpflege in der GND), vermutlich sollten wir (nach m.E. positiven Erfahrungen auf Wikidata) hier eine stärkere Automatisierung angehen. -- Thomas Berger (Diskussion) 10:36, 5. Sep. 2014 (CEST)
- Danke für die Aktualisierung, mein Eindruck ist ebenfalls, dass die Problemfälle tendentiell sinken. Wie es kommen kann, dass alte Fehler erstmalig sichtbar werden, dazu wüsste ich gerne mehr. --Mai-Sachme (Diskussion) 13: 01, 5. Sep. 2014 (CEST)
- Ist wohl eine Fehlerinnerung von mir: Ich habe gerade aus jeder 50er-Gruppe bei den Tp-"Enitätenfehlern" die ersten fünf überprüft, also insgesamt 30 Artikel: Bis auf zwei sind alle in den letzen Monaten angelegt worden, und bei den beiden älteren Fällen ist der Eintrag der monierten Nummer ebenfalls im fraglichen Zeitraum erfolgt. In drei Fällen ist eine bei GNDname bereits stehende Tn-Nummer nachträglich als GND dublett und falsch eingesetzt worden: normdaten.js könnte die Ursache dafür sein. Wir müssen also einfach davon ausgehen, dass monatlich im Schnitt 50 GND-Parameter neu in die Vorlage:Normdaten eingetragen werden, die formal korrekt sind aber nur nach GNDname gehören oder ganz entfallen sollten. Lt. Versionsgeschichte der Vorlage:NORMDATENCOUNT ist der Zuwachs an GND-Parametern durchschnittlich 2000 im Monat, Fehlerquote bei Erstvergabe also etwa 2, 5 %... -- Thomas Berger (Diskussion) 16:06, 5. Sep. 2014 (CEST)
- Auch von mir Danke. Ich habe noch eine Frage zum Datumsstempel des verwendeten GND-Datenbankabzugs: Grundlage ist vermutlich der Dump vom 10. Juli 2014 (sehe ich auf [27]). Weitere Vermutung ist, dass über Metadata-Harvesting (OAI-PMH) bis zum Stichtag aktualisiert wurde. (OAI-PMH habe ich unter http://www.dnb.de/oai und http://d-nb.info/1044619376/34 gefunden). -- Make (Diskussion) 18:22, 5. Sep. 2014 (CEST)
- Im Prinzip ja, allerdings ist Grundlage der vorige Datenabzug (vom März oder April 2014) und für die Auswertung habe ich auch noch bis irgendwann am 4. September geharvested. Benutzt habe ich die Daten im RDF-Format (Turtle-Version des Gesamtabzugs, Harvesting als RDF/XML), das gegenüber der Aufbereitung in MARC21/XML weniger Information bereitstellt. Insbesondere die Codierungen Tn/Tp/Tb etc. liegen dabei nicht explizit vor sondern werden von mir aus dem Befund (welcher rdf:type, wie heisst das Prädikat, das die Ansetzung transportiert) rückgeschlossen. Normalerweise sollte das zuverlässig sein, im Fall von Mehrfachcodes, fehlendem Entitätstyp (ca. 25.000 Körperschaften sind betroffen) oder in sich widersprüchlicher Grob- und Feincodierung (auch das kommt vor, beide Sorten Codes werden ja unabhängig voneinander manuell belegt) wird es etwas beliebig. -- Thomas Berger (Diskussion) 20:40, 5. Sep. 2014 (CEST)
- Der Datenabzug ist "GND-2014-02.ttl", von mir am 28. Februar downgeloadet (vermutlich zeitnah, allerdings vergehen zwischen Abzugsdatum und tatsächlicher Bereitstellung meist einige Wochen). Inzwischen hat Kolja21 (Diskussion • Beiträge • hochgeladene Dateien • SBL-Log • Sperr-Logbuch • globale Beiträge • SUL • Logbuch ) zwei "unbekannt"-Listungen ermittelt, die durchaus in der GND vorliegen (mit Erstellungsdatum nach Februar), mir also durch die Lappen gegangen sind. Noch frühere Gesamtabzüge waren stellenweise gar nicht vollständig, das ist mir für den Februar-Abzug aber nicht bekannt. Das Gegenteil ist auch möglich: ich habe lange nicht mehr genauer untersucht, wie echte Löschungen in der GND kommuniziert werden: Die Wirklichkeit (der realen Normdatengeschäftsgänge in GND-Beziehern) ist deutlich komplexer als das eine "Löschung"-Flag im OAI-PMH-Standard, ist aber wie alle Verwaltungsinformation ein Bereich, der nur in der MARC21-Darstellung abgebildet wird. Es können also bei meiner Auswertung Sätze als "gültig" durchgewunken worden sein, die in der GND nicht mehr existiern. Das wird dann erst auffallen, wenn ich meine interne Datenbasis auf einen aktuelleren Volldump umstelle. -- 12:32, 6. Sep. 2014 (CEST)
- Im Prinzip ja, allerdings ist Grundlage der vorige Datenabzug (vom März oder April 2014) und für die Auswertung habe ich auch noch bis irgendwann am 4. September geharvested. Benutzt habe ich die Daten im RDF-Format (Turtle-Version des Gesamtabzugs, Harvesting als RDF/XML), das gegenüber der Aufbereitung in MARC21/XML weniger Information bereitstellt. Insbesondere die Codierungen Tn/Tp/Tb etc. liegen dabei nicht explizit vor sondern werden von mir aus dem Befund (welcher rdf:type, wie heisst das Prädikat, das die Ansetzung transportiert) rückgeschlossen. Normalerweise sollte das zuverlässig sein, im Fall von Mehrfachcodes, fehlendem Entitätstyp (ca. 25.000 Körperschaften sind betroffen) oder in sich widersprüchlicher Grob- und Feincodierung (auch das kommt vor, beide Sorten Codes werden ja unabhängig voneinander manuell belegt) wird es etwas beliebig. -- Thomas Berger (Diskussion) 20:40, 5. Sep. 2014 (CEST)
Aktualisiert: Benutzer:APPER/VIAF2 -> fehlerhafte VIAFs
Hi. Auf der Seite Benutzer:APPER/VIAF2 findet ihr jetzt wieder "deleted" Cluster. Außerdem neu (erstmalig getestet) solche, bei denen eine Fehlermeldung von VIAF kommt. Das sind dann irgendwie vollkommen falsche Nummern oder ähnliches. Rund 150 deleted Cluster und 250 fehlerhafte Nummern.
Außerdem eine Frage: Wie gehen wir mit eingetragenen VIAFs um, denen ausschließlich eine deutsche Tn zugeordnet ist. Meist ist diese in diesem Fall auch im Artikel eingetragen. Das sind ca. 6000 Stück in der de.wikipedia... Als "eine Art Normdatensatz" behalten? Per Bot entfernen? --APPER\☺☹ 15:09, 19. Sep. 2014 (CEST)
- Unbedingt behalten: Falls VIAF irgendwann diesen Normsatz einem anderen Cluster zuordnen kann, wird es dann einen Redirect geben. Das Resultat sollte dann vielleicht nicht ganz so blind übernommen werden wie in anderen Fällen, aber letzendlich hängt die Zuverlässigkeit davon ab, wie verantwortungsvoll die VIAF-Nummer ursprünglich in die Vorlage eintetragen worden ist: Zumindest die spärlichen von VIAF eingeblendeten Werktitel sollten einschlägig sein. Und wenn andererseits die GND schneller sein sollte und den Tn löscht, bevor VIAF eine sinnvolle Zusammenlegung mit anderem erreicht, ist immer noch Gelegenheit zur Löschung. Mein Vorschlag also, die Einträge zu lassen, interne VIAF-Umlenkungen anhand von Wartungslisten manuell abarbeiten. -- Thomas Berger (Diskussion) 15:42, 19. Sep. 2014 (CEST)
Ich habe mir eines der "deleted cluster" einmal angesehen:
- Gerhard Seyfried vermerkt VIAF 15003760
- http://viaf.org/viaf/15003760/ sagt "This VIAF Cluster has been deleted. It is no longer part of VIAF"
- Enthalten ist der Link auf den "undifferentiated" GND-Satz 157891070
- http://d-nb.info/gnd/157891070 ist aber eine Weiterleitung auf http://d-nb.info/gnd/115834168 ("Umlenkung" Tn 157891070 auf GND 115834168)
- Mit dieser aktuellen GND-Nummer GND 115834168 kann http://viaf.org/viaf/sourceID/DNB|115834168 aufgerufen werden
- Enthalten ist der Link auf den "undifferentiated" GND-Satz 157891070
- Das leitete weiter auf http://viaf.org/viaf/269074620/
- http://viaf.org/viaf/15003760/ sagt "This VIAF Cluster has been deleted. It is no longer part of VIAF"
- Dementsprechend ist VIAF 269074620 die aktuell einzutragende VIAF Nummer für Gerhard Seyfried
GND-Umlenkungen werden also nicht automatisch zu VIAF-Weiterleitungen, umgekehrt ist nicht jeder in VIAF als "nur historisch" nachgewiesene Normsatz auch wirklich spurlos verschwunden: Es lohnt sich, auf den Link der jeweiligen Normdatei zu klicken... -- Thomas Berger (Diskussion) 16:27, 19. Sep. 2014 (CEST)
- Ich bin nicht für "unbedingt behalten". Die Tn's sind per se fehleranfällig, da namensgleiche Autoren zusammengewürfelt werden. Darauf beruhende VIAFs haben imho nichts im Artikelraum verloren. Eine der neg. Folgen ist, dass sie leichtfertig per Bot von Wikidata übernommen wurden und dort die Normdaten in Misskredit bringen. --Kolja21 (Diskussion) 21:56, 19. Sep. 2014 (CEST)
- VIAF weiss zwar, dass da "undifferentiated" GND- oder LoC-Sätze im Cluster sitzen, kennt aber selbst nicht das Konzept eines Vn-VIAF-Clusters. Fehler sind immer möglich, mehrere Clusters zu einer Person, Cluster für Personen die es nie gab (hier auch der Fall von Tn, die definitiv für mehrere Personen stehen). Solange es VIAF-Sätze gibt, wird jemand die auch verwenden, verantwortungsvolle Verwendung bedeutet zu überprüfen, wofür das VIAF-Cluster steht und ob das mit dem übereinstimmt, wofür man einen Normdatenreferenz benötigt. Ich halte es für problematisch zu deklarieren, dass gewisse VIAF-Cluster aufgrund bestimmter formaler Eigenschaften ihrer Konstituenten a priori untauglich sind und daher jegliche Verwendung hier (und womöglich in Wikidata) unbesehen als "gewiss fehlerhaft" unterbleiben bzw. falls vorhanden aktiv herausgelöscht werden soll. Mag sein, dass ich da befangen bin, aber in Fällen ohne Tp oder uninteressanter VIAF-Cluster zur Tp habe ich gerne die VIAF-Nummer eines Tn-Satzes (etwa denen mit Vermerk "BSB-Musik" oder mit Verweis von einem bestimmten Mädchennamen) eingetragen. Ich habe aber auch kein Problem damit, einen Datensatz in seinem GND-Biotop als unindividualisiert und pfui aufzufassen und denselben Datensatz in VIAF als eine Person kennzeichnend und akzeptabel: Nach meinem Verständnis ist es - hinreichende Nutzung vorausgesetzt - nicht der konkrete Inhalt des Normsatzes (geschweige denn irgendein willkürliches Häkchen), der über seine Bedeutung bestimmt, sondern seine Verwendung und Vernetzung... -- Thomas Berger (Diskussion) 01:12, 20. Sep. 2014 (CEST)
Position der Wikipedia-Personensuche
Hallo, es wurde ja immer wieder mal darüber gesprochen, die Wikipedia-Personensuche aus der Normdatenleiste irgendwie populärer/sichtbarer zu machen oder an geeigneterer Position zu verankern. Ich muss sagen, dass mir die Position, an der in italienischen Artikeln die Normdaten eingebunden werden, relativ gut gefällt. Beispiel: it:Carlo Schmid (ganz rechts oben, analog zu Koordinaten in geographischen Artikeln). Was haltet ihr davon, wenn ein Link zur Personensuche (also nicht die Normdatennummern, bloß der Link zum Apper-Tool und vielleicht mit peppigerem Namen) von der Normdatenleiste gelöst werden würde und rechts nach oben gepackt? --Mai-Sachme (Diskussion) 15:57, 21. Sep. 2014 (CEST)
- Wäre eine Idee wert, aber man müsste dann das Layout klären, wenn sowohl Koordinaten als auch der Suchlink vorhanden sind (ja, es gibt Personenartikel, wo - aus welchen Gründen auch immer - Koordinaten enthalten sind). 129.13.72.197 16:00, 21. Sep. 2014 (CEST)
- So ein Fall ist mir auch schon mal unter gekommen (die Koordinaten bezogen sich auf die Position einer Statue der gemeinten Person), allerdings halte ich das für einen (sehr selten vorkommenden) Fehler und sowieso korrekturwürdig. Menschen haben keine Koordinaten, ich hab sie damals dann auch gelöscht. --Mai-Sachme (Diskussion) 16:02, 21. Sep. 2014 (CEST)
- Beispiele: Louise Gueury, Justin Popović, George Washington Carver, William Lashly, Johannes Flintrop, Apsley Cherry-Garrard, Jörg Hartmann und Lothar Schleusener. 129.13.72.197 16:02, 21. Sep. 2014 (CEST)
- Himmel hilf! Danke für die Beispiele, ich mach das dann jedenfalls so. Aber wie gesagt: Hatte das bisher eigentlich nur einmal gesehen, wir sprechen sicherlich nicht von einem strukturellen Problem, sondern eigentümlichen Ausnahmen. --Mai-Sachme (Diskussion) 16:09, 21. Sep. 2014 (CEST)
- Übel: Eduard Zais. 129.13.72.197 16:22, 21. Sep. 2014 (CEST)
- Nicht mehr, aber stimmt schon: Solchen all-coordinates-Sachen kann man schwer Sinnhaftigkeit absprechen, insofern müsste die Position der Wikipedia-Personensuche tatsächlich mit den Koordinaten kompatibel gemacht werden. --Mai-Sachme (Diskussion) 16:44, 21. Sep. 2014 (CEST)
- Oder man lässt das All-Coordinates-Zeug generell aus Biografien raus und verlinkt immer inline bzw. verweist auf den entsprechenden Artikel (sofern vorhanden). 85.212.6.101 17:31, 21. Sep. 2014 (CEST)
- Prinzipiell glaube ich schon, dass Eduard Zais irgendwie demonstriert, dass all coordinates in Biographien eine sinnhafte Sache sein kann. Bei Le Corbusier fände ich das auch phantastisch und überhaupt wäre so ein Kartenangebot bei vielen Architekten-Biographien ein toller Mehrwert für Leser. Aber das führt jetzt ein wenig weg von meiner eigentlichen Frage, nämlich ob eine neue Positionierung der Personensuche grundsätzlich für sinnvoll gehalten wird. Dazu hätte ich ganz gern ein paar Meinungen, @APPER:, @Gymel:, @Kolja21:, @APPER:, @Silewe:, @AndreasPraefcke:. Ich hoffe, es stört dich nicht, dass ich unser Gespräch jetzt mal klein mache. --Mai-Sachme (Diskussion) 17:42, 21. Sep. 2014 (CEST)
- Für mich wäre es natürlich okay, das irgendwo prominenter zu verlinken, aber ob rechts oben die richtige Position ist, weiß ich nicht. Eine bessere Position weiß ich spontan aber auch nicht. --APPER\☺☹ 17:50, 21. Sep. 2014 (CEST)
- Prinzipiell glaube ich schon, dass Eduard Zais irgendwie demonstriert, dass all coordinates in Biographien eine sinnhafte Sache sein kann. Bei Le Corbusier fände ich das auch phantastisch und überhaupt wäre so ein Kartenangebot bei vielen Architekten-Biographien ein toller Mehrwert für Leser. Aber das führt jetzt ein wenig weg von meiner eigentlichen Frage, nämlich ob eine neue Positionierung der Personensuche grundsätzlich für sinnvoll gehalten wird. Dazu hätte ich ganz gern ein paar Meinungen, @APPER:, @Gymel:, @Kolja21:, @APPER:, @Silewe:, @AndreasPraefcke:. Ich hoffe, es stört dich nicht, dass ich unser Gespräch jetzt mal klein mache. --Mai-Sachme (Diskussion) 17:42, 21. Sep. 2014 (CEST)
- Oder man lässt das All-Coordinates-Zeug generell aus Biografien raus und verlinkt immer inline bzw. verweist auf den entsprechenden Artikel (sofern vorhanden). 85.212.6.101 17:31, 21. Sep. 2014 (CEST)
- Nicht mehr, aber stimmt schon: Solchen all-coordinates-Sachen kann man schwer Sinnhaftigkeit absprechen, insofern müsste die Position der Wikipedia-Personensuche tatsächlich mit den Koordinaten kompatibel gemacht werden. --Mai-Sachme (Diskussion) 16:44, 21. Sep. 2014 (CEST)
- Übel: Eduard Zais. 129.13.72.197 16:22, 21. Sep. 2014 (CEST)
- Himmel hilf! Danke für die Beispiele, ich mach das dann jedenfalls so. Aber wie gesagt: Hatte das bisher eigentlich nur einmal gesehen, wir sprechen sicherlich nicht von einem strukturellen Problem, sondern eigentümlichen Ausnahmen. --Mai-Sachme (Diskussion) 16:09, 21. Sep. 2014 (CEST)
- Beispiele: Louise Gueury, Justin Popović, George Washington Carver, William Lashly, Johannes Flintrop, Apsley Cherry-Garrard, Jörg Hartmann und Lothar Schleusener. 129.13.72.197 16:02, 21. Sep. 2014 (CEST)
- So ein Fall ist mir auch schon mal unter gekommen (die Koordinaten bezogen sich auf die Position einer Statue der gemeinten Person), allerdings halte ich das für einen (sehr selten vorkommenden) Fehler und sowieso korrekturwürdig. Menschen haben keine Koordinaten, ich hab sie damals dann auch gelöscht. --Mai-Sachme (Diskussion) 16:02, 21. Sep. 2014 (CEST)
- Die italienische Variante ist mir auch schon aufgefallen: Sie gefällt mir sehr! (Leider bindet it:Template:Controllo di autorità die GND nicht ein, aber das ist ein lokales Thema.) --Kolja21 (Diskussion) 17:49, 21. Sep. 2014 (CEST)
- Mal ganz unabhängig vom „wo“ ein Gedanke zur Nichtkollision mit anderen Elementen: Viele der selbstgebastelten Erweiterungen bauen darauf auf, dass sie irgendeinen per CSS/JS adressierbaren Punkt im Quelltext abgreifen und verändern. Wie wäre es denn mal zur Abwechslung, wenn per Bugzilla-Request die Einbindung eines neuen Hooks für genau diesen Normdaten-Zweck in Auftrag gegeben wird? -- 32X 21:28, 21. Sep. 2014 (CEST)
Kann man das auf Seiten im Artikelnamensraum begrenzen? Aktuell werden 297 Seiten angezeigt, so ist das viel Sucherei... --Mai-Sachme (Diskussion) 15:47, 26. Sep. 2014 (CEST)
- In der Kategorie oben auf CatScan klicken. Dort kann man nach Namensräumen filtern. --Mps、かみまみたDisk. 15:59, 26. Sep. 2014 (CEST)
- Ich habe die meisten Seiten korrigiert. Wenn man die restlichen auch noch korrigiert, könnte man auf das unzuverlässige CatScan verzichten. 129.13.72.197 13:53, 29. Sep. 2014 (CEST)
- Danke, habe auch ein paar korrigiert und für zwei einen SLA gestellt. War gar nicht so schlecht, da mal drüberzuschauen, da einige der betreffenden Seiten seit Jahren verwaist sind. --Kolja21 (Diskussion) 22:52, 29. Sep. 2014 (CEST)
- Ich habe die meisten Seiten korrigiert. Wenn man die restlichen auch noch korrigiert, könnte man auf das unzuverlässige CatScan verzichten. 129.13.72.197 13:53, 29. Sep. 2014 (CEST)
- Sieben Seiten übrig. Die darf jetzt jemand anders erledigen. 129.13.72.197 12:23, 30. Sep. 2014 (CEST)
aktualisiert: Benutzer:APPER/VIAF
Hi. Auch diese Liste habe ich jetzt mal aktualisiert. Es handelt sich um Artikel mit einer VIAF-ID, bei der eine Tp-GND angegeben ist. In den meisten Fällen kann diese GND nachgetragen werden. Leider wieder fast 2000 Fälle... --APPER\☺☹ 13:30, 4. Okt. 2014 (CEST)
- Lieber APPER, war schon am Überlegen, wie und wo ich noch Helfen könnte. Da kommt die Liste gerade richtig! Vielen Dank und ein schönes Wochenende wünscht --Silke (Diskussion) 14:37, 4. Okt. 2014 (CEST)
- Hallo, ich hab mal eine Frage zu Gladwyn Kingsley Noble. Da wird in der DNB (GND 1055362169) als Beschreibung US-amerikan. Linguist; Spezialist für Indianersprachen angegeben, obwohl in der Wiki nichts dazu steht. Auch über die Personensuche kann ich mit dieser Tp-Nummer nur Angaben über den Zoologen finden, nicht aber über den Linguisten. Liegt hier eine Personenverwechslung vor? Ich hatte erst gedacht, dass diese Beschreibung ein Fehler der DNB ist.
- Lt. en:Gladwyn Kingsley Noble ist sein gleichnamiger Sohn ein 1994 gestorbener Ethnologe gewesen (und alle im Artikel gelisteten Werke stammen vom "jr", nicht von der Person selbst). Der Tp scheint im August vom HBZ angelegt worden zu sein, das Werke von Vater und Sohn nachweist, allerdings hat sich das in der HBZ-Verbund-Datenbank wohl noch nicht niedergeschlagen. -- Thomas Berger (Diskussion) 09:59, 19. Okt. 2014 (CEST)
- Danke für die Recherche. Kann der Tp denn so im Artikel stehen bleiben?--Eddgel (Diskussion) 10:44, 19. Okt. 2014 (CEST)
- Nicht das HBZ war's, sondern die SUB Göttingen. Leider bietet der GBV-Verbundkatalog keine Möglichkeit zur Kontaktaufnahme, ich habe den Fall daher bei WP:PND/F eingetragen. Da die "harten" Daten im Normdatensatz die des Vaters sind, würde ich den GND-Eintrag im Artikel lassen. Es kann natürlich sein, dass die Nutzung des Satzes in den Bibliotheken bis zur Korrektur so heillos verfilzt ist, dass für die Reparatur zwei frische Sätze für Vater und Sohn angelegt werden und der alte gelöscht wird - davon werden wir dann benachrichtigt werden... -- Thomas Berger (Diskussion) 23:29, 19. Okt. 2014 (CEST)
- OK, da weiß ich bescheid.--Eddgel (Diskussion) 00:51, 20. Okt. 2014 (CEST)
- Nicht das HBZ war's, sondern die SUB Göttingen. Leider bietet der GBV-Verbundkatalog keine Möglichkeit zur Kontaktaufnahme, ich habe den Fall daher bei WP:PND/F eingetragen. Da die "harten" Daten im Normdatensatz die des Vaters sind, würde ich den GND-Eintrag im Artikel lassen. Es kann natürlich sein, dass die Nutzung des Satzes in den Bibliotheken bis zur Korrektur so heillos verfilzt ist, dass für die Reparatur zwei frische Sätze für Vater und Sohn angelegt werden und der alte gelöscht wird - davon werden wir dann benachrichtigt werden... -- Thomas Berger (Diskussion) 23:29, 19. Okt. 2014 (CEST)
- Danke für die Recherche. Kann der Tp denn so im Artikel stehen bleiben?--Eddgel (Diskussion) 10:44, 19. Okt. 2014 (CEST)
- Lt. en:Gladwyn Kingsley Noble ist sein gleichnamiger Sohn ein 1994 gestorbener Ethnologe gewesen (und alle im Artikel gelisteten Werke stammen vom "jr", nicht von der Person selbst). Der Tp scheint im August vom HBZ angelegt worden zu sein, das Werke von Vater und Sohn nachweist, allerdings hat sich das in der HBZ-Verbund-Datenbank wohl noch nicht niedergeschlagen. -- Thomas Berger (Diskussion) 09:59, 19. Okt. 2014 (CEST)
- Zweite Frage noch: Wenn es in einem Artikel zusätzlich zur GND noch einen GND-Namenseintrag gibt, soll dann die GNDCheck Datumsangabe eingetragen bleiben? Gruß.
- Perfekt wäre, den Namenseintrag zu überprüfen (gibt es den Tn-Satz noch, steht er zweifelsfrei für die gemeinte Person, ...) und ihn dann entweder zu löschen oder das GNDCheck-Datum zu aktualisieren. -- Thomas Berger (Diskussion) 09:59, 19. Okt. 2014 (CEST)
- Alles klar!--Eddgel (Diskussion) 10:44, 19. Okt. 2014 (CEST)
- Perfekt wäre, den Namenseintrag zu überprüfen (gibt es den Tn-Satz noch, steht er zweifelsfrei für die gemeinte Person, ...) und ihn dann entweder zu löschen oder das GNDCheck-Datum zu aktualisieren. -- Thomas Berger (Diskussion) 09:59, 19. Okt. 2014 (CEST)
- Hallo, ich hab mal eine Frage zu Gladwyn Kingsley Noble. Da wird in der DNB (GND 1055362169) als Beschreibung US-amerikan. Linguist; Spezialist für Indianersprachen angegeben, obwohl in der Wiki nichts dazu steht. Auch über die Personensuche kann ich mit dieser Tp-Nummer nur Angaben über den Zoologen finden, nicht aber über den Linguisten. Liegt hier eine Personenverwechslung vor? Ich hatte erst gedacht, dass diese Beschreibung ein Fehler der DNB ist.
Norm- und Personendaten für Paare/Duos
Manchmal haben wir Artikel über Paare bzw. Duos, die in der GND nur "aufgesplittet" als einzelne Personen vertreten sind. Beispiel: Bonnie und Clyde. Es würde wohl nicht viel Sinn ergeben, einzelne Artikel über die eigentlich immer zusammen thematisierten Personen anzulegen, gleichwohl gibt es in der GND nur die gesonderten Datensätze für Bonnie Parker und Clyde Barrow. Offenbar wird ein solches "Duo" von der GND nicht als "Körperschaft" angesehen, die als solche einen eigenen Datensatz "Bonnie und Clyde" erhalten könnte. Dementsprechend gibt es in unserem Artikel auch keine Normdaten und ebenfalls keine Personendaten, obwohl es ja ganz entschieden um Personen geht - einfach zwei. Gibt es dafür eine Lösung? Wäre es denkbar, Normdaten für mehr als eine Person in einen Artikel zu setzen? Vermutlich ist die Vorlage nicht dafür gedacht. Auf das Problem aufmerksam geworden bin ich, weil ich mit Deubelbeiss und Schürmann gerade einen ähnlichen Fall habe. Sowohl Ernst Deubelbeiss als auch Kurt Schürmann haben einen Eintrag in der GND, aber in der Wikipedia ergibt nur ein gemeinsamer Artikel Sinn (der bisher unter dem Lemma "Ernst Deubelbeiss" stand, aber bereits beide Personen behandelte). - Das Problem erstreckt sich natürlich nicht auf Kriminelle, siehe z.B. auch Katia und Maurice Krafft. Für die Brüder Grimm besteht es in dieser Form nicht, da die beiden Brüder auch je einen eigenen Artikel haben. Gestumblindi 23:20, 13. Okt. 2014 (CEST)
- Ah, ich sehe gerade selbst, welche Lösung offenbar praktiziert wird: Die Weiterleitungen Bonnie Parker und Clyde Barrow sind kategorisiert und haben Personen- wie auch Normdaten. Dann mache ich das bei Deubelbeiss und Schürmann auch mal so. Gestumblindi 23:21, 13. Okt. 2014 (CEST)
- Hm, für Deubelbeiss ging das - für Schürmann aber nicht, da es auch einen offenbar relevanten Mediziner dieses Namens gibt (bereits 2 rote Wikilinks), Kurt Schürmann ist nun also eine BKL. Gestumblindi 23:38, 13. Okt. 2014 (CEST)
- Hab keine Angst vor einer Klammerweiterleitung: Christoph Walther (Kabarettist) ist die Schnittstelle zwischen der BKS Christoph Walther, dem Artikel Zärtlichkeiten mit Freunden und dem ganzen Rest. -- 32X 01:55, 14. Okt. 2014 (CEST)
- Wie von 32X gesagt: Redirect-Anlagen zur Ablage von Normdaten und Personendaten sind ja völlig unproblematisch. Ich hab das mal so gemacht. Weiß jetzt bloß nicht, wie man mit angeblichen Todesdaten umgeht. Laut GND 133123936 ist er übrigens 2005 verstorben, nicht 2006. --Mai-Sachme (Diskussion) 08:40, 14. Okt. 2014 (CEST)
- Besten Dank. Die Idee kam mir auch noch, aber ich hatte das Gefühl, sowas könnte unwillkommen sein... Gestumblindi 23:38, 14. Okt. 2014 (CEST)
- Da KurtR gerade den Link in der BKL Kurt Schürmann vom Redirect Kurt Schürmann (Schwerverbrecher) auf Deubelbeiss und Schürmann umgebogen hat, hier noch die Nachfrage: Wenn eine Klammerweiterleitung als "Norm- und Personendaten-Ablage" angelegt wird, sollte dann die BKL entgegen üblichen Gepflogenheiten auf die Weiterleitung verweisen oder hat KurtR recht? Gestumblindi 20:47, 20. Okt. 2014 (CEST)
- Ich hatte es nicht gesehen, dass es eine Klammerweiterleitung als "Norm- und Personendaten-Ablage" angelegt ist war. sonst hätte ich die Änderung nicht gemacht. Kenn mich aber nicht aus im Ganzen. --KurtR (Diskussion) 20:51, 20. Okt. 2014 (CEST)
- Es gehört eigentlich nicht hierhin (die Klammerweiterleitung ist als Vehikel für die Kategorien, Personendaten und Normdaten wichtig, ob die BKL hingegen über die Klammerweiterleitung schleust ist davon unabhängig): Weiterleitungen mit __STATICREDIRECT__ waren m.E. für solche Situationen gedacht: Da ist so eine Art kategorischer Übergang von Person auf das Duo (oder in anderen Fällen von der Theorie auf ihren Urheber oder umgekehrt, von Staat auf Region etc.), schließlich ist die - natürlich in dem Fall unbedingt notwendige - Link-Maskierung Deubelbeiss und Schürmann durch irgendwas mit Kurt Schürmann in der BKL eigentlich auch nicht erwünscht. So wie ich es verstanden habe, waren -Weiterleitungen als eine Art Poller gedacht, die nicht wegoptimiert werden sollten, weil z.B. irgendwann vielleicht doch ein eigener Artikel entsteht oder allgemeiner die Weiterleitung keinesfalls eine Austauschbarkeit der Konzepte bedeutet. In der Praxis klappt das aber nie, die Weiterleitungsoptimierer sind einfach viel zu präsent und es ist schon schwer genug, die "unsichtbaren Content" tragenden Klammerleitungen gegen Löschungen zu verteidigen... -- Thomas Berger (Diskussion) 22:17, 20. Okt. 2014 (CEST)
- Ich hatte es nicht gesehen, dass es eine Klammerweiterleitung als "Norm- und Personendaten-Ablage" angelegt ist war. sonst hätte ich die Änderung nicht gemacht. Kenn mich aber nicht aus im Ganzen. --KurtR (Diskussion) 20:51, 20. Okt. 2014 (CEST)
- Da KurtR gerade den Link in der BKL Kurt Schürmann vom Redirect Kurt Schürmann (Schwerverbrecher) auf Deubelbeiss und Schürmann umgebogen hat, hier noch die Nachfrage: Wenn eine Klammerweiterleitung als "Norm- und Personendaten-Ablage" angelegt wird, sollte dann die BKL entgegen üblichen Gepflogenheiten auf die Weiterleitung verweisen oder hat KurtR recht? Gestumblindi 20:47, 20. Okt. 2014 (CEST)
- Besten Dank. Die Idee kam mir auch noch, aber ich hatte das Gefühl, sowas könnte unwillkommen sein... Gestumblindi 23:38, 14. Okt. 2014 (CEST)
- Wie von 32X gesagt: Redirect-Anlagen zur Ablage von Normdaten und Personendaten sind ja völlig unproblematisch. Ich hab das mal so gemacht. Weiß jetzt bloß nicht, wie man mit angeblichen Todesdaten umgeht. Laut GND 133123936 ist er übrigens 2005 verstorben, nicht 2006. --Mai-Sachme (Diskussion) 08:40, 14. Okt. 2014 (CEST)
- Hab keine Angst vor einer Klammerweiterleitung: Christoph Walther (Kabarettist) ist die Schnittstelle zwischen der BKS Christoph Walther, dem Artikel Zärtlichkeiten mit Freunden und dem ganzen Rest. -- 32X 01:55, 14. Okt. 2014 (CEST)
- Hm, für Deubelbeiss ging das - für Schürmann aber nicht, da es auch einen offenbar relevanten Mediziner dieses Namens gibt (bereits 2 rote Wikilinks), Kurt Schürmann ist nun also eine BKL. Gestumblindi 23:38, 13. Okt. 2014 (CEST)
Ich denke, sowohl diese als auch die aktuelle Version sind regelkonform. Der Sinn der Weiterleitung ist unbestritten. Die Frage ist nun, ob es besser/notwendig/hilfreich ist, in der BKL auf die Weiterleitung zu verlinken, oder ob es reicht, dass die Weiterleitung existiert und die BKL besser gleich auf den Zielartikel verlinkt. Die Frage ist für mich offen, ich habe eine gewisse Tendenz in Richtung Zielartikel, da die BKLs ja die wirkliche Struktur der Enzyklopädie abbilden und die angereicherte Weiterleitung eher eine technische Funktion hat (sie kann kategorisiert und vielleicht auch ver-wikidata-t werden). --= (Diskussion) 23:37, 21. Okt. 2014 (CEST)
Verknüpfte Titel samt und sonders falsch, dennoch eintragen?
Benutzer:Rettinghaus hat mich auf Probleme beim Fall Johann Ernst Bach (Arnstadt) aufmerksam gemacht. Der VIAF-Satz bezieht sich über den tschechischen Normdatensatz zwar eindeutig auf diesen Namensträger, allerdings passen sowohl der enthaltene Tn-Satz und die im tschechischen Datensatz verknüpften Werke allesamt zum Namensvetter Johann Ernst Bach (Eisenach). Ist der VIAF-Satz nun qualitativ dermaßen schlecht, dass er nicht eingetragen werden sollte? --Mai-Sachme (Diskussion) 11:48, 20. Okt. 2014 (CEST)
- Der VIAF-Satz folgt - Tn beiseite - dem NKC-Satz als einzigem anderen Bewohner des Clusters, also NKC|xx0040918. Dort ist neben den Lebensdaten des Arnstädters als weiterführende Information http://www2.nau.edu/~tas3/jebofarnstadt.html hinterlegt, d.h. ebenfalls "Arnstadt" mit expliziter Warnung vor "Eisenach". Insofern halte ich den NKC-Satz und damit den VIAF-Eintrag für "korrekt", und das Problem ist eine Ebene nach hinten verlagert, nämlich dass die zwei NKC-Nutzungen des Normsatzes 100% falsch sind. Nicht weiter verwunderlich eigentlich, denn auch der Artikel hier sagt "Von eigenen Werken ist nichts bekannt". Meine Meinung: Die VIAF-Nummer kann mit einigem Bauchweh (solche Nachrecherchen in den Heimatdatenbanken sind ja eigentlich nicht Sinn der Sache) in den Artikel, die Tn-Nummer natürlich keinesfalls. --Thomas Berger (Diskussion) 16:20, 20. Okt. 2014 (CEST)
Bitte um Meinungsäußerung: GND 118712985-Beruf Maler passt nicht (was heißt eigentlich dieses TA im Feld Quelle?), Zuordnung zur Person des Artikels scheint aber plausibel genug. --Mai-Sachme (Diskussion) 14:20, 13. Nov. 2014 (CET)
- Hallo Mai-Sachme, unter "Nachweise der Quellen" im GND-Datensatz der DNB findest Du eine PDF-Datei. Dort steht: Personennamen mit der Quellenangabe TA (Titelaufnahme) wurden nach den Verfasserangaben im jeweiligen alphabetischen Katalog angesetzt. Hierbei steht BVB-Kat für den Bayerischen Verbundkatalog, GBV für die Verbunddatenbank des Gemeinsamen Bibliotheksverbundes der Länder Bremen, Hamburg, Mecklenburg-Vorpommern, Niedersachsen, Sachsen-Anhalt, Schleswig-Holstein, Thüringen und der Stiftung Preußischer Kulturbesitz, HBZ für die Verbunddatenbank des Hochschulbibliothekszentrums des Landes Nordrhein-Westfalen, ÖVK für den Verbundkatalog der wissenschaftlichen Bibliotheken Österreichs, SWB für den Südwestdeutschen Bibliotheksverbund, KOBV für den Kooperativen Bibliotheksverbund Berlin-Brandenburg (ab 01.02.1999) und SNB für die Schweizerische Nationalbibliothek, Bern (von 1998 bis 2006: SLB für „Schweizerische Landesbibliothek“), HEBIS für die Verbunddatenbank des Hessischen Bibliotheksinformationssystems (ab 01. 07. 2000). Hilft in diesem Fall nicht wirklich weiter... Viele Grüße --Silke (Diskussion) 17:58, 13. Nov. 2014 (CET)
- Danke, die PDF-Datei hatte ich auch ein wenig durchsucht, aber mit dem Suchbegriff TA kommt man nicht so recht weiter :-) Ein wenig helfen tut's schon, wenn ich das hoffentlich korrekt interpretiere.
- TA heißt also, dass der Satz auf den Verfasserangaben irgendeines Werks basiert, das in den Verbundskatalogen nachgewiesen ist. Wenn dann hier alle Verbundsverknüpfungen nur Werke kennen, die vom Gerhard Joop des Wikipedia-Artikels stammen, dann ist doch eine Identität quasi nachgewiesen, oder? --Mai-Sachme (Diskussion) 18:05, 13. Nov. 2014 (CET)
- :-) Stimmt! Hoffen wir nun, dass die GND-Redaktion zu den gleichen Schlüssen kommt und diese Berufsangabe korrigiert. Viele Grüße Silke (Diskussion) 19:22, 13. Nov. 2014 (CET)
Aktualisiert: Benutzer:Gymel/GND-Probleme (Stand 2014-11-11)
Die Wartungsliste ist aktualisiert (Stand: Wikipedia-Dump 20141111, verglichen mit GND-Bereitstellung Turtle 2014-10-27, per OAI fortgeschrieben bis 2014-11-14), die einzelnen Teil-Listen habe ich dabei meist auf Unterseiten ausgelagert. Mir scheint alles auf recht gutem Wege zu sein, nur dass die illegale Nutzung von Tn-Nummern für den GND-Parameter leicht zugenommen hat, statt zu sinken. -- Thomas Berger (Diskussion) 12:53, 16. Nov. 2014 (CET)
Resultate IN2N
Hallo, die DNB hat heute verlautbart [28], dass voraussichtlich Samstag ab 18:00 ca. 140.000 neue Personensätze aus dem IN2N-Projekt (Deutsches Filminstitut / filmportal.de / [29]) auf einen Batzen in die GND eingespielt werden. Den Samstag drauf folgen dann noch Korrekturen/Ergänzungen an bereits vorher existierenden GND-Sätzen. -- Thomas Berger (Diskussion) 20:47, 13. Nov. 2014 (CET)
- Danke für die Info! Katalogisierungslevel 6 - das wird spannend. --Kolja21 (Diskussion) 17:48, 14. Nov. 2014 (CET)
- Ich hatte da irgendetwas in den falschen Hals bekommen, angekündigt wurde als vorausichtlicher Termin Samstag, der 22. November für die Neusätze und der folgende Samstag, 29. November für die Änderungen oder Anreicherungen. Sorry! -- Thomas Berger (Diskussion) 14:59, 16. Nov. 2014 (CET)
- @Gymel: Hat die Einspielung geklappt? Gibt es erste Erfahrungen (Qualität und Anzahl der Datensätze)? --Kolja21 (Diskussion) 03:39, 1. Dez. 2014 (CET)
- An den vergangenen beiden Samstagen hat es später am Abend jeweils ungefähr die angekündigte Anzahl von Sätzen über OAI gegeben, etwa neu die hier seitdem bereits genutzen GND 106211339X, GND 106125223X, GND 1061915220, GND 1051065399, GND 1062020685 und GND 1062472829. VIAF sieht die allerdings noch nicht. Mein erster Eindruck ist, dass die Sätze überwiegend schwach individualisiert sind, also wie in den Beispielen eher Wirkungs- als Lebensdaten tragen. -- Thomas Berger (Diskussion) 06:45, 1. Dez. 2014 (CET)
- @Gymel: Hat die Einspielung geklappt? Gibt es erste Erfahrungen (Qualität und Anzahl der Datensätze)? --Kolja21 (Diskussion) 03:39, 1. Dez. 2014 (CET)
doppelte Einträge in Datenbanken - wie handhaben?
Das Problem ist sicher nicht neu, aber ich habe keinen Punkt dazu in den Beschreibungen gefunden. Matthias R. Lemke hat zwei VIAF-Nummern eingetragen, und beide führen zu einem Matthias R. Lemke. VIAF hat auch in beiden Fällen noch GND-IDs. Wie geht man damit um? Den besser befüllten Eintrag (hier VIAF=33063170) behalten, den anderen entfernen? --mfb (Diskussion) 23:52, 22. Nov. 2014 (CET)
- Hallo Mfb. Für den Namen "Matthias R. Lemke" gibt es zwei GND-Nummern: Tn 12394130X und GND 128943041. Dabei ist aber nur die letztere eine personalisierte GND, die also direkt zu dieser Person gehört. Die erste ist eine so genannte "nicht individualisierte GND", das heißt dieser Nummer werden alle Werke zugeordnet, die von irgendeinem "Matthias R. Lemke" stammen. In diesem Fall ist das ein zugeordnetes Werk, was eindeutig zur richtigen Person gehört. So etwas kann der DNB gemeldet werden, die dann das Werk der korrekten Nummer zuordnet. Solche Meldungen machen wir unter WP:PND/F. In Artikel sollten als Normdaten-GND immer nur individualisierte GNDs aufgenommen werden (in diesem Fall also die 128943041). Mit dem zusätzlichen Parameter GNDName kann auf eine nicht individualisierte GND verwiesen werden. Entsprechend gibt es auch zwei VIAF-Nummern und es sollte die eingebunden werden, die die individualisierte GND enthält (33063170). Bei der anderen VIAF 25523308 wird hinter der GND auch "undifferentiated" angezeigt, was genau dieser fehlenden Individualisierung entspricht. --APPER\☺☹ 11:08, 23. Nov. 2014 (CET)
Fiktive Personen
Hallo, ich habe zuletzt recht umfangreich GND zu Sagengestalten nachgetragen und dabei festgestellt, dass eine relativ große nunja Personengruppe in der Wikipedia sehr schwach mit Normdaten versorgt ist, nämlich Götter und Göttinnen. Die sind in der Suchfunktion der DNB mit Einschränkung auf Personen relativ einfach zu finden, siehe hier beispielsweise für Göttinnen (auf Seite 4 geht's dann richtig los). Weil's so viele sind, wollte ich fragen, ob man nicht automatisiert ein matching (Ansetzungsform ähnlich/identisch, GND muss Typ pxg sein, Wikipedia-Artikel irgendwo in der Kategorie:Gottheit drinstecken) versuchen könnte? --Mai-Sachme (Diskussion) 13:12, 5. Dez. 2014 (CET)
- Matching habe ich nicht versucht, aber unter Benutzer:Gymel/Gods liegen die ca. 500 in der GND so codierten. Der optional angegebene Wikipedia-Artikel sollte Indiz dafür sein, dass Normdaten bereits eingetragen sind. Hilft Dir das? -- Thomas Berger (Diskussion) 17:13, 5. Dez. 2014 (CET)
- Sind das alle pxg der GND? Für jeden Link, den ich anklicke, krieg ich eine 404. Ist der optional angegebene Artikel nur ein Indiz für eine gesetzte Normdaten-Vorlage oder ein eindeutiger Hinweis? Ja, prinzipiell helfen tut's, danke! --Mai-Sachme (Diskussion) 17:28, 5. Dez. 2014 (CET)
- Ich habe hier keinen MARC21-Dump vorliegen, nur aus den RDF-Darstellungen alles mit Typ Gods selektiert, das ist lt. Vokabular eine 1:1 Umsetzung von "pxg". Die 61 mit angegebenenem Wikipedia-Lemma (die stecken so in den RDF-Daten drin) sind ein ganz starkes Indiz für Vorliegen der Normdaten-Vorlage, ich habe gerade einmal die Nummern der 'Gods'-Liste gegen eine aktuelle BEACON-Datei der de:WP abgeglichen und es gibt genau 61 Übereinstimmungen! -- Thomas Berger (Diskussion) 18:07, 5. Dez. 2014 (CET)
- Alles klar, danke! --Mai-Sachme (Diskussion) 18:23, 5. Dez. 2014 (CET)
- Ich habe hier keinen MARC21-Dump vorliegen, nur aus den RDF-Darstellungen alles mit Typ Gods selektiert, das ist lt. Vokabular eine 1:1 Umsetzung von "pxg". Die 61 mit angegebenenem Wikipedia-Lemma (die stecken so in den RDF-Daten drin) sind ein ganz starkes Indiz für Vorliegen der Normdaten-Vorlage, ich habe gerade einmal die Nummern der 'Gods'-Liste gegen eine aktuelle BEACON-Datei der de:WP abgeglichen und es gibt genau 61 Übereinstimmungen! -- Thomas Berger (Diskussion) 18:07, 5. Dez. 2014 (CET)
- Analog nun auch Benutzer:Gymel/LiteraryOrLegendaryCharacter (pxl) mit 117/1163 bereits behandelten und Benutzer:Gymel/Spirits (pxs) mit 0/61. -- Thomas Berger (Diskussion) 18:21, 5. Dez. 2014 (CET)
- Schau ich mir auch mal an. --Mai-Sachme (Diskussion) 18:23, 5. Dez. 2014 (CET)
- Jetzt um Dubletten bereinigt, Zählungen nun pxg: 61/499 ; pxl: 110/1150 ; pxs: 0/55 -- Thomas Berger (Diskussion) 18:32, 5. Dez. 2014 (CET)
- Auf die Spirits kannst du auch sofort einen Löschantrag stellen, bis auf einen bayrischen Glashüttengeist, einen chinesischen Dämonen (beide ohne Wikipedia-Artikel) und den da ausnahmslos Quatsch. --Mai-Sachme (Diskussion) 18:34, 5. Dez. 2014 (CET)
- In Wikidata konnte ich noch drei davon ausfindig machen: d:Q5976039, d:Q16940549, d:Q10308588 (den kennt die GND gleich zweifach). SLA stelle ich noch nicht, die GND-Sätze sind ganz interessant, da sie (leider nur im Freitext) stets angeben, welches Medium den Geist channelt, evtl. kennen wir ja die? -- Thomas Berger (Diskussion) 19:06, 5. Dez. 2014 (CET)
- Auf die Spirits kannst du auch sofort einen Löschantrag stellen, bis auf einen bayrischen Glashüttengeist, einen chinesischen Dämonen (beide ohne Wikipedia-Artikel) und den da ausnahmslos Quatsch. --Mai-Sachme (Diskussion) 18:34, 5. Dez. 2014 (CET)
Die Götter bin ich mal durch, die 123 aktuell ohne de.wikipedia-Artikel oder -Weiterleitung sind jetzt in einen eigenen Abschnitt. Bei vielen davon habe ich die GND-Nummer auf Wikidata ergänzt. Werden Götter auf WP:PND/F im Abschnitt Todesjahr bis einschließlich 1850 behandelt? --Mai-Sachme (Diskussion) 10:48, 8. Dez. 2014 (CET)
- Den Fall hatten wir noch nicht. Trag die Götter am besten unter "Todesjahr bis einschließlich 1850" ein, denn der Teil der Liste wird am schnellsten bearbeitet. Schlimmstenfalls melden wir sie dann vier Wochen später noch mal. --Kolja21 (Diskussion) 23:57, 8. Dez. 2014 (CET)
Neue Eigenschaft auf Wikidata
Ich kenn mich da drüber zwar nicht wirklich aus, aber ich hab mal einen Vorschlag versucht und bitte um freundliche Beachtung: [30]. Nach Einführung der Eigenschaft sollte dann ein Bot das hier nach Wikidata schaffen, um dann eine BEACON-Datei basteln zu können (anch diesem Vorbild). --Mai-Sachme (Diskussion) 12:10, 9. Dez. 2014 (CET)
- Du meinst [31] ? -- Thomas Berger (Diskussion) 13:41, 9. Dez. 2014 (CET)
- Grml, ja meine ich... Aber wenn ich's hier nicht finde und hier auch nicht, dann ist's halt ein bisschen Versteckspiel :-)
- Unabhängig davon: Migration der ID nach Wikidata und anschließende Berücksichtigung durch Magnus' beacon.php sowie Verlinkung in der Personensuche sind doch wünschenswert, oder? --Mai-Sachme (Diskussion) 13:50, 9. Dez. 2014 (CET)
- Sicher: beacon.php erlaubt ja das In-Beziehung-setzen der Scans mit frei wählbaren Identifier-Systemen, also nicht nur GND-Nummern. -- Thomas Berger (Diskussion) 14:43, 9. Dez. 2014 (CET)