Acka47
Zurückgezogene Identifikatoren
BearbeitenHallo Acka47, ich arbeitete gerade die Liste d:Property talk:P227/incorrect identifier value ab. Offenbar wurden mehrere GNDs gelöscht, was ich selten erlebt habe. Bislang handelte sich ausschließlich um maschinell eingespielte Datensätze (Systematik: 00m) und GNDs mit falscher Typ-Angabe. Die Fälle aus der neuen Liste sind dagegen ungewönlich:
- Rallye Dakar 1996 (Q260738) mit GND 1117328090; gültiger Normdatensatz, ohne ersichtlichen Grund gelöscht (s. Archivlink)
- Intelligent Computing in Engineering and Architecture, 13th EG-ICE Workshop 2006, Ascona, Switzerland, June 25-30, 2006 (Q106067602) mit GND 1117259870; importiert aus lobid-gnd
Beide Normdatensätze sind über lobid noch abrufbar. Weißt du, ob die Löschung gewollt war? @MisterSynergy, Wurgl: FYI. --Kolja21 (Diskussion) 01:41, 7. Jun. 2023 (CEST)
- Hallo @Kolja21, leider habe ich weder die Expertise noch die Möglichkeiten (wie z.B. ein Zugriff auf das Pica-System), um diese Frage zu beantworten. In lobid verarbeiten wir lediglich das von der DNB bereitgestellte RDF (auch das von EntityFacts) und stellen dann auf Basis der – zusammengeführten und leicht angepassten Daten – die lobid-API, den Reconciliation Endpoint und die Nutzer:innenoberfläche zur Verfügung. Von daher habe ich nichts mit Erfassung und Löschung zu tun. Ich leite die Anfrage mal weiter an die hbz-GND-Redaktion, vielleicht können die das beantworten. LG Adrian Acka47 (Diskussion) 09:12, 7. Jun. 2023 (CEST)
- Danke. Bin gespannt auf die Antwort, damit klar ist, wie wir mit den Fällen am besten verfahren. --Kolja21 (Diskussion) 18:05, 7. Jun. 2023 (CEST)
- Die Kollegin war im Urlaub und hat sich nun gemeldet. Hier die Erläuterung: "Von der DNB wurden ab KW 44 (2022) ca. 6.100 Löschungen von Tf6-Normdaten durchgeführt. Diese Datensätze stammten aus einem Import der Schweizerischen Nationalbibliothek von 2016, die weder von der NB noch von anderen GND-Anwender*innen benötigt wurden." Ich hoffe, das beantwortet deine Fragen. Acka47 (Diskussion) 08:34, 16. Jun. 2023 (CEST)
- Ja okay. Aber warum ist der gelöschte Datensatz immer noch aufrufbar? https://lobid.org/gnd/1117328090 Sprich: Wenn die DNB löscht, dann solltet ihr wohl auch. --Wurgl (Diskussion) 09:19, 16. Jun. 2023 (CEST)
- Löschungen werden in lobid-gnd momentan nur nachvollzogen, wenn ein neuer Dump geladen wird (d.h. vierteljährlich). Lange Zeit wurden Löschungsinformationen zu den RDF-Daten gar nicht über OAI-PMH geliefert. Dies geschieht zwar – augrund unserer nachfrage – seit September 2021, wir haben es aber bisher nicht in lobid-gnd umgesetzt (weil wir endliche Ressourcen haben und schlicht bisher kein:e lobid-Nutzer:in nachgefragt hat). in diesem Ticket haben wir alles dokumentiert: https://github.com/hbz/lobid-gnd/issues/159 Wenn die Löschungen für deinen Anwendungsfall wichtig sind, dann kommentiere bitte entsprechend an dem Ticket. Falls du kein GitHub-Konto hast, übernehme ich das gerne. Acka47 (Diskussion) 12:22, 16. Jun. 2023 (CEST)
- Dritteljährlich gibts einen Dump, aber das ist ein Korinth. Allerdings gab seit der Löschung schon einen Dump, im März … oder löschen die seit der KW 44 bis über die KW 10 (Zeitpunkt des Dumps) hinaus? Wie auch immer, Anfang Juli gibts neuen Dump und dann guck ich nochmals. --Wurgl (Diskussion) 14:28, 16. Jun. 2023 (CEST)
- @Acka47: Danke für die Rückmeldung. Ich habe die Info auf Hilfe Diskussion:Normdaten gepostet. --Kolja21 (Diskussion) 15:29, 16. Jun. 2023 (CEST)
- Dritteljährlich gibts einen Dump, aber das ist ein Korinth. Allerdings gab seit der Löschung schon einen Dump, im März … oder löschen die seit der KW 44 bis über die KW 10 (Zeitpunkt des Dumps) hinaus? Wie auch immer, Anfang Juli gibts neuen Dump und dann guck ich nochmals. --Wurgl (Diskussion) 14:28, 16. Jun. 2023 (CEST)
- Löschungen werden in lobid-gnd momentan nur nachvollzogen, wenn ein neuer Dump geladen wird (d.h. vierteljährlich). Lange Zeit wurden Löschungsinformationen zu den RDF-Daten gar nicht über OAI-PMH geliefert. Dies geschieht zwar – augrund unserer nachfrage – seit September 2021, wir haben es aber bisher nicht in lobid-gnd umgesetzt (weil wir endliche Ressourcen haben und schlicht bisher kein:e lobid-Nutzer:in nachgefragt hat). in diesem Ticket haben wir alles dokumentiert: https://github.com/hbz/lobid-gnd/issues/159 Wenn die Löschungen für deinen Anwendungsfall wichtig sind, dann kommentiere bitte entsprechend an dem Ticket. Falls du kein GitHub-Konto hast, übernehme ich das gerne. Acka47 (Diskussion) 12:22, 16. Jun. 2023 (CEST)
- Ja okay. Aber warum ist der gelöschte Datensatz immer noch aufrufbar? https://lobid.org/gnd/1117328090 Sprich: Wenn die DNB löscht, dann solltet ihr wohl auch. --Wurgl (Diskussion) 09:19, 16. Jun. 2023 (CEST)
- Die Kollegin war im Urlaub und hat sich nun gemeldet. Hier die Erläuterung: "Von der DNB wurden ab KW 44 (2022) ca. 6.100 Löschungen von Tf6-Normdaten durchgeführt. Diese Datensätze stammten aus einem Import der Schweizerischen Nationalbibliothek von 2016, die weder von der NB noch von anderen GND-Anwender*innen benötigt wurden." Ich hoffe, das beantwortet deine Fragen. Acka47 (Diskussion) 08:34, 16. Jun. 2023 (CEST)
- Danke. Bin gespannt auf die Antwort, damit klar ist, wie wir mit den Fällen am besten verfahren. --Kolja21 (Diskussion) 18:05, 7. Jun. 2023 (CEST)
lobid-links
BearbeitenIch bin nur ein wenig (zu) neugierig. Mich würde (rein aus Neugierde) interessieren, ob die Einbindung des lobid-Links in den Normdaten mehr Aufrufe zur Folge hatte. 2 Monate sind vergangen, da könnte man ja was sehen. --Wurgl (Diskussion) 09:15, 10. Aug. 2023 (CEST)
- Hallo @Wurgl, danke für die Anfrage. Wir haben uns das jetzt mal angeschaut und können für Juli 2023 eine enorme Steigerung an Zugriffen auf lobid-gnd feststellen, mindestens um den Faktor 3 bis 4 im Vergleich zum Vorjahr. (Wir haben nur noch dir aggregierten Daten für 2022 und können da nur schätzen.) So hatten wir nur im Juli fast ein Viertel der Zugriffszahlen des gesamten Jahres 2022 auf lobid-gnd, noch mehr, wenn mensch auf die Unique IPs schaut. @PascalC hat die Zahlen mal hier ergänzt: https://service-wiki.hbz-nrw.de/display/SEM/lobid-Nutzung
- Stellt sich natürlich die Frage, ob das alles auf Wikipedia-Links zurückzuführen ist. Das würde mich eigentlich wundern, aber evtl. gehen einfach sehr viele Crawler häufig über Wikipedia. Wir sind unsicher, wie wir die Zahlen genauer auf jene aus Wikipedia eingrenzen können. Hast du vielleicht eine Idee oder gibt es da womöglich irgendwo Infos zu? Andere werden sich das ja sicher auch schon gefragt haben. Acka47 (Diskussion) 10:44, 11. Aug. 2023 (CEST)
- Hmm … Muss mal gucken, ob man hier ein "nofollow" an die Links pappen sollte bzw. ich muss forschen wie das geht. Das sollte wohlgesonnene (gut erzogene) Bots fernhalten. Allerdings sind die unique IDs ja auch entsprechend gestiegen, so viele IPs haben die Betreiber von Crawlern nun auch wieder nicht. Und eine IPv6 eurer Server gibt es wohl nicht, zumindest spuckt mein Nameserver nur eine IPv4-Adresse aus, bei IPv6 sind die unteren 64 Bit der Adresse ja die Privacy Extension, dieser Teil kann wechseln wie das Rechnerlein Lust hat, aber das Problem habt ihr gar nicht.
- Also mein Eindruck(!) ist jedenfalls, dass da doch so einige Leser klicken. 7 Klicks mit einer IP sind laut meinem Browser-Log von mir. Aber ich denke das ändert nix an den Zahlen ;^)
- Jedenfalls danke für die Antwort. Wie gesagt: das mit dem nofollow … wenn gewünscht, forsche ich mal und bau das ein. --Wurgl (Diskussion) 14:24, 11. Aug. 2023 (CEST)