Keine Datensätze?

Hallo Apper, falls du es noch nicht weißt. Laut deinen Webtool sind keine Datensätze mehr vorhanden. Ich vermute es liegt ein Fehler vor. Schau dir das doch mal an. --ElRakı ?! 20:01, 12. Jul 2005 (CEST)

Nö, es sind heute alle abgearbeitet worden :) Phrood 20:05, 12. Jul 2005 (CEST)

Über 10.000 Datensätze in einer Woche eingearbeitet? Wow, das ist keine schlechte Leistung! Die allerdings nicht von allen goutiert wird. Naheliegender Weise melden sich nicht die Leute zu Wort, die den PND-Link brauchbar finden, sondern die, die er stört. Vor allem, dass er an der ersten Stelle der Weblinks steht, wird kritisiert.

"Ich bin übrigens auch gegen die wahllose Einführung der PND ..." und andere Kommentare finden sich unter Vorlage Diskussion:PND. Wer für den Erhalt des Weblinks ist (es gibt auch einen sinnvollen Vorschlag, die PND ähnlich der ISSN oben rechts einzublenden), sollte sich an der Diskussion beteiligen.

Viele Grüße & in der Hoffnung auf baldigen Nachschub --Kolja21 23:41, 12. Jul 2005 (CEST)

Ich bin mir zwar immer noch nicht sicher, ob das ganze (in der Geschwindigkeit) korrekt abgelaufen ist, aber okay. Zumindestens wurden noch nicht alle Personen in die Datenbank geladen, denn derzeit sind noch viele Personen ohne PND-Weblink. --ElRakı ?! 03:46, 13. Jul 2005 (CEST)

Person doppelt im Katalog der DDB

Für Ernst Blass tauchen in der DDB zwei Einträge auf und das mit verschiedenen Publikationen. Der doppelte PND-Weblink im Artikel sieht jetzt natürlich sehr unschön aus, weiß da jemand eine bessere Lösung? Ich hab ein Kommentar hinterlassen, damit keiner der beiden Links gelöscht wird. Wie kann man die DDB am Besten auf solche Fehler hinweisen? Mich wundert nur, dass so eine offensichtliche Redundanz überhaupt enstehen konnte. Grüße, ElRakı ?! 03:46, 13. Jul 2005 (CEST)

Hallo ElRaki, das Problem wurde schon an anderer Stelle besprochen. Die zweite PND ist nicht individualisiert, d.h. trifft auf alle Personen zu, die sich "Ernst Blass" nennen und gehört damit NICHT in die Wikipedia. Es ist kein Fehler der DDB. In der Datenbank wird zwischen den beiden Arten von PNDs unterschieden, nur leider können wir es nicht sehen. Nach und nach arbeiten die beteiligten Redaktionen die nicht individualisierten PNDs ab. Anschließend werden sie gelöscht. --Kolja21 05:31, 13. Jul 2005 (CEST)
Okay, danke für die Information. --ElRakı ?! 23:18, 13. Jul 2005 (CEST)

Tool hat nicht alle Personen erfasst

Hallo - ich weiß, kein Tool ist perfekt. Aber mir ist aufgefallen, dass es immer noch Personen gibt, die in der Wikipedia und in der DDB sind, die aber zum jetzigen Zeitpunkt noch keinen {{PND| }}-Eintrag haben. So z.B. Eleuterio Sánchez Rodríguez und Marcus Porcius Cato der Ältere. Dort haben ich eben per Hand die Einträge gemacht. -- Raven 20:33, 13. Jul 2005 (CEST)

Ein Fehler auf Seiten der PND-Redaktion scheint bei Johann Benedict Carpzov vorzuliegen. (PND per Hand eingetragen.) --Diderot76 03:58, 14. Jul 2005 (CEST)
Carpzov hatte keine Kategorien, vermutlich daher wurden nie Personendaten eingefügt und ohne Personendaten/Kategorien kann man halt nicht automatisch erkennen, dass das ein Mensch ist. --APPER\☺☹ 07:15, 14. Jul 2005 (CEST)
Bei den beiden hat er halt nichts automatisch gefunden, bei Marcus Porcius z.B. wegen dem Zusatz "der Ältere". Das Tool sollte auch erstmal einen Grundstock an DDB-Daten schaffen und wird nie alles perfekt finden. MfG --APPER\☺☹ 07:15, 14. Jul 2005 (CEST)
Um die Unvollsätndigkeit zu sehen, genügt es die gut 45.000 Personendaten (23. Juni 2005), mit den knapp 42.000 überprüften PND-Datensätze der Datenbank (13. Juli 2005) zu vergleichen. Es müssen alleine dadurch schon 3.000 Personen fehlen. Ich weiß zwar nicht, wo die verloren gegangen sind, aber APPER hoffentlich schon ;). Wenn die Daten beim nächsten Dump dabei sind, ist es ja sowieso kein Problem. --ElRakı ?! 12:33, 14. Jul 2005 (CEST)
Die Liste der Personen/Lebensdaten bekam ich von Benutzer:JakobVoss, ich glaube der Dump aus dem die sind ist noch ein wenig älter (Mai?). --APPER\☺☹ 16:57, 14. Jul 2005 (CEST)

Hi APPER, fast alle Bemerkungen hier drehen sich um dein Tool, bei Johann Benedict Carpzov ging es nur um einen möglichen Fehler der PND-Redaktion; ich wollte nicht extra eine eigene Überschrift dafür anlegen. Du hast geschrieben, dass du Hinweise sammelst und der DDB schicken willst. Bei dem genannten Herrn stimmen die Literaturangaben, nicht aber Beruf und Lebensdaten mit dem Artikel überein. Da die Carpzovs eine weit verzweigte Famlie sind, nehme ich an, dass der Fehler auf Seiten der DDB/PND-Red. liegt. --Diderot76 22:30, 14. Jul 2005 (CEST)

Ah danke für den Hinweis ;). Ja das werde ich dann mal notieren, aber die meisten Sachen werden beim nächsten Dump automatisch gemacht werden - also da wird es dann eine Liste der PND-Nummern geben, wo es bei den Lebensdaten unterschiede gibt. Trotzdem danke für den konkreten Hinweis. MfG --APPER\☺☹ 06:10, 15. Jul 2005 (CEST)

Fehler oder Doppeleinträge in der PND

Mir ist gerade aufgefallen, dass Ludwig von Friedeburg zwei verschiedene PND hat (104887370 und 116791950). Ich habe die zweite mal zusätzlich eingetragen - oder führt das zu Problemen?

Da die DDB-Website keine einfache Möglichkeit zu bieten scheint, um auf so etwas hinzuweisen (it's not a wiki ;), könnte man ja solche Fälle, wenn sie jemand entdeckt, hier sammeln; als kleine Gefälligkeit an die DDB. grüße, Hoch auf einem Baum 22:23, 8. Aug 2005 (CEST)

Ich sehe jetzt erst den obigen Abschnitt #Person_doppelt_im_Katalog_der_DDB. Es ist natürlich einsichtig, dass nur die individualisierten PND zum Datenbankabgleich verwendet werden sollten. In diesem Fall ist das allerdings etwas ärgerlich, da unter der individualisierten PND gerade mal zwei Werke stehen, unter der nicht individualisierten hingegen 21 (darunter alle wichtigen). Hier zeigen sich wieder die Probleme, die durch die Vermischung von Metadaten (PND-Nummer) und Inhalten für die Leser (OPAC-Weblink)entstehen. Ich werde den nicht individualisierten PND-Link wieder entfernen und den individualisierten auskommentieren, bis sich die DDB-Redaktion dieses Frankfurter Gelehrten annimmt ;)

Der Vorschlag, solche Fälle hier zu sammeln, besteht natürlich weiterhin. grüße, Hoch auf einem Baum 22:37, 8. Aug 2005 (CEST)

Na dann schau bitte mindestens ein Mal pro Woche im Katalog der DDB nach, wann sie bei den anderen Werken die (individualisierte) PND nachgetragen haben. Die Diskussion, ob man die PND in einen Artikel als sichtbaren Link einfügen soll, haben wir hier doch schon zur Genüge geführt. Gruß --Kolja21 01:30, 9. Aug 2005 (CEST)
Ja, mit dem Ergebnis, dass sie in solchen Fällen auskommentiert werden kann. Siehe Wikipedia:PND, Vorlage_Diskussion:PND#Vorgehensweise_(siehe_auch_Wikipedia:PND). grüße, Hoch auf einem Baum 03:09, 9. Aug 2005 (CEST)

Lob und Vorschlag

Hallo zuerst mal ein Lob zur PND Verknüpfung! Ich weiß nicht, ob das hierher paßt ... Ich rege an, daß der komplette restliche Datenbestand von der DDB übernommen wird und automatisch mit einem zusammengebastelten Text in die Wikipedia eingeladen wird. Zum einen erhalten wir dann eine neue große Informationsbasis zum anderen werden die Lemmas automatisch PND konform und regen zu guter letzt möglicherweise unsere geneigten Leser an unserer WIKI mehr mitzuarbeiten ... Pierre gronau 21:08, 25. Aug 2005 (CEST)

Die Idee klingt verlockend, aber sogenannte "gute" Stubs anzulegen, stösst bei vielen Nutzern (leider!) auf Ablehnung. Siehe die Diskussion um den Vorschlag, die biografischen Artikel in Bezug auf die Ansetzung der Namen und die Lebensdaten mit dem Brockhaus abzugleichen: Projekt 52.000 Personen. Viele Grüße --Kolja21 02:28, 26. Aug 2005 (CEST)

PND für Gebäude...

Mir fiel gerade auf, dass auch Gebäude teilweise PND-Nummern haben, siehe Petersdom. Wie verfahren wir damit? Hinweis an Jakob: daher hast du auch mehr Personen in deiner Tabelle, als es eigentlich gibt - du nimmst auch alle Artikel mit PND-Nummern auf ;). --APPER\☺☹ 05:29, 29. Aug 2005 (CEST)

Es ist keine PND-Nummer. Scheinbar wird die interne Pica-Produktionsnummer (PPN) in der Wikipedia als PND-Nummer verwendet. Wenn das durchgehend so gemacht wurde, dann ist es an Schwachsinn nicht zu überbieten, weil die PPN in anderen Systemen nicht bekannt ist (im Gegensatz zur PND-Nummer). - Im vorliegenden Fall handelt es sich beim Ziel um einen Satz der SWD, der Schlagwort-Normdatei. --Ska13351 18:40, 29. Aug 2005 (CEST)
Da ist wohl jemand mit dem nächsten Projekt vorgeprescht ;-) Das ist nämlich anscheinend keine PND- sondern eine SWD-Nummer (?). Auch GKD-Nummern sind im Katalog der DDB indexiert. Ich habe mal dort angefragt, wie wir die Nummern auseinander halten sollen. Eigentlich ganz gut aber der Text der Vorlage passt bei Schlagwörtern nicht ganz. Hier noch zwei Beispiele:

Hier die Antwort: Die PND hat einen eigenen ID-Nummernbereich in der Datenbank (das ist gleichzeitig bei der PND auch die PND-Nummer), der bei 10000000 (plus Prüfziffer) beginnt und aktuell bei 130328529 endet. Zuwachs ist bis 14999999 möglich. Bei ID-Nummer 15000000 beginnt ein neuer Normdatenbereich (Basisklassifikationen). PND-Nummern liegen damit im Bereich 10000000-14999999.

Bei GKD und SWD ist das anders. Hier gibt es keine Übereinstimmung zwischen ID-Nummer und GKD-Nummer bzw. SWD-Nummer. Die ID-Nummern-Bereiche sind:

GKD: 00000001-00899999, 05000001-05999999, ab 94000001
SWD: 04000001-04999999, ab 94000001

Also alles von 10000000 bis 14999999 ist als PND möglich - die anderen ID-Nummern nützen uns nichts, da es sich lediglich um interne Datenbank-IDs handelt und keine offiziellen Normdaten-IDs. -- Nichtich 11:06, 7. Sep 2005 (CEST)

Hilfe beim Auffinden einer PND-Nummer

Bärbel Schäfer hat den Roman Wer, wenn nicht er? geschrieben. Der ist auch schon bei der deutschen Bibliothek auffindbar. Wie ermittle ich nun die PND-Nummer für Bärbel Schäfer? Noch als Zusatz: http://de.wikipedia.org/wiki/Vorlage_Diskussion:PND#Wie_kommen_wir_an_die_PND-Nummern.3F habe ich gelesen, bekomme es aber trotzdem nicht hin.--Harmonica 16:46, 2. Sep 2005 (CEST)

Geduld. Im Katalog der DDB steht: "Titel für die Benutzung noch nicht verfügbar (in Bearbeitung)". Der Name der Autorin ist entsprechend noch nicht verlinkt.
Es gibt zwar die PND 106065998 "Bärbel Schäfer", aber sie bezieht sich auf den Namen, d.h. umfasst alle Personen, die so heißen. Erst wenn eine individualierte PND für "Bärbel Schäfer, geb. 1963" vergeben ist, macht es Sinn, sie bei Wikipedia einzutragen. Gruß --Kolja21 00:44, 3. Sep 2005 (CEST)

In der ddb bereits als Autorin mit benutzbaren Werken verzeichnet ist Rada Ivekobic. Wie finde ich die PND zu dieser Person heraus? merci sagt -- Pipifaxa 08:55, 3. Okt 2006 (CEST)

Der Name ist nicht vorhanden. Gib mal ein Beispiel für verzeichnete Werke. --08-15 10:47, 3. Okt 2006 (CEST)
sorry, war typo, es ging um Rada Ivekovic - wie Kolja21 richtig recherchiert hat (s.u.) -- Pipifaxa 22:03, 3. Okt 2006 (CEST)

Die Autorin hat noch keine eigene PND. Ihre Bücher sind vorläufig unter der (nicht indivudalisierten) PND 103224580 abrufbar. --Kolja21 16:05, 3. Okt 2006 (CEST)

merci für die Ziffernfolge und die Angabe, dass diese PND noch nicht individualisiert ist, aber wie hast du dies herausgefunden? das wollte ich ja gern wissen :-) -- Pipifaxa 22:03, 3. Okt 2006 (CEST)

Es gibt doch den Artikel zur Diskussionsseite. Dort steht der Link zum Bibliothekskatalog.

ich hatte zwar im Artikel geschaut, bin aber mit den dortigen Angaben nicht weitergekommen, daher habe ich hier gefragt. --Pipifaxa 08:50, 4. Okt 2006 (CEST)

Den Link

Auf der Seite befinden sich viele Links, deren Sinn sich für Nicht-Bibliotheksfachleute sich nicht so leicht erschliesst, sagst du mir bitte in URL, welchen Link genau du meinst?

klickst du an, tippst den Namen der gesuchten Person ein und dann liest du die PND ab.

die finde ich in welchem Feld? merci --Pipifaxa 08:50, 4. Okt 2006 (CEST)

Viel wichtiger als solche Detailfragen, ist aber in diesem Fall die Wikipedia:Formatvorlage Biografie. Ein tabellarischer Lebenslauf ist zwar eine brauchbare Quelle, aber noch kein Artikel. Die Auflistung der Interessengebiete habe ich bereits gelöscht, denn sowas gehört hier überhaupt nicht rein. --Kolja21 03:47, 4. Okt 2006 (CEST)

merci dafür,
mit Verlaub, diese Bemerkung wiederum hätte ich bei der Diskussionsseite zum Eintrag zu Rada Ivekovic erwartet, danke trotzdem, mir den Link zur entsprechenden Vorlage anzugeben, meine Fragen zu deinen Aenderungen siehe also dort.
Trotz deines für meinen Geschmack etwas zu ungeduldigen bzw. belehrenden Tons hier: wikipedianische Gruesse und schönen Tag noch :-) --Pipifaxa 08:50, 4. Okt 2006 (CEST)

Ist es irgendwie möglich bei bekannter PND einer Person, einen Link zur entsprechenden Wikipedia-Seite zu legen, bzw. abzufragen, ob es zu dieser PND eine zugeordnete Wikipediaseite gibt? -- 12:48, 3. Sep 2005 (CEST)

Na klar, dazu gibt es den "Suche"-Button. Der Suchfunktion ist es völlig egal, ob man nach einer Nummern- oder Buchstabenfolge sucht. Den Link legt man dann ganz normal über den Artikelnamen an. Viele Grüße -- Kolja21 03:59, 4. Sep 2005 (CEST)
Verlinkt werden sollte wenn möglich immer auf den direkten Artikelnamen. Eine OpenURL wird es so schnell nicht auf den Server der Wikipedia geben. Solange kann folgende OpenURL verlinkt werden (Achtung! keine Garantie auf Funktionstüchtigkeit - wenn dies wirklich verwendet wird, am besten bei mir melden (apper@apper.de), dass ich mich melden kann, wenn es Probleme geben sollte etc.): http://www.apper.de/wikipedia/pnd.php?pnd=118501828 - und dort halt jeweils die PND angeben. --APPER\☺☹ 04:38, 4. Sep 2005 (CEST)
Wenn wir OpenURLs einrichten, was ich begrüßen würde, sollte ein offizieller Resolver verwendet werden - z.B. http://resolver.wikimedia.de Das ist wahrscheinlich verbunden mit der Vergabe von URIs für Wikipedia-Artikel. -- Nichtich 15:12, 5. Sep 2005 (CEST)
Zur Verlinkung über die PND zu einem Wikipediaartikel habe ich bei den Architektenseiten von archINFORM jetzt folgendes realisiert (dank APPERs Hilfe):

Schritt 1: SQL-Abfrage einer Verweistabelle PNDNummer - Wikipediaartikelname Schritt 2: Bei vorhandenem Eintrag Einblendung eines Links direkt zu Wikipedia. Die Verweistabelle wurde aus einem Wikipedia-Dumpextrakt von Jakob Voß auf wdw.datawarehouse.de gebildet. Ist vielleicht für ähnliche Projekte ganz interessant als praktisches Anwendungsbeispiel für die PND.

Auskommentierte PND-Nummern

Wäre es nicht besser in diesen beiden Fällen, die Kommentare aus der Vorlage entweder rauszunehmen in der Form <!--{{PND|119485427}}, Keine Treffer im DDB-OPAC, 23.05.2005--> oder als zweiten Parameter zu übergeben in der Form <!--{{PND|119485427|Keine Treffer im DDB-OPAC, 23.05.2005}}. Ansonsten bekommt man bei SQL-Abfragen zur PND-Ausfilterung für kommentierte Vorlagen ein unschönes Ergebnis. - Arch2all 12:19, 26. Sep 2005 (CEST)

Wenn der Kommentar im Vorlagen-Parameter steht, kann man ihn besser auswerten als im Text. Die Vorlage kann nicht gleichzeitig ein oder zwei Parameter haben. Ein "unschönes Ergebnis" kann je nach gewünschter Anwendung mit weiteren Skripten verschönert werden. Übrigens gibt es eine Datenbank aller Personendaten zum Herunterladen unter http://wdw.sieheauch.de/staging-area/ -- Nichtich 12:29, 26. Sep 2005 (CEST)
Wenn ein Parameter mehr übergeben wird (der Kommentar eben), funzt die Vorlage doch trotzdem noch korrekt und ignoriert einfach den zusätzlichen Parameter und man spart sich das "unschöne Ergebnis" mit weiteren Skripten "aufhübschen" zu müssen. - Arch2all 15:19, 26. Sep 2005 (CEST)
Ich weiss nicht, mit welchen Mittel du die Daten aus der Datenbank bekommst wenn nicht mit einem Skript aber das mit der ignorierten Vorlage überzeugt mich, da es sowohl bei auskommentierten als auch bei nicht auskommentierten Links stehen kann - allerdings sollte zunächst überprüft werden, wie viele Einträge in Alter Form <!--{{PND|...}}, ...--> vorhanden sind und sie in die neue Form <!--{{PND|...|...}}--> überführt werden können. -- Nichtich 10:17, 27. Sep 2005 (CEST)

Darstellung in Wikipedia

Wäre es jetzt, nachdem die PND in der Wikipedia etabliert ist, nicht an der Zeit, die Darstellung in den biografischen Artikeln zu verbessern? Es gibt mittlerweile zahlreiche PND-Einträge, zu denen kein Treffer im DDB-OPAC vorliegt, wie beispielweise bei dem kanadischen Rundfunkpionier Reginald Fessenden. Nach den aktuellen Regeln lautet der Eintrag in dem entsprechenden Artikel:

  • <!--{{PND|121960889, Keine Treffer im DDB-OPAC, 21.12.2005}}-->

Die PND ist also nur in den Metadaten vermerkt, was schade ist - auch im Hinblick auf die DVD-Ausgabe. Ich denke, man sollte zusammen mit der Vorlage:Koordinate Artikel eine einheitliche Lösung finden. --Kolja21 17:45, 23. Dez 2005 (CET)

Wenn man mit der PND keine zusätzlichen Informationen über die Person erhalten kann, ist die Angabe für die meisten Leser sicher uninteressant. Es ist aber sehr ungeschickt, dass die Informationen nur als Kommentar im Quelltext stehen - eine optional einblendbare Vorlage würde das Bearbeiten von Artikeln im Hinblick auf fehlende PND-Angaben sehr erleichtern. --08-15 21:30, 13. Apr 2006 (CEST)

Was ist mit der Alternative "Vorlage:PND-Datensatz"? Da werden zwar viele jammern, dass das ein überflüssiger Weblink sei, aber die Angaben zur PND stehen an der gewohnten Stelle und sind nicht nur in den Metadaten sichtbar. Ich habe die Angaben in Reginald Fessenden entsprechend für Demozwecke geändert. --Kolja21 00:05, 14. Apr 2006 (CEST)

Da werden nicht nur viele jammern, sondern den Weblink mangels Relevanz auch wieder löschen. (Dumme Frage: Wie findet man überhaupt einen PDN-Datensatz ohne verknüpfte Literatur?) --08-15 00:19, 14. Apr 2006 (CEST)
Über diese Suchmaske. Aber nur die Einträge mit Lebensdaten sind echte PNDs. --Raymond 01:57, 14. Apr 2006 (CEST)

Ich habe unter Benutzer:Raymond/PND2 ein Template erstellt, mit dem man fallweise die Anzeige der PND unterdrücken kann. Bitte schaut es euch doch mal an, ob es so als Ersatz für das bisherige PND zu gebrauchen ist bzw. das bisherige Template ohne Kollateralschaden umgebaut werden kann.

Was ich bisher nicht überblicken kann, ist die Auswertung der bisherigen Einträge durch externe Tools wie z.B. die von APPER.

Bitte ergänzt ggfs. die Beschreibung in der neuen Vorlage (ist noch in meinem Benutzernamensraum) oder diskutiert sie. --Raymond 08:53, 19. Apr 2006 (CEST)

Ich finds gut ;). Auswertungsscripts sollten recht leicht anpassbar sein. --APPER\☺☹ 17:52, 19. Apr 2006 (CEST)
Ich kann nichts erkennen, was Probleme machen sollte: Was spricht dagegen die aktuelle Vorlage zu ersetzen? Das verursacht (wahrscheinlich) die kleinsten Probleme, da an den Artikeln nichts veraendert werden muss. Oder seh ich das falsch? --Prolineserver 21:57, 19. Apr 2006 (CEST)
Stimmt, wenn ich die vorhandene Vorlage umbaue, braucht bei korrekter, "aktivierter" PND am Artikel nichts geändert zu werden. Nur bei auskommentierten PNDs kann man dann nach und nach das neue Format, mit dem Kommentar als zweitem Parameter, anwenden, wenn an den Artikeln sowieso gearbeitet wird. --Raymond 22:29, 19. Apr 2006 (CEST)
Es gibt nur wenige auskommentierte PNDs, so zumindest mein Eindruck. Kann jemand, falls die Änderung vorgenommen wird, eine Liste erstellen? --Kolja21 22:45, 19. Apr 2006 (CEST)
Wir haben grad am Toolserver das Problem, dass nicht alle Artikeltexte direkt verfügbar sind, deshalb werden die Personendaten auch nur aus dem Dump generiert. Wichtiger als dass die auskommentierten PND geändert werden ist, dass die Dokumentation geupdatet und verbessert wird, dann ändern sich die Angaben mit der Zeit praktisch von alleine. -- Nichtich 17:44, 20. Apr 2006 (CEST)

Ok, nachdem bis jetzt keine Einwände gekommen sind, werde ich die Vorlage:PND umbauen und die Doku anpassen. --Raymond 22:40, 20. Apr 2006 (CEST)

Danke - und so gehts weiter!

Hallo - danke für die wirklich schnelle Abarbeitung. Das ganze geht jetzt wie folgt weiter: bis Freitag (Prüfung..) werde ich gar nix tun, danach werde ich in meiner Datenbank eure Kommentare durchschauen und werde anfangen anhand von Datenbankangaben und euren Angaben hier, Listen mit Doppeleinträgen der DDB zu erstellen. Weiterhin warten wir dann auf den nächsten Datenbankdump. Bis dahin werde ich versuchen ein Test-Tool fertigzustellen, um fehlerhafte Einträge zu finden, ich denke da wird es einiges geben. Ja und danach sollte die Qualität erstmal ganz gut stimmen ;).

Zum jetzigen Zustand. Anhand eines Status-Eintrags in der DB kann ich kurz mal sagen, wie es wohl derzeit aussieht:

  • bei 13905 Personen wurden Datensätze eingefügt
  • bei 25335 Personen gab es keinen Datensatz bei der DDB, mit dem Publikationen verknüpft sind
  • bei 39 Personen gab es Probleme bzgl. der Anzahl der Datensätze (es gab vielleicht mehrere gleiche Datensätze der DDB, wobei ich später erst mitbekam, dass als "gleich" auch gilt, wenn die DDB zwei Datensätze ohne Jahresangaben hat und unsere Personendaten auch keine Lebensdaten haben) - das mach ich demnächst per Hand nochmal
  • bei 2028 Personen wurde explizit auf "Keine PND" geklickt
  • bei 626 Personen waren keine Personendaten mehr im Artikel - das waren meist inzwischen verschobene Artikel, die werden dann vermutlich bei einem nächsten Durchlauf erfasst
  • bei 30 Personen gab es mindestens 10 Treffer bei der DDB, die habe ich nicht angezeigt, da es vermutlich auch mehr als 10 gab und mein Tool da nicht die weiteren Seiten auslesen kann (bzw. für die 30 Datensätze wollt ich nicht extra deswegen Programmieraufwand treiben).

MfG --APPER\☺☹ 05:12, 13. Jul 2005 (CEST)

Korrektheitsprüfung

Ich habe gerade begonnen, Korrektheitsprüfungen durchzuführen. Die von Jakob Voß geschätzten 10% Fehler halte ich dabei für zu hoch, ich komme auf ca. 2%.

Wie ich vorgehe: ich ermittle zwei Wahrscheinlichkeiten. Zum einen ermittle ich die Ähnlichkeit der Namen der Personendaten und der PND-Daten. Dabei benutze ich verschieden gewichtete Verfahren, die zu einer Endwahrscheinlichkeit zusammengerechnet werden. Des Weiteren berechne ich eine Jahreswahrscheinlichkeit, die die Lebendaten vergleicht und entsprechende Abweichungen erkennt und einbezieht. Beide Werte werden dann gleich gewichtet zu einer Wahrscheinlichkeit zusammengefasst.

Es zeigt sich, dass die Wahrscheinlichkeit 50% eine sehr gute Grenze ist. Bei meinem ersten Test mit 1000 Datensätzen ergab sich, dass auf diese Weise Fehler sehr zuverlässlich ermittelt werden können.

Selten kommt es vor, dass Personen mit weniger als 50% doch korrekt sind (dann liegt es meist daran, dass z.B. die Lebensdaten sehr konfus sind bzw. nicht korrekt ausgelesen werden konnten (Martin von Tours) oder aber die PND-Datensätze sehr verwirrend sind Friedrich August II. oder III.??).

Schlimmer ist, dass es in einem Fall vorkam, dass eine Person trotz Fehlers über 50% hatte. Dies kommt daher, dass bei den PND-Daten für Marie Curie angegeben ist "Curie, Pierre <Madame>". Daher habe ich den Fehler, dass Pierre Curie die PND-Nummer seiner Frau hat nur durch Zufall erkannt. Ich hoffe, dass es nicht zu oft vorkommt, dass bei den PND-Daten der Name einer anderen Person als Alternativname angegeben ist...

So nun zu den Ergebnissen meines Tests mit 1000 Datensätzen. Eine erfreulich hohe Anzahl erreichte 100% Übereinstimmung, das heißt sowohl der Name als auch die Lebensdaten stimmen 100%ig überein. Auf 851 der 1000 Datensätze trifft dies zu, immerhin 85%. Für 130 Datensätze (13%) ergibt sich ein Wert zwischen 50 und 100%. Über diese Datensätze muss man sich nochmal Gedanken machen bzgl. Angleichung/Überprüfung der Lebensdaten bspw. Nur 19 von 1000 Datensätzen liegen unter 50% und sind somit wohl sehr wahrscheinlich fehlerhaft.

Als nächstes werde ich mir Gedanken machen, wie man diese fehlerhaften Einträge am besten abarbeitet. Auch eine Anpassung des Jahres-Algorithmus überlege ich, denn wenn bspw. Geburts- und Sterbejahr jeweils nur um 2 Jahre abweichen, werden derzeit gerade einmal 11% Übereinstimmung im Jahreszahlenbereich angezeigt, was ein wenig sehr schlecht ist.

Naja ein ander mal ;) --APPER\☺☹ 19:24, 27. Aug 2005 (CEST)

Motivation

Wenn wie bei den Personendaten die Anzahl der Datensätze angezeigt wird, erhöht das die Motivation vielleicht, da man dann den Fortschritt sehen kann! -- Nichtich 4. Jul 2005 13:08 (CEST)

Hallo Nichtich, ich habe eine private wöchentliche Statistik gefügt, und der Anstieg der Artikel, die mit der Nationalbibliothek verlinkt sind, ist verdammt beeindruckend:
17. Mai - Joachim Ringelnatz (erste Verlinkung mit PND)
24. Mai - 38 Einträge
31. Mai - 75 Einträge
7. Juni - 89 Einträge
13. Juni - Apper stellt seine Planung für ein PND-Tool vor
14. Juni - 109 Einträge
16. Juni - Testlauf des PND-Tools gestartet
21. Juni - 159 Einträge
28.Juni - 282 Einträge
4. Juli - PND-Tool offiziell online
5. Juli (1) - 420 Einträge
5. Juli (2) - ca. 22 Std. später: ca. 1.730 Einträge
Jetzt, wo die 1.000-Grenze überschritten ist, habe ich mit dem Zählen aufgehört und kann insofern deinen Vorschlag, die Anzahl der Datensätze mit anzuzeigen, nur begrüßen.
--Kolja21 7. Jul 2005 02:37 (CEST)

Sehr schön! Ich vermute mal, dass es nicht ganz so schnell geht wie bei den Personendaten, bin aber schon auf den ersten Dump gespannt! -- Nichtich 7. Jul 2005 09:34 (CEST)

Wo findet man eigentlich die aktuellen Zahlen zur PND? Ich lese immer nur "Mitte 2003 enthielt die PND rund 2 Millionen Namen", aber seitdem hat sich doch einiges getan. Außerdem würde mich interessieren, wie gut die Zusammenarbeit mit der DDB läuft. Wieviele Datensätze hat sie der dt. Wikipedia zur Verfügung gestellt? Gibt es Pläne für eine Zusammenarbeit mit der LoC? --Kolja21 7. Jul 2005 23:33 (CEST)

Nicht exakte Treffer

Hi, ich hatte gerade den Fall, dass eine Person in der Wikipedia vorhanden war und ein nicht exakter Treffer der PND angezeigt wurde. Dieser eine Treffer hat nicht gepasst (bzw. hätte schon irgendwie gepasst, es war nur ein Wirkungszeitraum angegeben), allerdings existiert ein anderer PND-Eintrag der exakt passt; dieser wurde aber nicht angezeigt, da er mit keiner Publikationen verknüpft ist.

Vielleicht könntest du in dem Fall auch die nicht mit Publikationen verknüpften Personen der PND anzeigen lassen. Dann kann man leichter herausfinden welcher der richtige Eintrag ist.

(Für so leere Einträge wäre z.B. eine leere Vorlage möglich: {{PNDkein_eintrag_in_DDB|11245678|2005-06-07}}, darauf könnte man besser Zugreifen als auf die in HTML auskommentierte.) --Habakuk <>< 6. Jul 2005 17:03 (CEST)

Ich finde es weiterhin sinnlos, Wikipedia-Einträge mit nicht-informationen aufzublähen. Solange die Person keine Publikationen in der DDB hat, sollte der Artikel keine entsprechende Information haben, soweit meine Meinung. Es gibt keinen Grund, wieso in einem Artikeltext stehen sollte, dass die Person zwar einen Eintrag hat, aber keine Publikationen. --APPER\☺☹ 6. Jul 2005 19:43 (CEST)
Die Person hat aber Publikationen, allerdings nicht im OPAC der DDB, sondern in anderen Bibliographischen Datenbanken, auf die wir bisher noch nicht verlinken. Ich sehe auch keine ideale Lösung, aber im Endeffekt sollte die PND für alle Personen irgendwann eingetragen werden. Die Frage ist nur ob jetzt gleich oder erst wenn wir auch auf andere Kataloge linken (ähnlich wie bei den ISBN-Links oder noch etwas komfortabler). -- Nichtich 7. Jul 2005 00:33 (CEST)
Das Problem ließe sich lösen, wenn man die PND in die Metadaten (Personendaten) mit aufnimmt. Dann dient sie als das, was sie eigentlich ist, als Normdatei, d.h. der Artikel wird einer Person eindeutig zugeordnet und es spielt keine Rolle, ob die DDB Literatur von oder über diese Person besitzt. --Kolja21 7. Jul 2005 23:42 (CEST)
Das ist leider keine Lösung, denn erstens sind die Personendaten bisher nicht für alle sichtbar und zweiten muss dann trotzdem in jedem Fall ein Link mit der PND-Nummer gesetzt werden. Der Text der Vorlage:PND könnte irgendwann in "Werke von und über XY" umgenannt werden, wenn es eine Möglichkeit gibt, alle wesentlichen Bibliotheken und Archive nach PND zu durchsuchen. Fangen wir einfach erstmal bei der DDB an, die hat noch das meiste. Mittelfristig steht sowieso auch noch VIAF an :-) -- Nichtich 8. Jul 2005 01:20 (CEST)
Der Vorschlag zielt auch nicht auf die Ablösung des jetztigen Links. Aber bitte nicht schon wieder eine Umbenennung ;-) Die Version "Werke von und über XY" hatte wir schon. Bin auf die Einführung des VIAF gespannt. In der aktuellen Ausgaben von dialog findet sich leider nichts zu dem Thema, aber ich bin sicher, sie werden in einem der nächsten Heften etwas über die PND & Wikipedia schreiben. Gruß --Kolja21 8. Jul 2005 02:05 (CEST)

Ergänzung von Daten in der WP

In der Anleitung steht, dass wir hier keine Daten verbessern. Was ist aber, wenn uns Daten fehlen? Bei Eliza Wille z.B. hatte die DDB das Totesdatum und wir nicht (peinlich, peinlich, wo's doch sonst andersrum ist, mein Rekord ist jemand, der seit 200 tot ist ;-)). Ich habe es mal ergänzt, ist das ok? Wenn nicht, bitte wieder entfernen. --DaB. 9. Jul 2005 13:19 (CEST)

Hm, ich sehe nichts, was dagegen spricht. Wenn ich Ungereimtheiten finde, versuche ich auch immer ein wenig zu schauen, obs an uns oder denen liegt :) --ElRakı ?! 9. Jul 2005 13:58 (CEST)

Hallo DaB, es spricht in der Tat nichts dagegen, Daten von der PND zu übernehmen - es ist mit Sicherheit nicht die schlechteste Quelle. Das heißt, wenn in Wikipedia das Todesjahr fehlt und in der PND steht es drinnen, sollte es auf jeden Fall nachgetragen werden.

Der Hinweis "keine Daten verbessern" bezieht sich darauf, dass man nicht einfach Daten ungeprüft überschreiben sollte. Wenn in der Wikipedia ein anderes Todesjahr als in der PND aufgeführt wird, sollte man nicht blind der PND glauben, sondern höchstens in dem betreffenden Artikel anmerken, dass das Todesdatum nicht geklärt ist und dass zwei abweichende Datumsangaben vorliegen. --Kolja21 9. Jul 2005 14:37 (CEST)

OK. --DaB. 9. Jul 2005 14:55 (CEST)