Wikipedia:Archiv/Datenbankabfragen
Diese Seite dient als Hauptseite für die Koordination von Datenbankabfragen. Die Software MediaWiki bietet zwar eine Funktion, die SQL-Abfragen auf der Datenbank erlaubt (Spezial:Asksql), aber aus Performance-Gründen ist diese in der Wikipedia abgeschaltet. Es gibt jedoch ein Abfragemodul, das sich für kleinere eigene Abfragen oder auch die Programmierung eines Bots eignet. Außerdem werden in mehr oder weniger regelmäßigen Abständen Kopien der verschiedenen Wikipedia-Datenbanken zum Download angeboten (Wikipedia:Download), die für eigene Abfragen - offline-Abfragen - verwendet werden können.
Diese Seite ist ein Versuch, nach dem Vorbild von Offline reports eine gemeinsame Seite zur Verfügung zu stellen, auf der man Wünsche für Datenbankabfragen äußern kann, und die jeder mit den nötigen Mitteln und Fähigkeiten abarbeiten kann:
- Auf Abfragewünsche kannst du eine Anfrage stellen (Archiv)
Einige Benutzer (u.a. MichaelDiederich) laden sich regelmäßig die neueste Kopie der deutschen Wikipedia-Datenbank herunter, und führen auf Anfrage Abfragen aus. Wer wirklich den aktuellen Datenbestand benötigt, kann sich im Wikipedia:Chat an einen Developer wenden, oder - wenn vorher bekannt ist, welche (wenigen!) Seiten betrachtet werden müssen - die Seiten über Spezial:Export als XML-Dump aus der WP herunterladen und manuell oder mit Hilfsprogrammen verarbeiten.
Die Ergebnisse werden üblicherweise auf Unterseiten des anfragenden Benutzers oder dieser Seite hochgeladen. Zu jeder neuen Ergebnisseite sollte auf der Seite selbst die verwendete Abfrage hinterlegt werden, um eine einfache Aktualisierung durch andere zu ermöglichen. Neue Seiten, die für andere Bearbeiter interessant sein könnten, sollten hier verlinkt werden.
Datenbankabfragen im Web
Bearbeiten- GrepWikiTitle (aus SQL-Dump) Einfache Suche nach Artikel-Titeln mit regulären Ausdrücken
Toolserver
BearbeitenFür intensiveren Datenbankzugriff gibt es den meta:Toolserver, bei dem du dich für einen Account bewerben kannst, damit steht dir dann ein direkter Datenbankzugriff zur Verfügung. Es werden dort ca. 640 Datenbanken der Wikimedia-Projekte mit ungefähr 5 Min. Verzögerung gespiegelt.
Aktuelle Dumps
BearbeitenAchtung: Seit MediaWiki Version 1.5 sind die Tabellen cur und old nicht mehr als SQL-Dump formatiert, sondern in XML. Siehe Wikipedia:Download für eine Anleitung zur Verarbeitung der Dumps (einschließlich dem Import in eine eigene MediaWiki-Installation).
Die aktuell herunterladbaren Dumps liegen auf http://dumps.wikimedia.org/dewiki/
Wartungslisten
BearbeitenEinige der Wartungslisten werden mit jedem Dump aktualisiert, einige erst, wenn sie größtenteils abgearbeitet sind.
Etliche der hier aufgeführten Wartungslisten werden nicht routinemäßig, sondern auf Anfrage, d.h. wenn konkreter Bedarf besteht, aktualisiert.
Aktualisierungswünsche sind ausdrücklich willkommen!
Liste | Beschreibung | Stand | Status |
---|---|---|---|
Bilder | |||
Benutzer:SirJective/Wartungslisten/Bildprobleme | Bilder ohne Beschreibung, Beschreibungen ohne Bild etc. | 26. November 2004 | |
Benutzer:SirJective/Wartungslisten/Identische Bildbeschreibung | Bilder mit identischen Bildbeschreibungen in verschiedenen WPs | 3. Februar 2005 | |
Benutzer:SirJective/Wartungslisten/Selbst erstellte Bilder | Bildbeschreibungsseiten, auf denen keine Lizenz, aber der Text "selbst erstellt" steht | erledigt | |
Benutzer:Dapete/Datenbankabfragen/Verwaiste Bildbeschreibungsseiten | Bildbeschreibungsseiten, zu denen es weder hier noch auf Commons ein Bild gibt | 14. Juli 2007 | |
Wiki-Syntax | |||
Benutzer:SirJective/Wartungslisten/Klammer-Ungleichgewicht | Artikel mit Absätzen, bei denen die Anzahl der öffnenden und schließenden eckigen Klammern verschieden sind, sowie Artikel, deren Anzahl der öffnenden und schließenden geschweiften Klammern verschieden sind | 31. Januar 2006 | Teile L, N und O zum Abarbeiten vorhanden |
Benutzer:SirJective/Wartungslisten/Pre-Text | Artikel, die möglicherweise fest formatierten Text enthalten | 27. Januar 2005 | Liste nur für nur Sonderzeichen und A als Test der Abfrage, sollte evtl. vervollständigt werden |
Personen/Personendaten | |||
Benutzer:SirJective/Unkategorisierte Personen | Personen (identifiziert durch bestimmte Zeichenketten im Text), die in keine Kategorie eingeordnet sind | erledigt | |
Benutzer:SirJective/Personendaten | Probleme in Artikeln, die Personendaten enthalten | 7. Januar 2005 | |
Benutzer:SirJective/Personen ohne Personendaten | Artikel, die vermutlich Personen beschreiben, aber noch keine Personendaten enthalten | 3. März 2005 | |
Benutzer:FEXX/war | Artikel, die die Zeichenfolge "|KURZBESCHREIBUNG=war" enthalten | erledigt | |
Benutzer:MichaelDiederich/Plus als dagger | Artikel, die vermutlich ein als Dagger (†) verwendetes Plus (+) enthalten | 31. Januar 2006 | erledigt |
Artikeltitel | |||
Benutzer:SirJective/Wartungslisten/Namensraum-Titel | Artikel, deren Titel mit einem Namensraum kollidiert | 20. Oktober 2005 | |
Benutzer:SirJective/Klammerzusatz | Artikeltitel mit Klammerzusatz ohne klammerlose Version | 6. April 2005 | |
Benutzer:SirJective/Wartungslisten/Ähnliche Titel | Artikel, deren Titel sich sehr ähnlich sind | 11. Dezember 2005 | erledigt |
Nicht vorhandene Artikel mit Sonderzeichen am Anfang | 27. Februar 2006 | ||
Benutzer:Sansculotte/Zu lange Titel | Artikel mit einem sehr langen Titel | 28. Dez 2005 | |
Verlinkungen auf vorhandene Seiten | |||
Wikipedia:Archiv/Redirects im falschen Namensraum | Redirects, die wir vermutlich nicht haben wollen | erledigt | |
Benutzer:Rdb/Falsche Redirects | Sehr kurze Artikel, die das Wort "siehe" enthalten und eventuell zu Redirects gemacht werden müssen | erledigt | |
Benutzer:Echoray/Sackgassen-Artikel | Artikel, die keine Links zu anderen Artikeln haben | erledigt | |
Benutzer:SirJective/Wartungslisten/Halbwaisen | Artikel, die nicht von Artikeln, aber möglicherweise von anderen Namensräumen aus verlinkt sind | 6. April 2005 | erledigt |
Wikipedia:Selbstlinks | Seiten mit Links auf sich selbst | 27. April 2007 | erledigt |
Benutzer:SirJective/Wartungslisten/Selbstlinks via Redirect | Seiten mit Links auf Redirects, die auf die ursprüngliche Seite verweisen | 3. Feb 2005 | |
Verlinkungen auf nicht vorhandene Seiten (broken links) | |||
Benutzer:SirJective/Wartungslisten/Fehlende Artikel mit langem Titel | brokenlinks mit sehr langem Titel | 26. Jun 2005 | |
Benutzer:SirJective/Wartungslisten/Kürzere Treffer | fehlende Artikel, zu denen Artikel mit verkürztem Titel existiert | 7. Januar 2005 | |
Kategorien | |||
Benutzer:SirJective/Wartungslisten/Topkategorien | Kategorien, die in keine Kategorie eingeordnet sind | 20. Oktober 2005 | |
Benutzer:Ezrimerchant/Sehr kleine Kategorien | Kategorien mit höchstens 2 Artikeln und Unterkategorien | 20. Oktober 2005 | |
Benutzer:Bierdimpfl/Nicht kategorisierte Seiten | Artikel die in keine Kategorie eingeordnet sind | 23. Januar 2006 | |
Begriffsklärung | |||
Benutzer:SirJective/Wartungslisten/Nicht verwaiste Begriffsklärungsseiten | BKS, die noch Links von Artikeln haben | 23. Dez 2004 | |
Benutzer:SirJective/Wartungslisten/Begriffsklärungskandidaten | Seiten, die vielleicht als BKS in Frage kommen | 23.06.2005 | |
Interwiki | |||
Benutzer:SirJective/Gleichlautender Titel | Artikel mit gleichem Titel in verschiedenen Wikipedias und möglicherweise noch Interwikilinks brauchen können | ||
Benutzer:Mathias Schindler/Interwikiliste | |||
Weblinks | |||
Benutzer:SirJective/Wartungslisten/Artikel mit vielen Weblinks | 21. April 2005 | ||
Wikipedia:Defekte Weblinks | 7. Feb 2006 | ||
Sonstige | |||
Wikipedia:Fehlende Artikel | listet jene fehlenden Artikel die am häufigsten in anderen Artikel vorkommen. | 11. März 2006 | mit jedem Dump zu aktualisieren |
Benutzer:SirJective/Kurze Artikel | Artikel mit sehr kurzem Quelltext in bestimmten Kategorien; Demo-Liste anlässlich einer Diskussion über Stubs | ||
Wikipedia:Falsches Datumsformat | Artikel mit Datumsangaben im Format TT.MM.JJJJ | 23. Januar 2006 | nach Abarbeitung zu aktualisieren (derzeit hat nur SirJective das bisher verwendete Programm) |
Benutzer:SirJective/Wartungslisten/Älteste neue Artikel | die ältesten Artikel, die nach ihrer Erstellung noch nicht editiert wurden | 20. Oktober 2005 | |
Benutzer:SirJective/Wartungslisten/Doppeleinträge | geschlossen | ||
Benutzer:SirJective/Newpages verdoppelt | geschlossen | ||
Benutzer:SirJective/Wartungslisten/Vergessene Löschkandidaten | Löschkandidaten älteren Datums | erledigt | |
Wikipedia:Datenbankabfragen/IP-Diskussionen | Veraltete, überflüssige IP-Diskussionen, die gelöscht werden sollen | 22.11.06 | bitte aktualisieren |
Benutzer:APPER/ISBN | fehlerhafte ISBN-Nummern | 20. März 2006 | nicht erledigt |
Übersichten | |||
Hier sind z.B. Kategoriebäume oder inhaltlich gegliederte Artikellisten, die durch Abfragen erneuert werden können. Die Grenze zur Wartungsliste ist natürlich fließend. Diese Seiten sollten je nach Bedarf (auf Wunsch) aktualisiert werden. | |||
Portal:Astronomie/Index | Alphabetischer Index | 15. Februar 2006 | |
Portal:Militär/Register | Alphabetischer Index | 2. März 2006 |