Portal Diskussion:Vereinigte Staaten
Archiv |
|
Wie wird ein Archiv angelegt? |
American FactFinder, Census 2020, weitere Vorgehensweise
BearbeitenHallo, kommendes Jahr wird die Seite American FactFinder offenbar stillgelegt. Infos zur Neustrukturierung der Statistiken siehe hier. Durch den Census 2020 werden wir ohnehin gänzlich neue Daten bekommen, wodurch ein Boteinsatz wohl keinen Sinn macht. Die Größenordnung unserer Aufgabe nächstes Jahr kann man hier erahnen. Im Zuge dessen würde ich auch mal fragen wollen, inwieweit ein Interesse besteht, nach Veröffentlichung der Zensus-Daten 2020 eine gemeinsame Vorlage zu erarbeiten, mit welcher statistische Daten zu jedem Ort auf dieselbe Weise mit gleichem Inhalt veröffentlicht werden können. Vor 10 Jahren lief das anscheinend ziemlich unkoordiniert ab. LG und frohe Weihnachten, Stefan 12:59, 24. Dez. 2019 (CET)
- Hi, das haben wir schon vor zehn Jahren für den Census 2010 diskutiert. Heute haben wir Wikidata und ich schlage vor, dass wir die 2020'er Daten dafür nutzen, möglichst viel aus den Infoboxen zu US-Gebietskörperschaften auf Wikidatata umstellen. Die Daten werden ab Mai 2021 oder so stückweise veröffentlicht. Bis dahin haben wir Zeit uns ein Verfahren auszudenken. Grüße --h-stt !? 21:14, 8. Jan. 2020 (CET)
- Hallo h-stt, danke für deine Antwort. Grundsätzlich ist ja jede Vereinfachung der Datenaufbereitung hilfreich. Wikidata kenne ich leider nur oberflächlich. Bisher habe ich es so verstanden, dass Daten auf Wikidata gesammelt werden, die dann für die verschiedenen Sprachversionen von WP verwendet werden. Also würde es sich hauptsächlich um ein Arbeitsprojekt auf der Plattform Wikidata handeln. Die Frage wäre dann doch, ob dies von den anderen Wikipedias auch wirklich so gewünscht ist? Die federführende WP wäre da dann sicherlich die englischsprachige, mit der man sich absprechen müsste. Und das auch nur, wenn es auch einigermaßen realistisch machbar wäre. Also ich kann mir dahinter derzeit kein genaues Konzept vorstellen, lasse mich diesbezüglich aber gerne weiterbilden. Noch haben wir ja etwas Zeit, aber diese sollten wir nutzen. LG Stefan 21:53, 10. Jan. 2020 (CET)
- Hallo zusammen, es gibt entweder die Möglichkeit, diese Kategorie zu befüllen Kategorie:Vorlage:Metadaten Einwohnerzahl US oder die Daten (was im Falle der US-Zensus-Daten möglicherweise kein rechtliches Problem darstellt) aus Wikidata zu beziehen. Können Wikidata-Daten mittlerweile ohne Probleme im Fließtext eingebunden werden? --Septembermorgen (Diskussion) 18:30, 12. Jan. 2020 (CET)
- Der Aufwand dürfte bei beidem in etwa gleich sein. Die Zahlen müssen in beiden Fällen über Vorlagen in die Artikel eingebunden werden. --Septembermorgen (Diskussion) 18:49, 12. Jan. 2020 (CET)
- Ja, es ist inzwischen möglich, Daten aus Wikidata in Artikel einzubinden: sowohl in Infoboxen, wie in den Text. Bei der Überlegung, es per Metadaten hier oder per Wikidata zu machen, spreche ich mich entschieden für Wikidata aus, weil dann die Daten an einer Stelle zentral für alle Wikipedias verwaltet werden müssen. Dieses Mal sind beide Verfahren gleich viel Arbeit, 2030 ist die Aktualisierung bei Wikidata dann trivial. Und wenn wir das machen wollen, sollten wir uns nicht nur auf die Einwohnerzahlen beschränken, sondern gleich auch die Bürgermeister miterledigen. Denn da kommen wir ja bisher nie hinterher, die zu aktualisieren, wenn es nicht um NYC, San Francisco oder Chicago geht. Grüße --h-stt !? 16:03, 13. Jan. 2020 (CET)
- Es gibt eine Reihe von Vor- und Nachteilen bei beiden Vorgehensweisen. Ich wäre aber dafür, die Einbindung aus Wikidata erst mal im kleineren Umfang auszustesten, um zu sehen, welche Probleme damit verbunden sein können. Damit könnte man auch schon jetzt beginnen. --Septembermorgen (Diskussion) 22:27, 13. Jan. 2020 (CET)
- Ja, es ist inzwischen möglich, Daten aus Wikidata in Artikel einzubinden: sowohl in Infoboxen, wie in den Text. Bei der Überlegung, es per Metadaten hier oder per Wikidata zu machen, spreche ich mich entschieden für Wikidata aus, weil dann die Daten an einer Stelle zentral für alle Wikipedias verwaltet werden müssen. Dieses Mal sind beide Verfahren gleich viel Arbeit, 2030 ist die Aktualisierung bei Wikidata dann trivial. Und wenn wir das machen wollen, sollten wir uns nicht nur auf die Einwohnerzahlen beschränken, sondern gleich auch die Bürgermeister miterledigen. Denn da kommen wir ja bisher nie hinterher, die zu aktualisieren, wenn es nicht um NYC, San Francisco oder Chicago geht. Grüße --h-stt !? 16:03, 13. Jan. 2020 (CET)
- Hallo h-stt, danke für deine Antwort. Grundsätzlich ist ja jede Vereinfachung der Datenaufbereitung hilfreich. Wikidata kenne ich leider nur oberflächlich. Bisher habe ich es so verstanden, dass Daten auf Wikidata gesammelt werden, die dann für die verschiedenen Sprachversionen von WP verwendet werden. Also würde es sich hauptsächlich um ein Arbeitsprojekt auf der Plattform Wikidata handeln. Die Frage wäre dann doch, ob dies von den anderen Wikipedias auch wirklich so gewünscht ist? Die federführende WP wäre da dann sicherlich die englischsprachige, mit der man sich absprechen müsste. Und das auch nur, wenn es auch einigermaßen realistisch machbar wäre. Also ich kann mir dahinter derzeit kein genaues Konzept vorstellen, lasse mich diesbezüglich aber gerne weiterbilden. Noch haben wir ja etwas Zeit, aber diese sollten wir nutzen. LG Stefan 21:53, 10. Jan. 2020 (CET)
- Hallo h-stt, Septembermorgen, Dionysos1988 und andere Interessierte, ich stolperte gerade über diese Diskussion hinsichtlich der Einwohnerzahlen. Ich möchte kurz in die Runde werfen, dass die {{Infobox Ort in den Vereinigten Staaten}} bereits seit 2017 eine Wikidata-Anbindung aufweist, und zwar als Fallback: Wenn keine Einwohnerzahl angegeben ist, holt sie sich die Einwohnerzahl aus Wikidata. Das funktioniert technisch einwandfrei (betroffene Artikel siehe Suchabfrage). Darüber hinaus gibt es die Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/Einwohnerzahl mit Artikeln, bei denen auf Wikidata aktuellere Zensus-Daten verfügbar wären.
- Man könnte diese Funktionalität mit den in 2021 zu erwartenden Zensus-Daten natürlich erweitern, zum Beispiel, dass die Daten immer bevorzugt aus Wikidata geholt werden, wenn dort bereits die Zensus-2020-Daten vorliegen. Ich fände es geschickt, bereits jetzt mit diesen Überlegungen anzufangen, bevor es sich ab Mitte 2021 dann in verschiedenen Ansätzen verselbständigt.
- Eine klare Meinung habe ich zu Kategorie:Vorlage:Metadaten Einwohnerzahl und Unterkategorien: Dieser Ansatz ist nicht mehr der Stand der Technik und sollte nicht mehr vorangetrieben werden. Wikidata ist das Mittel der Wahl, und als zentrale Datenbank profitieren alle Wikipedia-Sprachversionen von den dortigen Daten. Yellowcard (D.) 10:41, 29. Mai 2020 (CEST)
- Zentrale Einbindung ist klasse. Was ist aber mit Vandalismus auf Wikidata? Ich habe vor ein paar Wochen festgestellt, dass Daten auf Wikidata praktisch von jedermann geändert werden können, auch wenn sich diese auf viele Artikel gleichzeitig auswirken. Kennt sich jemand mit Wikidata gut genug aus, kann man solche Daten dort vorsorglich sperren, zumindest für nicht angemeldete Benutzer? -- Perrak (Disk) 13:16, 29. Mai 2020 (CEST)
- @Perrak: Insbesondere unsere hiesigen Werkzeuge bieten da eigentlich gleichwertigen Schutz: zum einen werden Änderungen auf Wikidata, die Auswirkungen auf einen Artikel, den Du hier auf der Beobachtungsliste hast, genauso angezeigt wie ein Eintrag unmittelbar im Artikel. Heißt: Wenn Du den Artikel zum Ort San Francisco beobachtest, dieser Artikel die Einwohnerzahl von Wikidata bezieht und dort ein User die Einwohnerzahl ändert, wird Dir das hier in der Beobachtungsliste wie ein gewöhnlicher Edit angezeigt. Ich bin mir gerade jedoch nicht sicher, ob dies eine Standard-Einstellung ist oder ob die jeder User explizit aktivieren muss.
- Die zweite Funktionalität sind die gesichteten Versionen, hier bin ich mit dem Zusammenspiel aber noch nicht 100-prozentig vertraut. Soweit ich das sehe, wird eine Version eines Artikels hier aber als ungesichtet angezeigt, wenn ein Benutzer ohne passive Sichterrechte auf Wikidata einen Wert ändert, der von dem Artikel verwendet wird.
- Da sich das alles nur mühsam zusammentragen lässt, habe ich auf Wikidata genau das mal angefragt: Wikidata:Wikidata:Project_chat#Vandalism:_Counter_Measures. Ich nehme mir mal vor, das auch hier lokal besser zusammenzutragen, da diese Fragen ja doch immer wieder aufkommen. Grüße, Yellowcard (D.) 14:20, 29. Mai 2020 (CEST)
- Danke erstmal für die schnelle Antwort und für Deine Initiative auf Wikidata, ich werde das da auch verfolgen. Mein Englisch reicht zwar zum Lesen und für gelegentliche Antworten, in diesem Fall war mir die Schwelle aber etwas zu hoch.
- Dass Bearbeitungen auf Wikidata angezeigt werden, kann man in den Einstellungen unter "Beobachtungsliste/Erweiterte Optionen" auswählen, ich vermute, dass das nicht vorausgewählt ist. In dem Fall neulich war eine Vorlage vandaliert worden, die in einem Artikel eingebunden war, ob auch der Artikel als ungesichtet angezeigt wurde, weiß ich offengestanden nicht mehr. Falls ja, wäre das natürlich sinnvoll. Auf jeden Fall war es nicht offensichtlich, dass die Vorlage ihre Daten von Wikidata bezog, das hat mich einige Minuten Suche gekostet - und ich bin an sich recht fit im Suchen, die meisten Wikipedianer hätten vermutlich länger gebraucht.
- An sich bin ich ein großer Fan von Wikidata und halte es für sinnvoll, solche Daten auszulagern. Aber es ist natürlich wichtig, dass wir unseren Vandalen da keine Spielwiese durch die Hintertür bieten ;-) -- Perrak (Disk) 14:28, 29. Mai 2020 (CEST)
- Kategorie:Vorlage:Metadaten Einwohnerzahl ist durchaus immer noch Stand der Technik und zwar hat das damit zu tun, dass auf Wikidata CC-0 gefordert ist, worunter aber die europäischen Statistikbehörden ihre Daten nicht lizenzieren (das aber nur als Nebenbemerkung), somit Wikidata für diese Datensätze nicht in Frage kommt. Für die US-Daten sollte die Einbindung aus Wikidata aus meiner Sicht kein Problem sein. Die Einbindungen aus Wikdata sollten aber nachvollziebar dokumentiert werden, das ist bislang an anderer Stelle häufig nicht der Fall. Einbindungen im Fließtext sollten ebenfalls möglich sein und eine saubere Quellenangabe sollte vorhanden sein (bislang ist das ein erheblicher Mangel in Wikidata). Ich nehme an, dass auf Wikidata Massenänderungen möglich sind, sodass nicht jede einzelne Einwohnerzahl manuell eingetragen werden muss. Den Punkt Vandalismuserkennung und -beseitigung sollte man vorher abklären. Kann mir aber nicht vorstellen, dass Wikidata besonders interessant für Vandalen ist, dafür die Wahrnehmungsschwelle zu gering und die Bearbeitungshürde zu hoch. --Septembermorgen (Diskussion) 11:22, 31. Mai 2020 (CEST)
- Ich sehe keinen Bedarf für Erklärungen im Fließtext des Artikels, unseren Lesern ist es völlig egal, ob die Daten von Hand in den jeweiligen Artikel geschrieben wurden, aus einer lokalen Vorlage stammen oder von WikiData bezogen werden. Aber ich habe gerade in der Vorlagenwerkstatt angefragt, ob und wie man Kommentare in den Seitenquellcode der Vorlage einbauen kann, um die Herkunft der Daten für Gelegenheitsautoren zu erklären, die nicht so tief in die Vorlagenstrukturen eingedrungen sind. Grüße --h-stt !? 10:23, 3. Jun. 2020 (CEST) Nachtrag: Ich habe mir in der Vorlagenwerkstatt erklären lassen, dass man auch in Vorlagen Kommentare benutzen kann, die werden rechtzeitig vom System entfernt, bevor es die Vorlagen-Daten übergibt. Damit können wir in die Infobox einen Kommentar zur Datenherkunft schreiben.
- Das wäre sinnvoll. Vor ein paar Wochen hatte jemand auf Wikidata die Beschreibung von PETA vandaliert, was in die Infobox übernommen wurde, ohne dass man das im Quelltext sehen konnte. Ich habe einige Zeit gesucht, wo der Fehler herkommt, bis ich auf die Idee kam, in Wikidata nachzuschauen - wenn ich richtig erinnre erst, als ich mit dem englischen Artikel verglichen hatte. -- Perrak (Disk) 15:29, 3. Jun. 2020 (CEST)
- @Perrak: Eigentlich ist das aber gar nicht notwendig. Gemäß Meinungsbild müssen alle von Wikidata bezogenen Daten per CSS-Klasse "wikidata-content" ausgezeichnet werden. Für den Leser hat dies keine Auswirkung, im Quelltext erkennt man die Herkunft aber, und wenn man möchte (ich habe es so eingerichtet), kann man über die eigene common.css alle von Wikidata bezogenen Daten einfärben lassen (siehe Benutzer:Yellowcard/vector.css, ganz unten). Vielleicht hilft das schon weiter? Bei der in PETA verwendeten {{Infobox Organisation}} wurde das auch so umgesetzt. Texte von Wikidata zu übernehmen, ist natürlich hinsichtlich Vandalismus schon deutlich sensibler als andere Datentypen wie insbesondere Zahlen.
- @Septembermorgen: Das Lizenz-Argument verstehe ich nicht; wenn die Daten nicht frei lizenziert sind, können wir sie ja über Direkteinbindung sowieso nicht nutzen, denn da gehen Urheber-Angaben doch immer verloren. Oder verstehe ich das falsch? Das könnte aber eine separate Diskussion wert sein, die Zensus-Daten sollte das ja ohnehin nicht betreffen. Yellowcard (D.) 08:51, 4. Jun. 2020 (CEST)
- Danke für den Hinweis, den Code-Schnipsel werde ich übernehmen ;-) Das MB scheint an mir völlig vorbeigegangen zu sein, seltsam - eigentlich war ich zu der Zeit aktiv. Allerdings habe ich in Nicht-Corona-Zeiten im Juni arbeitsmäßig viel um die Ohren, vielleicht deshalb. Danke auch für diese Info. -- Perrak (Disk) 09:50, 4. Jun. 2020 (CEST)
- Das wäre sinnvoll. Vor ein paar Wochen hatte jemand auf Wikidata die Beschreibung von PETA vandaliert, was in die Infobox übernommen wurde, ohne dass man das im Quelltext sehen konnte. Ich habe einige Zeit gesucht, wo der Fehler herkommt, bis ich auf die Idee kam, in Wikidata nachzuschauen - wenn ich richtig erinnre erst, als ich mit dem englischen Artikel verglichen hatte. -- Perrak (Disk) 15:29, 3. Jun. 2020 (CEST)
- Ich sehe keinen Bedarf für Erklärungen im Fließtext des Artikels, unseren Lesern ist es völlig egal, ob die Daten von Hand in den jeweiligen Artikel geschrieben wurden, aus einer lokalen Vorlage stammen oder von WikiData bezogen werden. Aber ich habe gerade in der Vorlagenwerkstatt angefragt, ob und wie man Kommentare in den Seitenquellcode der Vorlage einbauen kann, um die Herkunft der Daten für Gelegenheitsautoren zu erklären, die nicht so tief in die Vorlagenstrukturen eingedrungen sind. Grüße --h-stt !? 10:23, 3. Jun. 2020 (CEST) Nachtrag: Ich habe mir in der Vorlagenwerkstatt erklären lassen, dass man auch in Vorlagen Kommentare benutzen kann, die werden rechtzeitig vom System entfernt, bevor es die Vorlagen-Daten übergibt. Damit können wir in die Infobox einen Kommentar zur Datenherkunft schreiben.
- Kategorie:Vorlage:Metadaten Einwohnerzahl ist durchaus immer noch Stand der Technik und zwar hat das damit zu tun, dass auf Wikidata CC-0 gefordert ist, worunter aber die europäischen Statistikbehörden ihre Daten nicht lizenzieren (das aber nur als Nebenbemerkung), somit Wikidata für diese Datensätze nicht in Frage kommt. Für die US-Daten sollte die Einbindung aus Wikidata aus meiner Sicht kein Problem sein. Die Einbindungen aus Wikdata sollten aber nachvollziebar dokumentiert werden, das ist bislang an anderer Stelle häufig nicht der Fall. Einbindungen im Fließtext sollten ebenfalls möglich sein und eine saubere Quellenangabe sollte vorhanden sein (bislang ist das ein erheblicher Mangel in Wikidata). Ich nehme an, dass auf Wikidata Massenänderungen möglich sind, sodass nicht jede einzelne Einwohnerzahl manuell eingetragen werden muss. Den Punkt Vandalismuserkennung und -beseitigung sollte man vorher abklären. Kann mir aber nicht vorstellen, dass Wikidata besonders interessant für Vandalen ist, dafür die Wahrnehmungsschwelle zu gering und die Bearbeitungshürde zu hoch. --Septembermorgen (Diskussion) 11:22, 31. Mai 2020 (CEST)
- Zentrale Einbindung ist klasse. Was ist aber mit Vandalismus auf Wikidata? Ich habe vor ein paar Wochen festgestellt, dass Daten auf Wikidata praktisch von jedermann geändert werden können, auch wenn sich diese auf viele Artikel gleichzeitig auswirken. Kennt sich jemand mit Wikidata gut genug aus, kann man solche Daten dort vorsorglich sperren, zumindest für nicht angemeldete Benutzer? -- Perrak (Disk) 13:16, 29. Mai 2020 (CEST)
Wikidata-Anbindung der Infobox Ort in den Vereinigten Staaten
BearbeitenHallo zusammen, wie auch schon im Abschnitt zwei drüber angeklungen, hielte ich es für sinnvoll, die {{Infobox Ort in den Vereinigten Staaten}} hinsichtlich ihrer Wikidata-Anbindung zu überarbeiten. Mein Ziel wäre es, bis zur Veröffentlichung der Census-2020-Daten einen Konsens gefunden sowie die technische Umsetzung und einige Erprobungen durchgeführt zu haben.
Konkret geht es bei der Wikidata-Anbindung um zwei Aspekte, die völlig unabhängig voneinander zu realisieren sind:
- (Daten aus Wikidata) Daten werden direkt aus Wikidata bezogen und in der Infobox angezeigt (in verschiedenen Abstufungen, siehe unten)
- (Wikidata-Wartung) Daten aus der Infobox werden mit Angaben auf Wikidata verglichen, bei Abweichungen werden die Artikel in eine Wartungskategorie einsortiert.
Status Quo: Beide Ansätze sind in der Infobox seit April 2017 in ersten Ansätzen umgesetzt. Das war einmal als Testszenario gedacht und hat sich in meinen Augen bewährt:
- (Daten aus Wikidata) Derzeit beziehen immerhin 11.268 Artikel in ihrer Infobox Daten aus Wikidata (siehe Beobachtungskategorie). Derzeit werden Informationen nur dann von Wikidata eingebunden, wenn die Angabe in unserem Artikel vollständig fehlt. Eine hoffentlich abschließende Auflistung:
- Gründungsdatum (Datum der Gründung, Erstellung, Entstehung, Erbauung (P571)). Das ist derzeit der überwiegende Teil der Datenabrufe aus Wikidata (Petscan-Abfrage, 2340 Artikel)
- Einwohnerzahl (Einwohnerzahl (P1082)); wenn abgerufen, wird auch der Stand der Angabe (Zeitpunkt/Stand (P585)) mit abgerufen (Petscan-Abfrage, 32 Artikel)
- Mit dieser Angabe wird auch die Bevölkerungsdichte berechnet, wenn die Fläche in der Infobox angegeben wurde. Die Fläche selbst wird aber Stand jetzt nicht von Wikidata abgerufen.
- FIPS (FIPS 55-3 (Orte in USA) (P774)), (Petscan-Abfrage, 185 Artikel)
- GNIS-ID (GNIS-ID (P590)) (Petscan-Abfrage, 220 Artikel)
- Bürgermeister (Leiter der Regierung oder Verwaltung (P6)) (Petscan-Abfrage, 12 Artikel. Grund für diese niedrige Anzahl: Die Angabe auf Wikidata erfolgt nur, wenn die Person auf Wikidata relevant ist)
- (Wikidata-Wartung) Dazu kommen die Beobachtungskategorien für den Fall, dass Daten im Artikel von Daten auf Wikidata abweichen:
- Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/Einwohnerzahl (0 Artikel, es werden allerdings nur Artikel berücksichtigt, bei denen die Einwohnerzahl von vor 2010 stammt)
- Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/Einwohnerzahl Stand (0 Artikel, auch hier keine Kategorisierung, wenn die Artikel-Angabe von vor 2010 stammt)
- Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/Bürgermeister (0 Artikel)
- Artikel ohne Bild in Infobox, aber mit Bild auf Wikidata (wird über die Vorlage {{Wikidata image}} realisiert, keine separate Wartungskategorie, Petscan-Abfrage, derzeit > 3.000 Artikel)
Überlegungen: Im Prinzip geht es nun darum, zu überlegen, inwiefern der bereits existierende Ansatz weiterverfolgt wird, der Datenbezug aus Wikidata ggf. schärfer gestaltet wird sowie wie man die Wikidata-Wartung ausbauen kann.
- (Daten aus Wikidata) Für jede einzelne Infobox-Zeile (oder noch granularer) kann individuell entschieden werden, ob und wann Daten aus Wikidata bezogen werden. Es steht jeweils eine der folgenden Optionen zur Verfügung:
- überhaupt nicht
- Als Fallback, falls keine Angabe in der Infobox gemacht wurde (Status Quo bei Gründungsdatum, Einwohnerzahl, Bürgermeister etc.)
- Bei Verwendung eines Schlüsselworts in der Infobox im Artikel (hier hat sich in anderen Infoboxen die Angaben ABFRAGE_WIKIDATA etabliert)
- Unter bestimmten, individuell festlegbaren Bedingungen wird der Wert aus Wikidata bevorzugt verwendet
- In der Umsetzung am schwierigsten, aber recht mächtig.
- Beispiel: Die Einwohnerzahl wird unabhängig von der Angabe in der Infobox von Wikidata bezogen, wenn die dortige Angabe von 2020 stammt oder als Bestimmungsmethode (Bestimmungsmethode (P459)) „Volkszählung“ angegeben wurde
- Immer, d.h. die Angabe im Artikel wird vollständig überschrieben. Vermutlich selten sinnvoll.
- Ich schlage also vor, dass wir uns mal die einzelnen Zeilen der Infobox vornehmen und jeweils entscheiden, welche dieser Optionen am sinnvollsten wäre. Verschiedene Optionen bieten jeweils Vor- und Nachteile. Beispielhaft wäre die automatische Verwendung der Einwohnerzahlen von Wikidata, wenn diese aus dem Census 2020 stammen. Dies würde ohne individuellen Aufwand in jedem Artikel die aktuellen Zahlen bereitstellen, wäre aber ggf. für Autoren sehr verwirrend, wenn die Angabe im Artikel-Quelltext keine Auswirkung mehr hat. Ein Ansatz über ABFRAGE_WIKIDATA hätte den Vorteil, dass man die Daten bei veralteten Artikeln mit geringen Abrufzahlen immer aktuell in der Infobox hat und bei großen Artikeln wie New York City die Oberhand behält; man müsste aber jeden Artikel einmalig einzeln anfassen usw.
- Unabhängig davon bleibt natürlich das Problem des Fließtextes. Prinzipiell lassen sich auch hier Informationen aus Wikidata über Satzbausteine einbauen. Ob das in Frage kommt, sollten wir ggf. separat besprechen und würde ich erst einmal hintanstellen.
- (Wikidata-Wartung) Der Ausbau der Wikidata-Wartung sollte deutlich einfacher sein. Auch hier gilt es zu überlegen, welche Merkmale man zusätzlich mit Wikidata abgleichen möchte. Wenn wir für den Abruf von Daten aus Wikidata ein gutes Konzept gefunden haben, denke ich übrigens, dass die derzeit z.T. sehr vollen Kategorien deutlich leerer werden (dank automatischem Datenbezug gibt es weniger Abweichungen), sodass die verbleibenden Artikel dann tatsächlich abarbeitet werden können.
In diesem Zusammenhang bietet es sich darüber hinaus natürlich an, zu prüfen, ob noch weitere Zeilen in der Infobox sinnvoll wären oder ob gewisse derzeit existente Daten nicht sinnvoll sind. Die Masse an auf Wikidata grundsätzlich verfügbaren Daten lässt sich ganz gut am Item zu New York City ( (P60)) abschätzen.
Ich bin auf eure Meinungen gespannt und hoffe, dass ich mit diesem langen Text und der Darstellung niemanden erschlagen habe. Bei Unklarheiten bitte einfach fragen; die obigen Aussagen könnten ziemlich abstrakt und unverständlich auf jemanden wirken, der noch nicht zu viel mit Wikidata zu tun hatte. Viele Grüße, Yellowcard (D.) 11:56, 30. Jun. 2020 (CEST)
- Danke für den Start der Diskussion hier, das ist wertvoll und es ist an der Zeit, die Diskussion jetzt zu führen, bevor so etwa ab Mai 2021 die Daten einlaufen werden. Ich kann aber nur eine sinnvolle Lösung erkennen: Die vollständige Umstellung auf WikiData. Für die Infobox und soweit wie irgend möglich den Fließtext. Der Aufwand dieses Mal ist praktisch identisch zwischen der manuellen Aktualisierung der Daten und der Umstellung auf WikiData. 2030 muss dann aber nur noch WikiData befüllt werden und alle Wikipedia-Sprach-Projekte, die mitgemacht haben, haben die aktuellen Daten. Wer der Mitlesenden erinnert sich noch an 2010? Genau .... Grüße --h-stt !? 15:25, 3. Jul. 2020 (CEST)
- @H-stt: Was genau meinst Du mit „vollständiger Umstellung auf Wikidata“? Dass die Daten aus Wikidata bezogen werden, unabhängig davon, was im Artikel-Quelltext steht; sprich die Daten im Artikeltext werden einfach überschrieben? Der Aufwand wäre natürlich sehr gering; die einzelnen Artikel müssten zur Umsetzung nicht einmal angefasst werden. Oder aber die Nutzung von Schlüsselwörtern wie ABFRAGE_WIKIDATA in den einzelnen Feldern, um die Daten gezielt von Wikidata zu beziehen und damit für jeden Artikel einzeln entscheiden zu können?
- Für den Fließtext halte ich die Situation schon schwieriger. Technisch gesehen könnte man diesen über Textbausteine natürlich auch aus Wikidata generieren lassen, ich denke aber, dass es dafür keinen Konsens gibt.
- @Perrak, Septembermorgen, Dionysos1988, Matthiasb: Habt ihr Meinungen zur Umsetzung? Yellowcard (D.) 19:04, 3. Jul. 2020 (CEST)
- Daten für die Infoboxen aus Wikidata zu übernehmen halte ich grundsätzlich für sinnvoll, Zahlen haben keine sprachliche Heimat. Leider ist es wenn ich das richtig sehe in Wikidata relativ einfaqch, Daten zu vandalieren, wenn sich das nicht bessert, sollten wir bei der Übernahme nicht auf Automatismen bauen. Insofern sollten lokale Daten auf keinen Fall einfach überschrieben werden. Ein Hinweis in der Infobox, dass diese Daten aus Wikidata verwendet, wäre auch nett, da habe ich neulich mal lange gesucht. -- Perrak (Disk) 19:08, 3. Jul. 2020 (CEST)
- Die Theorie mit dem Vandalismus auf Wikidata halte ich nach einiger Recherche eher für ein Ammenmärchen als eine reale Gefahr. Zwar gibt es auf Wikidata keine klassischen gesichteten Versionen und auch keine RC-Prüfung wie in der de.wp, aber dafür einige andere Maßnahmen: Zum einen sind die Datentypen festgelegt, das heißt, wo eine Einwohnerzahl erwartet wird, kann niemand einen Text eingeben, sondern bloß eine falsche Zahl. Dies macht Vandalismus von Rohdaten reichlich unattraktiv, „Penis-Vandalismus“ ist nicht möglich. Zum zweiten ist die KI-basierte Erkennung von Vandalismus insgesamt ziemlich treffsicher; Edits mit einer hohen Wahrscheinlichkeit, dass sie falsch oder gar schädlich sein könnten, werden markiert und manuell geprüft. Drittens habe ich letztens, auf Basis der Diskussion oben, relativ viele Einwohnerzahlen auf Wikidata mit den Angaben aus dem Census 2010 verglichen, ohne eine einzige Abweichung. Demgegenüber stehen die unermesslich vielen (laut Wartungskategorie mindestens 4000) veralteten Angaben in unserem Artikelbestand, wo sich auf Wikidata seit Jahren neuere Daten befinden. Da kann man meiner Meinung nach einzelne vandalierte Daten in Kauf nehmen, zumal perspektivisch ja Mitarbeiter aus allen Sprachversionen ein Auge auf Wikidata haben. Zuletzt werden Änderungen in Wikidata-Items von beobachteten Artikeln in der Beobachtungsliste angezeigt (ebenfalls konfigurierbar).
- Die Kennzeichnung von aus Wikidata bezogenen Daten ist ein Punkt. Selbstverständlich sollte sein, sie mit der CSS-Klasse "wikidata-content" auszuzeichnen, das ist aber standardmäßig nur im Quelltext sichtbar. Dies lässt sich individuell leicht ändern (ebenfalls im Abschnitt oben beschrieben), aber dafür muss man dies konkret wollen. Man könnte auch überlegen, wie in der Infobox Fußballspieler bei Datenbezug aus Wikidata einen Link auf das Wikidata-Item zu platzieren (Beispiel: Pedro Santos), das kann aber durchaus störend wirken. Yellowcard (D.) 19:20, 3. Jul. 2020 (CEST)
- Ergänzung: Die Nutzung eines Schlüsselwortes ABFRAGE_WIKIDATA anstelle einer automatischen Übernahme würde letzteres Problem aber natürlich ebenfalls lösen: Da ist im Quelltext offensichtlich, woher die Angabe kommt. Yellowcard (D.) 19:21, 3. Jul. 2020 (CEST)
- Letzteres wäre insofern sympathisch, ja.
- Dass Vandalismus bei Zahlen wenig wahrscheinlich ist und dass einzelne falsche Zahlen weniger schlimm sind als viele hoffnungslos veraltete sehe ich auch so. Dass Vandalismus bei Wikidata nur ein Ammenmärchen ist kann ich leider nicht bestätigen, vor ein paar Wochen fiel mir im Artikel PETA Vandalismus auf, der seit einer Woche nicht aufgefallen war, weil keine Sichtung nötig ist. Den Hinweis, dass die Infobox Daten aus Wikidata verwendet, habe ich dann erst bemerkt, als ich schon eine Viertelstunde die Versionsgeschichte durchsucht hatte, um die Änderung zu finden. Wie ich gerade sehe, wurde das Wikidata-Objekt vor vier Wochen erneut vandaliert, diesmal nicht unbemerkt. Es wäre auf jeden Fall sinnvoll, wenn Wikidata gesichtete Versionen hätte, aber das ist natürlich nicht hier das Thema.
- Trotz dem vorherigen halte ich es für sinnvoll, Daten aus Wikidata zu übernehmen. Wikidata muss halt auch besser werden hat ja auch hier geklappt ;-) -- Perrak (Disk) 19:33, 3. Jul. 2020 (CEST)
- Huch, hier ist ja mal richtig was los. Also, ich denke, Perrak, daß H-stt sich vor allem auf die Einwohnerzahlen. Ich fordere seit geraumer Zeit eine mindestens Halbsperre von Daten, die einmal gesetzt sich nicht mehr ändern. Die Einwohnerzahlen der Volkszählung 2020 werden sich nie mehr ändern, sobald sie einmal korrekt erfaßt sind. Und das sollte man von dem Botbetreiber, der die ZIP-Files des Census Bureaus abarbeitet, erwarten können. Daß es au Wikidata jemals gesichtete Versionen gibt, glaube ich nicht. Zuviele Daten, zuwenige Benutzer.
- Nun zu Yellowcard Sermon.
- Gründungsdatum. Ist seit Jahren Murks. Manchmal isses das Datum, wann der erste Siedler ich niedergelassen hat. Manchmal das, wann es erstmals inkorporiert wurde. In vielen Fällen da Datum der Inkorporierung der aktuellen Gemeindeform. Fast immer aber ohne Spezifizierung. Ich habe etliche Artikel, da habe ich hier drei Jahreszahlen einetragen, mit <br/> getrennt.
- Einwohnerzahl und Stand: sollten von Wikidata kommen.
- Achtung: Bei jeder Volkzählung ändert sich auch die Fläche vieler Orte, weil sie Gebiete "annektieren" oder weil der census-dessignated place neu bestimmt wird. Auch diese Zahl muß künftig von Wikidata kommen. Folgeproblem: Diese Angaben stehen auch im Abschnitt "Geographie" im Fließtext (und oft ist es ziemlich das einzige, das da steht). Betrifft: Fläche, Landfläche und Gewässerfläche
- FIPS und GNIS-ID: hier will ich die lokale Kontrolle behalten. Hier macht WD auch keinen Vorteil, da sich keine dieser Angaben je ändert.
- Bürgermeister: sollten grundsätzlich von WD gezogen werden, wir können das lokal nicht warten.
- Problem: Die Wikidata-Relevanzscheiße. Sorry, nach acht Jahren Wikidata haben die (cf. P109!) immer noch nichts vestanden. Wenn ich eine Stadt habe, gehört der BM eingetragen, ganz gleich ob er relevant ist.
- neuer Wunsch: Abgleich der Zeitzone mit den auf WD hinterlegten Daten, insbesondere auf die bislang ignorierte Sommerzeit, die ja, wie wir spätestens seit der Präsidentschaftswahl 2000 wissen, sich nicht überall an Bundesstaatsgrenzen hält, sondern tw. sogar Countys zerteilt.
- Bild in Infobox: Hier haben wir das Problem, daß unsere IB zwei Bilder unterstützt. Manche Autoren (ich und andere) setzten das Bild bewußt als Bild 2, wenn es keine Ansicht der Gemeinde oder zumindest ihres Wahrzeichens ist, sondern "irgendein" Bild. Ich sehe hier Schwierigkeiten, das mit WD abzugleichen. Nicht zuletzt deswegen wird die Zahl der Artikel ohne Infoboxenbild aber Bild auf Wikidata relativ groß sein. Ich verstehe da auch den Sinn ganz allgemein nicht. Warum genau jenes Bild und keines der hundert anderen zu zehn verschiedenen Tageszeite und drei verschiedenen Jahreszeiten bei jedem möglichen und unmöglichen Hundewetters? --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 21:23, 3. Jul. 2020 (CEST)
- Klar, Sperre oder wenigstens Halbsperre von Daten, die sich nie oder fast nie ändern wäre auch eine Lösung. -- Perrak (Disk) 21:25, 3. Jul. 2020 (CEST)
- Ergänzung: Die Nutzung eines Schlüsselwortes ABFRAGE_WIKIDATA anstelle einer automatischen Übernahme würde letzteres Problem aber natürlich ebenfalls lösen: Da ist im Quelltext offensichtlich, woher die Angabe kommt. Yellowcard (D.) 19:21, 3. Jul. 2020 (CEST)
- Daten für die Infoboxen aus Wikidata zu übernehmen halte ich grundsätzlich für sinnvoll, Zahlen haben keine sprachliche Heimat. Leider ist es wenn ich das richtig sehe in Wikidata relativ einfaqch, Daten zu vandalieren, wenn sich das nicht bessert, sollten wir bei der Übernahme nicht auf Automatismen bauen. Insofern sollten lokale Daten auf keinen Fall einfach überschrieben werden. Ein Hinweis in der Infobox, dass diese Daten aus Wikidata verwendet, wäre auch nett, da habe ich neulich mal lange gesucht. -- Perrak (Disk) 19:08, 3. Jul. 2020 (CEST)
- Schön, dass das hier Fahrt aufnimmt, kurz bevor ich das Portal für endgültig tot erklärt hätte. ;-) Ein paar Kommentare von mir:
- Halb- / Vollschutz für einzelne Statements, die geprüft wurden und sich nicht verändern werden (außer ihr Rank), vermisse ich auch. Das wäre eine große Verbesserung. Stand jetzt ist das aber nicht in Sicht.
- Einwohnerzahl, Fläche, Stand: gehe ich mit, sollte von Wikidata bezogen werden.
- Bleibt die Frage, wie es umgesetzt werden soll. @Matthiasb: Hast Du eine Meinung? Schlüsselwort wie ABFRAGE_WIKIDATA verwenden? Oder gar automatisch von Wikidata beziehen, auch wenn ein anderer Wert in der Infobox steht?
- Bürgermeister: Sehe ich genauso. Dass kein Item zu jedem Bürgermeister einer ggf. noch so kleinen Town angelegt wird, hat vielleicht auch mit Persönlichkeitsrechten zu tun. Natürlich könnte man hier auch ein Freitextfeld verwenden, das würde aber wiederum die Vandalismusgefahr massiv erhöhen.
- Zeitzone: sollte machbar sein, ggf. zunächst mal über eine Wartungskategorie. Das schaue ich mir als erstes mal an. @Matthiasb: Was genau meinst Du mit der „bislang ignorierten Sommerzeit“? Was genau gibt es dort zu beachten?
- Ggf. weitere von Wikidata zu beziehende Werte: Höhe über dem Meeresspiegel, Vorwahl, ZIP-Code, Website.
- Der Bild-Abgleich ist meiner Meinung nach ein Stück weit Spielerei und die Wartungskategorie nicht ganz ernstzunehmen. Stand jetzt ist es aber nach meiner Erfahrung so, dass für die meisten Artikel in der Kategorie ein brauchbares Bild auf Commons verfügbar ist. Welches Bild auf Wikidata ausgewählt wird, ist wohl reichlich willkürlich.
- Gruß, Yellowcard (D.) 22:49, 3. Jul. 2020 (CEST)
- Schön, dass das hier Fahrt aufnimmt, kurz bevor ich das Portal für endgültig tot erklärt hätte. ;-) Ein paar Kommentare von mir:
- Ein erster Versuch scheint nicht besonders hilfreich: Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/Zeitzone. Liegt wohl vorrangig daran, dass wir hier eine deutlich bessere Datenlage haben als Wikidata, wo die Informationen zu den Zeitzonen häufig fehlt. Wie kann man die Angabe zur Zeitzone am besten belegen? Yellowcard (D.) 23:41, 3. Jul. 2020 (CEST)
- ... oder Angaben wie in Aurora (Q49246), wo die Zeitzone als Mountain Standard Time Zone (Q3134980) angegeben ist und damit der Vergleich mit dem Parameter „UTC-7“ aus dem Artikelquelltext fehlschlägt. Hmm, das gefällt mir noch überhaupt nicht. Sollten wir vielleicht in einem Unterabschnitt überlegen, wie man das geschickt lösen kann. Yellowcard (D.) 23:45, 3. Jul. 2020 (CEST)
- Wir erfassen bisher in der IB nur die normale Zeitzone. Einach eine stunde addieren geht aber nicht, weil nicht alle Gebiete der Sommereit unterliegen (z.B. ohne Indianerreservate) und, wie gesagt, gehört nicht unbedingt der ganze Bundesstaat derselben Zeitzone an. Hier denke ich, sollten wir einen Abgleich zwishen DE:WP und Wikidata durchführen.
- Bei den Flächen halte ich 30–40 % der Angaben schon jetzt für falsch. Wenn nicht gar alle, weil das Census Bureau die Fläche in Quadratmeter (sic!) angibt, die dann einst von Rammbot in Square Miles konvertiert wurden, was wir dann wieder in Quadratkilometer umgereechnet haben, also zweimal gerundet wird. Ich habe zwar in den letzten Monaten, nachdem ich das Problem erkannte, en passant einige Ortsartiel erledigt, das waren aber wenige Dutzend. Wir können spaßhalber eine Wartungskategorie setzen, um zu sehen, als wie groß sich das Problem erweist, denke aber, daß es letztlich darau hinauläuft, daß wir die lokale Eingabe einfach abschalten und die Parameter für die Fläche nach und nach aus den Artikeln entfernen. Vorausgesetzt, daß die Fläche in WD überhaupt als Property hinterlegt ist; und es muß ja nah Censusjahr (2000, 2010, 2020) entschieden werden.
- Bei den Einwohnerzahlen sehe ich es ähnlich, da haben wir jetzt schon ein Durcheinander von 2000er/2010er Censuszahlen und jeder Menge Zwischenjahrschätzungen. Diese Daten sind Schrott.
- Es gibt noch ein Problem. In vielen Orts- und Countyartieln gibt es die Vorlage:US Census population (Vorlage:USCensusPop); da dürfte vielfach das Censusjahr 2010 fehlen und/oder ein veraltetes Zwischenschätzungsjahr erfaßt sein. Hier würde ich vorschlagen, alle Angaben bis 2000 lokal beizubehalten – bis 1990 sind die sowieso nur in PDFs verfügbar, also wurden die wohl auf WD noch nicht erfaßt, zuviel Arbeit, für 2010 auf die Fallbackmethode zurückzugreifen und 2020 von Wikidata zu ziehen. Die derzeitigen Zwischenjahrschätzungen würde ich solange behalten, bis 2022 die Schätzung 2021 eingepflegt wird. Nebenproblem: Es gibt/gab? Fälle außerhalb der USA, da fanden die die Vorlage geeignet, um dort die Einwohnerentwicklung zu tabellarisieren. Das müßte man auch angehen. Noch ein Nebenaspekt: Eine Adaption dieser Vorlage wird in EN für die Philippinen verwendet. Die will ich hier auch!
- Das mit dem Halb-/Vollschutz für einzelne Datenreihen steht bereits in einem meiner ersten Wikidata-Projektdiskussionsbeiträge 2009 oder so. Traurig, wie man hier ernstgenommen wird. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 00:52, 4. Jul. 2020 (CEST)
- Die klassischen statistischen Daten (Einwohner, Fläche, Geokoordinate, Höhe, etc) sollten unstreitig sein. Sowas wird aus WikiData kommen. Ich würde die Bürgermeister sehr begrüßen, denn bislang werfe ich die bei kleinen und mittelgroßen Ortschaften schlicht raus, wann immer ich einen Artikel ohnehin offen habe. Ich würde mir zudem wünschen, wenn wir diese unsäglichen Demographie-Absätze überwinden könnten, in denen bei der Erstanlage der Artikel uralte (oft noch die 2000er) Zahlen in erratischer Auswahl per Script zu vermeintlichem Fließtext zusammengebastelt wurden. Wenn wir viele der Artikel von Hand anfassen müssen, sollten wir die entfernen. Oder durch etwas besseres ersetzen. Was besser wäre und trotzdem aktuell gehalten werden kann, müssten wir gesondert diskutieren. Grüße --h-stt !? 17:51, 7. Jul. 2020 (CEST)
- Du weißt ja, daß ich Demographiefan bin, und ich habe da auch eine Idee, wie das alles viel schöner wird. Und besser. Und richtiger sowieso, weil die Tipfehler komplett entfallen. Das aber anzufangen, bevor die Daten auf WD liegen, ist zwecklos. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 20:54, 7. Jul. 2020 (CEST)
- Ach Ideen sammeln kann man ja schon mal. Und evtl auch schon mit einem der Botbetreiber reden, wenn wir dafür eine voll- oder halbautomagische Umsetzung für sinnvoll halten. Ich mach unten mal einen eigenen Abschnitt auf. Grüße --h-stt !? 13:24, 8. Jul. 2020 (CEST)
- Du weißt ja, daß ich Demographiefan bin, und ich habe da auch eine Idee, wie das alles viel schöner wird. Und besser. Und richtiger sowieso, weil die Tipfehler komplett entfallen. Das aber anzufangen, bevor die Daten auf WD liegen, ist zwecklos. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 20:54, 7. Jul. 2020 (CEST)
- Die klassischen statistischen Daten (Einwohner, Fläche, Geokoordinate, Höhe, etc) sollten unstreitig sein. Sowas wird aus WikiData kommen. Ich würde die Bürgermeister sehr begrüßen, denn bislang werfe ich die bei kleinen und mittelgroßen Ortschaften schlicht raus, wann immer ich einen Artikel ohnehin offen habe. Ich würde mir zudem wünschen, wenn wir diese unsäglichen Demographie-Absätze überwinden könnten, in denen bei der Erstanlage der Artikel uralte (oft noch die 2000er) Zahlen in erratischer Auswahl per Script zu vermeintlichem Fließtext zusammengebastelt wurden. Wenn wir viele der Artikel von Hand anfassen müssen, sollten wir die entfernen. Oder durch etwas besseres ersetzen. Was besser wäre und trotzdem aktuell gehalten werden kann, müssten wir gesondert diskutieren. Grüße --h-stt !? 17:51, 7. Jul. 2020 (CEST)
Entkoppelt: Zeitzonen
BearbeitenÜberschrift nachträglich eingefügt. Yellowcard (D.) 13:31, 4. Jul. 2020 (CEST)
Die nebenstehende Karte ist als amtliches Werk grds. belegfähig.
Komplett zu einer Zeitzone gehören, von Westen nach Osten, Hawaii, Washington, Kalifornien, Nevada, Utah, Colorado, New Mexico, Montana, Wyoming, Oklahoma, Minnesota, Iowa, Missouri, Arkansas, Louisiana, Missisippi, Alabama, Michigan, Georgia, North und South Carolina, Virginia, West Virginia, Ohio, Delaware, Delaware, Maryland, New Jersey, New Xork, Vermont, Massachusetts, Rhode Island, Connecticut, New Hamshire und Maine, die kann man vorher nochmal mit dem AWB auf Linie bringen.
Ob sie ausreicht, die Countys zu identifizieren, die von einzelnen Bundesstaaten in eine andere Zeitzone gehören, etwa der Westen von Florida, Kansas, Nebraska, Idaho, der Nordwesten von Michigan, North und South Dakota und Texas, der Süden und Nordwesten von Indiana und die westliche Hälfte von Kentucky und Tennessee und schließlich den Osten von Oregon, wird man sehen. Ich besitze eine Straßenkarte, da sind die Zeitzonen eingezeichet, aber die ist von 2005, und Indiana wurde 2007 geändert; die hilft uns also nur teilweise. Aber auch hier könnten wir unseren Datenbestand nochmal gegenchecken. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 03:03, 4. Jul. 2020 (CEST)
- Schraffiert sind die Gebiete ohne Sommerzeit, richtig? Das beträfe dann nur Hawaii und den größten Teil von Arizona, oder habe ich etwas übersehen? -- Perrak (Disk) 10:02, 4. Jul. 2020 (CEST)
- Die Verwaltung der Zeitzonen auf Wikidata ist nach ein bisschen Recherche noch nicht konsequent umgesetzt. Die neu erstellte Wartungskat Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/Zeitzone ist mit > 9.000 Artikeln auch extrem voll.
- Wie die Kategorie gefüllt wird: Aus der Angabe der Infobox werden nur die Ziffern extrahiert (d.h. aus „UTC-5“ wird „5“), auf Wikidata das gleiche. Die beiden Zahlen werden miteinander verglichen. Dies ist notwendig, um den unterschiedlichen Minuszeichen (bei uns nämlich eigentlich ein Bindestrich, kein Minuszeichen) Rechnung zu tragen.
- Wenn aber benannte Zeitzonen wie Eastern Time Zone (Q941023) verwendet werden, schlägt dieser Vergleich natürlich fehl. Das scheint regelmäßig vorzukommen. Hier wäre es eine Abhilfe, dem Statement auf Wikidata die UTC-Angabe zusätzlich hinzuzufügen. Den Vergleich würde man auch in der Infobox noch hinbekommen.
- Das Thema Sommerzeit scheint auf Wikidata noch nicht so recht abgebildet zu sein. Auf wikidata:Property talk:P421 wird dieses Problem diskutiert und es wird vorgeschlagen, die UTC-Angabe der Sommerzeit ebenfalls in die Zeitzone mit aufzunehmen, und zwar mit einem zusätzlichen Qualifier (zum Beispiel mit betroffener Zeitraum (P1264) → Sommerzeit (Q36669). Die Möglichkeit finde ich nicht schlecht, ich weiß aber nicht, ob sie derzeit schon genutzt wird. Alternativ könnte man eine neue Eigenschaft anfragen, die separat zur Zeitzone die Sommerzeit angibt. @Matthiasb: Weil du explizit den Abgleich mit der Sommerzeit-Angabe auf Wikidata ins Spiel brachtest: Kennst Du dort die übliche Praxis? Wie wird die Sommerzeit in Wikidata sauber abgebildet? Yellowcard (D.) 13:31, 4. Jul. 2020 (CEST)
- Hm, es gibt mMn nur eine effektive Methode, die Sommerzeit korrekt abzubilden. Nämlich durch das Property "Sommerzeit" bestehend aus dem Offset zur UTC und der Gültigkeitsdauer. Wie das auf WD bisher gemacht wir, entzieht ich meiner Kenntnis. Seit dem P107-Debakel schimpfe ich nämlich nur noch über und rede nicht mehr mit WD. (Der Treppenwitz ist ja, daß die 12 Millionen damals gelöschten DNB-IDs inzwischen wieder in WD eingearbeitet wurden. Der Admin, der das damals betrieb, hätte eigentlich als Ausgeburt amerikanischer Wikiarroganz aus dem Projekt geworfen werden müssen.) Die Praxis, dort die Zeitzone Eastern Time Zone explizit zu erfassen. In Equador, Peru, Bolivien und paßt das mit dem Osten nämlich nimmmer so gut. Außerem lösen wir so das Problem von Arizona nicht.
- Vielleicht findet sich in der EN:WP im Gegenstück zu Zeitzonen in den Vereinigten Staaten verlinktes Quellenmaterial zu den Bundesstaaten mit geteilter Zeitzone. Auf WD könnte man dann anhand des FIPS-Codes für die Countys gezielt die Orte auswählen, deren Zeitone zu erfassen ist. In Arizona wird man noch nach der idealen Lösung suchen müssen.
- Hierzupedia haben wir übrigens eine Wartungskategorie, die das Format der Zeitzonen kontrolliert. Die Zahl der nicht als UTC-Offset angegebenen oder verlinkter Zeitzonenangaben dürfte relativ niedrig sein. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 16:38, 4. Jul. 2020 (CEST)
- @Matthiasb: Für die Zeitzonen muss jedenfalls zuerst ein gutes Vorgehen auf Wikidata gefunden werden. Das scheint derzeit noch überhaupt nicht der Fall zu sein. Ich verfolge das parallel weiter, die erste Diskussion läuft hier. Den Aspekt der Zeitzonen sollten wir also meines Erachtens zunächst etwas zurückstellen und uns auf andere Aspekte der Infobox und der jeweiligen Anbindung jeder Infobox-Aussage an Wikidata prüfen. Viele Grüße, Yellowcard (D.) 09:53, 6. Jul. 2020 (CEST)
- Na ja, manche von den oben genannten Bundesstaaten sind nicht nur in einer Zeitzone. Zum Beispiel:
- Nevada: West Wendover hat Mountain Time (Elko County)
- Oklahoma: Kenton hat Mountain Time
- Und die Grenze verläuft leider nicht immer auch auf County-Grenzen: Zum Beispiel die oben genannten Beispiele, oder auch durch Malheur County (OR), Aleutians West Census Area (AK), Cherry County (NE), Sioux, Dunn und McKenzie Countys (ND) (nicht vollständig)
- Auch die Sommerzeitsgrenze in AZ verläuft nicht entlang Countygrenzen, wohl aber entlang Reservatsgrenzen. --Torpian (Diskussion) 21:00, 13. Sep. 2021 (CEST)
Konkrete Vorschläge
BearbeitenIch starte hier einfach mal mit konkreten Vorschlägen anhand der derzeit existierenden verschiedenen Infobox-Parameter. Offen lasse ich die Frage, ob weitere Infobox-Parameter sinnvoll wären, ich meine eher nein.
- Bundesstaat:
- Angabe im Artikel-Quelltext; von Wikidata beziehen, wenn lokal keine Angabe; dann auch Wartungskategorie setzen.
- Bild:
- Nur lokale Angabe, kein Bezug von Wikidata (außer die vorhandene Wartungskategorie)
- Breiten- und Längengrad, Gründung, Postleitzahl, Vorwahl, Fips, GNIS, Bürgermeister:
- Angabe im Artikel-Quelltext; von Wikidata beziehen, wenn lokal keine Angabe oder Schlüsselwort ABFRAGE_WIKIDATA
- Einwohner + Stand, Fläche, Höhe:
- Bevorzugt lokalen Wert verwenden
- Bei Angabe ABFRAGE_WIKIDATA oder fehlender Angabe Wert von Wikidata beziehen
- Zur Diskussion: Falls auf Wikidata eine Angabe mit Datum = 2020 vorhanden ist, könnte man diesen Wert bevorzugt beziehen und den lokalen Wert überschreiben. Zusätzlich Wartungskategorie setzen. Wäre das konsensfähig?
- Zeitzone:
- Erst einmal auf Wikidata zu klären, daher bis zur dortigen Lösung keine Änderung bei uns.
- Typ:
- Wäre zu prüfen, ob man das sinnvoll von Wikidata holen kann, aber wenn der Typ fehlt, weist der Artikel möglicherweise noch mehr Probleme auf. Ich würde ihn daher nur in eine Wartungskategorie laufen lassen.
Dies meine derzeitige Vorstellung mit Bitte um eure Meinungen. Grüße, Yellowcard (D.) 12:15, 7. Jul. 2020 (CEST)
Nein, umgekehrt...
- Breiten- und Längengrad, Gründung, Postleitzahl, Vorwahl, Fips, GNIS, Bürgermeister, Höhe:
- Angabe im Artikel-Quelltext; nur wenn lokal keine Angabe von Wikidata beziehen, dann aber auch Wartungskategorie bei Abweichung
- Einwohner + Stand, Fläche:
- nur Wikidata-Werte verwenden, lokale Befüllung der IB völlig augeben
- ABER SICHERSTELLEN, daß im Frühjahr 2021 die einlaufenden Daten auf Wikidata geordnet erfaßt werden. (In der Vergangenheit hat das Census Bureau pro Staat ZIP-Files mit den Daten im CSV-Format zurv<verfügungvgestellt.) Sicherstellen, daß Flächenangaben und Bevlkerungsdichte nicht über Umweg imperial ermittelt werden.
- Diesen Schritt (Aufgabe er lokalen Daten) aber nur gehen, wenn wir sicher sind, daß das auf WD in unerem Sinne läuft, oder was meinst du, Benutzer:H-stt?
- Typ:
- lokal belassen, Wartungskategorie bei Fehlen und Abweichen
- wenn er abweicht, deutet das mglw. auf C+P der Vorlage aus einem anderen Artikel
- fehlt er, wußte der Artikelerteller verutlich gar nicht, was er da macht: Artiel enthält vermutlich auch im Fließtext Murks, etwa town -> "Kleinstadt"
--Matthiasb – (CallMyCenter) Wikinews ist nebenan! 20:47, 7. Jul. 2020 (CEST)
- Klingt für mich alles gut, so weit seid ihr ja nicht auseinander. Bis wann ist mit den Zensus-Daten zu rechnen? Schon 2021? Dann wäre automatische Übernahme unter den von Matthias genannten Bedingungen sinnvoll, vorher sollten die lokalen Daten Vorrang haben. -- Perrak (Disk) 20:56, 7. Jul. 2020 (CEST)
- Schon? Die Zählung war ja berreis im April. Für April 2021 erhofft man sich die ersten Ergebnisse. So denn im Herbst bei und nach den Wahlen alles ruhig bleibt. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 21:42, 7. Jul. 2020 (CEST)
- Naja, das dauert in manchen Ländern länger, so weit ich weiß, auch in Deutschland. Okay, dass die Daten bereits im April erhoben wurden, war mir entgangen. -- Perrak (Disk) 22:27, 7. Jul. 2020 (CEST)
- Ich sehe das auch so, dass wir da eigentlich recht nahe beieinander sind. Unterschiede sehe ich eigentlich nur bei der Höhe sowie bei der konkreten Umsetzung von Einwohnerzahl und Fläche.
- @Matthiasb: Zudem ist bei Dir das Schlüsselwort ABFRAGE_WIKIDATA völlig herausgefallen. War das bewusst? Ich finde diese Option allein deshalb nicht schlecht, weil im Quelltext sofort klar wird, woher die Daten stammen. Gerade bei einer so vielfach und langfährig verwendeten Vorlage wie dieser Infobox fände ich das Schlüsselwort als Standardwert (auch in der Kopiervorlage) nicht verkehrt. Wie siehst Du das?
- Die Daten des Zensus 2010 sind auf Wikidata übrigens wirklich nicht gut eingepflegt worden. Ich weiß nicht, ob es überhaupt irgendwo eine zentrale Stelle gibt, die den Datenimport organisiert. Vielleicht übernehmen wir das am besten einfach selbst. Ich erstelle dazu gleich noch einen weiteren Abschnitt... Yellowcard (D.) 10:32, 8. Jul. 2020 (CEST)
- Schon? Die Zählung war ja berreis im April. Für April 2021 erhofft man sich die ersten Ergebnisse. So denn im Herbst bei und nach den Wahlen alles ruhig bleibt. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 21:42, 7. Jul. 2020 (CEST)
- Klingt für mich alles gut, so weit seid ihr ja nicht auseinander. Bis wann ist mit den Zensus-Daten zu rechnen? Schon 2021? Dann wäre automatische Übernahme unter den von Matthias genannten Bedingungen sinnvoll, vorher sollten die lokalen Daten Vorrang haben. -- Perrak (Disk) 20:56, 7. Jul. 2020 (CEST)
Sorry für die blöde Frage, aber ist das hier der richtige Ort, dies zu diskutieren? Wenn Infos zentral über Wikidata gesammelt und verwertet werden, muss es doch zwischen den einzelnen Sprachversionen eine Einigkeit darüber geben, wie das umgesetzt wird? LG Stefan 00:12, 8. Jul. 2020 (CEST)
- Blöde Fragen gibts eigentlich nicht, blöd ist nur, wenn man eine Frage hat und die nicht stellt ;-)
- Eine zentrale Diskussionplattform für alle Wikis gibt es nicht, wäre aus Sprachgründen auch schwierig. Und in diesem Falle auch nicht unbedingt nötig, das kann doch jeder anders umsetzen. Sprachversionen mit nur sehr wenigen Mitarbeitern können fast alles automatisiert übernehmen, um möglichst viel Inhalt mit wenig Aufwand zu erhalten. Die englische WP kann praktisch alles übernehmen, da die Sprache passt. Wir wählen aus, was sinnvoll ist, da wir (hoffentlich) die Kapazität haben, uns um den Rest händisch zu kümmern, und weil wir möglichst viel Kontrolle vor Ort haben wollen, was in den Artikeln steht. -- Perrak (Disk) 10:13, 8. Jul. 2020 (CEST)
- (BK) Hallo Stefan, zwei Aspekte, zwischen denen man unterscheiden muss:
- Die Darstellung der Daten auf Wikidata: Dass die Daten dort gesammelt und dargestellt werden sollten, ist unstrittig, das ist ja Kernaufgabe von Wikidata. Wie genau diese Daten optimalerweise strukturiert sein sollten, ist eigentlich auch relativ klar vorgeschrieben, nur wurde das de facto bisher nicht so umgesetzt. Da sind eigentlich eher Details zu klären (wie z.B.: über welche externe Veröffentlichung werden die Daten am besten belegt? – Da diverse Fundstellen angegeben werden können, können hier auch verschiedene Ansichten zusammenfließen).
- Die Darstellung bei uns: Wie wir die auf Wikidata vorhandenen Daten hier verwerten, ist eine lokale Entscheidung, die jede Wikipedia-Sprachversion individuell entscheiden kann und sollte. Von „Wir wollen nichts von Wikidata“ bis „Wir beziehen alles von Wikidata“ sind hier verschiedene Ansätze in allen Grautönen möglich, siehe oben. Beste Grüße, Yellowcard (D.) 10:32, 8. Jul. 2020 (CEST)
- Vielen Dank für die Antworten. LG Stefan 22:24, 8. Jul. 2020 (CEST)
Blöde Frage
BearbeitenWarum bekomme ich bei Alton (Maine) einen Eintrag in der Wartungskat., hingegen wird Bangor (Maine) genau so ausgefüllt nicht angemahnt? --Itti 21:08, 15. Aug. 2020 (CEST)
- @Itti: Meinst Du die Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/Zeitzone? Das ist auf die obenstehende, bisher noch nicht abgeschlossene / gelöste Diskussion zurückzuführen. Genauer gesagt: Im Artikel Alton (Maine) steht als Zeitzone UTC-4, im zugehörigen Wikidata-Item steht Eastern Time Zone (Q941023). Inhaltlich ist das quasi identisch, wenn man berücksichtigt, was die Vorlage aus dieser Angabe macht, aber die Vorlagenprogrammierung erkennt eine Abweichung. Anders im Artikel Bangor (Maine), wo im zugehörigen Wikidata-Datenobjekt ebenfalls UTC−5 (Q5390) eingetragen ist - es wird eine Übereinstimmung erkannt, aber diese Angabe ignoriert die Sommerzeit, also eigentlich ist die Wikidata-Angabe in dieser Form falsch / nur halb richtig.
- Das ist also ein Problem, für dessen Lösung wir noch etwas Grips investieren müssten. Falls die Wartungskategorie stört (sie lässt sich derzeit realistischerweise kaum abarbeiten), könnten wir sie auch temporär deaktivieren. Wartungskategorien sind allerdings ohnehin nur für angemeldete Benutzer, die die Anzeige aktiviert haben, sichtbar. Vielleicht wäre es sinnvoller, diesen Abschnitt mit in den obigen zur Zeitzone zu integrieren. Grüße, Yellowcard (D.) 12:48, 16. Aug. 2020 (CEST)
- Mich stört es nicht wirklich, nur so weit, dass ich mich bemühe solches abzuarbeiten. Dann jedoch stört mich halt, wenn ich es nicht schaffe. Anderes Problem einige Fips-Angaben habe ich nach dem Hinweis der Wartungskat. korrigiert, es verbleiben jedoch noch immer welche. Problem ist, auf Wikidata haben sie einen anderen Eintrag, der ist mit einer nicht abrufbaren Census-Seite belegt. Per Roadside habe ich jedoch eine andere Angabe, aber ich bin ebenfalls zu blöd, das auf Wikidata zu ändern, sprich, den Wert kann ich ändern, aber nicht die zugehörige Quelle. Ich hatte es bei einer anderen Town versucht, die keine Quelle hat. Es gelingt mir nicht, dort eine Quellenangabe zu speichern. So habe ich es dann halt gelassen. Viele Grüße --Itti 12:55, 16. Aug. 2020 (CEST)
- Auf Wikidata gibt es einige falsche FIPS-Angaben. Interessanterweise haben diese oft ihren Ursprung in der de.wp und wurden ovn dort nach Wikidata importiert, das ist auch recht spannend... Diese gehe ich derzeit systematisch durch (für Cities, Towns und CDPs), bin aber alphabetisch soritert erst von Alabama bis Delaware fertig. Um welchen konkreten Artikel geht es denn bei Dir? Dann schaue ich gerne mal, wo das Problem liegt. Gruß Yellowcard (D.) 13:01, 16. Aug. 2020 (CEST)
- Z.B. Guilford (Maine) Wikidata sagt 23-30095, Roadsidethoughts sagt 23-27520 Ich denke, nachdem ich jetzt einiges rumgesucht habe, bei Roadsidethoughts wird nicht die Town angezeigt, sondern das Village, was es nicht einfacher macht, seufz. Nur kann ich es gerade nicht nachsehen, den die Census-Daten dazu finde ich nicht. Viele Grüße --Itti 13:13, 16. Aug. 2020 (CEST)
- Auf Wikidata gibt es einige falsche FIPS-Angaben. Interessanterweise haben diese oft ihren Ursprung in der de.wp und wurden ovn dort nach Wikidata importiert, das ist auch recht spannend... Diese gehe ich derzeit systematisch durch (für Cities, Towns und CDPs), bin aber alphabetisch soritert erst von Alabama bis Delaware fertig. Um welchen konkreten Artikel geht es denn bei Dir? Dann schaue ich gerne mal, wo das Problem liegt. Gruß Yellowcard (D.) 13:01, 16. Aug. 2020 (CEST)
- Mich stört es nicht wirklich, nur so weit, dass ich mich bemühe solches abzuarbeiten. Dann jedoch stört mich halt, wenn ich es nicht schaffe. Anderes Problem einige Fips-Angaben habe ich nach dem Hinweis der Wartungskat. korrigiert, es verbleiben jedoch noch immer welche. Problem ist, auf Wikidata haben sie einen anderen Eintrag, der ist mit einer nicht abrufbaren Census-Seite belegt. Per Roadside habe ich jedoch eine andere Angabe, aber ich bin ebenfalls zu blöd, das auf Wikidata zu ändern, sprich, den Wert kann ich ändern, aber nicht die zugehörige Quelle. Ich hatte es bei einer anderen Town versucht, die keine Quelle hat. Es gelingt mir nicht, dort eine Quellenangabe zu speichern. So habe ich es dann halt gelassen. Viele Grüße --Itti 12:55, 16. Aug. 2020 (CEST)
- Leider ist die GNIS-Datenbank gerade offline ... Und ein Blick in die Zensus-Daten verwirrt mich noch mehr. Dort gibt es in Maine nur das Guilford CDP mit dem FIPS-Code 23-30060. Dort haben 2010 903 Menschen gelebt, es scheint sich also um einen anderen Ort zu handeln. Eine Guilford town in Maine finde ich in den Zensus-Daten nicht. Übrigens: „ Im Jahr 2010 lebten dort 1521 Einwohner in 88 Haushalten“ -- das scheint mir doch ein bisschen zu beengt, oder nicht? ;-) Viele Grüße, Yellowcard (D.) 13:30, 16. Aug. 2020 (CEST)
- Und das, wo die die Fewos mitzählen. Danke, das war ein Typo, 882 ist korrekt. Viele Grüße --Itti 13:35, 16. Aug. 2020 (CEST)
- Hier findet sich Guilford town in Maine, mit FIPS-Code 23-30095. Scheint also auf Wikidata korrekt zu sein. Grüße, Yellowcard (D.) 13:40, 16. Aug. 2020 (CEST)
- Super, den Link habe ich mir gleich eingelagert. Viele Grüße --Itti 13:52, 16. Aug. 2020 (CEST)
- Schau mal hier, dort die Linkliste mit den einzelnen Staaten ganz unten: Da gibt es jeweils das gleiche, nur mit aktuellen Daten bis einschließlich 2019. :) Auf den Seiten vom Census Bureau gibt es echt viele Fundstücke, leider nur völlig chaotisch strukturiert, sodass man immer Glück braucht, da etwas gutes zu finden. Grüße, Yellowcard (D.) 14:22, 16. Aug. 2020 (CEST)
- Super, den Link habe ich mir gleich eingelagert. Viele Grüße --Itti 13:52, 16. Aug. 2020 (CEST)
- Hier findet sich Guilford town in Maine, mit FIPS-Code 23-30095. Scheint also auf Wikidata korrekt zu sein. Grüße, Yellowcard (D.) 13:40, 16. Aug. 2020 (CEST)
- Und das, wo die die Fewos mitzählen. Danke, das war ein Typo, 882 ist korrekt. Viele Grüße --Itti 13:35, 16. Aug. 2020 (CEST)
- Leider ist die GNIS-Datenbank gerade offline ... Und ein Blick in die Zensus-Daten verwirrt mich noch mehr. Dort gibt es in Maine nur das Guilford CDP mit dem FIPS-Code 23-30060. Dort haben 2010 903 Menschen gelebt, es scheint sich also um einen anderen Ort zu handeln. Eine Guilford town in Maine finde ich in den Zensus-Daten nicht. Übrigens: „ Im Jahr 2010 lebten dort 1521 Einwohner in 88 Haushalten“ -- das scheint mir doch ein bisschen zu beengt, oder nicht? ;-) Viele Grüße, Yellowcard (D.) 13:30, 16. Aug. 2020 (CEST)
Strukturierung der Einwohnerzahlen auf Wikidata
BearbeitenDas hier verliert jetzt etwas den Bezug zur Infobox, und trotzdem würde ich das hier gern aufgreifen, da von Matthiasb und zum Teil von h-stt angeklungen.
- Wie genau sollten die Daten auf Wikidata struktuiert werden?
- In meinen Augen sollten vorhanden sein: die Einwohnerzahl als Statement (klar), als Qualifikatoren der Stand (das Jahr oder besser noch der genaue Stichtag) und die Bestimmungsmethode als Volkszählung, und als Nachweis das Item des jeweiligen Zensus, eine URL auf ein Dokument oder Datenbank sowie optimalerweise ein Abrufdatum.
- Beispiele sind San Francisco (wikidata:Q62#P1082) und Camden (wikidata:Q1144372#P1082)
- Die für mich noch offene Frage: Welche URL eignet sich am besten zum Beleg? Ich habe im Beispiel Camden die jeweilige PDF-Veröffentlichung verwendet. In San Francisco ist eine CSV-Datei verlinkt, die inzwischen nicht mehr erreichbar ist. Für Orte größer 5000 Einwohner böten sich noch die QuickFacts an. @Matthiasb: Hast Du hierzu eine Meinung?
- Die bereits vorhandenen Daten zu früheren Zensus sind ebenfalls größtenteils schlecht eingepflegt. Die Daten liegen ja teilweise als CSV- oder Excel-Dateien vor, ich finde sie aber derzeit nicht. Aufbereitete Excel-Daten lassen sich in Wikidata (mitsamt Qualifikatoren und Fundstellen) per Wikidata QuickStatements bequem einpflegen. Wer kann mir helfen, diese Excel- oder CSV-Dateien des US Census Bureau zu finden? Yellowcard (D.) 11:09, 8. Jul. 2020 (CEST)
- Ich bin kein wirklicher Experte für WD, aber dem Grundsatz nach ist die Struktur ja schon vorhanden. Die Gebietskörperschaften (und die CDPs und sonstigen Siedlungen) sind als Item ja alle schon vorhanden (oder müssen eben neu angelegt werden, sollte es neue CDPs und sonstige Siedlungen geben). An diesen Items hängen Properties wie Geokoordinaten, Einwohnerzahl, etc. Soweit ich das sehe, sind alle für uns sinnvollen Properties schon vorhanden, nur zu einem guten Teil bisher nicht bei allen Items befüllt. Die Daten kommen als CSV rein und können trivial per Script nach WD gespielt werden. Alle neuen Daten bekommen den Zeitstempel 2020 als Property und das jeweilige Census-CSV-File als Beleg-Property. Und sie bekommen das Label, dass sie preferred sind. Das müsste doch unsere Bedürfnisse auf WD völlig abdecken, oder? Grüße --h-stt !? 13:19, 8. Jul. 2020 (CEST)
- Ja, ich sehe es auch so, dass wir dies in der Struktur bereits so haben und im Datenobjekt zu San Francisco ist das ja auch so umgesetzt. Ich finde bloß die CSV/Excel-Dateien für den Census 2010 nicht. Gibt es die noch irgendwo? Ich würde mir das nämlich gerne mal anschauen. Wenn ich keinen Denkfehler habe, wird für den großflächigen Datenimport nicht einmal ein Bot benötigt; ein bisschen Spielerei mit Excel und dann reinladen der Daten über die QuickStatements-Schnittstelle sollte völlig ausreichen. Grüße, Yellowcard (D.) 18:08, 8. Jul. 2020 (CEST)
- Die haben anscheinend alles umgefrickelt. Eine Txt-Datai Census 2010 für kompl. US Town, Citys, Plantations, UTs, usw habe ich dir Yellowcard gerade per mail geschickt. Ich hoffe das hilft weiter. Viele Grüße --Itti 18:17, 8. Jul. 2020 (CEST)
- Vielen Dank, Itti! Ich komme auf den Seiten des Census Bureaus seit der Umstrukturierung auch nicht mehr so recht klar. Die Mail kann ich mir erst morgen Vormittag anschauen. Nochmals danke, Gruß Yellowcard (D.) 18:23, 8. Jul. 2020 (CEST)
- Gerne --Itti 18:24, 8. Jul. 2020 (CEST)
- Vielen Dank, Itti! Ich komme auf den Seiten des Census Bureaus seit der Umstrukturierung auch nicht mehr so recht klar. Die Mail kann ich mir erst morgen Vormittag anschauen. Nochmals danke, Gruß Yellowcard (D.) 18:23, 8. Jul. 2020 (CEST)
- Die haben anscheinend alles umgefrickelt. Eine Txt-Datai Census 2010 für kompl. US Town, Citys, Plantations, UTs, usw habe ich dir Yellowcard gerade per mail geschickt. Ich hoffe das hilft weiter. Viele Grüße --Itti 18:17, 8. Jul. 2020 (CEST)
- Die 2010er Daten müssten irgendwo unter https://www.census.gov/programs-surveys/decennial-census/data/datasets.2010.html liegen. Grüße --h-stt !? 18:25, 8. Jul. 2020 (CEST)
- Vermutlich hier, aber als Access-Dateien. Das müsste ich mir mal in Ruhe anschauen. Die Text-Datei, die Itti mir per Mail zugeschickt hat, sieht auf den ersten Blick sehr hilfreich aus (bezüglich Bevölkerungszahl, Fläche und Landfläche); genau das hatte ich gesucht. Alle tiefergehenden Daten (Haushaltsgrößen, Altersverteilung etc.) müsste man sich dann wohl aus den Access-Datenbanken ziehen. Das macht den Aufwand schon größer. Yellowcard (D.) 23:46, 8. Jul. 2020 (CEST)
- Ergänzung: Itti hat mir „Gazetteer Files“ geschickt. Den Begriff kannte ich bislang nicht, damit habe ich aber die neue URL finden können: Die Dateien befinden sich inzwischen hier, spannenderweise ebenfalls verfügbar für die Census 1990 und 2000 sowie (eher weniger spannend) für die American Community Surveys 2012 bis 2018. Danke nochmal, ich schaue mir das in den nächsten Tagen in Ruhe an. Yellowcard (D.) 23:51, 8. Jul. 2020 (CEST)
- Vermutlich hier, aber als Access-Dateien. Das müsste ich mir mal in Ruhe anschauen. Die Text-Datei, die Itti mir per Mail zugeschickt hat, sieht auf den ersten Blick sehr hilfreich aus (bezüglich Bevölkerungszahl, Fläche und Landfläche); genau das hatte ich gesucht. Alle tiefergehenden Daten (Haushaltsgrößen, Altersverteilung etc.) müsste man sich dann wohl aus den Access-Datenbanken ziehen. Das macht den Aufwand schon größer. Yellowcard (D.) 23:46, 8. Jul. 2020 (CEST)
- Ja, ich sehe es auch so, dass wir dies in der Struktur bereits so haben und im Datenobjekt zu San Francisco ist das ja auch so umgesetzt. Ich finde bloß die CSV/Excel-Dateien für den Census 2010 nicht. Gibt es die noch irgendwo? Ich würde mir das nämlich gerne mal anschauen. Wenn ich keinen Denkfehler habe, wird für den großflächigen Datenimport nicht einmal ein Bot benötigt; ein bisschen Spielerei mit Excel und dann reinladen der Daten über die QuickStatements-Schnittstelle sollte völlig ausreichen. Grüße, Yellowcard (D.) 18:08, 8. Jul. 2020 (CEST)
- Ich bin kein wirklicher Experte für WD, aber dem Grundsatz nach ist die Struktur ja schon vorhanden. Die Gebietskörperschaften (und die CDPs und sonstigen Siedlungen) sind als Item ja alle schon vorhanden (oder müssen eben neu angelegt werden, sollte es neue CDPs und sonstige Siedlungen geben). An diesen Items hängen Properties wie Geokoordinaten, Einwohnerzahl, etc. Soweit ich das sehe, sind alle für uns sinnvollen Properties schon vorhanden, nur zu einem guten Teil bisher nicht bei allen Items befüllt. Die Daten kommen als CSV rein und können trivial per Script nach WD gespielt werden. Alle neuen Daten bekommen den Zeitstempel 2020 als Property und das jeweilige Census-CSV-File als Beleg-Property. Und sie bekommen das Label, dass sie preferred sind. Das müsste doch unsere Bedürfnisse auf WD völlig abdecken, oder? Grüße --h-stt !? 13:19, 8. Jul. 2020 (CEST)
- Die Gazetteer-Dateien lassen sich ganz hervorrgend haltautomatisch nach Wikidata übertragen, wenn man sie per Excel etwas frisiert. Ich habe das an einem Beispiel versuchsweise getestet: Wikidata-Diff.
- Bevor ich das etwas großflächiger ausprobiere, benötige ich Fachwissen von den Experten: Auch bei der Fläche habe ich Bestimmungsmethode "Volkszählung", nachgewiesen im Census 2010 sowie Stichtag 1. April 2010 angegeben (siehe Q520251#P2046). Ist das richtig? Oder stammen die Flächen-Angaben aus einer anderen Ermittlung und wurden nur in den Daten mit aufgenommen?
- Ich habe die originale Angabe (in Quadratmetern) verwendet, in Quadrat-Kilometer umgerechnet und dann auf drei Nachkommastellen gerundet. Das sollte an Genauigkeit ausreichen, meine ich. Yellowcard (D.) 11:23, 9. Jul. 2020 (CEST)
- Ich denke, wenn wir die Daten für 1990 bis 2010 haben, sollte man sie gleich mit einpflegen. Ob man das en bloc macht oder nacheinander, kann ich nicht beurteilen. Worauf man sicher achten muß, ist, daß die Datenreihen unterschiedliche Grundgesamtheiten haben. Wenn ein CDP erst 2010 eingerichtet wurde, gibt es keine Zahlen für 1990. Sinngemäß umgekehrt, bei Eingemeindungen/Auflassungen. Da gibt es aber jeweils eine Datei, in der solche "Gebietsänderungen" aufgelistet sind, falls das notwendig wäre. (Müßte ich aber suchen danach.)
- Was die PDFs angeht, die in der Infobox verlinkt werden, so hatte ich damals town und townships ausgeblendett, weil a.) mir seinerzeit der Zusammenhang fehlte, daß Neuengland-Towns für das Census Bureau Townships sind, b.) später dann mir Zeit und Gelgenheit fehlten, um beides auseinander zu fieseln. Es gibt aber eine Diskussion (im WPG-Archiv, wenn ich mich richtig erinnere), zwischen mir und Visi-on, wo die Logik, wie diese PDF-URLs gebildet werden, zumindest nach damaligem Stand dokumentiert ist.
- Es gibt auch Fälle, in denen diese PDFs "verschwinden". Das hängt oft, aber nicht immer damit zusammen, daß sich der "Typ" zwischenzeitlich geändert hat. Die Fallzahl dürfte im niedrigen einstelligen Prozentbereich liegen.
- Nach meiner Kenntnis stammen die Flächenangaben seit jeher aus den Census-Files, schon zu Zeiten der damaligen englischen Vorlage GR2, die als Relikt in vielen dortigen Ortsartikeln als Ref-Name erhalten ist, vgl. en:Wikipedia:Geographic references#United States.
- Wobei mir noch einfällt, daß die Flächenangaben in Bundesstaaten wie New York, wo der ganze Staat restlos auf Citys, Towns und Indian Revervations aufgeteilt ist, sich tendenziell eher weniger ändern als im Rest des Landes. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 07:09, 11. Jul. 2020 (CEST)
- Im ersten Schritt habe ich gestern die Bevölkerungszahlen für Städte in South Carolina aus dem Zensus 2010 hochgeladen. Wenn man bedenkt, dass das nur ein Bruchteil der Arbeit war (es fehlen noch die Jahre 1990 und 2000, es fehlen noch die CDPs, und das alles fehlt noch bei 49 weiteren Bundesstaaten), kann man sich ausmalen, dass das noch einige Zeit dauern wird, zumal ich nicht jeden Tag Zeit dafür habe. Aber da die Daten seit rund zehn Jahren nicht vollständig auf Wikidata lagen, kommt es auf ein paar Wochen wohl auch nicht mehr an.
- @Matthiasb: Weißt Du denn, ob die Flächen-Daten auch im Rahmen des Census ermittelt werden? Es geht mir insbesondere um die Aussage "Bestimmungsmethode" → "Volkszählung". Ich weiß nicht, ob das bei den Flächenangaben wirklich korrekt ist (anders bei Angaben z.B. zur Bevölkerung und Anzahl der Haushalte).
- Zu den Quellen: Tatsächlich würde ich dann eher die Gazetteer-Files verlinken, wenn ich die Daten dorther nehme, auch wenn die PDFs wohl inhaltlich identisch sind. Yellowcard (D.) 13:04, 11. Jul. 2020 (CEST)
- Ich habe die Flächenangaben ohne die Bestimmungsmethode importiert (bisher für South Carolina, Census 2010). Yellowcard (D.) 09:01, 13. Jul. 2020 (CEST)
- Kurze Ergänzung: Auf Wikidata existiert bereits die Eigenschaft prozentualer Anteil Gewässerfläche (P2927). Diese werde ich ebenfalls befüllen. Dann steht also die Gesamtfläche in km² sowie der prozentuale Anteil an Wasserfläche zur Verfügung. Benötigen wir eine weitere Eigenschaft, die die Wasserfläche als absolute Fläche angibt oder reicht uns die prozentuale Angabe? Yellowcard (D.) 13:15, 13. Jul. 2020 (CEST)
- Mir reicht die relative Angabe. Aber ich möchte mal kurz drauf aufmerksam machen, dass die Gazetteer-Daten nicht alles sind. Wir brauchen auch die American Housing Study und die Socio-Economic Study, um Ortschaften umfassend beschreiben zu können. Die werden nur (voraussichtlich) nicht gleichzeitig veröffentlicht. Die Gazetteer-Daten waren in der Vergangenheit deutlich schneller. Grüße --h-stt !? 13:23, 13. Jul. 2020 (CEST)
- @H-stt: Gibt es die Daten aus der American Housing Study und die Socio-Economic Study für zurückliegende Zeitpunkte noch online? Yellowcard (D.) 15:37, 13. Jul. 2020 (CEST)
- Ziemlich sicher ja, aber danach muss man in dem Datenchaos des US Census Bureau suchen. Grüße --h-stt !? 15:39, 13. Jul. 2020 (CEST)
- Ich habe mich jetzt eine Stunde durch die verschiedenen angebotenen Daten gewühlt, zig verschiedene CSV-Dateien geöffnet, mich durch zugehörige Anleitungen gelesen, und de facto nichts Brauchbares gefunden. Die einzig einigermaßen guten Daten im CSV-Format waren auf Bundesstaat-Ebene. Vielleicht findet ja jemand anderes etwas Gutes, ansonsten müssen wir uns mit Bevölkerungszahl, Anzahl der Haushalte, Land- und Wasserfläche begnügen. Das ist okay für die Infobox; für einen Demographie-Abschnitt aber recht mager. Yellowcard (D.) 19:35, 13. Jul. 2020 (CEST)
- Ziemlich sicher ja, aber danach muss man in dem Datenchaos des US Census Bureau suchen. Grüße --h-stt !? 15:39, 13. Jul. 2020 (CEST)
- @H-stt: Gibt es die Daten aus der American Housing Study und die Socio-Economic Study für zurückliegende Zeitpunkte noch online? Yellowcard (D.) 15:37, 13. Jul. 2020 (CEST)
- Mir reicht die relative Angabe. Aber ich möchte mal kurz drauf aufmerksam machen, dass die Gazetteer-Daten nicht alles sind. Wir brauchen auch die American Housing Study und die Socio-Economic Study, um Ortschaften umfassend beschreiben zu können. Die werden nur (voraussichtlich) nicht gleichzeitig veröffentlicht. Die Gazetteer-Daten waren in der Vergangenheit deutlich schneller. Grüße --h-stt !? 13:23, 13. Jul. 2020 (CEST)
- Kurze Ergänzung: Auf Wikidata existiert bereits die Eigenschaft prozentualer Anteil Gewässerfläche (P2927). Diese werde ich ebenfalls befüllen. Dann steht also die Gesamtfläche in km² sowie der prozentuale Anteil an Wasserfläche zur Verfügung. Benötigen wir eine weitere Eigenschaft, die die Wasserfläche als absolute Fläche angibt oder reicht uns die prozentuale Angabe? Yellowcard (D.) 13:15, 13. Jul. 2020 (CEST)
- Ich habe die Flächenangaben ohne die Bestimmungsmethode importiert (bisher für South Carolina, Census 2010). Yellowcard (D.) 09:01, 13. Jul. 2020 (CEST)
- Hallo @Yellowcard:, @Matthiasb:, @Itti:, @H-stt:, ich möchte die Aktualität und Vollständigkeit von Einwohnerzahlen für Orte und Regionen auf Wikipedia verbessern. Im Prinzip brauchen ja alle Wikipedien die selben Daten, daher habe ich das wikidata:Wikidata:WikiProject Gazetteer angelegt um die Pflege der Daten zu koordinieren und Wikis auch davon zu überzeugen die Zahlen zu benutzen. Da ihr schon die Census-Daten hinzufügt würde es mich sehr freuen, wenn ihr mit macht. --Pyfisch (Diskussion) 20:43, 23. Aug. 2020 (CEST)
Unterstützung benötigt
BearbeitenSPARQL-Query mit den fehlenden FIPS-Codes
Ich bin mit dem automatisierten Import der Daten nach Wikidata (Grundvoraussetzung für alles) auf einem guten Weg. Entscheidend ist aber, dass die Items auf Wikidata jeweils einen korrekten FIPS-Code aufweisen, diesen benötige ich für die Zuordnung von Census-Dokumenten zu den Wikidata-Items. Das ist der einzige wirklich manuelle Schritt, der Rest geht dann stark automatisiert für die Zensus-Daten 1990 bis 2010 (und bald 2020).
Derzeit gibt es noch 2579 CDPs/Cities/Towns ohne FIPS auf Wikidata. Dies manuell nachzutragen, ist leider notwendig, aber recht zeitintensiv und langweilig. Wer mag helfen? Ist auch eine ganz passable Aufgabe für nebenbei, und auch zehn Minuten helfen schon weiter. Aktuelle Liste findet sich per Datenbankabfrage: SPARQL-Query, einfach auf den Play-Knopf drücken und kurz warten. Zu tun:
- Auf das jeweilige Item klicken
- im geöffneten Wikidata-Fenster ganz nach unten scrollen, dort auf "Aussage hinzufügen" klicken
- im linken Feld "FIPS" eingeben und das erscheinende FIPS 55-3 auswählen (alternativ: P774 eingeben)
- im rechten Feld den FIPS-Code eingeben, den man z.B. auf den Census-Seiten, dem englischen WP-Artikel oder den anderen bekannten Quellen erhält.
Wie gesagt, jeder abgearbeitete Ort ist einer, und nach etwas Übung liegt der Zeitaufwand bei ca. 10 Sekunden pro Ort. Danke für eure Unterstützung! Yellowcard (D.) 00:23, 3. Aug. 2020 (CEST)
- Update: 2498 sind noch übrig. Yellowcard (D.) 10:10, 20. Aug. 2020 (CEST)
- Hab ein paar hundert Einträge aus Wisconsin, Wyoming und Pennsylvania bearbeitet. --Pyfisch (Diskussion) 11:48, 22. Aug. 2020 (CEST)
- Update: Done. Noch 169 Einträge ohne Zuordnung verblieben, die im GNIS keinen Census-Code aufweisen oder nicht auffindbar sind. Ein weiteres Paar Augen wäre hilfreich, sicherheitshalber. Außerdem ist eine Prüfung auf doppelte GNIS oder FIPS sinnvoll, um Datensätze zu identifizieren, die zusammengeführt werden sollten. --109.41.67.236 04:42, 25. Mär. 2021 (CET)
- Update: Nach weiteren Suchen jetzt noch 139 Verbleibende. Damit beende ich meine Arbeit an dieser Aktion. Meldet Euch gerne, wenn Ihr anderweitig Unterstützung benötigt, die ich vielleicht bieten könnte. Zwischenzeitlich wende ich mich anderen Aufgaben der Datenpflege zu. Freundlicher Gruß --109.41.64.75 08:25, 1. Apr. 2021 (CEST)
- Update: Done. Noch 169 Einträge ohne Zuordnung verblieben, die im GNIS keinen Census-Code aufweisen oder nicht auffindbar sind. Ein weiteres Paar Augen wäre hilfreich, sicherheitshalber. Außerdem ist eine Prüfung auf doppelte GNIS oder FIPS sinnvoll, um Datensätze zu identifizieren, die zusammengeführt werden sollten. --109.41.67.236 04:42, 25. Mär. 2021 (CET)
Nach der beeindruckenden Arbeit der IP sind es - insbesondere aufgrund der Änderungen im 2020er-Zensus - inzwischen wieder 958 Wikidata-Items mit fehlenden FIPS-Codes. Yellowcard (D.) 22:30, 8. Jan. 2022 (CET)
- 539 :D --G-41614 (Diskussion) 14:04, 11. Jan. 2022 (CET)
- Ehe der falsche Eindruck entsteht: wollte nur anzeigen, das es langsam besser aussieht. Nicht mein Werk allein --G-41614 (Diskussion) 22:47, 11. Jan. 2022 (CET)
- 343 --MTheiler (Diskussion) 20:52, 11. Jan. 2022 (CET)
Unterstützung benötigt ab Januar 2022
BearbeitenHier geht's weiter hinsichtlich benötigter Unterstützung: Benutzer:Yellowcard/Zensus-Daten ohne Wikidata-Zuordnung
Ich weiß nicht, was speziell mit Arkansas los ist. Das sind über 1000 Einträge aus der Zensus-Datenbank, zu denen kein Wikidata-Item gefunden wurde. Für die übrigen bisher abgefragten Staaten (Alabama, Alaska, Arizona und New Hampshire) sieht es sehr überschaubar aus, das sind jeweils nur einzelne wo vermutlich der FIPS-Code fehlt oder falsch ist. Wer findet den Grund bei Arkansas, dass es so wahnsinnig viele Einträge sind? Yellowcard (D.) 22:58, 20. Jan. 2022 (CET)
- Ergänzung zu Arkansas: Ursache sind wohl größtenteils neu entstandene CDPs (hier sollten wir auf Wikidata die FIPS-Codes einpflegen) sowie Townships. Speziell in Arkansas sind Townships wohl eher ein älteres Relikt, deren Nutzen in heutiger Zeit fragwürdig ist. Die en.wp hat zu den Townships in Arkansas offenbar keine eigenen Artikel. Sie überschneiden sich speziell in Arkansas offenbar stark mit Cities und CDPs. Daher würde ich sagen, können wir die Pflege der FIPS-Codes zu Townships in Arkansas bleiben lassen, das hat für uns keine Relevanz, die den Aufwand rechtfertigen würde. --Yellowcard (D.) 23:04, 20. Jan. 2022 (CET)
- Die Township-Einträge zu Arkansas habe ich wieder gelöscht, da bleiben immer noch eine Menge CDPs zu Arkansas in der Liste, aber sie ist deutlich händelbarer geworden.
- Septembermorgen hatte hier vor einiger Zeit mal für Pennsylvania systematisch ausgeholen, ich wei nicht wie genau das funktioniert hatte und ob er hier nochmal irgendwie unterstützen könnte. --Yellowcard (D.) 10:14, 21. Jan. 2022 (CET)
- Muss mal schauen, was sich zeitlich machen lässt. --Septembermorgen (Diskussion) 12:30, 6. Feb. 2022 (CET)
aktueller Stand ?
BearbeitenKurze Rückfrage: Wie ist den der aktuelle Stand dieses Vorhabens? Ich nehm' an, die 2020er Zahlen sind noch nicht verfügbar, sodass sie noch nicht auf WD eingepflegt werden können? Nichtsdestotrotz wäre die Einbindung in den hiesigen Artikelbestand ja jetzt schon möglich, mit den 2010er Zahlen, was aber nur bei rd. 370 Artikeln bislang der Fall ist. Zur Einbindung in die Artikel selbst folgende Fragen: - gibt es Vorlagen, die verhindern, dass Artikel mit WD-Einbindungen im Text zu Quelltextmonstern werden? Ist gfs. an eine Erweiterung der Vorlage:EWZ et al. gedacht für optionale Einbindungen aus WD? - wie ist es möglich, Zahlen aus WD außerhalb eines Artikels mit dem damit direkt verbundenen WD-Datensatz (bspw. in Listen) zu verwenden? Geht das über eine wie auch immer gartete ID (wie bspw. Gemeindenummern o.ä. in einer relationalen Beziehung) oder nur mit dem WD-identifier? --Septembermorgen (Diskussion) 13:43, 10. Jul. 2021 (CEST)
- Hallo Septembermorgen, nachdem das Vorhaben einige Zeit von meiner Seite aus liegen geblieben war, gab es hier wenig Fortschritt. Seit Mitte Juni bin ich dabei, die übrigen Daten des Zensus 2010 für die Orte (CDPs, Städte, Boroughs etc.) nach Wikidata zu importieren. Das umfasst die Angaben zu Einwohnerzahl, Anzahl der Haushalte, Fläche und Wasserfläche. Es ist eine sehr große Menge an Daten und es treten doch immer wieder Sonderfälle auf (gerade habe ich ein Problem mit Pennsylvania), sodass man hier nur Schritt für Schritt voran kommt. Ca. 80 Prozent der Daten zu den Orten sind bereits auf Wikidata. Ich gehe davon aus, damit in ca. einem Monat fertig zu sein. Kurz später werden dann wohl die Daten des Zensus 2020 als CSV- oder Excel-Dateien kommen und können nach Wikidata geladen werden, und die Zwischenzeit könnte man für die Daten von 2000 und 1990 verwenden, die auch nutzbar vorliegen.
- Was den Zensus 2020 angeht, sind bislang nur die Bevölkerungszahlen für die Staaten in brauchbarer Form vorhanden. Diese würde ich bei Gelegenheit nebenbei nach WD uploaden, das ist nicht der Rede wert.
- Bzgl. der 371 Einbindungen (gemäß Kategorie:Wikipedia:Seite verwendet P1082): Die Daten werden Stand jetzt nur eingebunden, wenn die Angabe auf Wikidata aus dem Jahr 2010 vorhanden ist UND keine Angabe in der Infobox (lokal im Artikel) vorliegt. Das heißt, sobald eine feste Zahl in die Infobox des Artikels eingetragen wurde, wird diese verwendet - eine ggü. Wikidata sehr zurückhaltende Vorgehensweise. Man könnte es durchaus so umstellen, dass die Daten von Wikidata bevorzugt angezeigt werden, z.B. wenn die lokale Angabe von vor 2010 ist, oder auch grundsätzlich (dann hätte man eine einheitliche Datenbasis). Die Diskussion dazu ist aber eingeschlafen und ich würde mich freuen, wenn wir hier eine weniger zurückhaltende Methode finden.
- Was meinst Du mit Quelltextmonstern? {{EWZ}} hat ja einen anderen Ansatz, indem die Daten lokal in Vorlagen geladen und dann abgerufen werden (siehe z.B. Vorlage:Metadaten Einwohnerzahl DE-BB. An sich ist der Ansatz über die Metadaten aber veraltet, seit es Wikidata gibt. {{Einwohnerzahl Wikidata}} kann das ganz ohne diese Metadaten-Vorlagen (und gleichzeitig profitieren alle Wikimedia-Projekte sowie externe Projekte von der Datenbasis).
- Und um an die Daten aus Wikidata zu kommen, benötigst Du meines Wissens immer den WD-Identifier. Siehe z.B. Liste der Städte in South Carolina, dort wird auch die vorgenannte {{Einwohnerzahl Wikidata}} verwendet.
- Viele Grüße, Yellowcard (D.) 15:00, 10. Jul. 2021 (CEST)
- Ergänzung: Ganz entscheidende Grundlage ist, dass die Wikidata-Items die FIPS-Codes der jeweiligen Orte aufweisen - darüber verknüpfe ich die Zensus-Daten mit den Wikidata-Items. Dies ist ein einmaliger Pflegeaufwand, anschließend können beliebige Zensus-Daten einfach nach WD geladen werden. Hier das Problem für Pennsylvania: Hier fehlen in über 900 Items die FIPS-Daten. Vorher macht es wenig Sinn, die Einwohnerzahlen hochzuladen. Die betroffenen Items findet man über diese Abfrage. @Septembermorgen, Carol.Christiansen: etc.: Jede Unterstützung hier ist herzlich willkommen, 900 Items manuell zu bearbeiten ist dann doch eine sehr stumpfe Aufgabe... Yellowcard (D.) 15:07, 10. Jul. 2021 (CEST)
- Ok, Quelltextmonster war jetzt ein bischen polemisch, das könnte aber in langen Listen ohne Formatvorlage durchaus dazu kommen. Ich wäre aber dafür, dass „EWZ“ und die anderen Metadaten-Formatvorlagen (weil kürzer) die Funktionalität von „Einwohnerzahl Wikidata“ mit abdecken, beide Vorlagen („EWZ“ und „Einwohnerzahl Wikidata“) machen im Prinzip dasselbe, sie binden Einwohnerzahlen von extern ein, geben sie formatiert aus und wichtig: sie verkürzen den Quelltext. Die FIPS-Codes benötigst Du für den Upload auf Wikidata? Lassen sich die anschließend auch nutzen, um Wikidata lokal einzubinden. Das Problem mit Wikidata-Objekten ist, sie sind nicht immer eindeutig. Beispiel: Hat Guxhagen (mindestens) drei verschiedene Bedeutungen (Gemeinde, Ortsbezirk, Ort im geografischen Sinn), denen auch drei verschiedene Einwohnerzahlen zugeordnet werden können (je nach Kontext), die aber alle im selben Artikel abgehandelt werden. Primär ist die Gemeinde, der die Einwohnerzahl über den Gemeindeschlüssel (06634008) zugeordnet wird (die Zuordnung über das verbundene WD-. Wikiprojekt Metadaten funktioniert seit 12 Jahren reibungslos in jetzt ca. 100.000 Artikeln, also gibt es da kein Grund das primär durch eine andere Vorgehensweise zu ersetzen (Was aus grundsätzlichen Problemen, Stichwort CC-0 für Wikidata auch gar nicht möglich ist). Lasst uns daher mal zunächst auf die Wikidata-Einbindung hier und nachfolgend an den Stellen konzentrieren, bei denen es keine grundsätzlichen Probleme gibt und die derzeit keine zentrale Einbindung der Einwohnerzahlen (bzw. generell volatiler Daten) haben.
Ich versteh nicht ganz, warum keine Datenbankabfrage möglich ist, die alle US-Orte mit fehlender FIPS ausgibtund anschließend diese Items aus einer Liste heraus mit den fehlenden FIPS befüllt werden können? --Septembermorgen (Diskussion) 16:18, 10. Jul. 2021 (CEST)
- Ok, Quelltextmonster war jetzt ein bischen polemisch, das könnte aber in langen Listen ohne Formatvorlage durchaus dazu kommen. Ich wäre aber dafür, dass „EWZ“ und die anderen Metadaten-Formatvorlagen (weil kürzer) die Funktionalität von „Einwohnerzahl Wikidata“ mit abdecken, beide Vorlagen („EWZ“ und „Einwohnerzahl Wikidata“) machen im Prinzip dasselbe, sie binden Einwohnerzahlen von extern ein, geben sie formatiert aus und wichtig: sie verkürzen den Quelltext. Die FIPS-Codes benötigst Du für den Upload auf Wikidata? Lassen sich die anschließend auch nutzen, um Wikidata lokal einzubinden. Das Problem mit Wikidata-Objekten ist, sie sind nicht immer eindeutig. Beispiel: Hat Guxhagen (mindestens) drei verschiedene Bedeutungen (Gemeinde, Ortsbezirk, Ort im geografischen Sinn), denen auch drei verschiedene Einwohnerzahlen zugeordnet werden können (je nach Kontext), die aber alle im selben Artikel abgehandelt werden. Primär ist die Gemeinde, der die Einwohnerzahl über den Gemeindeschlüssel (06634008) zugeordnet wird (die Zuordnung über das verbundene WD-. Wikiprojekt Metadaten funktioniert seit 12 Jahren reibungslos in jetzt ca. 100.000 Artikeln, also gibt es da kein Grund das primär durch eine andere Vorgehensweise zu ersetzen (Was aus grundsätzlichen Problemen, Stichwort CC-0 für Wikidata auch gar nicht möglich ist). Lasst uns daher mal zunächst auf die Wikidata-Einbindung hier und nachfolgend an den Stellen konzentrieren, bei denen es keine grundsätzlichen Probleme gibt und die derzeit keine zentrale Einbindung der Einwohnerzahlen (bzw. generell volatiler Daten) haben.
- Ergänzung: Ganz entscheidende Grundlage ist, dass die Wikidata-Items die FIPS-Codes der jeweiligen Orte aufweisen - darüber verknüpfe ich die Zensus-Daten mit den Wikidata-Items. Dies ist ein einmaliger Pflegeaufwand, anschließend können beliebige Zensus-Daten einfach nach WD geladen werden. Hier das Problem für Pennsylvania: Hier fehlen in über 900 Items die FIPS-Daten. Vorher macht es wenig Sinn, die Einwohnerzahlen hochzuladen. Die betroffenen Items findet man über diese Abfrage. @Septembermorgen, Carol.Christiansen: etc.: Jede Unterstützung hier ist herzlich willkommen, 900 Items manuell zu bearbeiten ist dann doch eine sehr stumpfe Aufgabe... Yellowcard (D.) 15:07, 10. Jul. 2021 (CEST)
- Genau, FIPS-Code benötige ich für die Zuordnung zwischen dem Ort gemäß Census Bureau und Wikidata-Item. Das dahinterliegende Problem beschreibst Du ja schon, es gibt auch in den USA gleichnamige Körperschaften, die aber etwas unterschiedliches meinen. Über den FIPS-Code erfolgt eine eindeutige Zuordnung. Deshalb ist das auch nicht automatisierbar, zumindest fällt mir nichts sinnvolles wenig fehlerbehaftetes ein.
- Die Zuordnung direkt aus einem Artikel heraus ist wohl nicht möglich, dafür bräuchte man eine Datenbankabfrage, das funktioniert auf dieser Ebene nicht (sondern nur über SPARQL). Um von einem Ort x in einem Artikel die Einwohnerzahl oder andere Infos abzufragen, muss man die Wikidata-ID wissen oder aber es handelt sich um das Item, das mit dem Artikel verknüpft ist.
- Den Punkt mit CC-0 verstehe ich nicht. Gruß Yellowcard (D.) 16:33, 10. Jul. 2021 (CEST)
- Sind das die aktuellsten FIPS-Code-Listen [1]? Die Liste für den FIPS-Code upload auf WD kann man dennoch generieren, auch wenn Ortsnamen doppelt vorkommen. Der Vorbereitungsaufwand ist etwas höher, bei weitem aber nicht so hoch, wie alle manuell in WD einzutragen. Die 900+ fehlenden sind alle in Pennsylvania? --Septembermorgen (Diskussion) 13:09, 11. Jul. 2021 (CEST)
- Die genannten 900 sind alle aus Pennsylvania, ich konnte aber insgesamt bei ca. 2500 Orten kein Wikidata-Item zuordnen. Ich habe die übrigen fehlenden ca. 1600 gerade analysiert und ein weiterer Schwerpunkt scheint Illinois zu sein, dort fehlt bei ca. 700 Orten die Zuordnung. Die übrigen sind auf den ersten Blick über alle Staaten verteilt und haben möglicherweise unterschiedliche Ursachen. Gerne könnte ich eine entsprechende Excel-Datei der betroffenen Orte bereitstellen. Wenn der derzeitige Schwung auf WD durch ist (dürfte morgen Abend spätestens so weit sein), wurden zu ca. 26.000 Orten die Daten Einwohner, Haushalte, Fläche und Wasserfläche eingetragen, basierend auf den Veröffentlichungen des Zensus 2010. Ebenfalls noch nicht hochgeladen sind die Daten zu Puerto Rico (hier muss ich noch prüfen, ob das FIPS-Code-System genauso funktioniert wie bei den kontinentalen Staaten). Die Zensus-Daten umfassen Einträge zu 29.500 Orten, die Erfolgsquote ist trotz fehlenden PA, PR und den 1600 Problemfällen also schon recht hoch. Gruß Yellowcard (D.) 20:54, 11. Jul. 2021 (CEST)
- Also wenn Du die weiteren fehlenden auch nach Staaten trenne kannst, wäre das hilfreich beim Listen erstellen in Hinblick auf nicht eindeutige Ortsnamen. Gruß --Septembermorgen (Diskussion) 12:45, 12. Jul. 2021 (CEST)
- @Septembermorgen: Eine vollständige Liste der Orte in den Zensus-Daten, die bei meinem Vorgehen keinem Wikidata-Item zugeordnet werden konnten, habe ich hier abgelegt: Portal:Vereinigte_Staaten/fehlende_FIPS. Pennsylvania und Puerto Rico habe ich dabei ausgenommen. Yellowcard (D.) 19:19, 13. Jul. 2021 (CEST)
- Okay, danke! Ich denke damit lässt sich arbeiten. --Septembermorgen (Diskussion) 21:44, 13. Jul. 2021 (CEST)
- Die Census-designated places sind in der FIPS-Code-Liste hier: [2] nicht dabei, der Rest ist aber ohne Probleme machbar. --Septembermorgen (Diskussion) 22:03, 13. Jul. 2021 (CEST)
- @Yellowcard:, hier ist die Liste für Pennsylvania: Benutzer:Septembermorgen/FIPS-Code-Liste Pennsylvania. Wenn die Query noch die Countys mit enthält, ließe sich die Anzahl eindeutigen Zuordnungen noch erhöhen. --Septembermorgen (Diskussion) 22:43, 16. Jul. 2021 (CEST)
- @Septembermorgen: Eine vollständige Liste der Orte in den Zensus-Daten, die bei meinem Vorgehen keinem Wikidata-Item zugeordnet werden konnten, habe ich hier abgelegt: Portal:Vereinigte_Staaten/fehlende_FIPS. Pennsylvania und Puerto Rico habe ich dabei ausgenommen. Yellowcard (D.) 19:19, 13. Jul. 2021 (CEST)
- Also wenn Du die weiteren fehlenden auch nach Staaten trenne kannst, wäre das hilfreich beim Listen erstellen in Hinblick auf nicht eindeutige Ortsnamen. Gruß --Septembermorgen (Diskussion) 12:45, 12. Jul. 2021 (CEST)
- Die genannten 900 sind alle aus Pennsylvania, ich konnte aber insgesamt bei ca. 2500 Orten kein Wikidata-Item zuordnen. Ich habe die übrigen fehlenden ca. 1600 gerade analysiert und ein weiterer Schwerpunkt scheint Illinois zu sein, dort fehlt bei ca. 700 Orten die Zuordnung. Die übrigen sind auf den ersten Blick über alle Staaten verteilt und haben möglicherweise unterschiedliche Ursachen. Gerne könnte ich eine entsprechende Excel-Datei der betroffenen Orte bereitstellen. Wenn der derzeitige Schwung auf WD durch ist (dürfte morgen Abend spätestens so weit sein), wurden zu ca. 26.000 Orten die Daten Einwohner, Haushalte, Fläche und Wasserfläche eingetragen, basierend auf den Veröffentlichungen des Zensus 2010. Ebenfalls noch nicht hochgeladen sind die Daten zu Puerto Rico (hier muss ich noch prüfen, ob das FIPS-Code-System genauso funktioniert wie bei den kontinentalen Staaten). Die Zensus-Daten umfassen Einträge zu 29.500 Orten, die Erfolgsquote ist trotz fehlenden PA, PR und den 1600 Problemfällen also schon recht hoch. Gruß Yellowcard (D.) 20:54, 11. Jul. 2021 (CEST)
- Sind das die aktuellsten FIPS-Code-Listen [1]? Die Liste für den FIPS-Code upload auf WD kann man dennoch generieren, auch wenn Ortsnamen doppelt vorkommen. Der Vorbereitungsaufwand ist etwas höher, bei weitem aber nicht so hoch, wie alle manuell in WD einzutragen. Die 900+ fehlenden sind alle in Pennsylvania? --Septembermorgen (Diskussion) 13:09, 11. Jul. 2021 (CEST)
Umsetzung von Aktualisierungen
BearbeitenHallo und frohes neues Jahr!
Ich habe leider absolut keinen Überblick darüber, welche Daten nun in welcher Form vorliegen. Ich würde gerne trotzdem nach Möglichkeit die nächste Zeit dazu nutzen, die Artikel zu aktualisieren. Daher frage ich mich nun:
- Liegen uns derzeit genug Daten zum Zensus 2020 vor, um sinnvoll mit Artikel-Aktualisierungen zu beginnen?
- Welche Arbeitsschritte müssen noch im Vorfeld der systematischen Aktualisierungen erledigt werden?
- Welche Daten sollen überhaupt zukünftig erfasst werden?
- Wo können diese Daten abgerufen werden?
- In welcher genauen Form soll auf die Quellen verwiesen werden?
Kann z. B. ganz konkret ein Demographie-Abschnitt wie in Fern Park so weitergeführt werden, oder sollte man daran inhaltliche Änderungen vornehmen? Ich fände es ganz gut, wenn wir einen Konsens darüber finden könnten, wie ein Demographie-Abschnitt vom Grundsatz her auszusehen hat. Regionale Besonderheiten können natürlich dann trotzdem zu Unterschieden führen. Ich würde mich über einen Austausch an dieser Stelle sehr freuen! LG Stefan 22:29, 4. Jan. 2022 (CET)
- Hallo Stefan, Dir auch ein frohes neues Jahr! Und berechtigte Fragen, die Du da stellst. Wir waren mit der Akutalisierung des Bestands auf Basis der Zensus-Daten 2010 schon ziemlich weit, und in dem Zusammenhang sind ja erhebliche wichtige Datenkorrekturen auf Wikidata passiert (d.h. vorrangig die Anpassung der FIPS-Daten, anhand derer man die Gazetteer-Files einbinden kann). Bei einer Handvoll Staaten hatte das noch nicht funktioniert, und da war ich im Juli 2021 irgendwie hängen geblieben (also vor allem motivations- und zeittechnisch).
- Ich nehme das aber mal wieder auf und habe ein paar Wartungskategorien erstellt, um einen besseren Überblick über den Ist-Zustand auf Wikidata zu erhalten. Die werden jetzt in den nächsten Stunden automatisch gefüllt.
- Zurück zu Deinen Fragen, ich denke, folgenes können wir realistisch tun:
- Zensusdaten von 2020 vollständig nach Wikidata hochladen, sodass wir dort saubere Statements mit aktuellen Daten haben (Zensusdaten in diesem Zusammenhang wären: Einwohnerzahl, Anzahl der Haushalte, Fläche, und relativer Anteil Wasserfläche).
- Diese Daten in die Infoboxen übernehmen (automatisch, die einzelnen Artikel müssten dafür nicht angefasst werden, wir müssten aber die Details abstimmen)
- Wir könnten ein Template schreiben, mit dem wir den Einleitungssatz standardisieren können und dank der Daten auf Wikidata auch zukünftig immer aktuell halten können - Zensus-Daten kommen zwar nur alle 10 Jahre, aber ich denke wir haben genug Artikel, die noch die Daten vom Zensus 2000 enthalten ...
- Weitere Daten (wie diese Statistik-Absätze, die sich in vielen Artikeln finden, wie auch in Deinem Beispiel Fern Park), können wir eher nicht automatisieren, zum einen weil sie nicht gut als importierbare Daten vorliegen und zum anderen, weil das keinen eindeutigen Konsens finden würde. (Ich persönlich bin auch kein großer Fan dieser Absätze, aber das ist nochmal ein anderes Thema.)
- Wäre super, wenn wir hier einen neuen Anlauf nehmen, den Artikelbestand mit den 2020er-Daten zu versorgen. Grüße, Yellowcard (D.) 23:35, 6. Jan. 2022 (CET)
- Vielen Dank Yellowcard für deine Antwort!
- Wikidata zu aktualisieren ist kein Problem. Aber ich verstehe gerade nicht, wie die Daten dann "automatisch" in die Infobox übernommen werden sollen? Wie funktioniert das genau? Wenn ich das richtig verstehe, dass wir den jeweiligen Artikel bzgl. Aktualisierung der Infobox und des Einleitungssatzes nicht manuell anrühren wollen, dann muss quasi ein Konzept ausgearbeitet werden, wie alle drei Vorgänge, also Aktualisierung von Wikidata, Aktualisierung der Infobox und Aktualisierung des Einleitungssatzes gleichzeitig erfolgen? Es bringt ja schließlich wenig, wenn die Infobox bereits aktualisiert, aber der Einleitungssatz noch veraltet ist. Wenig Sinn sehe ich auch darin, wenn man die Einleitung jetzt noch manuell ändert und dadurch noch die doppelte Arbeit hat, nur weil man sich noch nicht auf ein Template einigen konnte. Bevor man also irgendwas aktualisiert, müsste man sich wohl um das Template kümmern? Ich bin auf jeden Fall auch für ein solches Template, gerade aufgrund des ansonsten riesigen Wartungsaufwandes, wie von dir geschildert. LG Stefan 21:17, 7. Jan. 2022 (CET)
- Sorry, wenn ich dazwischen senfe, aber ich würde gerne ein wenig weiter folgen können wollen - was heißt hier "Einleitungssatz standardisieren"? Das jeder Ortschaftsartikel bezüglich den USA und zugehörigen Gebieten mit dem gleichen Satz anfängt? --G-41614 (Diskussion) 22:45, 7. Jan. 2022 (CET)
- Genau das sind die Überlegungen, ja. Welche Möglichkeiten wir haben, steht ja schon ausführlichst oben, daran hat sich im Prinzip bislang nichts geändert. Eine Entscheidung haben wir nicht getroffen. Es wäre möglich, ein Template zu verwenden, sodass die Einleitungssätze dieser Artikel identisch sind, ja. Oder aber man verwendet Platzhalter für die Einwohnerzahl, Fläche und Anzahl Haushalte, die man dann flexibel einsetzen kann.
- @Stefan: Die Daten nach Wikidata zu übertragen, ist halt der erste Schritt, der noch keine Auswirkungen auf den Artikelbestand hat. Die Infobox könnte man dann leicht aktualisieren (vollautomatisch), die Daten wären dann aber aktueller als in dem Fließtext, korrekt. Das wäre aber doch besser, als alles veraltet zu lassen. Da, wo die Daten als Fließtext im Artikel stehen, muss man natürlich manuell ran (oder allenfalls mit Bot-Unterstützung) - und genau dafür müssen wir mal zu einer Entscheidung kommen, wie wir das denn ausgestalten wollen. Wie wäre denn Deine Meinung dazu? Viele Grüße, Yellowcard (D.) 23:51, 7. Jan. 2022 (CET)
- Ok, alles verstanden soweit. Mein Vorschlag wäre, dass wir nun mit den Wikidata-Aktualisierungen beginnen, die IB-Aktualisierungen zu bereits aktualisierten Wikidata-Einträgen laufen lassen und parallel dazu überlegen, wie das Template aussehen soll. Das Thema Fließtext würde ich erst mal zurückstellen, zumal in den Texten ja normalerweise klar Bezug auf den Zensus 2010 genommen wird - es also keine Verwirrung geben kann.
- Welche Quellen sollen wir verwenden? Für Einwohnerzahl und Haushalte dient natürlich das Census Bureau, Beispiel Fern Park. Aber wo findet man Zahlen zur (Wasser-)Fläche? LG Stefan 16:11, 8. Jan. 2022 (CET)
- Fläche genau da, wo Du's verlinkt hast, steht rechts oben, aber Wasser würde mich auch interessieren. Nehme an, Folgendes sollte ich auf WD fragen, aber das schätze ich wie der Teufel das Weihwasser. Habe mal geschaut, wie das mit den Daten aussieht. Finde da einen Eintrag für z. B. eine EWZ, mit Fundstelle DBpedia. Sagt mir nichts, also nachgeschaut. OK, wenn also DBpedia Daten aus WP extrahiert, WD diese Daten auf DBpedia findet und angibt, und ich dann WD als Datenspeicher für WP benutze, dann fehlt mir da was, oder das ist ein prächtiger Zirkelnachweis: A sagt B sagt C sagt A sagt. Sorry, kann gerade überhaupt nicht folgen. Wer hilft wer? Nächster Aspekt: Vorlagen. Danke erstmal für die Antwort oben. Für Werte scheint mir das eine prima Idee zu sein, standardisierten Einleitungssätzen stehe ich derzeit skeptisch gegenüber, von diesen veralteten Statistik-Abschnitten habe ich schon mal locker-flockig welche gelöscht, da völlig veraltet, und wer's drinhaben möchte, soll das auch pflegen - soweit mein Senf. Man kann meinen Standardeinleitungssatz vermutlich umständlich finden, aber meine Einleitungen um EWZ zu erweitern, das mache ich glaube ich mal. Vorher wüsste ich aber gerne, ob ich auf WD als "Fundstelle" auch irgendwie census.gov angeben kann, denn sonst scheint mir das erstmal witzlos - ich baue keine Vorlage auf veraltete Datensätze in meine neuen Ortsartikel ein. Gruß, --G-41614 (Diskussion) 20:42, 8. Jan. 2022 (CET)
- @Stefan: Japp, was das geplante Vorgehen angeht, stimme ich Dir voll zu. Die von euch beiden angesprochenen Punkte zu Wikidata beantworte ich in dem Unterabschnitt eins drunter, da sich einiges überschneidet. Yellowcard (D.) 22:28, 8. Jan. 2022 (CET)
- Fläche genau da, wo Du's verlinkt hast, steht rechts oben, aber Wasser würde mich auch interessieren. Nehme an, Folgendes sollte ich auf WD fragen, aber das schätze ich wie der Teufel das Weihwasser. Habe mal geschaut, wie das mit den Daten aussieht. Finde da einen Eintrag für z. B. eine EWZ, mit Fundstelle DBpedia. Sagt mir nichts, also nachgeschaut. OK, wenn also DBpedia Daten aus WP extrahiert, WD diese Daten auf DBpedia findet und angibt, und ich dann WD als Datenspeicher für WP benutze, dann fehlt mir da was, oder das ist ein prächtiger Zirkelnachweis: A sagt B sagt C sagt A sagt. Sorry, kann gerade überhaupt nicht folgen. Wer hilft wer? Nächster Aspekt: Vorlagen. Danke erstmal für die Antwort oben. Für Werte scheint mir das eine prima Idee zu sein, standardisierten Einleitungssätzen stehe ich derzeit skeptisch gegenüber, von diesen veralteten Statistik-Abschnitten habe ich schon mal locker-flockig welche gelöscht, da völlig veraltet, und wer's drinhaben möchte, soll das auch pflegen - soweit mein Senf. Man kann meinen Standardeinleitungssatz vermutlich umständlich finden, aber meine Einleitungen um EWZ zu erweitern, das mache ich glaube ich mal. Vorher wüsste ich aber gerne, ob ich auf WD als "Fundstelle" auch irgendwie census.gov angeben kann, denn sonst scheint mir das erstmal witzlos - ich baue keine Vorlage auf veraltete Datensätze in meine neuen Ortsartikel ein. Gruß, --G-41614 (Diskussion) 20:42, 8. Jan. 2022 (CET)
- Sorry, wenn ich dazwischen senfe, aber ich würde gerne ein wenig weiter folgen können wollen - was heißt hier "Einleitungssatz standardisieren"? Das jeder Ortschaftsartikel bezüglich den USA und zugehörigen Gebieten mit dem gleichen Satz anfängt? --G-41614 (Diskussion) 22:45, 7. Jan. 2022 (CET)
Wikidata
BearbeitenIst das in Ordnung so? Müssen "Bestimmungsmethode" und "Zeitpunkt/Stand" immer mit angegeben werden? Soll man auch die Daten vorheriger Volkszählungen noch stehen lassen oder sind diese alten Daten zum Zweck von Wikidata überflüssig? Jedes Mal einen neuen Wert hinzuzufügen dauert halt länger, als einen alten zu aktualisieren. LG Stefan 16:40, 8. Jan. 2022 (CET)
- Edit: Man kann unter "Einwohnerzahl" auch einen Qualifikator "Anzahl der Haushalte" anlegen. Ist das für die IBs so dann auch umsetzbar oder soll man dazu das Fenster "Anzahl der Haushalte" weiter unten nutzen? Ersteres wäre einfacher. LG Stefan 16:44, 8. Jan. 2022 (CET)
- @Stefan, G-41614: Hier gibt es glaube ich gerade ein paar Missverständnisse. Zum Thema "Daten auf Wikidata" steht oben in diesem Abschnitt sehr viel, aber zugegeben zwischen den ganzen Überlegungen und daher schwer verständlich. Ich versuche das einmal in Kürze zusammenzusammen.
- Das US Census Bureau veröffentlicht jedes Jahr sogenannte "Gazetteer Files". In diesen steht maschinenlesbar für jeden Ort, jeden CDP, sowie Counties, Bundesstaaten etc. die folgenden Daten: Einwohnerzahl, Anzahl der Haushalte, Landfläche sowie Wasserfläche. (In Zensus-Jahren entsprechen die Angaben in den Gazetteer-Files den Zensus-Ergebnissen, in den neun darauffolgenden Jahren sind es Schätzungen und Fortschreibungen.) Diese Daten lassen sich somit sehr bequem in großen Mengen und sauberen Quellenangaben nach Wikidata übertragen. Dies manuell zu erledigen, macht definitiv keinen Sinn aufgrund der riesigen Datenmenge.
- Voraussetzung für diesen automatischen Upload ist es, dass man irgendwie eine Verbindung der Daten aus den Gazetteer Files zu den Wikidata-Einträgen hinbekommt. Die Namen der Orte eignen sich aufgrund der vielen Dopplungen für diese Zuordnung nicht. Das lösen wir daher stattdessen über den FIPS-Code, der sich sowohl in den Gazetteer Files als auch auf Wikidata findet. Es ist also entscheidend, dass die Wikidata-Items zu den Orten den FIPS-Code enthalten.
- Und genau das ist der Punkt, an dem wir jetzt am besten gemeinsam arbeiten, siehe Abschnitt #Unterstützung_benötigt: Die fehlenden FIPS-Codes nachtragen. Das ist eine manuelle Arbeit, die zum Teil recht nervig ist, aber es ist halt eine einmalige Arbeit für die Zukunft, denn dieser manuelle Edit ermöglicht, dass für den jeweiligen Ort zukünftig die Zensus-Daten vollautomatisch hochgeladen werden können (und wenn wir wollen zusätzlich auch die jährlichen Schätzungen). Hier hatte eine IP bereits grandiose Arbeit geleistet und die Anzahl der fehlenden FIPS-Codes auf ungefähr 100 gedrückt, inzwischen sind durch einige neue Items und auch Körperschaftsänderungen wieder mehrere hundert dazugekommen - das wird wohl bei jedem Zensus alle zehn Jahre der Fall sein, dass es solche Änderungen gibt.
- @G-41614: Die Situation zu "DBPedia" oder auch "importiert aus der xx-sprachigen Wikipedia" siehst Du genau richtig, diese Nachweise sind natürlich Unsinn. Genau das wollen wir mit dieser Aktion ja beheben, und sind da eigentlich inzwischen für die 2010er-Daten recht weit. Daher würde mich mal interessieren, auf welchen Ort konkret Du Dich beziehst, denn die Daten zum Zensus 2010 sollten mit Ausnahme Pennsylvania und Puerto Rico eigentlich relativ vollständig und gut belegt sein. Damit meine ich alle Places/Cities/Townships sowie Census-designated places. Viele Grüße, Yellowcard (D.) 22:28, 8. Jan. 2022 (CET)
- Ok - Eure Bitte um Unterstützung löst bei mir erstmal Grauen aus, das muß ich mir erst näher anschauen. Was das zweite betrifft, entschuldige bitte, das ich das so umständlich mache: ich bin eben mal kurz die erste Spalte meiner braglist Benutzer:G-41614#Ort hier durchgegangen. Ashland: EWZ 2010 ohne Fundstelle, Bristol aktualisiert 2020 mit census link (danke für die Vorlage :). Der Rest von Bath bis Clarksville EWZ 2010 mit Fundstelle DBpedia. Ferner noch gefunden Andover ganz ohne EWZ. Alle Orte NH. Fips teils de:wp, teils census ... Könnte man fast annehmen, das da einfach das Entfernen der Fundstelle vergessen wurde? Wenn mir jemand sagt, ob da jemand an einem schicken Wasweißich/gehtautomatisch arbeitet oder nicht, könnte ich das für NH händisch entfernen. Falls das nicht gegen irgend etwas verstößt ... ist WD, kennich nich. Gruß, --G-41614 (Diskussion) 23:40, 8. Jan. 2022 (CET)
- @G-41614: So, habe mir mal die Situation um Ashland angeschaut, und das ist eher ein Zensus-Problem: Es gibt ein CDP namens Ashland, der wohl nur den Hauptort der Gemeinde umfasst, nicht aber die weiteren Siedlungen, die ebenfalls zur Town of Ashland gehören. Nur für den CDP enthalten die Zensus-Daten Informationen, nicht für Ashland als Ganzes. Die en.wp unterscheidet hier sogar mittels zwei Artikeln: Ashland und Ashland. Das zum CDP zugehörige Item Ashland (CDP, New Hampshire) (Q38249834) enthielt bis gerade keine FIPS-Nummer und ist daher bei den Zensus-Daten für 2010 leer ausgegangen - für den Durchlauf mit den 2020er-Daten ist das ja jetzt behoben. Das sind leider die Fallstricke des US Census Bureau, dem man nur mit manueller Kleinstarbeit beikommen kann... Yellowcard (D.) 17:27, 12. Jan. 2022 (CET)
- Iz confuzd. Oder taucht das nur einfach nicht in den Daten auf, die Du zur IB-Aktualisierung benutzt? --G-41614 (Diskussion) 19:54, 13. Jan. 2022 (CET)
- Richtig, das taucht nicht in den Daten auf. Den Grund habe ich erst aufgrund Deines Hinweises gefunden (siehe auch Ende dieses Unterabschnitts): In einigen Staaten (mutmaßlich New England) gibt es noch eine Zwischenebene zwischen den Counties und den Places: Sub-County Entities. Bei anderen Staaten sind das nur die CCDs, die uns nicht interessieren - aber bei New Hampshire, Maine und Co. sind dort auch die Einwohnerzahlen zu den Towns versteckt. Daher sind diese Towns bei den 2010er-Zahlen leer ausgegangen, bei dem 2020er-Lauf, den ich nach und nach starte, habe ich diese Daten dann mit dabei. :) Grüße --Yellowcard (D.) 20:28, 13. Jan. 2022 (CET)
- Iz confuzd. Oder taucht das nur einfach nicht in den Daten auf, die Du zur IB-Aktualisierung benutzt? --G-41614 (Diskussion) 19:54, 13. Jan. 2022 (CET)
- @G-41614: So, habe mir mal die Situation um Ashland angeschaut, und das ist eher ein Zensus-Problem: Es gibt ein CDP namens Ashland, der wohl nur den Hauptort der Gemeinde umfasst, nicht aber die weiteren Siedlungen, die ebenfalls zur Town of Ashland gehören. Nur für den CDP enthalten die Zensus-Daten Informationen, nicht für Ashland als Ganzes. Die en.wp unterscheidet hier sogar mittels zwei Artikeln: Ashland und Ashland. Das zum CDP zugehörige Item Ashland (CDP, New Hampshire) (Q38249834) enthielt bis gerade keine FIPS-Nummer und ist daher bei den Zensus-Daten für 2010 leer ausgegangen - für den Durchlauf mit den 2020er-Daten ist das ja jetzt behoben. Das sind leider die Fallstricke des US Census Bureau, dem man nur mit manueller Kleinstarbeit beikommen kann... Yellowcard (D.) 17:27, 12. Jan. 2022 (CET)
- Ok - Eure Bitte um Unterstützung löst bei mir erstmal Grauen aus, das muß ich mir erst näher anschauen. Was das zweite betrifft, entschuldige bitte, das ich das so umständlich mache: ich bin eben mal kurz die erste Spalte meiner braglist Benutzer:G-41614#Ort hier durchgegangen. Ashland: EWZ 2010 ohne Fundstelle, Bristol aktualisiert 2020 mit census link (danke für die Vorlage :). Der Rest von Bath bis Clarksville EWZ 2010 mit Fundstelle DBpedia. Ferner noch gefunden Andover ganz ohne EWZ. Alle Orte NH. Fips teils de:wp, teils census ... Könnte man fast annehmen, das da einfach das Entfernen der Fundstelle vergessen wurde? Wenn mir jemand sagt, ob da jemand an einem schicken Wasweißich/gehtautomatisch arbeitet oder nicht, könnte ich das für NH händisch entfernen. Falls das nicht gegen irgend etwas verstößt ... ist WD, kennich nich. Gruß, --G-41614 (Diskussion) 23:40, 8. Jan. 2022 (CET)
Danke @Yellowcard, dann werde ich mich mal an die Arbeit machen. Welche Quelle für die FIPS-Codes empfiehlst du? Ich habe bisher nur das hier gefunden, was allerdings recht umständlich ist, da man immer erst den State auswählen muss - außerdem werden viele (kleine) Orte gar nicht gelistet. Die EN-WP hilft bei sehr kleinen Orten leider auch nicht weiter. Beispiel: en:Adelphi, Texas. LG Stefan 11:44, 10. Jan. 2022 (CET)
- Stefan: [3] hier ist eine Liste (1,6 MB xlsx). Geht aber nur bis auf MCD-Level, darunter weiß ich auch nicht. Gruß, --G-41614 (Diskussion) 11:58, 10. Jan. 2022 (CET)
- Mein erster Eindruck ist, dass FIPS-Codes immer nur dann nicht auffindbar sind, wenn es sich um keine vom Census Bureau definierte Siedlung handelt (also kein CDP) und daher statistisch gar nicht erfasst wird. Kann man diese Siedlungen nicht von vornherein ausblenden? LG Stefan 12:03, 10. Jan. 2022 (CET)
- Vllt. eine ganz blöde Frage: ist das nun 10-4 oder 55-3? Habe das mal hier versucht, aber ehe ich weitermache sollte das von jemandem kontrolliert werden der im Gegensatz zu mir sicher weiß, was er/sie tut. Den Code habe ich von hier. Gruß, --G-41614 (Diskussion) 12:37, 10. Jan. 2022 (CET)
- 55-3 ist richtig. So wie ich das verstanden habe, ist deine Eintragung korrekt. Danke für die Quelle bzgl. Pennsylvania. Könntest du die Staaten-Übersicht auch verlinken? LG Stefan 14:53, 10. Jan. 2022 (CET)
- Merke gerade, wenn es eine GNIS-ID gibt, kann man den FIPS von dort holen. Wenn der Census das kennt, natürlich. Was macht man mit Adelphi? --G-41614 (Diskussion) 14:37, 10. Jan. 2022 (CET)
- Gut, dann stimmt das ja so weit, danke. Staaten - meinst Du das hier? Ich habe hier drauf geschaut. Nächste Frage - Bspw. Glover, VT, oder auch Irasburg, VT. Es gibt verschiedene WD-Einträge, die GNIS-Codes werden zweimal benutzt, der fehlende FIPs für den CDP steht schon im anderen Eintrag, der sich zwar nicht CDP nennt, aber als CDP bezeichnet ist. Geht so wohl nicht, aber zum Korrigieren fehlen mir das Wissen um WD-Prozeduren. Ehrlich gesagt bin ich auch nicht wirklich daran interessiert, mir das anzueignen - WP alleine reicht mir schon. Gruß, --G-41614 (Diskussion) 15:24, 10. Jan. 2022 (CET)
- Danke dir, damit kann ich gut arbeiten. LG Stefan 15:35, 10. Jan. 2022 (CET)
- Gut, dann stimmt das ja so weit, danke. Staaten - meinst Du das hier? Ich habe hier drauf geschaut. Nächste Frage - Bspw. Glover, VT, oder auch Irasburg, VT. Es gibt verschiedene WD-Einträge, die GNIS-Codes werden zweimal benutzt, der fehlende FIPs für den CDP steht schon im anderen Eintrag, der sich zwar nicht CDP nennt, aber als CDP bezeichnet ist. Geht so wohl nicht, aber zum Korrigieren fehlen mir das Wissen um WD-Prozeduren. Ehrlich gesagt bin ich auch nicht wirklich daran interessiert, mir das anzueignen - WP alleine reicht mir schon. Gruß, --G-41614 (Diskussion) 15:24, 10. Jan. 2022 (CET)
- Merke gerade, wenn es eine GNIS-ID gibt, kann man den FIPS von dort holen. Wenn der Census das kennt, natürlich. Was macht man mit Adelphi? --G-41614 (Diskussion) 14:37, 10. Jan. 2022 (CET)
- 55-3 ist richtig. So wie ich das verstanden habe, ist deine Eintragung korrekt. Danke für die Quelle bzgl. Pennsylvania. Könntest du die Staaten-Übersicht auch verlinken? LG Stefan 14:53, 10. Jan. 2022 (CET)
- @Stefan: zu „Mein erster Eindruck ist, dass FIPS-Codes immer nur dann nicht auffindbar sind, wenn es sich um keine vom Census Bureau definierte Siedlung handelt (also kein CDP) und daher statistisch gar nicht erfasst wird. Kann man diese Siedlungen nicht von vornherein ausblenden?“: Mit der oben verlinkten Abfrage sollten solche nicht definierten Siedlungen eigentlich herausfallen. Es kann sein, dass dann eine andere Aussage auf Wikidata falsch ist. Hast Du mal ein konkretes Beispiel? Danke für eure Hilfe euch beiden! Gruß Yellowcard (D.) 08:52, 11. Jan. 2022 (CET)
- Zum Beispiel Cascade Park West, ein Wohngebiet innerhalb von Vancouver (Washington). Gleiches Problem mit Stevens Crossing und mit Adelphi. Tauchen alle in der Abfrage auf, obwohl kein FIPS-Code vorhanden und auch nicht als CDP oder sonstwas geführt. Oder habe ich nur einen Denkfehler?? LG Stefan 16:27, 12. Jan. 2022 (CET)
- Edit: Yellowcard - kannst du mal nachschauen, ob die Einstellungen in der Abfrage überhaupt korrekt sind? Kein einziges geographisches Objekt der ersten 10 Einträge von hier lassen sich wiederum hier auffinden. Oder ist nur die FIPS-Datenbank veraltet? Dann benötige ich dringend eine neue Quelle zum Abrufen. LG Stefan 16:37, 12. Jan. 2022 (CET)
- @Stefan: Die Abfrage bezieht sich auf die Aussagen über ist ein(e) (P31). Zum Beispiel Adelphi (Q4682057): Das scheint irgendeine undefinierte Community zu sein, im Wikidata-Item ist aber ist ein(e) (P31) → Ort mit Status "City" in den Vereinigten Staaten (Q1093829) als Statement angelegt. Dadurch fällt das Item in die Abfrage, weil natürlich kein FIPS-Code da ist. Das Problem hier ist also ein unsauberes Wikidata-Item, nicht die Abfrage.
- Zwei Lösungsmöglichkeiten: Wikidata-Item anpassen (mehr Aufwand) oder dieses Item ignorieren. Da es bei letzterer Alternative aber immer in den Abfrageergebnissen hängen bleibt, macht es die Ergebnisliste natürlich schwierig abzuarbeiten. Hm.
Dem Hinweis von G-41614 muss ich aber noch nachgehen, denn die Tatsache, dass Ashland (Q2310716) nicht mit Census-Daten versorgt wurde, ist tatsächlich auffällig. Hier könnte sein, dass die Abfrage echt noch ein Problem hat. Dies würde dann aber eher umgekehrt dazu führen, dass mehr Artikel in der Abfrage landen als weniger.Viele Grüße, Yellowcard (D.) 17:00, 12. Jan. 2022 (CET)- Never mind, das Problem mit Hampshire ist ganz was anderes, hier hat die Datenpflege im Prinzip alles richtig gemacht. Yellowcard (D.) 17:10, 12. Jan. 2022 (CET)
- Edit: Yellowcard - kannst du mal nachschauen, ob die Einstellungen in der Abfrage überhaupt korrekt sind? Kein einziges geographisches Objekt der ersten 10 Einträge von hier lassen sich wiederum hier auffinden. Oder ist nur die FIPS-Datenbank veraltet? Dann benötige ich dringend eine neue Quelle zum Abrufen. LG Stefan 16:37, 12. Jan. 2022 (CET)
- Zum Beispiel Cascade Park West, ein Wohngebiet innerhalb von Vancouver (Washington). Gleiches Problem mit Stevens Crossing und mit Adelphi. Tauchen alle in der Abfrage auf, obwohl kein FIPS-Code vorhanden und auch nicht als CDP oder sonstwas geführt. Oder habe ich nur einen Denkfehler?? LG Stefan 16:27, 12. Jan. 2022 (CET)
- Vllt. eine ganz blöde Frage: ist das nun 10-4 oder 55-3? Habe das mal hier versucht, aber ehe ich weitermache sollte das von jemandem kontrolliert werden der im Gegensatz zu mir sicher weiß, was er/sie tut. Den Code habe ich von hier. Gruß, --G-41614 (Diskussion) 12:37, 10. Jan. 2022 (CET)
- Mein erster Eindruck ist, dass FIPS-Codes immer nur dann nicht auffindbar sind, wenn es sich um keine vom Census Bureau definierte Siedlung handelt (also kein CDP) und daher statistisch gar nicht erfasst wird. Kann man diese Siedlungen nicht von vornherein ausblenden? LG Stefan 12:03, 10. Jan. 2022 (CET)
Liste mit weiterem Klärungsbedarf
BearbeitenAls ich im Moment bearbeiten kann, wenn Ihr gestattet.
- Damascus, AL ? GNIS PopPl ohne FIPS WD
- Bsp: Waterford CT: Q106522187 Waterford (CDP), Q755974 Central Waterford, Q9095622 Waterford, alle drei mit gleicher GNIS-ID. Waterford (CDP) hat kein FIPS, nehme an, das könnte man mit Waterford zusammenlegen, ist jünger. Central Waterford kennt die GNIS-Suche nicht, dafür hat das WD-Objekt eine FIPS von der ich nicht weiß, wo sie herkommt oder wozu sie gehört. Mit milde irritierten Grüssen, --G-41614 (Diskussion) 15:15, 11. Jan. 2022 (CET)
- Hidden Lakes, OH WD GNIS kennt zwei CDP diesen Namens, gleiches County, unterschiedliche ID und FIPS. An bezogenem en:wp-Artikel zur Auswahl orientiert. --G-41614 (Diskussion) 15:27, 11. Jan. 2022 (CET)
- Gemäß Census-Daten hast Du den richtigen FIPS-Code für Hidden Lakes erwischt. --Yellowcard (D.) 17:47, 12. Jan. 2022 (CET)
- Madrid (Maine), Madrid (Q6728616): War mal Town, jetzt Teil eines anderen UT; GNIS für PopPl oder Town vorhanden. Daten FIPS/GNIS de:wp und WD im Moment für PopPl. Behält eine aufgelöste Town ihre IDs? Dann sollte das angepasst werden. En:WP benutzt die Town-IDs. --G-41614 (Diskussion) 20:26, 14. Jan. 2022 (CET)
- Waterford (Q106522187) hat inzwischen einen FIPS-Code, und zwar auch den richtigen. Bei Central Waterford (Q755974) teile ich Deine Irritationen - habe sowohl GNIS als auch FIPS entfernt, halte ich beides für falsch. Waterford (Q9095622) scheint eine Siedlung, die sich vom CDP unterscheidet, zu beschreiben - habe da auch mal bzgl. FIPS und GNIS aufgeräumt. Solche Fälle sind natürlich relativ tricky und das Aufräumen von so einem Fall kostet direkt mal ein paar Minuten... --Yellowcard (D.) 17:45, 12. Jan. 2022 (CET)
- Auf die Minuten soll es mir nicht ankommen, ich habe eher Probleme die Pfoten davon zu lassen, wenn ich so etwas vor mir habe. Ein paar Einträge aus der Liste habe ihc nach bestem Wissen und Gewissen abgearbeitet, obwohl da was fehlte, zum Bsp. eine genaue Angabe, welchem Gebiet das denn jetzt gilt - CDP, PopPl, etc. Für das, was noch da ist, fehlt mir einfach die WD-Erfahrung. Yellowcard: Wenn Du möchtest lass mich wissen, wo Deiner Meinung nach bei NH Probleme bestehen. Simples Abarbeiten kriege ich hin. :) Gruß, --G-41614 (Diskussion) 17:56, 12. Jan. 2022 (CET)
- New Hampshire scheint noch sieben gemäß WD "zensus-relevante" Entitäten zu haben, bei denen noch kein FIPS-Code enthalten ist: SPARQL-Abfrage. Macht einen sehr guten Eindruck, vielen Dank! --Yellowcard (D.) 00:18, 13. Jan. 2022 (CET)
- Jetzt nicht mehr. --G-41614 (Diskussion) 00:46, 13. Jan. 2022 (CET)
- Top, vielen Dank! Wie wäre es, wenn wir gemeinsam Staat für Staat durchgehen und dann parallel die Einwohnerzahlen hochladen? --Yellowcard (D.) 08:11, 13. Jan. 2022 (CET)
- Im Prinzip nicht nein, nur ist NH bei mir im Fokus, da bin ich erheblich motivierter. Ansonsten, such dir einen Staat aus, stell mir eine Abfrage hier rein, und ich gehe beizeiten drüber. Das Du die Census-Tabellen als Datenquelle zum Upload der EWZ benutzen willst oder etwas in der Art glaube ich mittlerweile verstanden zu haben, aber von der praktischen Umsetzung habe ich nicht die geringste Peilung. Mir ist aber noch etwas aufgefallen. In der Kategorie mit den fehlerhaften Fipsen sind jetzt noch gut vierzig Einträge. Beim Abarbeiten habe ich festgestellt das manche IB GNIS-ID ausgibt, ohne dass das im Quelltext auftaucht. Solange das funzt mir egal, aber teilweise wurden mehrere GNIS ausgegeben, die nicht zu dem Eintrag passten, den mir die GNIS-Suche ausspuckte. Da müsste man ggf. nacharbeiten, denn das habe ich bisher als fehlerhaft angesehen und geändert. Bsp. San Andreas (Kalifornien), nicht geändert. Andere Angelegenheit, auf WD: Marlow NH ist laut Ausfertigung ein Objekt für die Town, GNIS-ID gehörte jedoch zum PopPl. Ich kann nicht garantieren, das mir jeder Fall, in dem das so war, aufgefallen ist, und die FIPS zu CDP und PP scheinen mir in der Regel zwar die selben zu sein, aber nicht die von City und PP. Da kann es noch Fehler geben. Was ich mangels Übung und Kenntnissen nicht geprüft habe ist, ob da ein Objekt zwei GNIS haben könnte, einmal als CDP, einmal als PopPl, und dementsprechend auch solche Fälle nicht ergänzt. Aber das scheint mir ein WD-Problem zu sein, das hier erstmal weniger wichtig ist. Noch eine ganz allgemeine Portalfrage zu einem Ort: Alder Gulch kann imho auf eine IB-Ortschaft verzichten. Das war in dem Sinne nie ein Ort. Als Gründungsdatum in der IB steht der Tag, an dem da einer Gold gefunden hat. Ich finde das zu wenig. Gruß soweit, --G-41614 (Diskussion) 10:58, 13. Jan. 2022 (CET)
- Meinst Du diese Kategorie: Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/FIPS fehlt auf Wikidata? Hast Du mal ein konkretes Beispiel?
- Hinsichtlich praktischem Nutzen: Man kann die Infobox kurzfristig so anpassen, dass sie automatisch die Einwohnerzahl von Wikidata anzeigt, sofern diese aus dem Jahr 2020 kommt (d.h. aktuellste Zensus-basierte Einwohnerzahl). Somit wären zumindest die Infoboxen aktualisiert, ohne dass man die Artikel editieren muss.
- Dasselbe gilt für {{US Census Population}}, hier könnte man die aktuellen Zensus-Daten ebenfalls automatisch aufnehmen, ohne die einzelnen Artikel anfassen zu müssen. Bei dieser Vorlage fehlen fast ausnahmslos die Daten für 2020, teilweise sogar noch für 2010. Man spart hier also einfach jede Menge manuelle Arbeit, und zwar dauerhaft.
- Die Diskussion, wie wir mit Angaben im Fließtext umgehen, ist ja noch offen. Hier könnte man Vorlagen wie {{Einwohnerzahl Wikidata}} verwenden, dasselbe für die Fläche oder Anzahl der Haushalte. Wenn man solche Vorlagen als Platzhalter im Fließtext hat, bleibt der Artikel halt dauerhaft aktuell, ohne dass niemand den Fließtext regelmäßig aktualisieren muss. --Yellowcard (D.) 11:27, 13. Jan. 2022 (CET)
- Im Prinzip nicht nein, nur ist NH bei mir im Fokus, da bin ich erheblich motivierter. Ansonsten, such dir einen Staat aus, stell mir eine Abfrage hier rein, und ich gehe beizeiten drüber. Das Du die Census-Tabellen als Datenquelle zum Upload der EWZ benutzen willst oder etwas in der Art glaube ich mittlerweile verstanden zu haben, aber von der praktischen Umsetzung habe ich nicht die geringste Peilung. Mir ist aber noch etwas aufgefallen. In der Kategorie mit den fehlerhaften Fipsen sind jetzt noch gut vierzig Einträge. Beim Abarbeiten habe ich festgestellt das manche IB GNIS-ID ausgibt, ohne dass das im Quelltext auftaucht. Solange das funzt mir egal, aber teilweise wurden mehrere GNIS ausgegeben, die nicht zu dem Eintrag passten, den mir die GNIS-Suche ausspuckte. Da müsste man ggf. nacharbeiten, denn das habe ich bisher als fehlerhaft angesehen und geändert. Bsp. San Andreas (Kalifornien), nicht geändert. Andere Angelegenheit, auf WD: Marlow NH ist laut Ausfertigung ein Objekt für die Town, GNIS-ID gehörte jedoch zum PopPl. Ich kann nicht garantieren, das mir jeder Fall, in dem das so war, aufgefallen ist, und die FIPS zu CDP und PP scheinen mir in der Regel zwar die selben zu sein, aber nicht die von City und PP. Da kann es noch Fehler geben. Was ich mangels Übung und Kenntnissen nicht geprüft habe ist, ob da ein Objekt zwei GNIS haben könnte, einmal als CDP, einmal als PopPl, und dementsprechend auch solche Fälle nicht ergänzt. Aber das scheint mir ein WD-Problem zu sein, das hier erstmal weniger wichtig ist. Noch eine ganz allgemeine Portalfrage zu einem Ort: Alder Gulch kann imho auf eine IB-Ortschaft verzichten. Das war in dem Sinne nie ein Ort. Als Gründungsdatum in der IB steht der Tag, an dem da einer Gold gefunden hat. Ich finde das zu wenig. Gruß soweit, --G-41614 (Diskussion) 10:58, 13. Jan. 2022 (CET)
- Top, vielen Dank! Wie wäre es, wenn wir gemeinsam Staat für Staat durchgehen und dann parallel die Einwohnerzahlen hochladen? --Yellowcard (D.) 08:11, 13. Jan. 2022 (CET)
- Jetzt nicht mehr. --G-41614 (Diskussion) 00:46, 13. Jan. 2022 (CET)
- New Hampshire scheint noch sieben gemäß WD "zensus-relevante" Entitäten zu haben, bei denen noch kein FIPS-Code enthalten ist: SPARQL-Abfrage. Macht einen sehr guten Eindruck, vielen Dank! --Yellowcard (D.) 00:18, 13. Jan. 2022 (CET)
- Auf die Minuten soll es mir nicht ankommen, ich habe eher Probleme die Pfoten davon zu lassen, wenn ich so etwas vor mir habe. Ein paar Einträge aus der Liste habe ihc nach bestem Wissen und Gewissen abgearbeitet, obwohl da was fehlte, zum Bsp. eine genaue Angabe, welchem Gebiet das denn jetzt gilt - CDP, PopPl, etc. Für das, was noch da ist, fehlt mir einfach die WD-Erfahrung. Yellowcard: Wenn Du möchtest lass mich wissen, wo Deiner Meinung nach bei NH Probleme bestehen. Simples Abarbeiten kriege ich hin. :) Gruß, --G-41614 (Diskussion) 17:56, 12. Jan. 2022 (CET)
- Nee, sorry, bin auf WD und WP unterwegs. Ich teile das mal ein wenig auf:
- Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/FIPS in falschem Format, Beispiel San Andreas (Kalifornien) - zwei unterschiedliche GNIS-ID in der IB, zweimal die eine, einmal die andere - ? Nehme an, da ist irgendwie WD eingebunden, aber davon habe ich keinen blassen Schimmer.
- praktischer Nutzen: Sorry, kleines Missverständnis: Umsetzung, nicht Nutzen. Der Nutzen ist mir klar, die Ansicht teile ich. Nur die Umsetzung kann ich nicht, auch da fehlt mir jede Kenntnis.
- Vorlage|US Census Population: Ach das Ding :) Im Prinzip sicher eine gute Idee. Nur brate ich mir da die Extrawurst das Ding nicht zu mögen weil in "meinem Revier" (NH, falls das irgendwie untergegangen sein sollte:) ältere Bevölkerungszahlen vorliegen. Insofern ist das in dieser Form für eine vollständige Darstellung der EWZ im Nordosten der USA ungeeignet. Kann ja sein dass sich das problemlos anpassen ließe, aber wie gesagt - bei mir null Peilung. Verstehe auch nicht, was das mit fehlenden Daten für 2020, teils 2010 zu tun hat - Einbindung nur in Ausführung bis 2000?
- Einleitungen: Nicht was mich betrifft, da ist die Diskussion erledigt. Zumindest solange das über flexibel einsetzbare Vorlagen für die einzelnen Informationen läuft und nicht über einen standardisierten Einleitungssatz, der dann je nach beschriebenem Gebiet angepasst werden müsste.
- Null Peilung die x.: Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/FIPS fehlt auf Wikidata zeigt mir gerade 188 Einträge, die SPARQL oben war bei meinem letzten Besuch auf 13x runter. ? Sonst könnte ich die auch einfach durcharbeiten, nur wird das eine Weile dauern ...
- Für mich auch drollig: Livermore (New Hampshire). Bekomme über die GNIS-Suche zwei Ausgaben, einmal Town of L., einmal PopPl., jeweils eigene GNIS/FIPS. Town in Grafton County, PopPl in Carroll County. Ist die gleiche Einheit. Könnte natürlich daran liegen, das L. keine Town ist, sondern eine Township und vom Nachbarort aus verwaltet wird, der in Carroll County liegt. Habe mal angenommen, das die EWZ eher über die PopPl-FIPS läuft als über die Town-FIPS.
- Gruß, --G-41614 (Diskussion) 14:08, 13. Jan. 2022 (CET)
- @G-41614: Danke nochmals für die ganze Hilfe. Ich schaue mal dass ich ein paar Punkte spontan beantworte:
- Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/FIPS in falschem Format und auch Kategorie:Wikipedia:Qualitätssicherung Vereinigte Staaten:Infobox/FIPS fehlt auf Wikidata sind jetzt leer, ich nehme an hier wurde fleißig dran weiter gearbeitet, sodass die Kategorie jetzt leer ist - klasse! Damit dürften sich auch die Rückfragen erledigt haben, oder? Bin beeindruckt, klasse!
- zu {{US Census Population}}: Passt vielleicht nicht ganz hierher, aber neugierig bin ich dennoch für die konkrete Situation in NH: Die Vorlage bietet ja die Eingabe zurück bis 1790 an. Ich verwende die Vorlage bislang auch nicht, würde aber gerne das Problem mit Orten in NH verstehen, um zu schauen, ob wir hier eine weiterreichende Verwendung anstreben können (wenn ja, welche Veränderungen sind dafür notwendig) oder nicht.
- Als Bsp. Holderness. Für NH gehen die EW-Zahlen teilweise weiter zurück als der Census, und ich würde die lieber vollst. abgebildet sehen. Bei Orten mit Gründungsdatum ab 1790 ist alles klar, nur bei den älteren fehlt mir die Darstellungsmöglichkeit, auch wenn die Zahlen nicht aus einem US-Census stammen.
- Livermore (New Hampshire): Interessant, vielleicht ist der PopPl nicht mehr gültig, oder aber es gibt hier echt zwei - das sind vermutlich Detailfragen, die man im Einzelfall erörtern müsste. Wenn wir nur einen Artikel dazu haben, würde ich einfach beide GNIS ins Wikidata-Item eintragen.
- Der PopPl müsste eher gültig sein als die Town, die wurde ich glaube in den 1950ern aufgehoben. Aber das ist lt. GNIS-Coord der gleiche Ort. Twp in NH werden ggf. vom Nachbarort mitverwaltet, vllt. daher die unterschiedlichen Counties. Es ist mir aber beim Erstellen nicht gelungen herauszufinden, welcher Ort Livermore Twp verwaltet.
- Viele Grüße, Yellowcard (D.) 11:38, 17. Jan. 2022 (CET)
- Hallo! Also ich hoffe mal, dass ich jetzt niemandem hier irgendwie zuvorgekommen bin. Aber jedenfalls bin nun alle Ergebnisse der Abfrage durchgegangen und denke, dass ich guten Gewissens - soweit möglich - allen Orten mit FIPS-Code diesen einen solchen zugeordnet habe. Dennoch bleiben in der Abfrage jetzt noch 80 Einträge übrig. Diese übrigen Einträge sind, soweit ich das überblicke, zumeist ehemalige CDPs, die schon vor vielen Jahren in andere CDPs oder Städte aufgegangen sind. Teilweise sind das aber auch Orte auf den Nördlichen Marianen, für die es m.W. keine FIPS-Codes gibt. Aus meiner Sicht ist dieser Arbeitsschritt nun also abgeschlossen. Die Frage ist bloß: Müssen wir die Aussagen dieser WD-Einträge in der Abfrage so ändern, dass sie bei einer erneuten Abfrage nicht wieder auftauchen, oder ist das egal? Denn so, wie ich das verstanden habe, war dieser Arbeitsschritt ja einmalig. LG Stefan 00:58, 18. Jan. 2022 (CET)
- @Dionysos1988: Hallo Stefan, hervorragend, vielen Dank. Die übrig bleibenden Items sind egal (bzw. die zu korrigieren wäre Perfektionismus, und für unseren Zweck irrelevant), es ging ja darum, dass diejenigen Items einen FIPS-Code aufweisen, die mit Zensus-Daten versorgt werden sollen. Wenn da einige falsch-positive in der Abfrage übrig bleiben, ist das aus der Warte also völlig egal. Dafür, dass da ursprünglich mal über 3000 Einträge in der Abfrage waren, ist ein Rest von 80 Einträgen jedenfalls beeindruckend - danke an alle Beteiligten! Gruß --Yellowcard (D.) 09:20, 18. Jan. 2022 (CET)
- Von wegen - ich bin froh das jemand so verrückt war sich weiter um den Friemelkram zu kümmern, als ich echt genug hatte. Hatte eher ein schlechtes Gewissen, das ich mich an den leichten so locker bedient hatte :) Habe oben ein paar Bemerkungen in Yellowcards Anbmerkungen geklemmt. --G-41614 (Diskussion) 16:24, 21. Jan. 2022 (CET)
- @Dionysos1988: Hallo Stefan, hervorragend, vielen Dank. Die übrig bleibenden Items sind egal (bzw. die zu korrigieren wäre Perfektionismus, und für unseren Zweck irrelevant), es ging ja darum, dass diejenigen Items einen FIPS-Code aufweisen, die mit Zensus-Daten versorgt werden sollen. Wenn da einige falsch-positive in der Abfrage übrig bleiben, ist das aus der Warte also völlig egal. Dafür, dass da ursprünglich mal über 3000 Einträge in der Abfrage waren, ist ein Rest von 80 Einträgen jedenfalls beeindruckend - danke an alle Beteiligten! Gruß --Yellowcard (D.) 09:20, 18. Jan. 2022 (CET)
- Hallo! Also ich hoffe mal, dass ich jetzt niemandem hier irgendwie zuvorgekommen bin. Aber jedenfalls bin nun alle Ergebnisse der Abfrage durchgegangen und denke, dass ich guten Gewissens - soweit möglich - allen Orten mit FIPS-Code diesen einen solchen zugeordnet habe. Dennoch bleiben in der Abfrage jetzt noch 80 Einträge übrig. Diese übrigen Einträge sind, soweit ich das überblicke, zumeist ehemalige CDPs, die schon vor vielen Jahren in andere CDPs oder Städte aufgegangen sind. Teilweise sind das aber auch Orte auf den Nördlichen Marianen, für die es m.W. keine FIPS-Codes gibt. Aus meiner Sicht ist dieser Arbeitsschritt nun also abgeschlossen. Die Frage ist bloß: Müssen wir die Aussagen dieser WD-Einträge in der Abfrage so ändern, dass sie bei einer erneuten Abfrage nicht wieder auftauchen, oder ist das egal? Denn so, wie ich das verstanden habe, war dieser Arbeitsschritt ja einmalig. LG Stefan 00:58, 18. Jan. 2022 (CET)
- @G-41614: Danke nochmals für die ganze Hilfe. Ich schaue mal dass ich ein paar Punkte spontan beantworte:
- Nee, sorry, bin auf WD und WP unterwegs. Ich teile das mal ein wenig auf:
Problem: Gazetteer Files ohne Einwohnerdaten und Rang in Wikidata
BearbeitenMir ist gerade beim Vorbereiten des Uploads der 2020er-Daten die Kinnlade heruntergefallen. Ganz nebenbei ist mir aufgefallen, dass die Gazetteer Files, die mir als Datengrundlage für den Datenupload dienen, in den neueren Versionen die Einwohner- und Haushaltszahlen nicht mehr enthalten, stattdessen nur noch die Land- und Wasserfläche. Das steht auch ganz nüchtern dabei: "Population and housing unit counts are not included in these files." US Census Bureau: Gazetteer Files. Bis einschließlich 2010 war dies noch anders, die Daten waren enthalten.
Damit würde sich die ganze Aktion natürlich erübrigen. Es ist doch hoffentlich so, dass die Einwohnerzahlen dafür an einer anderen Stelle in Tabellenform veröffentlicht wurden, oder? Wie kam es zu dieser Änderung? Weiß da jemand mehr? Ich bin gerade irgendwo zwischen verwirrt und konsterniert... Yellowcard (D.) 18:59, 12. Jan. 2022 (CET)
- Konnte die Einwohnerzahlen jetzt hier abrufen: data.census.gov. Die Daten zu Haushaltsgrößen bekommt man sicherlich auch darüber, ich fokussiere mich aber zunächst auf den Upload der Einwohnerzahlen, Staat für Staat. Alabama sieht ziemlich gut aus, kann morgen ggf. schon starten. Yellowcard (D.) 00:12, 13. Jan. 2022 (CET)
- Erst mal herzlichen Dank an Yellowcard für das Übertragen der Einwohnerzahlen vom Census 2020 in Alabama nach WikiData. Sie stehen dort jetzt im Property:P1082 mit "Normaler Rang". (Den Rang erkennt man optisch an den 3 kleinen Zeichen direkt links von der Einwohnerzahl in Wikidata. Bei "Normaler Rang" ist der Punkt in der Mitte. Siehe hierzu auch: https://www.wikidata.org/wiki/Help:Ranking/de) Es kann jetzt vorkommen, dass bei einem Ort bereits Einwohnerzahlen zu anderen Jahreszahlen auf Wikidata existieren. Hier kann z.B. die Einwohnerzahl des Jahres 2010 den "Bevorzugten Rang" (der Punkt in Wikidata ist dann oben) haben. Beispiel: Tuscaloosa, Alabama mit Q79580 in Wikidata. Wenn jetzt eine Wiki seine Einwohnerzahl aus Wikidata bezieht, dann wird diese veraltete Einwohnerzahl mit dem bevorzugten Rang angezeigt. In unserem Beispiel ist das in https://de.wikivoyage.org/wiki/Tuscaloosa der Fall. Auch in der deutschen Wikipedia würde bei fehlender Einwohnerzahl im Artikel die alte Einwohnerzahl angezeigt. Wenn man die aus Wikidata stammende Anzeige in Wikipedia jetzt aktualisieren will, dann muß man manuell in Wikidata diesen "Rang" anpassen. Die Kenntnis dieses Sachverhaltes hat wahrscheinlich keine weite Verbreitung. - Es kann nätürlich auch der Fall auftreten, dass alle älteren Einwohnerzahlen von einem Ort auch nur den "Normaler Rang" haben. Beispiel: Eldridge, Alabama mit Q68374. In diesem Fall wird beim Zugriff auf Wikidata durch die "Infobox Ort in den Vereinigten Staaten" nach meiner Beobachtung die erste Einwohnerzahl, die gerade zu diesem Ort gefunden wird, geliefert. Dies ist dann wahrscheinlich nicht die aktuelle Einwohnerzahl vom Census 2020. - Aus meiner Sicht könnte es sinnvoll sein, den neuesten Einwohnerzahlen, und nur diesen (also jetzt von 2020 und jeweils bei späterer Aktualisierung) auch den "Bevorzugten Rang" auf Wikidata zu geben. Was meint Ihr ? MTheiler (Diskussion) 18:13, 15. Jan. 2022 (CET)
- Nachtrag: von den derzeit 11978 "City in den Vereinigten Staaten" (Q1093829) haben Stand heute bereits 628 eine Einwohnerzahl mit "bevorzugten Rang". Hiervon bereits etliche mit dem Datum vom 1. April 2020 in verschiedenen Staaten. Siehe SPARQL https://www.wikidata.org/wiki/User:MTheiler#SPARQL_-_ermittelt_Einwohnerzahlen_von_Q1093829=_%22City_in_den_Vereinigten_Staaten%22_mit_bevorzugtem_Rang. MTheiler (Diskussion) 16:42, 16. Jan. 2022 (CET)
- Hallo MTheiler, danke für den Input. Die Situation um die preffered/normal ranks ist mir bewusst, und für soetwas dynamisches wie Bevölkerungszahlen finde ich die Ranks insgesamt relativ ungeeignet. Ein preferred rank wird spätestens mit der nächsten Volkszählung wieder zum normal rank und es gibt einen neuen preferred rank. Ich würde die Statements daher lieber alle als normal ranks belassen.
- Wenn man den 2020er-Zahlen jetzt preffered status gibt, was macht man dann 2030? Die müsste man dann ja alle auf normal rank zurückstellen, oder?
- Hast Du einen Vorschlag, wie man mit den 628 preferred Ranks umgehen sollte? Ich würde fast dafür voten, diese als normale Ranks umzuschreiben, wobei man das wohl nicht zwingend automatisiert tun kann, denn es gibt möglicherweise sinnvolle Anwendungsfälle, die ich jetzt so nicht auf dem Zettel habe.
- Was die Verwendung der Zahlen aus der Infobox angeht: Die Infobox sollte eigentlich schon so programmiert sein, dass sie die neueste Angabe aus einer Volkszählung heranzieht. Das ist noch nicht so umgesetzt, dafür wollte ich erst die Diskussionen hier abwarten, ist dann aber etwas eingeschlafen. Technisch wäre das ohne preferred rank möglich. Eldridge (Alabama) verwendet derzeit gar keine Info von Wikidata, wenn ich das richtig sehe, oder? --Yellowcard (D.) 11:48, 17. Jan. 2022 (CET)
- Yellowcard - Verständnisfrage meinerseits: Wenn du davon ausgehst, dass man die Infobox unabhängig von diesen Ranks auf die jeweils aktuelle VZ programmieren kann, wieso sollte es dann noch notwendig sein, diese "falschen" Ranks umzuschreiben? LG Stefan 00:43, 18. Jan. 2022 (CET)
- Berechtigte Frage, Du hast recht, eigentlich sollte das für unseren Zweck nicht notwendig sein. Mit etwas einfacherer Vorlagenprogrammierung würde man aber bspw. immer den Wert für 2010 erhalten, auch wenn schon Werte für 2020 vorliegen, wenn der 2010er-Wert mit "preferred rank" ausgestattet ist. Meines Erachtens nach ist ein preffered rank bei dynamischen Daten nicht sinnvoll, sondern eher bei Informationen, die sich auf absehbare Zeit nicht ändern.
- Aber Du hast recht, für unseren Fall sollte das eher belanglos sein. --Yellowcard (D.) 09:26, 18. Jan. 2022 (CET)
- Hallo Zusammen!
- Einen Verzicht auf die Vergabe des "Bevorzugter Rang" halte ich für eine schlecht Idee. Hierfür gibt es folgende Gründe:
- 1.) höhere Rechnerlast: Die Vorlage müßte bei jedem Seitenaufruf die jüngste Jahreszahl ermitteln um an die aktuelle Einwohnerzahl zu kommen.Dies ist in Summe über viele Jahre deutlich mehr Rechenaufwand als jeweils einmalig die aktuelle Jahreszahl entspechend zu markieren . Details hierzu kann aber nur eine Datenbankverwalter abschätzen.
- 2.) Programmieraufwand in jeder Wikipedia-Sprachversion: Eine in der Vorlage implementierte Logik, die sich nicht auf den Rang sonderen auf
- die Jahreszahl der Einwohnerzahl schaut, müßte in jeder Sprache der Wikipedia, die diese Information aus Wikidata auslesen will, umgesetzt werden. Dieser Aufwand wäre hoch und schwer zu kommunizieren.
- 3.) Die Daten in Wikidata werden von vielen Systemen gelesen und verarbeitet, die eventuell schon jetzt das einfache Zugriffsverfahren
- über den bevorzugten Rang benutzen. Falls dieser bevorzugte Rang entfallen würde, dann würden diese anderen Systeme
- veraltete Daten anzeigen. Andere Teilnehmer könnten dann wieder damit anfangen, den Rang hochzusetzen.
- 4.) "Bevorzugter Rang" ist das Standardverfahren. Bei den Einwohnerzahlen vieler Länder (Beispiel: Deutschland, Schweiz, Frankreich, Spanien)
- wird die aktuelle Einwohnerzahl über den Rang in Wikidata festgelegt. Dies geschieht teilweise durch manuelles editieren wie in Deutschland und teilweise automatisiert.
- Existierende automatische Lösungen zum Rang der Einwohnerzahl auf Wikidata
- Frankreich: https://www.wikidata.org/wiki/User:AVMbot Dieser Bot schreibt die Einwohnerzahlen nach Wikidata. Der alte "Bevorzugter Rang" wird jeweis wieder auf "normal" gesetzt und die Daten zur jüngsten Jahreszahl erhalten den "Bevorzugten Rang"
- Spanien: https://www.wikidata.org/wiki/Special:Contributions/KLBot2 Logik wie oben
- Allgemein: https://www.wikidata.org/wiki/User:PreferentialBot Er kann bei einer ganzen Anzahl von Datenelementen den Rang umsetzen. Teil von Pywikibot.
- Software: https://www.wikidata.org/wiki/User:Github-wiki-bot Versionen von Softwareprogrammen werden automatisch eingepflegt und der Rang wird entsprechend geändert. Die Daten werden von vielen Wikipedia-Sprachversionen angezeigt.
- Mein Vorschlag:
- Man sollte zunächst die Einwohnerzahlen vom Census 2020 mit den zur Verfügung stehenden Werkzeugen ohne Berücksichtigung einer Rangvergabe nach Wikidata einlesen. Danach kann man dann unter zur Hilfe nahme oder durch Anpassung eines existierenden Werkzeuges (s.o.) den bei allen Orten der USA den "Bevorzugten Rang" richtig stellen lassen. Hierzu muß man sich dann wahrscheinlich Hilfe holen. Der Vorteil wäre eine Datenstruktur, die den Erwartungen aller Akteure anderer Sprachversion entspräche und kein willkürlicher Sonderweg in der Datenstruktur. Bei jedem neuen Census wäre dann dieser Vorgang zu wiederholen. Die Vorlage für die deutsche Wikipedia kann man natürlich so anpassen wie es für und vorteilhaft ist. MTheiler (Diskussion) 11:28, 18. Jan. 2022 (CET) ps: Bei Tests wie mit Eldridge (Alabama) habe ich im WP-Artikel die Einwohnerzahl entfernt und dann ohne abzuspeichern nur die Vorschau angeschaut. --MTheiler (Diskussion) 11:28, 18. Jan. 2022 (CET)
- Das sind einige valide Argumente. Persönlich würde ich, denke ich, dennoch dabei bleiben, gezielt die 2020er-Angabe abzurufen, anstatt mich auf einen preferred rank zu beziehen. Aber das ist eine Frage zur technischen Umsetzung, die man im Detail nochmal diskutieren kann. Die Verwendung eines preferred ranks, anstatt per Lua gezielt nach einem Snak zu suchen, ist unzweifelhaft performanter, da hast Du recht. Wir sollten die Diskussion nochmal aufnehmen, sobald die 2020er-Daten alle hochgeladen wurden.
- Und tatsächlich ist es so, dass der Abruf von Wikidata noch den preferred rank abruft, wenn keine Angabe im Wikiquelltext ist, aber die 2020er-Angabe von Wikidata verwendet wird, wenn im Quelltext eine veraltete Angabe vorliegt. Eldridge (Alabama) ist ein gutes Beispiel, da muss ich die Programmierung in der Vorlage noch verbessern. Danke für Deinen Input! Gruß --Yellowcard (D.) 12:08, 18. Jan. 2022 (CET)
- @MTheiler, @Yellowcard: In einem anderen Zusammenhang habe ich angefangen, auf Wikipedia beruhende Werte entweder ganz zu löschen, wenn ich belegte konkurrierende Daten habe oder sie konsequent im Rang herabzusetzen, wenn kein anderer Wert vorhanden ist. Längerfristig sollte man Wikipedia-Fundstellen grundsätzlich löschen, wobei auch mir klar ist, daß das nicht mit der Holzhammermethode geht. Vielerorts kann man Fundstelle auch ersetzen, etwa bei ID im GNIS. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 22:13, 3. Sep. 2023 (CEST)
- @Matthiasb: Wikipedia-belegte Aussagen sind blanker Unsinn und sollten immer weniger werden. Sie stammen größtenteils aus dem Massenimport von Daten, als Wikidata noch ganz leer war und man erstmal eine Grundlage haben wollte. Aus heutiger Sicht würde man soetwas bestimmt nicht nochmals tun; und vor allem würde man heute keine Daten mehr von Wikipedia in Wikidata laden (hoffe ich). Was die Zensus-Daten angeht, gilt das sogar umso mehr. Einwohner- und Haushaltszahlen sollten komplett auf Basis der Zensus-Daten vorhanden sein, ich glaube auch Einkommens-Informationen (weiß gerade nicht, wie weit ich da war – Zeit ist bei mir schon länger ziemlich knapp). Da gibt es erst recht keine Rechtfertigung mehr für diese Wikipedia-basierten Daten. --Yellowcard (D.) 08:32, 4. Sep. 2023 (CEST)
- Gut zu wissen - dann kann man die weiterhin löschen, wenn sie unterkommen. --G-41614 (Diskussion) 10:30, 4. Sep. 2023 (CEST)
- @Matthiasb: Wikipedia-belegte Aussagen sind blanker Unsinn und sollten immer weniger werden. Sie stammen größtenteils aus dem Massenimport von Daten, als Wikidata noch ganz leer war und man erstmal eine Grundlage haben wollte. Aus heutiger Sicht würde man soetwas bestimmt nicht nochmals tun; und vor allem würde man heute keine Daten mehr von Wikipedia in Wikidata laden (hoffe ich). Was die Zensus-Daten angeht, gilt das sogar umso mehr. Einwohner- und Haushaltszahlen sollten komplett auf Basis der Zensus-Daten vorhanden sein, ich glaube auch Einkommens-Informationen (weiß gerade nicht, wie weit ich da war – Zeit ist bei mir schon länger ziemlich knapp). Da gibt es erst recht keine Rechtfertigung mehr für diese Wikipedia-basierten Daten. --Yellowcard (D.) 08:32, 4. Sep. 2023 (CEST)
- @MTheiler, @Yellowcard: In einem anderen Zusammenhang habe ich angefangen, auf Wikipedia beruhende Werte entweder ganz zu löschen, wenn ich belegte konkurrierende Daten habe oder sie konsequent im Rang herabzusetzen, wenn kein anderer Wert vorhanden ist. Längerfristig sollte man Wikipedia-Fundstellen grundsätzlich löschen, wobei auch mir klar ist, daß das nicht mit der Holzhammermethode geht. Vielerorts kann man Fundstelle auch ersetzen, etwa bei ID im GNIS. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 22:13, 3. Sep. 2023 (CEST)
- Yellowcard - Verständnisfrage meinerseits: Wenn du davon ausgehst, dass man die Infobox unabhängig von diesen Ranks auf die jeweils aktuelle VZ programmieren kann, wieso sollte es dann noch notwendig sein, diese "falschen" Ranks umzuschreiben? LG Stefan 00:43, 18. Jan. 2022 (CET)
- Nachtrag: von den derzeit 11978 "City in den Vereinigten Staaten" (Q1093829) haben Stand heute bereits 628 eine Einwohnerzahl mit "bevorzugten Rang". Hiervon bereits etliche mit dem Datum vom 1. April 2020 in verschiedenen Staaten. Siehe SPARQL https://www.wikidata.org/wiki/User:MTheiler#SPARQL_-_ermittelt_Einwohnerzahlen_von_Q1093829=_%22City_in_den_Vereinigten_Staaten%22_mit_bevorzugtem_Rang. MTheiler (Diskussion) 16:42, 16. Jan. 2022 (CET)
Ein nächster Schritt: Harte Übernahme der 2020er-Daten
BearbeitenHallo in die Runde, ich habe heute Abend einen weiteren Schritt gewagt: Testhalber werden jetzt die Einwohnerzahlen der Infobox aus Wikidata unabhängig davon, was im Artikel-Quelltext steht übernommen, wenn auf Wikidata die Einwohnerzahl zum Census 2020 hinterlegt ist. Die Artikel werden (übergangsweise, zum Testen und Prüfen) in der folgenden Wartungskategorie einsortiert: Einwohnerzahl von Wikidata überschrieben.
Logischerweise sind das jetzt überwiegend Orte aus Alabama, da ist Stand jetzt nur für Orte in Alabama die 2020er-Daten hochgeladen habe, aber auch andere User haben natürlich schon für den ein oder anderen Ort diese Information in Wikidata hinterlegt. Schaut doch mal stichprobenartig durch die Kategorie. Mich würde eure Meinung dazu interessieren! Viele Grüße, Yellowcard (D.) 22:03, 17. Jan. 2022 (CET)
- @Perrak, Septembermorgen, H-stt, Matthiasb, Itti: Ich bin mal so frei, auch euch anzupingen. Schaut euch dieses Vorgehen doch gerne mal an und lasst eure Meinung hier, falls eure Zeit das zulässt. Im Fall von Fehlern bin ich natürlich umso mehr für Hinweise dankbar. Viele Grüße, --Yellowcard (D.) 22:24, 17. Jan. 2022 (CET)
- Hallo Yellowcard, das scheint rein technisch schon mal super zu funktionieren. Sollte man allerdings die beiden Zeilen im Quelltext (Einwohner+Stand) dann nicht per Bot löschen? Sonst werden die 2010er-Angaben (oder noch ältere) auf ewig im Quelltext stehenbleiben und künftige Nutzer verwirren. Ich habe das bei Abbeville, AL mal getestet. Das beträfe natürlich auch andere Angaben, die wir auf WD zentral verwalten wollen. LG Stefan 01:00, 18. Jan. 2022 (CET)
- Ja, wenn wir einen Konsens haben und alle Bundesstaaten umgestellt haben, würde ich es ebenfalls befürworten, diese Angaben zu löschen (oder durch ein "ABFRAGE_WIKIDATA" zu ersetzen, wie in einigen anderen Infoboxen üblich, etc.). Wenn im Quelltext dort gar keine Werte stehen, könnte das für weniger (Wikidata-) erfahrene Benutzer verwirrend sein.
- Eine Alternative könnte auch sein, einen kleinen Link zum Wikidata-Item bereitzustellen, wenn die Daten aus Wikidata kommen. So machen wir das bei der Infobox für Fußballspieler (siehe willkürliches Beispiel: Bernhard Allemann). Meinungen zum Vorgehen auch hier herzlich willkommen, es ist sicherlich sinnvoll, sich schon jetzt Gedanken darüber zu machen. --Yellowcard (D.) 09:30, 18. Jan. 2022 (CET)
- Ergänzung: Wie auch immer wir es lösen, vielleicht ist es eine Überlegung, dabei nicht auf einen Bot zurückzugreifen, sondern diese Arbeit manuell zu machen, zusammen mit ein paar noch zu definierenden weiteren Arbeiten: Demographieabschnitt rauswerfen, wenn er sich noch auf die 2000er-Daten bezieht, und im Fließtext die in Rede stehenden Platzhalter verwenden (also irgendwas wie Im Ort XY leben {{Einwohnerzahl Wikidata}} Menschen in {{Einwohnerzahl Wikidata|Wert=Haushalte}} Haushalten.). So könnte ich es mir vorstellen. Das wäre pro Ort ein einmaliger Aufwand, die Daten sollten damit dann auf immer aktuell bleiben. Müsste man sich aber vor Beginn einmal gründlich überlegen, damit anschließend diesbezüglich keine Änderungen am Fließtext mehr notwendig sind... Yellowcard (D.) 10:29, 18. Jan. 2022 (CET)
- Da bin ich ein bisschen skeptisch, das solche Vorlagen das Editieren in Wikipedia behindern und im Einzelfall schlichtweg falsche Daten in Wikipedia getragen werden. Gerade bei sehr lokalisierten Daten von Orten können aktuellere Daten unabhängig vom nationalen Census vorliegen. Das Korrigieren entsprechender Daten in Wikidata ist für WPner oft schwieriger/aufwändiger und zudem zu Streitereien dort führen.--Kmhkmh (Diskussion) 12:04, 18. Jan. 2022 (CET)
- Was die aktuelleren Daten angeht: Ja, die gibt es per Fortschreibung und/oder Schätzung jedes Jahr neu, wir sind uns hier aber bislang eigentlich einig, dass wir vor allem die Zensus-Daten als zuverlässig ansehen.
- Was den Artikelbestand der Orte in den USA angeht, spricht die Praxis leider eine andere Sprache: sehr viele Angaben sind noch auf Stand 2010, viele sogar noch auf Stand 2000. Realistisch betrachtet gibt es ausschließlich die Unterscheidung zwischen automatischem Datenabruf und veralteten Artikeln, daher ja auch die ganzen Diskussionskilometer hier. --Yellowcard (D.) 12:10, 18. Jan. 2022 (CET)
- Die Zensusdaten sind zuverlässig, aber aktuellere lokal erhobene Daten sind im Zweifelsfall zuverlässiger und aktueller. Meine Skepsis betrifft nicht die anstehende einmalige bzw. periodische Aktualisierung per Botlauf, meine Skepsis betrifft die Verwendung von Vorlagen, die WPner in gewisser Weise die Editiermöglichkeit entziehen. Zudem ist der Datenbestand meines Wissens nach immer noch nicht besonders gesichert und Trollereien auf Commons verfäschen mit einen Schlag ein Vielfaches anWP-Artikeln.--Kmhkmh (Diskussion) 12:26, 18. Jan. 2022 (CET)
- Hm. Tatsächlich ist in Bezug auf die USA-Artikel weder ein einmaliger Botlauf geplant noch der Datenbezug von Commons. Wir stützen uns hier auf die dynamische Datenübernahme von Wikidata. Die 2010er-Daten sind flächendeckend aus den Zensus-Daten und die 2020er-Daten werden dies in wenigen Tagen ebenfalls sein, das kann man durchaus als gesicherten Datenbestand bezeichnen. Lokale Bevölkerungsdaten werden in den USA nicht erhoben, das läuft alles über das zentrale US Census Bureau. Vandalismus war bislang glücklicherweise kein praktisch zu beobachtendes Problem in den Bevölkerungszahlen auf Wikidata, es sind auch einige Verhinderungsmaßnahmen aktiv, was das relativ unspaßig machen würde. Wurde aber auch weiter oben schon diskutiert... Möglicherweise verwechselst Du dies mit einem anderen Projekt? --Yellowcard (D.) 12:52, 18. Jan. 2022 (CET)
- Ich sehe es auch wie Yellowcard. Wenn man sich schon mehrere Jahre mit dem Thema beschäftigt, ist einem eigentlich klar, wie gewaltig die Aufgabe ist, alles einigermaßen aktuell zu halten. Daher würde zum einen auch ich die genannten Platzhalter definitiv bevorzugen. Zum anderen reichen die Zensus-Daten in aller Regel absolut aus. Wenn jemand für bestimmte bekannte Metropolen die Notwendigkeit sieht, aktuellere Zahlen anzugeben, können diese auch zusätzlich dabei stehen, mit der Anmerkung, dass das keine Census-Zahlen sind. Grundsätzlich wollen wir doch gerade deswegen Daten auf WD auslagern, weil sonst der Wartungsaufwand einfach zu hoch ist. Wenn wir jetzt genau diese Daten im Fließtext aber jetzt doch wieder manuell ändern müssten, wären das redundante Änderungen, und so könnte man sich den Aufwand mit WD bzgl. Infobox eigentlich gleich wieder sparen. LG Stefan 11:58, 19. Jan. 2022 (CET)
- @Dionysos1988: +1. Ich würde die Verwendung dieser "Platzhalter" auch nicht verpflichtend machen, und für Artikel wie New York City oder San Francisco sind sie vermutlich entbehrlich - neue Informationen werden den Weg ganz ohne Platzhalter relativ schnell in die jeweiligen Artikel finden. Aber die unzähligen Nischenartikel zu kleinen Orten zu warten, ist nahezu unmöglich mit der wenigen Manpower, die wir hier haben. Wenn die Bevölkerungszahlen (und Anzahl Haushalte und Angaben zur Fläche) aber regelmäßig aktualisiert werden, bleibt ein guter Artikel zu einem Ort sehr lange aktuell. Wenn dort aber die Bevölkerungszahlen von 2000 hinterlegt sind, wirkt er direkt veraltet, auch wenn sich die Bevölkerungszahlen nur unwesentlich verändert haben. --Yellowcard (D.) 12:14, 19. Jan. 2022 (CET)
- Keiner hat was gegen die (automatisierte) Aktualisierung wenn neue Zensusdaten vorliegen. Aber die Handhabung über Vorlagen ist eben nicht ganz unproblematisch, da sich die entsprechenden Informationen nicht mehr direkt in der Wikipedia editieren lassen, was in vielen Fällen ein "turn off" für Autoren ist.--Kmhkmh (Diskussion) 12:25, 19. Jan. 2022 (CET)
- Nunja. Zu einem "turn off" führt es in meinen Augen eher, wenn man merkt, dass die Arbeitsmasse dermaßen groß ist, dass man dann die Motivation verliert. Es kann doch nicht sein, dass man jahrelang braucht, um alles zu aktualisieren - und kaum ist man fertig, steht schon der nächste Zensus an? Wenn wir uns hier auf ein gemeinsames Vorgehen verständigen, das zu wesentlichen Erleichterungen führt, wäre es auch für mich (und andere) deutlich motivierender als bisher, hier mitzuarbeiten. Ich kann mir allerdings sehr gut vorstellen, dass wir eine Art Tutorial erstellen, in das sich neue Nutzer einlesen können und ihnen so der Einstieg in das Projekt erleichtert wird. LG Stefan 12:41, 19. Jan. 2022 (CET)
- Wieso braucht man jetzt jahrelang? Das Argument ist doch Botdurchlauf versus Vorlage, beides aktualisiert "schnell" (und die Vorlage halt ein wenig schneller). Und ja ein Tutorial wäre sicherlich sinvoll, sowie gegebenfalls einer Verbesserung von Vorlagen und größere Bedienungsfreundlichkeit auf Wikidata. Wobei ich ehrlich gesagt keinen Überblick habe, was derzeit/inzwischen die betroffenen Vorlagen in Zusammenhang mit dem Visualeditor leisten.--Kmhkmh (Diskussion) 12:50, 19. Jan. 2022 (CET)
- Ein Botlauf ist viel komplexer. Und hilft nur einem Projekt. Die Daten auf Wikidata können vollautomatisch aktualisiert werden, und können von allen Wikimedia-Projekten genauso wie externen Projekten genutzt werden. Die Werte im Fließtext zu aktualisieren hat demgegenüber nur deutliche Nachteile und viel höheres technisches Fehlerpotenzial. Eine offene Diskussion wäre Wikidata vs. TabularData auf Commons, aber dynamische Daten im Fließtext per Bot zu aktualisieren, ist wirklich outdated.
- Das Argument, dass dies ein Turnoff für Autoren sein soll, halte ich für genauso vorgeschoben wie das Vandalismus-Argument auf Wikidata. --Yellowcard (D.) 13:25, 19. Jan. 2022 (CET)
- Was soll da and zu welchen Zweck vorgeschoben sein? Für Autoren ist es prinzipiell problematisch, wenn sie Inhalte in Wikipedia-Artikeln nicht mehr (direkt) editieren können und Veränderungen im Artikel nicht mehr auf ihren Beobachtunsseiten registriert werden. Wenn die Vorlagen im Zusammenspiel mit dem Visualeditor bereits so funktionieren, dass sie ihn automatisch aud Wikidata editieren lassen und die Beobachtungsliste artikelbezogne Veränderungen bereits registriert, dann habe ich keine Einwände, falls nicht dann aber eben doch, dann sollte vielleicht eine Überarbeitung von Vorlagenunder Beobachtungsliste zuerst erfolgen.
- Dann verstehe ich das "Wikidata vs. TabularData"-Argument nicht so ganz bzw. es ist aus meiner Sicht nicht nicht existent. Auf Wikidata müssen bzw. sollten die Daten ohehin aktualisiert werden völlig unabhängig von WP). Die Frage ist, wie sie von Wikidata in die WP übernommen werden, inwieweit sie bearbeitbar sind. Also schiebt sie Botlauf von WD nach WP oder eine Vorlage und wenn es eine Vorlage ist, welche Funktionalität bzgl. Editierbarkeit bietet sie im Zusammenhang mit dem Visualeditor?--Kmhkmh (Diskussion) 16:04, 19. Jan. 2022 (CET)
- Diese Veränderungen müssen m. E. auch gar nicht mehr zwingend in der Beobachtungsliste erkennbar sein, wenn man zuvor gemeinschaftlich Richtlinien festgelegt hat, wie eine bestimmte Stelle im Artikel grundsätzlich aussehen soll. Individuelle Abweichungen kann man, wie bisher, natürlich in den betroffenen Artikeln diskutieren. Es sagt ja niemand, dass absolut jeder Artikel mit Platzhaltern ausgestattet werden soll. Es geht einfach um den Wartungsaufwand, um's große Ganze. Ich denke jeder ambitionierte neue Nutzer wird das nachvollziehen können und wird sich wegen sowas nicht direkt vergrault fühlen. LG Stefan 18:01, 19. Jan. 2022 (CET)
- Kmhkmh - Noch zu deiner Frage, was denn jahrelang dauert. Es gibt noch etliche Orte in den USA, die selbst 21 Jahre nach Beginn der WP noch keinen Artikel in der deutschsprachigen Version haben: willkürliches Beispiel. Wir müssen endlich mal da hinkommen, dass überhaupt erst mal jeder durch das Census Bureau statistisch erfasste Ort bei uns existiert. Allein das ist eine Mammutaufgabe. Wir haben derzeit noch nicht mal alle County Seats. Unzählige Navigationsleisten müssen noch erstellt werden. Das Thema Bürgermeister ist ein weiteres Beispiel. Da wäre es sehr hilfreich, wenn wir nicht alle 10 Jahre erst mal Daten, die wir systematisch einpflegen könnten, jedes Mal wieder manuell in jedem Artikel ändern müssen. LG Stefan 23:44, 19. Jan. 2022 (CET)
- Müssen wir das? Aus meiner Sicht jedenfalls nicht. Außerdem ist Artikelanlage eine andere Frage als die Wartung und hier geht es jetzt doch um die aktualisierung/Wartung existierender Artikel. Das andere wäre die artikelanlage durch Bots, kann man machen (da bin ich eher neutral), ist aber in der de.wp traditionell unbeliebt.--Kmhkmh (Diskussion) 00:16, 20. Jan. 2022 (CET)
- Kmhkmh - Noch zu deiner Frage, was denn jahrelang dauert. Es gibt noch etliche Orte in den USA, die selbst 21 Jahre nach Beginn der WP noch keinen Artikel in der deutschsprachigen Version haben: willkürliches Beispiel. Wir müssen endlich mal da hinkommen, dass überhaupt erst mal jeder durch das Census Bureau statistisch erfasste Ort bei uns existiert. Allein das ist eine Mammutaufgabe. Wir haben derzeit noch nicht mal alle County Seats. Unzählige Navigationsleisten müssen noch erstellt werden. Das Thema Bürgermeister ist ein weiteres Beispiel. Da wäre es sehr hilfreich, wenn wir nicht alle 10 Jahre erst mal Daten, die wir systematisch einpflegen könnten, jedes Mal wieder manuell in jedem Artikel ändern müssen. LG Stefan 23:44, 19. Jan. 2022 (CET)
- Die Änderungen erscheinen in der Tat auf der Beobachtungsliste (dies lässt sich in den Einstellungen aktivieren/deaktivieren) und der VisualEditor hat mit solchen Vorlagen ebenfalls kein Problem, insbesondere dann nicht, wenn sie vernünftig dokumentiert sind. --Yellowcard (D.) 09:28, 20. Jan. 2022 (CET)
- @Yellowcard: Editiert man über die Vorlage direkt auf Wikidata? Gibt es irgendwo schon ein funktionierendes Beispiel wo man sich das anschauen kann?--Kmhkmh (Diskussion) 10:57, 20. Jan. 2022 (CET)
- Natürlich nicht. Was soll editiert werden? Eine Einwohnerzahl, die gemäß Zensus-Daten auf Wikidata liegt, soll von einem unerfahrenen Editor geändert werden? Verstehe nicht, auf welchen konkreten Fall Du hinaus willst. --Yellowcard (D.) 13:39, 20. Jan. 2022 (CET)
- Ob der Editor nun unerfahren ist oder nicht ist eine separate Frage (und die Einaschränkung betrifft ja sowhl erfahrene als auch unerfahrene Autoren). Das generelle Problem dieser Vorlagen ist, dass sie dem Wikipedia-Autor die Kontrolle über die Artikelinhalten entziehen, was ich für problematisch halte. Und es ist auch ärgerlich wie das verkauft wird. Zuerst bekommt man erzählt, ja der Visualeditor kommt mit den Vorlagen zurecht und wenn man nachfragt erhält man als Antwort "natürlich nicht".--Kmhkmh (Diskussion) 13:52, 20. Jan. 2022 (CET)
- Kannst Du bitte ein realistisches Szenario ausdenken, damit wir konkret darüber diskutieren können? Ansonsten ist die Diskussion müßig. Es ist kein Problem, im Visual Editor darzustellen, dass ein Platzhalter bedeutet, dass eine Einwohnerzahl von Wikidata bezogen wird. Es gibt keinen erdenklichen Grund, weshalb ein unerfahrener Editor diese Zahl ändern sollte, wenn wir sie von den Zensus-Daten beziehen, und wenn doch, ist die Hürde nun wirklich nicht besonders hoch.
- Gerne können wir über realistische Probleme sprechen. Aber pauschale Ablehnungen von solchen Funktionen mit vorgeschobenen Argumenten sollten an zentralerer Stelle diskutiert werden, meine ich. --Yellowcard (D.) 15:05, 20. Jan. 2022 (CET)
- Das Szenario war doch oben schon angedeutet. Ein Editor möchte die Angaben in einem Artikel aktualisieren (aufgrund neuer lokaler Daten oder einer aktuelleren Zensusschätzung, die nocht nicht auf WD eingepflegt worden sind) und kann das nicht mehr direkt über den Wikipedia-Editor. Er kann dann (soweit er nicht einfach aufgibt oder Vorlage rausschmeißt) das entsprechende Wikidata-Objekt zu verändern. Nur ist ihm dann vermutlich auf Anhieb nicht klar welchen Datenpunkt die Vorlage übernimmt (den jüngsten Datenpunkt, den letzten Censuspunkt?). In Punkto Benutzerfreundlichkeit für Autoren und des "Wiki"-Prinzips ist das mMn. unter aller Sau.
- Man kann das als Kollateralschaden in Kauf nehmen, weil man die Aktualisierung aller Orte auf den Stand des letzten Census (und auf ein Jahrzehnt genau) als wichtiger ansieht als eine kleinschrittigere Aktualisierung (einer kleineren) Anzahl individueller Artikel. Sicherlich ein vertretbarer Standpunkt, aber besonders toll finde ich das persönlich nicht. Besser wäre es, wenn sich das so gestalten ließe, dass man eine (automatische) Aktualisierung hat und dann aber trotzdem möglichst einfach per Hand bei Bedarf nachbessern kann.--Kmhkmh (Diskussion) 03:12, 21. Jan. 2022 (CET)
- Wie gesagt: Lokale Angaben stehen in den USA nicht zur Verfügung, zumindest nicht soweit ich weiß; die jährlichen Schätzungen und Fortschreibungen haben eine geringere Qualität und werden hier daher im Konsens nicht anstelle der Zensus-Daten verwendet, aber gerne zusätzlich. Wenn ein Autor das anders haben möchte, kann er ja konkret auf den Platzhalter verzichten. Was der Platzhalter bewirkt, wird deutlich dokumentiert werden, bevor es zur Nutzung in der Breite kommt. "Unter aller Sau" finde ich das überhaupt nicht.
- Insofern denke ich, dass es sich hier dann um eine Grundsatzfrage handelt, ob man solche dynamischen Elemente nutzen möchte/sollte oder nicht; dies lässt sich hier im Portal wohl kaum klären. Es gab dazu ja ein Meinungsbild, das genau dem hier angedachten Vorgehen entspricht.
- Deinen Vorschlag hinsichtlich der kleinschrittigeren Aktualisierung individueller Artikel halte ich für etwas zynisch, wenn man sich ansieht, wie viele Artikel noch ausführliche Demographie-Abschnitte zu den Zensusdaten aus dem Jahr 2000 (!!) aufweisen. In der Praxis ist die Manpower dafür einfach bei ganz Weitem zu gering, und diese Manpower kann man besser in die inhaltliche Ausbesserung der Artikel stecken anstatt Metadaten zu aktualisieren, finde ich. --Yellowcard (D.) 09:40, 21. Jan. 2022 (CET)
- Das ist kein Vorschlag zur einer alternativen Vorgehensweise, sondern eine praktische Beschreibung wie Autoren vorgehen, die einzelne Artikel überarbeiten, warten, erstellen. Wenn sie aktuellere Angaben haben pflegen sie diese ein. Und es wäre halt schön wenn das weiterhin einfach möglich bliebe und nicht zum Kollateralschaden der großen Aktualisierung wird.
- Von einem Konsensus in Ortsartikeln nur die Daten des letzten durchgeführten Zensus aufzunehmen und keine lokalen Daten oder aktuelleren Schätzungen anzugeben ist mir nichts bekannt. Ist der irgendwo nachzulesen?
- Was das MB vetrifft da im Prinzip steht nur, dass eine Nutzung von Vorlagen zu WD-Daten unter bestimmenten (im Einzelfall noch zu definierenden) Bedingungen/Einschränkungen erlaubt sein soll und eine uneigeschränkte Verwendung vn Vorlagen wurde ja gerade abgelehnt. Und im Prinzip diskutieren wie ja gerade wie diese Einschränkungen bzw. Anforderungen an die Vorlage aussehen sollen.
- Um das noch ein einmal klarzustellen ich bin für eine automatische Aktualisierung der Zensusdaten und dankbar für jeden der sich um die Aktualisierung der Daten auf WD und WP kümmert. Wo unsere Meinungen etwas auseinander gehen sind bei den Details der technischen Umsetzungen und da halte ich Vorlagen die lediglich Daten aud WD beziehen und es aber nicht ermöglichen diese auf WD zu ändern prinzipiell für eine schlechte Lösung, auch wenn man sie in einer Abwägung der Nach- und Vorteile in konkreten Fall für vertretbar halten mag. Aber eine solche Vorlage widerspricht nun einmal dem Wiki-Prinzip und macht die einzelne Autorenarbeit am Artikel erschwerlicher. Und was die Sorge bzgl. unbedachter Änderungen durch unerfahrene Autoren betrifft, sowas könnte man ja zur Not regeln in den man die die Editierbarkeit durch die Vorlage mit Rechten bzw. Benutzergruppen verknüpft (z.B. Reviewer).--Kmhkmh (Diskussion) 18:38, 21. Jan. 2022 (CET)
- @Kmhkmh: Ich habe jetzt spontan mal nachgeschaut, wie das bei uns in Deutschland gehandhabt wird - und siehe da. Auch hier wird scheinbar mit einer Vorlage gearbeitet, die dazu führt, dass man zumindest in der IB die Einwohnerzahl gar nicht mehr manuell eintragen kann. Das ist doch genau das, was du als fehlende Benutzerfreundlichkeit kritisierst? Offenbar ist die Vorgehensweise zumindest bezgl. IB in vielen Bereichen (zumindest mal offenbar in ganz BW) längst gängige Praxis? Welchen Sinn macht es dann noch, im Fließtext eine Einwohnerzahl korrigieren zu wollen, wenn sie in der IB nicht korrigierbar ist? LG Stefan 12:25, 28. Jan. 2022 (CET)
- Ja, ich halte das für benutzerunfreundlich gegenüber Autoren und aus meiner Sicht ist das eine Unsitte und problematischer Trend. Letztlich wird hier das "Hoheitsrecht" der WPner bzw. Autorengemeinschaft über Artikelinhalte und Beleganforderungen nach WD ausgelagert. Im konkreten Falle der US-Censusdaten ist das bis auf mögliche Einzelfälle weitgehend unproblematisch, aber in anderen Fällen wo die Daten bzw. Belege auf WD fragwürdiger sind keineswegs.
- Was nun die IB und die Daten im Fließtext, da ist es natürlich richtig, dass es da wenig Sinn macht diese unterschiedlich zu behandeln. Trotzdem wäre es mMn. besser wenn sich bei den entsprechenden Vorlagen klare Hinweise auf WD geben und im Zweifelsfall auch die Möglichkeit dort zu editieren. Die IB zu einem deutschen Ort generiert ja immerhin Erläuterungen als Fußnote. Weniger schön ist, dass man im Editormodus keinen Hinweis darauf erhält, wo die Daten herstammen bzw. wie sie generiert werden. Im Quelltexteditor sie man schlicht gar nichts und Visualeditor ist immerhin Vorlagenseite verlinkt, wo man es theoretisch der Beschreibung entnehmen kann.--Kmhkmh (Diskussion) 14:39, 28. Jan. 2022 (CET)
- @Kmhkmh: Ich habe jetzt spontan mal nachgeschaut, wie das bei uns in Deutschland gehandhabt wird - und siehe da. Auch hier wird scheinbar mit einer Vorlage gearbeitet, die dazu führt, dass man zumindest in der IB die Einwohnerzahl gar nicht mehr manuell eintragen kann. Das ist doch genau das, was du als fehlende Benutzerfreundlichkeit kritisierst? Offenbar ist die Vorgehensweise zumindest bezgl. IB in vielen Bereichen (zumindest mal offenbar in ganz BW) längst gängige Praxis? Welchen Sinn macht es dann noch, im Fließtext eine Einwohnerzahl korrigieren zu wollen, wenn sie in der IB nicht korrigierbar ist? LG Stefan 12:25, 28. Jan. 2022 (CET)
- Ob der Editor nun unerfahren ist oder nicht ist eine separate Frage (und die Einaschränkung betrifft ja sowhl erfahrene als auch unerfahrene Autoren). Das generelle Problem dieser Vorlagen ist, dass sie dem Wikipedia-Autor die Kontrolle über die Artikelinhalten entziehen, was ich für problematisch halte. Und es ist auch ärgerlich wie das verkauft wird. Zuerst bekommt man erzählt, ja der Visualeditor kommt mit den Vorlagen zurecht und wenn man nachfragt erhält man als Antwort "natürlich nicht".--Kmhkmh (Diskussion) 13:52, 20. Jan. 2022 (CET)
- Natürlich nicht. Was soll editiert werden? Eine Einwohnerzahl, die gemäß Zensus-Daten auf Wikidata liegt, soll von einem unerfahrenen Editor geändert werden? Verstehe nicht, auf welchen konkreten Fall Du hinaus willst. --Yellowcard (D.) 13:39, 20. Jan. 2022 (CET)
- @Yellowcard: Editiert man über die Vorlage direkt auf Wikidata? Gibt es irgendwo schon ein funktionierendes Beispiel wo man sich das anschauen kann?--Kmhkmh (Diskussion) 10:57, 20. Jan. 2022 (CET)
- Diese Veränderungen müssen m. E. auch gar nicht mehr zwingend in der Beobachtungsliste erkennbar sein, wenn man zuvor gemeinschaftlich Richtlinien festgelegt hat, wie eine bestimmte Stelle im Artikel grundsätzlich aussehen soll. Individuelle Abweichungen kann man, wie bisher, natürlich in den betroffenen Artikeln diskutieren. Es sagt ja niemand, dass absolut jeder Artikel mit Platzhaltern ausgestattet werden soll. Es geht einfach um den Wartungsaufwand, um's große Ganze. Ich denke jeder ambitionierte neue Nutzer wird das nachvollziehen können und wird sich wegen sowas nicht direkt vergrault fühlen. LG Stefan 18:01, 19. Jan. 2022 (CET)
- Wieso braucht man jetzt jahrelang? Das Argument ist doch Botdurchlauf versus Vorlage, beides aktualisiert "schnell" (und die Vorlage halt ein wenig schneller). Und ja ein Tutorial wäre sicherlich sinvoll, sowie gegebenfalls einer Verbesserung von Vorlagen und größere Bedienungsfreundlichkeit auf Wikidata. Wobei ich ehrlich gesagt keinen Überblick habe, was derzeit/inzwischen die betroffenen Vorlagen in Zusammenhang mit dem Visualeditor leisten.--Kmhkmh (Diskussion) 12:50, 19. Jan. 2022 (CET)
- Nunja. Zu einem "turn off" führt es in meinen Augen eher, wenn man merkt, dass die Arbeitsmasse dermaßen groß ist, dass man dann die Motivation verliert. Es kann doch nicht sein, dass man jahrelang braucht, um alles zu aktualisieren - und kaum ist man fertig, steht schon der nächste Zensus an? Wenn wir uns hier auf ein gemeinsames Vorgehen verständigen, das zu wesentlichen Erleichterungen führt, wäre es auch für mich (und andere) deutlich motivierender als bisher, hier mitzuarbeiten. Ich kann mir allerdings sehr gut vorstellen, dass wir eine Art Tutorial erstellen, in das sich neue Nutzer einlesen können und ihnen so der Einstieg in das Projekt erleichtert wird. LG Stefan 12:41, 19. Jan. 2022 (CET)
- Keiner hat was gegen die (automatisierte) Aktualisierung wenn neue Zensusdaten vorliegen. Aber die Handhabung über Vorlagen ist eben nicht ganz unproblematisch, da sich die entsprechenden Informationen nicht mehr direkt in der Wikipedia editieren lassen, was in vielen Fällen ein "turn off" für Autoren ist.--Kmhkmh (Diskussion) 12:25, 19. Jan. 2022 (CET)
- @Dionysos1988: +1. Ich würde die Verwendung dieser "Platzhalter" auch nicht verpflichtend machen, und für Artikel wie New York City oder San Francisco sind sie vermutlich entbehrlich - neue Informationen werden den Weg ganz ohne Platzhalter relativ schnell in die jeweiligen Artikel finden. Aber die unzähligen Nischenartikel zu kleinen Orten zu warten, ist nahezu unmöglich mit der wenigen Manpower, die wir hier haben. Wenn die Bevölkerungszahlen (und Anzahl Haushalte und Angaben zur Fläche) aber regelmäßig aktualisiert werden, bleibt ein guter Artikel zu einem Ort sehr lange aktuell. Wenn dort aber die Bevölkerungszahlen von 2000 hinterlegt sind, wirkt er direkt veraltet, auch wenn sich die Bevölkerungszahlen nur unwesentlich verändert haben. --Yellowcard (D.) 12:14, 19. Jan. 2022 (CET)
- Ich sehe es auch wie Yellowcard. Wenn man sich schon mehrere Jahre mit dem Thema beschäftigt, ist einem eigentlich klar, wie gewaltig die Aufgabe ist, alles einigermaßen aktuell zu halten. Daher würde zum einen auch ich die genannten Platzhalter definitiv bevorzugen. Zum anderen reichen die Zensus-Daten in aller Regel absolut aus. Wenn jemand für bestimmte bekannte Metropolen die Notwendigkeit sieht, aktuellere Zahlen anzugeben, können diese auch zusätzlich dabei stehen, mit der Anmerkung, dass das keine Census-Zahlen sind. Grundsätzlich wollen wir doch gerade deswegen Daten auf WD auslagern, weil sonst der Wartungsaufwand einfach zu hoch ist. Wenn wir jetzt genau diese Daten im Fließtext aber jetzt doch wieder manuell ändern müssten, wären das redundante Änderungen, und so könnte man sich den Aufwand mit WD bzgl. Infobox eigentlich gleich wieder sparen. LG Stefan 11:58, 19. Jan. 2022 (CET)
- Hm. Tatsächlich ist in Bezug auf die USA-Artikel weder ein einmaliger Botlauf geplant noch der Datenbezug von Commons. Wir stützen uns hier auf die dynamische Datenübernahme von Wikidata. Die 2010er-Daten sind flächendeckend aus den Zensus-Daten und die 2020er-Daten werden dies in wenigen Tagen ebenfalls sein, das kann man durchaus als gesicherten Datenbestand bezeichnen. Lokale Bevölkerungsdaten werden in den USA nicht erhoben, das läuft alles über das zentrale US Census Bureau. Vandalismus war bislang glücklicherweise kein praktisch zu beobachtendes Problem in den Bevölkerungszahlen auf Wikidata, es sind auch einige Verhinderungsmaßnahmen aktiv, was das relativ unspaßig machen würde. Wurde aber auch weiter oben schon diskutiert... Möglicherweise verwechselst Du dies mit einem anderen Projekt? --Yellowcard (D.) 12:52, 18. Jan. 2022 (CET)
- Die Zensusdaten sind zuverlässig, aber aktuellere lokal erhobene Daten sind im Zweifelsfall zuverlässiger und aktueller. Meine Skepsis betrifft nicht die anstehende einmalige bzw. periodische Aktualisierung per Botlauf, meine Skepsis betrifft die Verwendung von Vorlagen, die WPner in gewisser Weise die Editiermöglichkeit entziehen. Zudem ist der Datenbestand meines Wissens nach immer noch nicht besonders gesichert und Trollereien auf Commons verfäschen mit einen Schlag ein Vielfaches anWP-Artikeln.--Kmhkmh (Diskussion) 12:26, 18. Jan. 2022 (CET)
- Da bin ich ein bisschen skeptisch, das solche Vorlagen das Editieren in Wikipedia behindern und im Einzelfall schlichtweg falsche Daten in Wikipedia getragen werden. Gerade bei sehr lokalisierten Daten von Orten können aktuellere Daten unabhängig vom nationalen Census vorliegen. Das Korrigieren entsprechender Daten in Wikidata ist für WPner oft schwieriger/aufwändiger und zudem zu Streitereien dort führen.--Kmhkmh (Diskussion) 12:04, 18. Jan. 2022 (CET)
- Hallo Yellowcard, das scheint rein technisch schon mal super zu funktionieren. Sollte man allerdings die beiden Zeilen im Quelltext (Einwohner+Stand) dann nicht per Bot löschen? Sonst werden die 2010er-Angaben (oder noch ältere) auf ewig im Quelltext stehenbleiben und künftige Nutzer verwirren. Ich habe das bei Abbeville, AL mal getestet. Das beträfe natürlich auch andere Angaben, die wir auf WD zentral verwalten wollen. LG Stefan 01:00, 18. Jan. 2022 (CET)
Nochmal zum Verständnis: Wenn wir uns also darauf verständigen, dass die Platzhalter genutzt werden - müssten doch dann die Angaben auf WD ebenso aktualisiert werden, oder? Im Beispiel Abbeville in WD werden die Angaben zur Anzahl der Haushalte und zur Fläche noch mit Stand 2010 geführt. Müsste man das nicht gleichzeitig ändern, wenn man schon in einem WD-Eintrag die neuen 2020er-Einwohnerzahlen einfügt? Oder funktionieren diese Platzhalter unabhängig von WD? LG Stefan 12:43, 19. Jan. 2022 (CET)
- Die Angaben auf Wikidata müssen aktualisiert werden, das geht aber über entsprechende Schnittstellen recht einfach. Für Abbeville ist das ja auch schon geschehen, und daher ist die Angabe in der Infobox schon korrekt.
- Was den Fließtext angeht, hier müsste einmalig auf die (noch zu erstellenden) Platzhalter umstellen, das stimmt. Das Datenupdate auf Wikidata ist aber völlig unabhängig davon, dabei fassen wir die einzelnen Artikel ja gar nicht an. Oder habe ich Deine Frage falsch verstanden? --Yellowcard (D.) 13:30, 19. Jan. 2022 (CET)
- In WD müssten doch auch die Angaben zu Haushalten (und alles, was man sonst für ein Template verwenden will) ebenso auf 2020 umgestellt werden, oder nicht? Also nur die Einwohnerzahlen zu aktualisieren, reicht ja dann nicht? LG Stefan 14:33, 19. Jan. 2022 (CET)
- Korrekt. Die Daten zu den Haushalten sind leider seit 2012 schwieriger zugänglich als noch bis einschl. 2010, da sie aus den Gazetteer Files des US Census Bureau rausgeflogen sind. Habe da aber eine Lösung im Blick. Fläche (Landfläche, Wasserfläche) steht in den Zensus-Daten, das geht analog zu den 2010er-Daten. --Yellowcard (D.) 14:39, 19. Jan. 2022 (CET)
- Ok. D. h. wie geht es jetzt erst mal weiter? Lädst du bei WD weiter schrittweise je Bundesstaat die Einwohnerzahlen für alle Orte hoch? Kann man dich unterstützen, und falls ja, wie? LG Stefan 23:24, 19. Jan. 2022 (CET)
- Ja, richtig. Für 2010 bin ich damit auch durch, für 2020 habe ich bislang nur Alabama erledigt, um die Datenqualität zu testen und auch die Umstellung der Infobox. Unterstützung kann ich immer gebrauchen, die besteht in der Regel aus eher eher langweiliger einmaliger Datenpflege, um die Verbindung zwischen den Zensus-Daten und den Wikidata-Einträgen hinzubekommen, damit der automatische Datenupload möglichst alle Orte erwischt. Ich kann dazu sicherlich heute Abend mal einen Zwischenstand einstellen. Danke für das Angebot jedenfalls! --Yellowcard (D.) 09:36, 20. Jan. 2022 (CET)
- @Dionysos1988: Hilfreiche Unterstützung könnte derzeit folgendermaßen aussehen: Auf Benutzer:Yellowcard/Zensus-Daten ohne Wikidata-Zuordnung werde ich jeweils vermerken, welche Einträge aus den Zensus-Daten keine Zuordnung erhalten haben. Hier müsste geprüft werden, ob das zugehörige Wikidata-Item existiert (wenn nein, könne man es anlegen) und wenn ja, ob es den korrekten FIPS-Code erhält. Der FIPS-Code steht ja direkt mit in der Liste. Viele Grüße, --Yellowcard (D.) 21:39, 20. Jan. 2022 (CET)
- Ja, richtig. Für 2010 bin ich damit auch durch, für 2020 habe ich bislang nur Alabama erledigt, um die Datenqualität zu testen und auch die Umstellung der Infobox. Unterstützung kann ich immer gebrauchen, die besteht in der Regel aus eher eher langweiliger einmaliger Datenpflege, um die Verbindung zwischen den Zensus-Daten und den Wikidata-Einträgen hinzubekommen, damit der automatische Datenupload möglichst alle Orte erwischt. Ich kann dazu sicherlich heute Abend mal einen Zwischenstand einstellen. Danke für das Angebot jedenfalls! --Yellowcard (D.) 09:36, 20. Jan. 2022 (CET)
- Ok. D. h. wie geht es jetzt erst mal weiter? Lädst du bei WD weiter schrittweise je Bundesstaat die Einwohnerzahlen für alle Orte hoch? Kann man dich unterstützen, und falls ja, wie? LG Stefan 23:24, 19. Jan. 2022 (CET)
- Korrekt. Die Daten zu den Haushalten sind leider seit 2012 schwieriger zugänglich als noch bis einschl. 2010, da sie aus den Gazetteer Files des US Census Bureau rausgeflogen sind. Habe da aber eine Lösung im Blick. Fläche (Landfläche, Wasserfläche) steht in den Zensus-Daten, das geht analog zu den 2010er-Daten. --Yellowcard (D.) 14:39, 19. Jan. 2022 (CET)
- In WD müssten doch auch die Angaben zu Haushalten (und alles, was man sonst für ein Template verwenden will) ebenso auf 2020 umgestellt werden, oder nicht? Also nur die Einwohnerzahlen zu aktualisieren, reicht ja dann nicht? LG Stefan 14:33, 19. Jan. 2022 (CET)
- Zwischenstand: Auch dank eurer fleißiger Mithilfe sind jetzt die Staaten Alabama, Alaska, Arkansas, Arizona und New Hampshire vollständig mit Einwohnerzahlen aus dem Zensus 2020 versorgt. 2405 Wikidata-Items wurden dadurch bislang aktualisiert, 1178 Artikel werden mit diesen Daten versorgt (die Differenz erklärt sich aus noch nicht geschriebenen Artikeln). Es fehlt nicht mehr viel, dann können wir mit Kalifornien einen nächsten größeren Brocken in Angriff nehmen. Super! Yellowcard (D.) 17:22, 29. Jan. 2022 (CET)
- Danke für den Zwischenstand. Voraussichtlich am Montag kann ich wieder was abarbeiten. Die Differenz zeigt gut auf, was nach der ganzen Geschichte hier eigentlich noch an reiner Artikelarbeit zu leisten ist. Es fühlt sich fast an wie eine Lebensaufgabe. LG Stefan 00:23, 30. Jan. 2022 (CET)
- Wieso fast - alleine um die towns in NH von rot nach blau zu ändern sehe ich noch ein paar Jahre Tätigkeit, ein Staat besteht auch noch aus anderem (NRHP, Flugplätze, Straßen, Berge und Gewässer, Personen, über die man zufällig stolpert, ...) und RL gibt's schließlich auch noch. Nicht, das ich fest vorhätte, das zu ändern, aber so lange das so ist, finde ich hier immer was zu tun. :) Eine Frage von oben aufgenommen: Ich würde sowas wie {{Einwohnerzahl Wikidata}} mit Vergnügen benutzen. Ein erster Versuch hat gezeigt, das dazu entweder das Ranking auf WD entsprechend eingestellt sein muß, oder der Baustein wird so eingestellt, das automatisch das richtige Jahr abgerufen wird. Bekam zwei Zahlen ausgegeben, und das war ja nun nicht das Gewünschte. Wenn ich das oben richtig verstehe, wurde die Entscheidung erstmal vertagt, bis die Daten aktualisiert sind? Gruß, --G-41614 (Diskussion) 18:17, 31. Jan. 2022 (CET)
- Also die Vorlage muss auf jeden Fall neu programmiert werden, aus genau den Gründen die Du aufzählst. Dazu fehlt mir gerade ein wenig die Zeit (u.a. bedingt auch durch die gerade laufenden Datenaktualisierungen, man kann halt immer nur eine Sache machen), aber vielleicht kann ich mir am Wochenende etwas Zeit dafür nehmen. Das wäre die Grundvoraussetzung, damit das in der Breite akzeptiert wird. Und sobald das steht, können wir damit gerne starten - erstmal in kleinen Testcases und dann immer weiter ausrollen, wenn wir mit dem Ergebnis zufrieden sind. Viele Grüße, --Yellowcard (D.) 10:43, 1. Feb. 2022 (CET)
- He, nur keine Eile, bitte - schon gar nicht mit Blick auf Illinois, + Beschreibung & Verwaltungsbezirk & ... war auch nur 'ne Frage, denn funktioniert hat es ja, auch wenn ich den Rang auf WD geändert habe. Mein Testfall war Danbury (New Hampshire), Einleitung. --G-41614 (Diskussion) 15:42, 2. Feb. 2022 (CET)
- Also die Vorlage muss auf jeden Fall neu programmiert werden, aus genau den Gründen die Du aufzählst. Dazu fehlt mir gerade ein wenig die Zeit (u.a. bedingt auch durch die gerade laufenden Datenaktualisierungen, man kann halt immer nur eine Sache machen), aber vielleicht kann ich mir am Wochenende etwas Zeit dafür nehmen. Das wäre die Grundvoraussetzung, damit das in der Breite akzeptiert wird. Und sobald das steht, können wir damit gerne starten - erstmal in kleinen Testcases und dann immer weiter ausrollen, wenn wir mit dem Ergebnis zufrieden sind. Viele Grüße, --Yellowcard (D.) 10:43, 1. Feb. 2022 (CET)
- Wieso fast - alleine um die towns in NH von rot nach blau zu ändern sehe ich noch ein paar Jahre Tätigkeit, ein Staat besteht auch noch aus anderem (NRHP, Flugplätze, Straßen, Berge und Gewässer, Personen, über die man zufällig stolpert, ...) und RL gibt's schließlich auch noch. Nicht, das ich fest vorhätte, das zu ändern, aber so lange das so ist, finde ich hier immer was zu tun. :) Eine Frage von oben aufgenommen: Ich würde sowas wie {{Einwohnerzahl Wikidata}} mit Vergnügen benutzen. Ein erster Versuch hat gezeigt, das dazu entweder das Ranking auf WD entsprechend eingestellt sein muß, oder der Baustein wird so eingestellt, das automatisch das richtige Jahr abgerufen wird. Bekam zwei Zahlen ausgegeben, und das war ja nun nicht das Gewünschte. Wenn ich das oben richtig verstehe, wurde die Entscheidung erstmal vertagt, bis die Daten aktualisiert sind? Gruß, --G-41614 (Diskussion) 18:17, 31. Jan. 2022 (CET)
- Danke für den Zwischenstand. Voraussichtlich am Montag kann ich wieder was abarbeiten. Die Differenz zeigt gut auf, was nach der ganzen Geschichte hier eigentlich noch an reiner Artikelarbeit zu leisten ist. Es fühlt sich fast an wie eine Lebensaufgabe. LG Stefan 00:23, 30. Jan. 2022 (CET)
Zwischenstand 02.02.: Kalifornien, Connecticut, Delaware und Florida sind ebenfalls erledigt. 2879 Artikel beziehen ihre Einwohnerangabe in der Infobox inzwischen aus Wikidata, mit Quelle Zensus 2020. Yellowcard (D.) 12:05, 2. Feb. 2022 (CET)
- Zwischenstand: 8.050 Wikidata-Items wurden mit aktuellen Einwohnerzahlen versorgt. Ich denke mal, dass wir damit die Hälfte aller Orte abgegrast haben. --Yellowcard (D.) 17:54, 21. Feb. 2022 (CET)
Nebenaspekt: Positionskarte / Coordinate mit Bevölkerungszahl
BearbeitenDirekt die nächste Frage, möglicherweise kann jemand helfen: Unter anderem wird von der Infobox auch eine Positionskarte eingebunden über die Vorlage {{Positionskarte}}. Beim Aufruf dieser Vorlage wird auch die Bevölkerungszahl übergeben, der Wert wird durchgegeben an {{Coordinate}}, die dortige Dokumentation ist aber sehr dürftig (siehe Vorlage:Coordinate#pop). Ich habe keinen blassen Schimmer, wie die Bevölkerungszahl von der Vorlage Coordinate weiterverarbeitet wird. Weiß das jemand, ist diese Angabe überhaupt notwendig? (Hintergrund der Frage natürlich: Muss die Bevölkerunsgzahl auch für diese Funktion von Wikidata abgerufen werden oder ist sie entbehrlich?) Gruß Yellowcard (D.) 13:39, 18. Jan. 2022 (CET)
- @Yellowcard: Ich sehe das jetzt erst, an dem Tag war meine Mama verstorben, weswegen ich mich hier die letzten anderthalb Jahre rargemacht habe und erst jetzt mich wieder herauswühle. Ich vermute, daß die Vorlage:Coordinate die Einwohnerzahlen deswegen erhebt, damit je nach Anwendung Städte ihr Stadtsymbol entsprechend ihrer EWZ erhalten, etwa kleinere rote Kreise ab 100.000 Einwohner, größere rote Kreise ab 500.000 Einwohner und rote Quadrate ab einer Million. Meines Wissens wird das auf WP selbst nicht ausgewertet, aber vielleicht weiß das Benutzer:NordNordWest oder Benutzer:Kolossos. Vielleicht war ja für die Vorlage:Positionskarte eine Unerscheidung geplant, aber dann wegen damaliger Ressourcenproblem aufgeschoben und inzwischen längst vergessen. Grundsätzlich denke, sollten wir das durchaus erfassen bzw. auswerten. Wer weiß, was sich in den OSM-Tiefen alles verbirgt, was unsereiner gar nicht weiß. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 21:17, 31. Aug. 2023 (CEST)
- Ich weiß es nicht, trage es aber auch nicht ein, da das alles nicht gepflegt werden kann. Lieber nichts als falsche Daten. Soweit ich weiß, sind nur die Koordinaten, der Typ und die Region Pflicht. NNW 23:16, 31. Aug. 2023 (CEST)
- Die Pop-Zahlen für die Einwohner in der Koordinatenvorlage tragen wir seit 2005 ein. Damals war das der einzigste Maschinenlesbare Parameter für die Bevölkerungsanzahl, seitdem hat sich aber Wikidata entwickelt und erscheint als sinnvolleres Werkzeug. Externe Tools können ja jetzt Wikidata nutzen. Die Pop-Zahlen habe ich mal genutzt für die Icondarstellung auf der OSM-Karte. Für die Relevanz nutze ich aber nur die Artikellänge. Die Unterstützung in anderen Sprachen und die Aktualität lassen in der VOrlage sicher auch zu wünschen. --Kolossos 18:19, 1. Sep. 2023 (CEST)
Countys sowie Metropolitan Statistical Areas
BearbeitenWie soll die Aktualisierung eigentlich bei den Countys und den Metropolitan Statistical Areas (MSAs) erfolgen? Da es die Vorlage:Infobox County (Vereinigte Staaten) gibt, wäre ein Vorgehen analog zu den Orten denkbar. Leider ist schon der ein oder andere User vorgeprescht und hat z. B. hier ohne Quellenangabe die Einwohnerzahl aktualisiert. Welche Quelle kann hier in welchem Format nachgetragen werden? Welche Quelle kann für die MSAs verwendet werden? Ich würde parallel schon jetzt mit den Aktualisierungen in den Artikeln der Kategorie:Metropolregion (Vereinigte Staaten) beginnen und würde im Zuge dessen auch weitere MSA-Artikel erstellen. LG Stefan 00:13, 20. Jan. 2022 (CET)
- Für Counties werden vom US Census Bureau sehr gute Daten maschinenlesbar bereitgestellt, da könnten wir dann direkt mit weitermachen. Was die MSAs angeht, scheint dies kein Thema seitens US Census Bureau zu sein, richtig? Da müsste man sich dann anschauen, welche Daten es in strukturierter Form gibt, damit man sie in Wikidata hochladen könnte, falls das gewünscht ist und sich lohnt. Habe mich mit den MSAs bislang ehrlich gesagt noch nie beschäftigt. --Yellowcard (D.) 09:37, 20. Jan. 2022 (CET)
- Doch, auch die Metropolregionen werden vom Census Bureau erfasst. Einfach hier auf "All CBSAs" gehen, dann kann man rechts die komplette Liste runterscrollen. Ob diese Daten irgendwo auch so aufbereitet sind, dass man sie auf WD hochladen kann, weiß ich leider nicht. Lohnen würde es sich aber definitiv. LG Stefan 12:10, 20. Jan. 2022 (CET)
- Spannend. Das müsste es auch in Tabellenform dort irgendwo zum Download geben. Sollten wir uns auf unsere virtuelle To-Do-Liste schreiben! --Yellowcard (D.) 13:06, 20. Jan. 2022 (CET)
- Gefunden: [4]. --Yellowcard (D.) 21:40, 20. Jan. 2022 (CET)
- Ausgezeichnet - die veralteten MSA sind mir gerade beim Aktualisieren von IB aufgefallen. So geht's ja nicht, EWZ von 2020 und darunter EWZ der MSA von 2016, 2010 oder ... :) --G-41614 (Diskussion) 19:20, 14. Mär. 2022 (CET)
- Bleibt die Frage, wie man diese Daten vernünftig auf Wikidata abbildet. Da bin ich gerade ein bisschen ratlos. --Yellowcard (D.) 19:28, 14. Mär. 2022 (CET)
- Hi Yellowcard, in den Ortsartikel-IBs gibt es ja den Parameter
| Metropolregion
. Ich könnte mir die Vorgehensweise wie folgt vorstellen - Beispiel Metropolregion Miami: Im WD-Datensatz zur MSA hinterlegt man die Oberzentren Miami, Fort Lauderdale und West Palm Beach, damit dort die Einwohnerzahl der MSA in der IB erscheint. So könnte man auch bei allen weiteren MSAs vorgehen. Navileisten habe ich bereits zu Florida und Georgia erstellt. Die Frage ist halt, ob das "Hinterlegen" tatsächlich umsetzbar ist. Evtl. könnte man es auch andersherum machen und in den Datensätzen zu den Städten die MSA hinterlegen. Vielleicht gelingt ja so dann eine Verknüpfung? LG Stefan 09:21, 15. Mär. 2022 (CET)- Hallo Stefan, der Hinweis auf die Metropolregion Miami ist extrem hilfreich, damit kann man gut arbeiten: Haben denn die MSAs auf Wikidata denn jeweils eigene Items, wo man die Einwohnerzahl hinterlegen kann? Das wäre die entscheidende Brücke, damit könnte man sehr gut arbeiten und die Übernahme in die Artikel sogar sehr elegant realisieren. Hast Du da einen besseren Überblick, wie es mit den MSAs auf Wikidata und Wikipedia aussieht? Und gibt es für die MSAs auch irgendwelche FIPS-Codes o.ä., mit denen die Verknüpfung zu den Zensus-Daten möglich wäre? (Wenn nein, sollte es in diesem Fall vermutlich auch über den Namen funktionieren, da die Namen der MSAs wohl anders als bei den Orten eindeutig sind, oder?)
- Ich war bislang davon ausgegangen, dass man die Einwohnerzahlen der MSAs irgendwo in den Items zu den Orten unterbringen muss. Da hatte ich noch keine wirklich überzeugende Idee. Eigene Items zu den MSAs würden da völlig andere Möglichkeiten bringen. Viele Grüße --Yellowcard (D.) 09:58, 15. Mär. 2022 (CET)
- Sehr spannend: SPARQL-Abfrage. Es scheint also die Items zu 181 Metropolregionen in Wikidata zu geben, die Datenqualität ist aber ziemlich schlecht: vielen fehlt sowohl englischer als auch deutscher Bezeichner, nur zu 20 der 181 ist ein Artikel in der de.wp zugeordnet (die Kategorie:Metropolregion (Vereinigte Staaten) enthält aber derer 55). Das ist ein super Ansatz, die Wikidata-Items müssen wir aber noch etwas frisieren. --Yellowcard (D.) 10:11, 15. Mär. 2022 (CET)
- Ein sehr gut gepflegtes Item, das uns eventuell als Vorlage dienen könnte, scheint San Francisco Bay Area (Q213205) zu sein. // Monolog Ende --Yellowcard (D.) 10:20, 15. Mär. 2022 (CET)
- Das Thema scheint etwas komplexer zu sein als ich dachte, besser ist wohl diese Abfrage, die nicht Metropolregion (Q1907114), sondern deren Unterklasse Metropolitan statistical area (Q1768043) berücksichtigt... // Monolog aber wirklich mal Ende --Yellowcard (D.) 10:23, 15. Mär. 2022 (CET)
- Ein sehr gut gepflegtes Item, das uns eventuell als Vorlage dienen könnte, scheint San Francisco Bay Area (Q213205) zu sein. // Monolog Ende --Yellowcard (D.) 10:20, 15. Mär. 2022 (CET)
- Sehr spannend: SPARQL-Abfrage. Es scheint also die Items zu 181 Metropolregionen in Wikidata zu geben, die Datenqualität ist aber ziemlich schlecht: vielen fehlt sowohl englischer als auch deutscher Bezeichner, nur zu 20 der 181 ist ein Artikel in der de.wp zugeordnet (die Kategorie:Metropolregion (Vereinigte Staaten) enthält aber derer 55). Das ist ein super Ansatz, die Wikidata-Items müssen wir aber noch etwas frisieren. --Yellowcard (D.) 10:11, 15. Mär. 2022 (CET)
- Hi Yellowcard, in den Ortsartikel-IBs gibt es ja den Parameter
- Bleibt die Frage, wie man diese Daten vernünftig auf Wikidata abbildet. Da bin ich gerade ein bisschen ratlos. --Yellowcard (D.) 19:28, 14. Mär. 2022 (CET)
- Ausgezeichnet - die veralteten MSA sind mir gerade beim Aktualisieren von IB aufgefallen. So geht's ja nicht, EWZ von 2020 und darunter EWZ der MSA von 2016, 2010 oder ... :) --G-41614 (Diskussion) 19:20, 14. Mär. 2022 (CET)
- Gefunden: [4]. --Yellowcard (D.) 21:40, 20. Jan. 2022 (CET)
- Spannend. Das müsste es auch in Tabellenform dort irgendwo zum Download geben. Sollten wir uns auf unsere virtuelle To-Do-Liste schreiben! --Yellowcard (D.) 13:06, 20. Jan. 2022 (CET)
- Doch, auch die Metropolregionen werden vom Census Bureau erfasst. Einfach hier auf "All CBSAs" gehen, dann kann man rechts die komplette Liste runterscrollen. Ob diese Daten irgendwo auch so aufbereitet sind, dass man sie auf WD hochladen kann, weiß ich leider nicht. Lohnen würde es sich aber definitiv. LG Stefan 12:10, 20. Jan. 2022 (CET)
Ich habe hier mal die Zensus-Daten abgelegt: Benutzer:Yellowcard/Census 2020 MSA. Finden wir einen Weg, wie wir die ID-Spalte mit Wikidata verlinken? Weiß jemand, was das für eine "ID" ist, die da vom US Census Bureau vergeben wurde, und ob sie (bzw. ein Teil davon) für Wikidata geeignet ist? Es scheint sich um einen FIPS-Code (inzwischen ANSI-Code) zu handeln, dafür benötigen wir vermutlich eine neue Property auf Wikidata, weil FIPS 6-4 (P882) (obwohl ebenfalls sechsstellig) wohl nicht passt. Weiß jemand, wie dieser FIPS-/ANSI-Code heißt, sodass man diese neue Eigenschaft auf Wikidata beantragen kann? Weblinks: OMB Bullentin mit Beschreibung und Codes-Liste, Liste der Codes, Info vom Census Bureau (dort werden die MSAs leider ignoriert). Yellowcard (D.) 11:10, 15. Mär. 2022 (CET)
- Hi Yellowcard, ich habe jetzt auch eine Weile gebraucht, mich gedanklich reinzuarbeiten. Laut diesem Link von Data.gov heißen die Codes, was die MSAa betrifft, jetzt wohl ANSI-Codes und nicht mehr FIPS-Codes. Bei WD lässt sich als Identifikator eine "ANSI/NISO standard ID" eintragen. Ist das nicht das, was wir brauchen? Falls nicht, vielleicht mal beim en:Wikipedia:Reference desk nachfragen oder direkt beim Census Bureau, wie dieser Code genau heißt? Könnte man diesem Identifikator nicht evtl. eine vorläufige Bezeichnung geben und diesen später umbenennen? Ansonsten bin ich leider überfragt, stecke da nicht tief genug drin. LG Stefan 13:12, 15. Mär. 2022 (CET)
- Wir sollten FIPS 6-4 (P882) dafür verwenden. Ich habe die Eigenschaft so angepasst, dass sie nicht mehr nur für Counties anwendbar ist. Ich finde nämlich keine Quelle, die besagt, dass dieser Code nur von Counties verwendet wird - und ich erinnere mich dabei auch an die "zona urbana" in Puerto Rico, das sind ja auch keine Counties sondern teilweise Städte. Ich habe einen entsprechenden Kommentar auf der Disk hinterlassen (Link), mal sehen, ob es da Widerspruch gibt. --Yellowcard (D.) 14:00, 15. Mär. 2022 (CET)
- ... und in die Orte, die zur Metropolregion gehören, sollten wir dann die Eigenschaft liegt in der statistischen Einheit (P8138) einfügen, also beispielsweise so: (Q8652#P8138). In der Infobox könnte man es dann so umsetzen, dass man die Einwohnerzahl aus dem Item zur Metropolregion lädt, wenn ein Ort über die Eigenschaft P8138 auf eine solche verweist. Halte ich für ein schlüssiges, sinnvolles Konzept, mit dem man auch dauerhaft arbeiten kann und die Zahlen dann automatisch laden kann, bedeutet aber jetzt erstmal (wieder) einen gewissen Einmalaufwand. --Yellowcard (D.) 15:40, 15. Mär. 2022 (CET)
- Ok. Die "Orte" sind dann in diesem Fall die sogenannten "Principal Cities" (im Dt. würde man "Oberzentren" sagen). Diese sind ja der Liste zu entnehmen. Dann warten wir noch ein paar Tage ab, ob sich jemand auf der WD-Disk meldet? LG Stefan 16:08, 15. Mär. 2022 (CET)
- ... und in die Orte, die zur Metropolregion gehören, sollten wir dann die Eigenschaft liegt in der statistischen Einheit (P8138) einfügen, also beispielsweise so: (Q8652#P8138). In der Infobox könnte man es dann so umsetzen, dass man die Einwohnerzahl aus dem Item zur Metropolregion lädt, wenn ein Ort über die Eigenschaft P8138 auf eine solche verweist. Halte ich für ein schlüssiges, sinnvolles Konzept, mit dem man auch dauerhaft arbeiten kann und die Zahlen dann automatisch laden kann, bedeutet aber jetzt erstmal (wieder) einen gewissen Einmalaufwand. --Yellowcard (D.) 15:40, 15. Mär. 2022 (CET)
- Wir sollten FIPS 6-4 (P882) dafür verwenden. Ich habe die Eigenschaft so angepasst, dass sie nicht mehr nur für Counties anwendbar ist. Ich finde nämlich keine Quelle, die besagt, dass dieser Code nur von Counties verwendet wird - und ich erinnere mich dabei auch an die "zona urbana" in Puerto Rico, das sind ja auch keine Counties sondern teilweise Städte. Ich habe einen entsprechenden Kommentar auf der Disk hinterlassen (Link), mal sehen, ob es da Widerspruch gibt. --Yellowcard (D.) 14:00, 15. Mär. 2022 (CET)
Angabe der Einwohnerzahl von MSAs in IBs
BearbeitenHallo, ich bitte alle Portaler um Rückmeldung zu diesem Thema. Auch wenn in diesem Portal nicht so arg viel los ist, hoffe ich auf weitere Meinungen, denn ein solcher Schritt ist aus meiner Sicht zu weitgreifend, um ihn einfach so via "Hinterzimmer" :-) umzusetzen. Soll wirklich in der IB zu jedem kleinen Ort die Einwohnerzahl der Metropolregion stehen? Bitte um Rückmeldung auf der verlinkten Disk. LG Stefan 10:59, 16. Mär. 2022 (CET)
- @Dionysos1988: Ich habe mich noch nicht sogenau mit dieser Problematik befaßt. Die grundsätzliche Frage, die sich mir hier stellt ist die danach, ob denn wirklich lückenlos jede Gemeinde einer Metropolregion zugeordnet ist. Ich denke (lasse mich auch vom Gegenteil überzeugen), daß es in Colorado kaum mehr Metropolregionen geben wird als Denver. Ob ein Ort, 500 Meilen weg von Denver, in der äußersten entgegengesetzten Ecke des Bundesstaates zur Metropolregion Denver gehört? Für's nächste Jahrzehnt kann man dann auch in Augenschein nehmen, was wir mit dem μSA machen wollen. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 21:26, 31. Aug. 2023 (CEST)
- Hi Matthiasb, zur Übersicht über alle MSAs siehe die Karte unter Metropolitan Statistical Area sowie diese sortierbare Liste. Ich habe mich seinerzeit mit Yellowcard dahingehend verständigt, dass eine Zuordnung von ausnahmslos jedem Ort zu einer MSA wenig Sinn macht, da viele Orte, wie du ja selbst annimmst, gar keinen zusammenhängenden urbanen Raum bilden, also die Zugehörigkeit zu einer MSA oft nur eine rein statistische Bedeutung hat. Abgesehen davon wäre die notwendige händische Mehrarbeit in WD weit jenseits des Machbaren gewesen. LG Stefan 21:35, 3. Sep. 2023 (CEST)
- Sieht auf den ersten Blick so aus, als würden sich die jeweiligen Gebiete an Countygrenzen halten?! Die Metroregionen umfassen häufig mehrere Countys, die μSA meist nur einzelne Countys, aber wie gesagt, auf den ersten Blick schaut es aus, als ob Countys nicht zerschnitten werden. Behalten wir im Kopf, bis uns was dazu einfällt. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 22:04, 3. Sep. 2023 (CEST)
- Ja, das ist korrekt. Und das führt wie gesagt zu dem Problem, dass z. B. der Ort Yeehaw Junction statistisch gesehen Teil der Region Greater Orlando ist, obwohl er sich im Nirgendwo befindet. Sowas sollte in der IB nicht abgebildet werden. Die Eingrenzung auf die en:Principal city (oder cities) einer jeden MSA war da auf jeden Fall sinnvoller. LG Stefan 13:47, 4. Sep. 2023 (CEST)
- Hm, da bist du dann aber nahe an der Theoriefindung. Die Leute, die sich das mit den Metropolregionen ausdenken, haben sich mutmaßlich etwas sinnvolles dabei gedacht. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 15:44, 4. Sep. 2023 (CEST)
- Mag sein, dass sie sich irgendetwas gedacht haben, aber das widerspricht so eindeutig unserem Verständnis einer "Metropolregion", dass wir das nicht in der Infobox abbilden sollten. Was ja nicht heißt, dass wir diese Zuordnung ignorieren oder gar für falsch erklären (TF), aber wir entscheiden uns bewusst dazu, sie eben nicht flächendeckend abzubilden. Das halte ich nicht für Theoriefindung. --Yellowcard (D.) 16:22, 4. Sep. 2023 (CEST)
- Hm, da bist du dann aber nahe an der Theoriefindung. Die Leute, die sich das mit den Metropolregionen ausdenken, haben sich mutmaßlich etwas sinnvolles dabei gedacht. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 15:44, 4. Sep. 2023 (CEST)
- Ja, das ist korrekt. Und das führt wie gesagt zu dem Problem, dass z. B. der Ort Yeehaw Junction statistisch gesehen Teil der Region Greater Orlando ist, obwohl er sich im Nirgendwo befindet. Sowas sollte in der IB nicht abgebildet werden. Die Eingrenzung auf die en:Principal city (oder cities) einer jeden MSA war da auf jeden Fall sinnvoller. LG Stefan 13:47, 4. Sep. 2023 (CEST)
- Sieht auf den ersten Blick so aus, als würden sich die jeweiligen Gebiete an Countygrenzen halten?! Die Metroregionen umfassen häufig mehrere Countys, die μSA meist nur einzelne Countys, aber wie gesagt, auf den ersten Blick schaut es aus, als ob Countys nicht zerschnitten werden. Behalten wir im Kopf, bis uns was dazu einfällt. --Matthiasb – (CallMyCenter) Wikinews ist nebenan! 22:04, 3. Sep. 2023 (CEST)
- Hi Matthiasb, zur Übersicht über alle MSAs siehe die Karte unter Metropolitan Statistical Area sowie diese sortierbare Liste. Ich habe mich seinerzeit mit Yellowcard dahingehend verständigt, dass eine Zuordnung von ausnahmslos jedem Ort zu einer MSA wenig Sinn macht, da viele Orte, wie du ja selbst annimmst, gar keinen zusammenhängenden urbanen Raum bilden, also die Zugehörigkeit zu einer MSA oft nur eine rein statistische Bedeutung hat. Abgesehen davon wäre die notwendige händische Mehrarbeit in WD weit jenseits des Machbaren gewesen. LG Stefan 21:35, 3. Sep. 2023 (CEST)
Löschungen von P8138 durch Dcflyer
BearbeitenDer User Dcflyer hat in den letzten Tagen in einigen Datensätzen P8138 einfach kommentarlos gelöscht. Ganz speziell in mindestens 17 Datensätzen im Zeitraum 2.09. 21:58 Uhr MESZ bis 3.09. um 6:27 Uhr MESZ. Habe ihn auf seiner WD-Disk darauf angesprochen. Bitte um Beachtung und ggf. Teilnahme an der Diskussion. LG Stefan 20:27, 6. Sep. 2023 (CEST)
- Ich bin hiermit wohl auf der VM-Seite von Wikidata gelandet. Der anklagende Nutzer hat vor 2 Wochen noch erklärt, er würde mir mit der MSA-Geschichte helfen, stattdessen hat er nichts gemacht und mich stattdessen gemeldet. Vielleicht kann ja jemand von euch was zu der Diskussion dort beitragen. @Benutzer:G-41614, @Yellowcard. LG Stefan 18:17, 20. Okt. 2023 (CEST)
Quellen
BearbeitenIn Bainbridge (Georgia) ist mir diese Quelle begegnet. Was soll man davon halten? Als Impressum wird eine deutsche Privatanschrift angegeben. Muss man da nicht befürchten, dass die Quelle irgendwann nicht mehr abrufbar ist? Wenn man in der Volltextsuche nach "citypopulation" sucht, kommen allerdings auch etliche Ergebnisse. LG Stefan 00:40, 20. Jan. 2022 (CET)
- Kann die Seite an sich nicht bewerten, aber es wäre insgesamt wohl aus mehreren Gründen sinnvoller, sich bei solchen statistischen Daten direkt auf die Angebote des US Census Bureau zu beziehen, leider sind die Tools auf deren Website nur so mittelmäßig intuitiv, da ist eine Seite wie die von Dir genannte vermutlich schneller per kurzer Google-Suche auffindbar...
- Kennst Du schon unsere Weblink-Sammlung? Dort haben wir im letzten Jahr mal einiges zusammengestellt. Gerne auch ergänzen mit weiteren brauchbaren Quellen (ist auch eine Memo an mich selbst ...). --Yellowcard (D.) 09:40, 20. Jan. 2022 (CET)
- Danke für den Link, kannte ich noch nicht. Wie soll die Bequellung der via WD zentral verwalteten Daten erfolgen? Reicht da WD selbst als Quelle tatsächlich schon aus? Nach meinem bisherigen Verständnis eigentlich eher nicht? LG Stefan 12:28, 20. Jan. 2022 (CET)
- "Quelle:Wikidata" ist natürlich keine Quellenangabe ;) Jedes einzelne Statement, das ich auf Wikidata hochlade, hat eine konkrete Quellenangabe. Willkürliches Beispiel: (Q66351#P1082), dort auf "eine Fundstelle" klicken, um die Quellenangabe anzeigen zu lassen. Ist es das, was Du meisnt? --Yellowcard (D.) 13:04, 20. Jan. 2022 (CET)
- Danke für den Link, kannte ich noch nicht. Wie soll die Bequellung der via WD zentral verwalteten Daten erfolgen? Reicht da WD selbst als Quelle tatsächlich schon aus? Nach meinem bisherigen Verständnis eigentlich eher nicht? LG Stefan 12:28, 20. Jan. 2022 (CET)
Anzahl der Haushalte
BearbeitenIch stolpere gerade über ein weiteres Problem bzw. eine Unklarheit. Ich habe ja die Anzahl der Haushalte mit der Eigenschaft Anzahl der Haushalte (P1538) gemäß Zensus-Daten (Tabelle H1) nach Wikidata hochgeladen. Allerdings muss man die "Number of households" des US-Zensus wohl eher als "Anzahl der Wohnungen" verstehen, und "number of occupied" wäre dann die richtige Anzahl der Haushalte in dem Sinne, in dem ich sie verstehe.
Sollen wir die Anzahl der "occupied households" auch noch nach Wikidata hochladen, benötigen wir sie? Eigentlich ist das ja sogar die wichtigere Zahl, meine ich. Hat jemand eine Idee, wie man das auf Wikidata abbildet, ohne unbedingt eine neue Eigenschaft zu beantragen? Notfalls wäre auch das eine Möglichkeit, aber ob der Antrag auf "number of occupied households" durchgeht, wenn das eher eine US-Spezialität ist, da bin ich mir nicht sicher ... Was meint ihr? Yellowcard (D.) 10:18, 14. Apr. 2022 (CEST)
- Hi Yellowcard. Schwierige Angelegenheit. Kann so etwas nicht über einen geeigneten Qualifikator abgebildet werden? Beides Mal geht es ja um eine Anzahl von Haushalten. In en:Bal Harbour, Florida heißt es, die durchschnittliche Haushaltsgröße lag 2010 bei 1,73 Personen, obwohl auf 2513 Einwohner satte 2780 Haushalte kamen. Gerade in den Südstaaten sind viele Wohnungen nur teilzeitbewohnt, vgl. en:Snowbird (person). Da es in den USA gleichzeitig keine Meldepflicht gibt, die mit D irgendwie vergleichbar wäre, sind Angaben zu bewohnten Haushalten immer ein Stück weit willkürlich. LG Stefan 11:48, 14. Apr. 2022 (CEST)
- Vielleicht die Statements mit "occupied households" auch unter Anzahl der Haushalte (P1538) hochladen mit dem zusätzlichen Qualifikator betroffener Teil (P518) --> Privathaushalt (Q64590170)? Oder so in der Art? Eine wirklich schöne Lösung will mir derzeit nicht einfallen. --Yellowcard (D.) 15:01, 14. Apr. 2022 (CEST)
- ... und die bestehenden könnte man entsprechend ergänzen um betroffener Teil (P518) --> Wohnung (Q188507). So könnte man diese beiden Zahlen zumindest über ihre Qualifikatoren unterscheiden, auch wenn sie unter derselben Eigenschaft stehen. @Stefan, was hältst Du davon? --Yellowcard (D.) 15:13, 14. Apr. 2022 (CEST)
- Das ist schon ein komplexes Thema. Zuerst müsste mal klar sein, wie der US-Census „Total housholds“. „Occupied housing units“ und „Vacant housing units“ überhaupt definiert. Ab wann ist eine Wohnung occupied oder vacant? Gerade in den schon angesprochenen Südstaaten sind ja nicht nur die Snowbirds aus dem Norden nur temporär in ihren Wohnungen (Häuser oder auch Condos), viele Immobilien sind auch im Besitz von Nicht-Amerikanern, die auch nur begrenzte Zeit dort verbringen. Viele Units werden auch ganzjährig nur zum kurzzeitigen Vermieten angeboten (Ferienhäuser, -wohnungen). In welche Kategorie fallen die? Ein weiterer Punkt: Wie geht der Census mit den Trailor Parks um und wie wird dort gezählt? Fragen über Fragen….. Ich glaube jede absolute Zahl ist da mit sehr viel Vorsicht zu betrachten aber zumindest haben sie die gleiche Datenbasis und sind dadurch zumindest halbwegs untereinander vergleichbar.
- Die Tabelle H1 verstehe ich so::
- Total = Occupied +Vacant
- Wohneinheiten = belegte Wohneinheiten + freie Wohneinheiten
- Die Zahlenwerte sind unabhängig von den darin wohnenden Menschen.
- Households = Anzahl von Personengruppen.
- Damit können nach meinen Verständnis eigentlich nur die Anzahl der Personengruppen gemeint sein, die ständig in einer belegten Wohneinheit leben – also in einer „Occupied housing unit“.
- Gruß --Wikisaar (Diskussion) 17:40, 14. Apr. 2022 (CEST)
- Danke @Wikisaar, das ist sehr erhellend.
- Bloß was bedeutet das für uns? Die "Anzahl der Haushalte", wie man sie intuitiv verstehen würde, wird also vom US Census Bureau gar nicht ermittelt, verstehe ich das richtig? Die "occupied households" kommen dem schon nahe, aber mitunter durchaus mit nicht unrelevanten Doppelzählungen.
- Geben wir uns dann mit den "Anzahl der Wohneinheiten" zufrieden? Und wollen wir die "Anzahl der belegten Wohneinheiten" (occupied) mit aufnehmen? --Yellowcard (D.) 18:23, 14. Apr. 2022 (CEST)
- Hi Yellowcard, es kommt halt drauf an, was wir haben wollen. Geht es darum, aufzuzeigen, wie groß ein durchschnittlicher bewohnter Haushalt ist, müsste der Fokus auf den bewohnten Units sein. Einwohner/Haushaltsanzahl ist die durchschnittliche Größe, was dann quasi jeder für sich ausrechnen kann. Trotzdem ist die Gesamtzahl aller Haushalte ein gewisser Gradmesser für die Größe eines Ortes (auch wenn unklar ist, was eigentlich als Haushalt gezählt wird - aber das sollte nicht unser Problem sein - wir bilden ja nur Fakten ab). Wenn wir beides gleichzeitig abbilden könnten, wäre das wohl die beste Lösung. Wenn man sich entscheiden müsste, wären die bewohnten Einheiten wohl die wichtigeren. Wie man das bei WD umsetzt, überlasse ich dir, da du sicher mehr Durchblick hast. LG Stefan 23:54, 14. Apr. 2022 (CEST)
- Ich habe mir mal in WD den Eintrag bei Clanton (Q79364) angesehen:
- Dort steht: Anzahl der Haushalte: 3.882
- Das deckt sich aber nicht mit den Censusdaten, denn dort steht: Total Households 3.399 (mit Symbol „Personen“)
- Die 3.882 sind dort unter Housing Units – also Wohneinheiten – aufgeführt (davon belegt 3.511 und 371 frei).
- Irgendwas läuft da noch nicht rund…
- Gruß --Wikisaar (Diskussion) 08:30, 16. Apr. 2022 (CEST)
- Welche Zensusdaten nimmst Du denn? Denn genau das meinte ich ja, die von mir verwendeten Daten (die in der Tabelle H1 als "Number of households" angegeben sind) scheinen mir eher die Anzahl der Wohneinheiten zu sein. Auf welche Datenquelle beziehst Du Dich? --Yellowcard (D.) 12:11, 16. Apr. 2022 (CEST)
- Hi Yellowcard, es kommt halt drauf an, was wir haben wollen. Geht es darum, aufzuzeigen, wie groß ein durchschnittlicher bewohnter Haushalt ist, müsste der Fokus auf den bewohnten Units sein. Einwohner/Haushaltsanzahl ist die durchschnittliche Größe, was dann quasi jeder für sich ausrechnen kann. Trotzdem ist die Gesamtzahl aller Haushalte ein gewisser Gradmesser für die Größe eines Ortes (auch wenn unklar ist, was eigentlich als Haushalt gezählt wird - aber das sollte nicht unser Problem sein - wir bilden ja nur Fakten ab). Wenn wir beides gleichzeitig abbilden könnten, wäre das wohl die beste Lösung. Wenn man sich entscheiden müsste, wären die bewohnten Einheiten wohl die wichtigeren. Wie man das bei WD umsetzt, überlasse ich dir, da du sicher mehr Durchblick hast. LG Stefan 23:54, 14. Apr. 2022 (CEST)
- ... und die bestehenden könnte man entsprechend ergänzen um betroffener Teil (P518) --> Wohnung (Q188507). So könnte man diese beiden Zahlen zumindest über ihre Qualifikatoren unterscheiden, auch wenn sie unter derselben Eigenschaft stehen. @Stefan, was hältst Du davon? --Yellowcard (D.) 15:13, 14. Apr. 2022 (CEST)
- Vielleicht die Statements mit "occupied households" auch unter Anzahl der Haushalte (P1538) hochladen mit dem zusätzlichen Qualifikator betroffener Teil (P518) --> Privathaushalt (Q64590170)? Oder so in der Art? Eine wirklich schöne Lösung will mir derzeit nicht einfallen. --Yellowcard (D.) 15:01, 14. Apr. 2022 (CEST)
Die Wohneinheiten siehe hier:https://data.census.gov/cedsci/table?g=1600000US0115136&tid=DECENNIALPL2020.H1 Wikisaar (Diskussion) 13:53, 16. Apr. 2022 (CEST)
Kostenloser Zugang zu Fachliteratur bei „The Wikipedia Library“
BearbeitenLiebes Portal Vereinigte Staaten,
seit 2012 gibt es mit „The Wikipedia Library“ eine Plattform mit kostenlosem und größtenteils direkten Zugang zu einer Vielzahl an digital verfügbaren Inhalten für aktive Community-Mitglieder der Wikimedia-Projekte. Insgesamt sind mehr als eine Million einzelner Aufsätze, Bücher und Zeitschriftenausgaben erreichbar.
Da die Plattform in der deutschsprachigen Wikipedia noch nicht allzu bekannt ist, arbeitet Wikimedia Deutschland seit letztem Jahr im Rahmen der Community-Förderung daran, den Zugang dorthin zu verbessern. Mittlerweile ist die Plattform soweit möglich ins Deutsche übersetzt, es gibt nun deutschsprachige Ansprechpersonen und alle Informationen sind auf einer Projektseite hier in der deutschsprachigen Wikipedia gesammelt.
- Zugang zum Angebot
Ein Großteil der Inhalte steht aktiven Community-Mitgliedern über ein Zugangspaket zu rund 25 Verlagen und Datenbankanbietern wie JSTOR, De Gruyter, Oxford, Cairn, Women Writers Online auch ohne Bewerbung offen. Automatisch zugangsberechtigt sind alle ungesperrten Konten mit mind. 500 Bearbeitungen insgesamt und mind. 10 innerhalb des letzten Monats. Bald wird eine Suchfunktion die Recherche im Zugangspaket noch deutlich vereinfachen. Einige Verlage haben jedoch den Zugang zu ihren Inhalten beschränkt, sodass eine Bewerbung nötig ist. Alle Abläufe werden auf „The Wikipedia Library“ koordiniert und auf der Projektseite näher beschrieben.
- Nützliche Ressourcen für die Arbeit im Portal Vereinigte Staaten
Es lohnt sicherlich allgemein ein Blick auf multidisziplinäre Inhalte (neben zuvor Genannten bspw. auch Cambridge University Press, ProQuest, Taylor & Francis, EBSCO) und in die Online-Zeitschriftenarchiven (NewspaperARCHIVE.com, Newspapers.com; Die Zeit, The Times, The New York Times u. a.). Für einen Überblick über alle Inhalte steht eine für die deutschsprachige Wikipedia angepasste Tabelle zur Verfügung.
Für die konkrete Arbeit hier scheinen uns im Themenfeld Geschichte bspw. American National Biography Online, Adam Matthew, darüber hinaus Foreign Affairs und unzählige ältere US-Zeitschriften auf Newspapers.com besonders nützlich zu sein. Zudem möchten wir auf weitere hilfreiche Links wie den EBSCO-Sonderbereich America: History and Life sowie das JSTOR-Benutzungshandbuch Geschichte, sowie die McFarland Sektionen History, Military History und Interdisciplinary Studies hinweisen.
Du hast eine Idee für eine andere Online-Datenbank, die sich für „The Wikipedia Library“ öffnen sollte? Ergänze auf dieser Seite gern deine Vorschläge. Wikimedia Deutschland versucht, in diesem Jahr weitere deutsch(sprachig)e Verlage für eine Partnerschaft zu gewinnen.
- Bei Rückfragen
Wenn du Fragen haben solltest zur Anmeldung, Benutzung und den verfügbaren Inhalten, schau am besten auf der Projektdiskussionsseite vorbei oder schreib uns eine E-Mail an community wikimedia.de.
Viel Freude bei der Nutzung und viele Grüße von Sandro und Martin von Wikimedia Deutschland 12:34, 11. Mai 2021 (CEST)
Navbox Countys
Bearbeiten- nicht signierter Beitrag von Yellowcard (Diskussion | Beiträge) 17:36, 16. Feb. 2022 (CET)) (
Die meisten Countys haben ja keine Navigationsleiste mit allen Orten etc. Fände das wäre eigentlich wichtig, auch um Lügen etc. zu finden, weile Orte noch fehlen und einfach mehr Übersicht zu haben.
Könnte man da nicht ein Art Projekt/Checklist machen mit allen Countys zum Abhaken, welche Countys schon eine Navbox haben?
LG KatastrophenKommando (Diskussion) 11:31, 8. Aug. 2021 (CEST)
- @KatastrophenKommando: Wäre eine gute Idee, sollte man machen, leider ist das noch offene Arbeitspensum im Bereich Ortsartikel USA so riesig und die Manpower so gering, dass das wohl nur etwas wird, wenn jemand konkret damit loslegt ... Grüße Yellowcard (D.) 10:45, 1. Feb. 2022 (CET)
- Moin, könnten wir dafür vielleicht im WikiProjekt einen Namensraum anlegen wie /Projekt County Navboxen oder so, wo wir dann Leute finden könnten und auch vielleicht eine Übersicht nach Staat anlegen könnten oder so. Lg KatastrophenKommando (Diskussion) 10:48, 1. Feb. 2022 (CET)
- Davon werden das hier auch nicht mehr Beteiligte ... leg mal einfach los, das müsste am "schnellsten" gehen. Die Counties in NH haben alle eine :D Gruß, --G-41614 (Diskussion) 18:57, 1. Feb. 2022 (CET)
- Ja, würde loslegen, aber fände das tatsächlich besser, wenn das strukuriert angegangen werden könnte, könnte ich hier eine Übersicht für mich und andere anlegen? LG KatastrophenKommando (Diskussion) 10:15, 2. Feb. 2022 (CET)
- Hast Du doch? In NH heißen die Dinger derzeit "Gemeinde", aber das ließe sich zur Not ändern. So genau habe ich es bis jetzt nur nicht genommen, und es sind auch nur drei Counties von zehn, wo das so nicht ganz hinhaut, da Twp≠Gemeinde. Gruß, --G-41614 (Diskussion) 21:18, 2. Feb. 2022 (CET)
- Ja, würde loslegen, aber fände das tatsächlich besser, wenn das strukuriert angegangen werden könnte, könnte ich hier eine Übersicht für mich und andere anlegen? LG KatastrophenKommando (Diskussion) 10:15, 2. Feb. 2022 (CET)
- Davon werden das hier auch nicht mehr Beteiligte ... leg mal einfach los, das müsste am "schnellsten" gehen. Die Counties in NH haben alle eine :D Gruß, --G-41614 (Diskussion) 18:57, 1. Feb. 2022 (CET)
- Moin, könnten wir dafür vielleicht im WikiProjekt einen Namensraum anlegen wie /Projekt County Navboxen oder so, wo wir dann Leute finden könnten und auch vielleicht eine Übersicht nach Staat anlegen könnten oder so. Lg KatastrophenKommando (Diskussion) 10:48, 1. Feb. 2022 (CET)
Hallo, ich bitte ganz dringend darum, die Navigationsleisten nicht "Gemeinden in..." zu nennen. Ansonsten müsste man zumindest mal alle CDPs ausklammern, was aber absolut keinen Sinn ergibt. Die Dinger sollten "Orte in..." heißen. LG Stefan 22:31, 15. Feb. 2022 (CET)
Portal-Disk aufräumen?
BearbeitenSo wie ich das sehe, ist das Thema WD-Anbindung jetzt abgeschlossen, oder? Die Census-Daten für Orte, Countys und MSAs wurden auf WD vollständig hochgeladen und erscheinen in den IBs. Ich würde bei dieser Gelegenheit vorschlagen, diese Disk aufzuräumen und die ersten beiden Abschnitte, insbesondere den zweiten Abschnitt ins Archiv zu verschieben, damit es hier ein bisschen aufgeräumter ist. Wenn doch noch irgendein Teil relevant sein sollte, kann man ihn evtl. nochmal hier rein kopieren. LG Stefan 14:00, 3. Apr. 2022 (CEST)
Kartographer ist da – die Kartensaison ist eröffnet!
BearbeitenHallo! Vielleicht habt ihr es schon mitbekommen: Seit Kurzem ist es hierzuwiki möglich, mithilfe der Softwarefunktion Kartographer Artikel mit Karten auszustatten, und das vergleichsweise einfach. Möglicherweise ist das auch für dieses WikiProjekt interessant.
Um das Ausprobieren der neuen Funktion einfacher zu machen, hat das Team Technische Wünsche die Kartensaison ins Leben gerufen:
- Hier finden sich allerhand Beispiele, Informationen und Hilfen zu Kartographer,
- andere interessierte Wikipedianer*innen,
- ein Forum zum Austausch.
- Und man kann sehen, welche Artikel im Zuge der Kartensaison schon Karten erhalten haben.
Habt ihr Lust, die Funktion auszuprobieren? Kennt ihr Artikel, die von Karten profitieren würden? Dann:
Das Team Technische Wünsche freut sich über rege Beteiligung und über Feedback zu Kartographer!
Mehr Infos
Mehr Infos zu dieser Neuerung gibt es auf der Projektseite „Bessere Unterstützung von Geoinformationen“.
― Johanna Strodt (WMDE) (Diskussion) 11:21, 15. Jun. 2022 (CEST)
- Ich kopiere diesen Abschnitt mal hierher vom WikiProjekt Straßen der Vereinigten Staaten, der Einsatz von Kartographer könnte für unsere Artikel durchaus sehr spannend sein. @Johanna Strodt (WMDE): Ich hoffe, das ist okay, dass ich Deinen Beitrag hierher kopiert habe. Viele Grüße, Yellowcard (D.) 14:16, 15. Jun. 2022 (CEST)
Evan Gershkovich
BearbeitenDer Artikel Evan Gershkovich war bereits im ANR und wurde dann, weil angeblich von MuM, in die Artikelwerkstatt verschoben. Der Artikel ist m.M. nach okay. Jeder Benutzer mit Sichterrechten kann ihn prüfen und, wenn ok, zurück in den ANR verschieben. Ich wäre sehr dankbar, wenn dies ein freundlicher Kollege übernehmen könnte, denn der Mann steht in den Schlagzeilen und es droht ihm eine lange Haftstrafe. --2001:4BB8:106:1F22:9420:A7E5:6A53:8521 14:28, 18. Apr. 2023 (CEST)
Umbenennungsantrag Kategorie:US-amerikanischer Tabakwarenhersteller nach Kategorie:Tabakwarenhersteller (Vereinigte Staaten)
Bearbeitenzur Info --Didionline (Diskussion) 21:54, 21. Jun. 2023 (CEST)
Vorlage für den Fließtext
BearbeitenIch will hier jetzt keine Paralleldiskussion starten, und womöglich habe ich es ja verpasst und es ist evtl. schon woanders diskutiert worden, aber ich möchte an dieser Stelle nochmal auf Vorlage Diskussion:Einwohnerzahl Wikidata hinweisen. Danke im Voraus. LG Stefan 12:05, 18. Nov. 2023 (CET)
Bezeichnung „Sportverein“ im Collegesport
BearbeitenSiehe Portal Diskussion:Sport #Bezeichnung „Sportverein“ im Collegesport, Antworten bitte dort. --Olaf Studt (Diskussion) 10:53, 3. Feb. 2024 (CET)
Vorlage der "Navigationsleiste Vorsitzende des Republican National Committee"
BearbeitenMit der Wahl von Lara Trump zur Co-Vorsitzenden des RNC ist da ein Problem aufgetteten. Hat RNC nun zwei oder nur einen Vorsitzenden bzw. wie soll das in der Navi gehandhabt werden? Ich habe auf Vorlage Diskussion:Navigationsleiste Vorsitzende des Republican National Committee eine Diskussion angestoßen und hoffentlich auf Meinungen.--Mit lieben Grüßen Kriddl Bitte schreib mir etwas. 16:38, 27. Mär. 2024 (CET)
Diskussion Navileisten im allgemeinen
BearbeitenZur Info für Engagierte: Hilfe Diskussion:Navigationsleisten#"Sie müssen stets alle Elemente des Bereichs als Link enthalten, auch wenn ein Teil der Seiten (noch) nicht existiert." Gruß, --G-41614 (Diskussion) 11:57, 10. Jun. 2024 (CEST)
"Amerikanisches Generalskonsulat in...."
BearbeitenWieso sind diese Lemmata nach einem Kontinent und nicht wie korrekt (und auch in der WP üblich) als "US-amerikanisches Generalkonsulat in...." bezeichnet? Gruß --Chtrede (Diskussion) 09:11, 11. Okt. 2024 (CEST)
- Es gibt keinen Kontinent, der irgendwo Generalkonsulate unterhalten würde. "US-amerikanisch" ist zwar etwas präziser, im Kontext ist "amerikanisch" aber ebenfalls eindeutig und damit korrekt. Wir schreiben ja auch meist "britisch", was ähnlich unpräzise ist. -- Perrak (Disk) 23:11, 11. Okt. 2024 (CEST)
Wartungsliste für Wahlen
BearbeitenIst erstellt Benutzer:Wartungsstube/Wahl_in_den_Vereinigten_Staaten, wird morgen aktualisiert. Grüße --Timmask mushrooms (Diskussion) 10:53, 5. Nov. 2024 (CET)