Linked Open Data

Linked Data verfügbar unter einer offenen Lizenz

Linked Open Data (LOD) bezeichnet im World Wide Web frei verfügbare Daten, die per Uniform Resource Identifier (URI) identifiziert sind und darüber direkt per HTTP abgerufen werden können und ebenfalls per URI auf andere Daten verweisen. Auch die Semantik und Verknüpfung der kodierten Datenpunkte ist über Technologien wie das Resource Description Framework (RDF) und darauf aufbauende Standards wie die Web Ontology Language (OWL) und die Abfragesprache SPARQL maschinell les- und verarbeitbar.

Wolke mit 1255 miteinander vernetzten Datensätzen und ihren Relationen untereinander
Übersicht über bekannte, verlinkte LOD-Bestände (Stand 2020)

Linked Open Data folgt damit den Prinzipien des Semantic Web. Die miteinander verknüpften Daten ergeben ein weltweites Netz, das auch als „Linked [Open] Data Cloud“, „Giant Global Graph“ oder „Knowledge Graph“ bezeichnet wird.[1][2][3] Dort, wo der Schwerpunkt weniger auf der freien Nutzbarkeit der Daten wie bei freien Inhalten liegt (Open Data), ist auch die Bezeichnung Linked Data üblich.

Idee offener vernetzter Daten

Bearbeiten

Offene vernetzte Daten sind sämtliche Datenbestände, die im Interesse der Allgemeinheit der Gesellschaft ohne jedwede Einschränkung zur freien Nutzung, zur Weiterverbreitung und zur freien Weiterverwendung frei zugänglich gemacht und über das World Wide Web miteinander vernetzt sind.[4] Ein Beispiel für einen Standard unter der Nutzung dieser Prinzipien ist Akoma Ntoso, auf dessen Grundlage in Deutschland offene, maschinenlesbare, vernetzte und adressierbare Rechtsetzungs- und Parlamentsdokumente veröffentlicht werden sollen.[5]

Grundkonzept

Bearbeiten

Während das WWW ein Netz aus Webseiten ist, soll mit Linked Open Data ein Netz aus Daten entstehen, die aus verschiedenen Quellen zusammen automatisch weiterverwendet werden können (Informationsintegration). Das Konzept von Linked Open Data geht im Wesentlichen auf Tim Berners Lee zurück, der auch Ende 2007 die Bezeichnung „Giant Global Graph“ (GGG) vorschlug.[2][1] Er prägte vier Regeln für Linked Data:[6]

  1. Use URIs as names for things
  2. Use HTTP URIs so that people can look up those names.
  3. When someone looks up a URI, provide useful information, using the standards (RDF, SPARQL)[7]
  4. Include links to other URIs, so that they can discover more things.
  1. Verwende URIs zur Bezeichnung von Objekten.
  2. Verwende HTTP-URIs, so dass sich die Bezeichnungen nachschlagen lassen.
  3. Stelle zweckdienliche Informationen bereit, wenn jemand eine URI nachschlägt (mittels der Standards RDF und SPARQL).
  4. Zu diesen Informationen gehören insbesondere Links auf andere URIs, über die weitere Objekte entdeckt werden können.

Eine populäre Darstellung der Linked Open Data Cloud wurde im Oktober 2007 erstellt und seitdem mehrmals aktualisiert.[8] Sie enthält beispielsweise die Datenbestände von DBpedia und GeoNames.

Siehe auch

Bearbeiten
Bearbeiten

Einzelnachweise

Bearbeiten
  1. a b Paul Miller: Who is afraid of the GGG? (Memento vom 1. Dezember 2007 im Internet Archive) In: Nodalities Blog, 26. November 2007.
  2. a b Tim Berners-Lee: Giant Global Graph | Decentralized Information Group (DIG) Breadcrumbs. Decentralized Information Group, 21. November 2007, archiviert vom Original am 13. Juli 2016; abgerufen am 8. Juni 2023 (englisch).
  3. What is a Knowledge Graph? In: Ontotext. Abgerufen am 8. Juni 2023 (amerikanisches Englisch).
  4. Jörn von Lucke, Christian P. Geiger: Open Data Government. Frei verfügbare Daten des öffentlichen Sektors. (PDF; 500 kB) In: Zeppelin University. 3. Dezember 2010, S. 4, archiviert vom Original (nicht mehr online verfügbar) am 14. Dezember 2010; abgerufen am 29. Juni 2019.
  5. Amelie Flatt, Arne Langner, Olof Leps: Model-Driven Development of Akoma Ntoso Application Profiles. Hrsg.: Springer Nature. 1. Auflage. Springer Nature, Heidelberg 2022, ISBN 978-3-03114131-7 (springer.com [abgerufen am 19. August 2022]).
  6. Linked Data – Design Issues. In: w3.org, abgerufen am 29. Juni 2019.
  7. Der Nachsatz „using the standards (RDF, SPARQL)“ wurde erst später eingeführt, siehe Version vom 15. November 2006.
  8. Richard Cyganiak, Anja Jentzsch: The Linked Open Data Cloud. Oktober 2007 bis September 2011.