FAIR Data, das „FAIR“-Prinzip im Forschungsdatenmanagement:

Die FAIR-Prinzipien sollen ein nachhaltiges Forschungsdatenmanagement (FDM) sichern, indem Daten und ihre zugehörigen Metadaten so aufbereitet und gespeichert werden, dass sie von anderen nachgenutzt werden können.

Die Daten sollen Findable, Accessible, Interoperable, Reusable sein, also (wieder-)auffindbar, zugänglich, interoperabel und wiederverwendbar werden.

Interoperabel bedeutet in diesem Zusammenhang: Kombinierbar mit anderen Datensätzen, austauschfähig, zur gemeinsamen Bearbeitung und Auswertung durch mehrere verschiedenen Nutzer geeignet, verzahnt.

Gute wissenschaftliche Praxis.

Nachprüfbarkeit von Forschungsergebnissen.

„FAIR“ sind Daten, die den Grundsätzen der Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit entsprechen.[1]

Eine FAIRe Datenhaltung bedeutet nicht unbedingt Open Data. Zum Beispiel aus rechtlichen Gründen können nicht alle Daten veröffentlicht werden. Einschränkungen des Zugriffs sind mit den FAIR-Prinzipien vereinbar, solange die Bedingungen und Wege zum Zugang ersichtlich sind.[1]

Die Abkürzung FAIR und die ihr zugrundeliegenden Grundsätze des Datenmanagements wurden im März 2016 von einem Konsortium aus Wissenschaftlern und Organisationen in der Zeitschrift Scientific Data definiert.[1]

Die FAIR-Prinzipien betonen die maschinelle Verarbeitbarkeit, d. h. die Fähigkeit von Computersystemen, Daten ohne oder mit nur minimalen menschlichen Eingriffen zu finden, darauf zuzugreifen, zu interagieren und sie wiederzuverwenden, da der Mensch aufgrund des zunehmenden Volumens, der Komplexität und der Erstellungsgeschwindigkeit von Daten zunehmend auf Computerunterstützung angewiesen ist, um mit Daten umzugehen.[2]

Die Abkürzung FAIR/O-Daten wird manchmal verwendet, um darauf hinzuweisen, dass der betreffende Datensatz oder die betreffende Datenbank den FAIR-Grundsätzen entspricht und außerdem eine explizite datenfähige offene Lizenz trägt.

Auffindbar

Der erste Schritt bei der (Wieder-)Verwendung von Daten besteht darin, sie zu finden. Metadaten und Daten sollten sowohl für Menschen als auch für Computer leicht zu finden sein. Maschinenlesbare Metadaten sind für das automatische Auffinden von Datensätzen und Diensten unerlässlich und daher ein wesentlicher Bestandteil des FAIRification-Prozesses.

F1. (Meta-)Daten erhalten einen weltweit eindeutigen und dauerhaften Identifikator

F2. Daten werden mit umfangreichen Metadaten beschrieben (definiert durch R1 unten)

F3. Metadaten enthalten eindeutig und explizit den Identifikator der Daten, die sie beschreiben

F4. (Meta-)Daten sind in einer durchsuchbaren Ressource registriert oder indiziert

Zugänglich

Sobald der Nutzer die gewünschten Daten gefunden hat, muss er wissen, wie er auf sie zugreifen kann, möglicherweise einschließlich Authentifizierung und Autorisierung.

A1. (Meta-)Daten sind über ihren Identifikator unter Verwendung eines standardisierten Kommunikationsprotokolls abrufbar

A1.1 Das Protokoll ist offen, frei und universell implementierbar

A1.2 Das Protokoll ermöglicht ein Authentifizierungs- und Autorisierungsverfahren, falls erforderlich

A2. Die Metadaten sind zugänglich, auch wenn die Daten nicht mehr verfügbar sind.

Interoperabel

Die Daten müssen in der Regel mit anderen Daten integriert werden. Darüber hinaus müssen die Daten mit Anwendungen oder Arbeitsabläufen zur Analyse, Speicherung und Verarbeitung interoperabel sein.

I1. (Meta-)Daten verwenden eine formale, zugängliche, gemeinsame und breit anwendbare Sprache zur Wissensdarstellung.

I2. (Meta-)Daten verwenden Vokabulare, die den FAIR-Grundsätzen entsprechen.

I3. (Meta)daten enthalten qualifizierte Verweise auf andere (Meta)daten

Wiederverwendbar

Das oberste Ziel von FAIR ist die Optimierung der Wiederverwendung von Daten. Um dies zu erreichen, sollten Metadaten und Daten gut beschrieben sein, damit sie in verschiedenen Umgebungen repliziert und/oder kombiniert werden können.

R1. Meta(daten) sind reichhaltig beschrieben mit einer Vielzahl von genauen und relevanten Attributen

R1.1. (Meta)daten werden mit einer klaren und zugänglichen Datennutzungslizenz freigegeben

R1.2. (Meta)daten sind mit einer detaillierten Provenienz verbunden

R1.3. (Meta)daten entsprechen den für den Bereich relevanten Gemeinschaftsstandards

Die Grundsätze beziehen sich auf drei Arten von Einheiten: Daten (oder jedes digitale Objekt), Metadaten (Informationen über dieses digitale Objekt) und Infrastruktur. So legt beispielsweise der Grundsatz F4 fest, dass sowohl Metadaten als auch Daten in einer durchsuchbaren Ressource (der Infrastrukturkomponente) registriert oder indiziert werden. - GO FAIR, FAIR-Prinzipien, https://www.go-fair.org/fair-principles/

Akzeptanz und Umsetzung der FAIR-Datengrundsätze

Bearbeiten

Vor FAIR war ein Papier aus dem Jahr 2007 das früheste Papier, in dem ähnliche Ideen im Zusammenhang mit der Zugänglichkeit von Daten erörtert wurden.[3]

Auf dem G20-Gipfel in Hangzhou 2016 gaben die Staats- und Regierungschefs der G20 eine Erklärung ab, in der sie die Anwendung der FAIR-Grundsätze auf die Forschung befürworteten.[4][5]

Im Jahr 2016 erarbeitete eine Gruppe australischer Organisationen eine Erklärung über den FAIR-Zugang zu australischen Forschungsergebnissen, die darauf abzielt, die Grundsätze auf Forschungsergebnisse im Allgemeinen auszuweiten.[6]

Im Jahr 2017 vereinbarten Deutschland, die Niederlande und Frankreich die Einrichtung[7] eines internationalen Büros zur Unterstützung der FAIR-Initiative, des GO FAIR International Support and Coordination Office.

Andere internationale Organisationen, die im Ökosystem der Forschungsdaten aktiv sind, wie CODATA oder Research Data Alliance (RDA), unterstützen ebenfalls die Umsetzung von FAIR durch ihre Gemeinschaften. Die Bewertung der Umsetzung der FAIR-Grundsätze wird von der FAIR Data Maturity Model Working Group der RDA untersucht,[8] das strategische dekadische Programm von CODATA "Data for Planet: Making data work for cross-domain challenges"[9] werden FAIR-Datengrundsätze als grundlegende Voraussetzung für datengestützte Wissenschaft genannt. Leitfaden "Implementing FAIR Data Principles - The Role of Libraries", ein Leitfaden

Die Association of European Research Libraries empfiehlt die Anwendung der FAIR-Prinzipien[10].

In einem Papier von Befürwortern von FAIR-Daten aus dem Jahr 2017 wird berichtet, dass das Bewusstsein für das FAIR-Konzept unter verschiedenen Forschern und Instituten zunimmt, aber auch das Verständnis des Konzepts verwirrt wird, da verschiedene Personen ihre eigenen unterschiedlichen Perspektiven darauf anwenden.[11]

In Leitfäden zur Umsetzung von FAIR-Datenpraktiken heißt es, dass die Kosten für einen Datenmanagementplan, der den FAIR-Datenpraktiken entspricht, 5 % des gesamten Forschungsbudgets betragen sollten[12].

Im Jahr 2019 veröffentlichte die Global Indigenous Data Alliance (GIDA) die CARE-Prinzipien für indigene Datenverwaltung als ergänzenden Leitfaden[13]. Die CARE-Prinzipien erweitern die in FAIR-Daten dargelegten Grundsätze um kollektiven Nutzen, Kontrollbefugnis, Verantwortung und Ethik, um sicherzustellen, dass Datenrichtlinien historische Kontexte und Machtgefälle berücksichtigen. Die CARE-Prinzipien für die Governance indigener Daten wurden auf der von der International Data Week und der Research Data Alliance Plenary gemeinsam ausgerichteten Veranstaltung "Indigenous Data Sovereignty Principles for the Governance of Indigenous Data Workshop" am 8. November 2018 in Gaborone, Botswana, formuliert.

Der Mangel an Informationen darüber, wie die Leitlinien umzusetzen sind, hat zu uneinheitlichen Auslegungen der Leitlinien geführt.[14]

Im Januar 2020 erarbeiteten Vertreter von neun Hochschulgruppen aus der ganzen Welt die Sorbonne-Erklärung zu den Rechten an Forschungsdaten,[15] die eine Verpflichtung zu FAIR-Daten enthält und die Regierungen auffordert, Unterstützung zu leisten, um dies zu ermöglichen.[16]

Rohstoffe

Bearbeiten

In der englischsprachigen Wikipedia gibt es einen Eintrag zum »FAIR«-Prinzip im Forschungsdatenmanagement: https://en.wikipedia.org/wiki/FAIR_data

++ ++ ++

Die FAIR-Prinzipien, besagen, dass Forschungsdaten auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und wiederverwendbar (re-usable) sein sollen. Sie bilden die Grundlage für eine disziplinen- und länderübergreifende Nachnutzung der Daten. Dabei beziehen sich die FAIR-Prinzipien auf alle digitalen Daten, die im Zuge wissenschaftlicher Vorhaben entstehen, das heißt sowohl qualitative und quantitative Forschungsdaten als auch Metadaten oder Algorithmen, Werkzeuge und Software.

Daten, die die FAIR-Prinzipien erfüllen, können – müssen aber nicht – Open Data und somit für jedermann verfügbar sein. Die FAIR-Prinzipien erlauben auch eine Einschränkung des Datenzugangs, die in gewissen Fällen sinnvoll oder sogar erforderlich ist. Anders herum gilt: Wenn Open Data gut dokumentiert und maschinenlesbar sind, eine offene Lizenz haben, herstellerunabhängige Formate und offene Standards verwendet, entsprechen sie auch dem FAIR-Konzept.

Quelle: https://www.tuwien.at/forschung/fti-support/forschungsdaten/forschungsdatenmanagement/fair-prinzipien

++ ++ ++

Geprägt wurde der Begriff FAIR von der FORCE 11-Community, die auch die Definition der Begriffe erarbeitet hat. Die FAIR-Prinzipien wurden von der Europäischen Kommission 2017 in den Förderrichtlinien EU Horizon 2020 aufgenommen und sind bei einem Antrag dieser Förderlinie verpflichtend. Das Motto lautet dabei: „As open as possible, as closed as necessary.“ Auch die NFDI hat sich die „Etablierung eines Forschungsdatenmanagements nach den FAIR-Prinzipien“ auf die Fahne geschrieben.

Warum die Umsetzung der FAIR-Prinzipien vorteilhaft ist

  • Auffindbarkeit von Datensätzen nimmt zu.
  • Sichtbarkeit steigt bei einer leichten Auffindbarkeit und Zugänglichkeit von Datensätzen.
  • Forschung wird effizienter, da doppelte Erhebungen oder Mehrfacharbeit vermieden werden.
  • Forschungsergebnisse werden nachvollziehbarer, wenn die Daten zu einer Publikation mitveröffentlicht werden.
  • Neue Forschungsfragen entstehen, beispielsweise aus den Erkenntnissen einer vorherigen Studie und dem dazugehörigen Datensatz.
  • Zusammenarbeit wird erleichtert – sowohl im Forschungsprojekt als auch weltweit.

Zusammengefasst machen die FAIR-Prinzipien Forschung und Forschungsergebnisse transparenter und effizienter. So steigt z. B. die Qualität der Daten durch Rückmeldungen von Forscherkolleginnen und –kollegen und kostspielige Doppelerhebungen werden bestenfalls vermieden.

Quelle: https://www.forschungsdaten.info/themen/veroeffentlichen-und-archivieren/faire-daten/

++ ++ ++

  1. https://www.ruhr-uni-bochum.de/researchdata/de/fair_data.html