Text+

Sprach- und textbasierte Forschungsdateninfrastruktur (Geisteswissenschaften)

Text+ [tɛkstˈplʊs] ist ein Konsortium der Nationalen Forschungsdateninfrastruktur (NFDI), das auf Sprach- und Textdaten ausgerichtet ist.

Text+
Logo
Rechtsform Konsortium in Nationale Forschungsdateninfrastruktur (NFDI) e.V.
Gründung 1. Oktober 2021
Sitz Mannheim, Deutschland Deutschland (Koordinaten: 49° 29′ 17,6″ N, 8° 28′ 19,2″ O)
Geschäftsstelle Leibniz-Institut für Deutsche Sprache
Vorläufer CLARIN-D, CLARIAH-DE, DARIAH-DE
Zweck Forschungsdateninfrastruktur für Text- und Sprachdaten
Personen Andreas Witt
Website www.text-plus.org

Beschreibung

Bearbeiten

Text+ macht Angebote rund um (Forschungs-)Daten im Rahmen der NFDI. Dazu untergliedert sich Text+ in die Datendomänen (digitale) Sammlungen (Collections), lexikalische Ressourcen und Editionen.

Der Bereich der Sammlungen (Collections) wird in Text+ verstanden als Zusammenstellungen geschriebener, gesprochener oder gebärdeter Sprache und Texte. Außerdem sind sprach- und textbezogene Experimental- oder Messdaten adressiert, die auf Grundlage wissenschaftlicher Kriterien gesammelt wurden. Dazu gehören Textsammlungen, mono- und multimodale Aufnahmen beispielsweise von spontaner und formaler Sprache, Sensordaten (z. B. Elektroenzephalografie, Eye-Tracking, Elektromagnetische Artikulographie), Befragungen oder Reaktionszeitexperimente.

Unter lexikalischen Ressourcen werden verschiedene Datensätze verstanden, die die Verwendung von Wörtern in Sätzen, Texten und multimodaler Kommunikation beschreiben, darunter: Wörterbuch, Enzyklopädie, Normdaten, Terminologiedatenbank, Ontologie, Wortlisten, Wortkarten und linguistische Atlanten oder Übersetzungswörterbücher (für menschliche oder maschinelle Übersetzung).

In Text+ werden als drittem Datenbereich auch Editionen abgedeckt. Diese sind kritische Repräsentationen historischer Dokumente, die durch eine zuverlässige methodengeleitete Bewahrung, Präsentation und Kommentierung aller Arten von Texten in verschiedenen Sprachen und Schriftsystemen charakterisiert sind.

Neben diesen Daten werden auch Werkzeuge zur Erstellung, Bearbeitung, Analyse und Archivierung in allen Datendomänen bereitgestellt, die in der Regel über gemeinsame Schnittstellen und Datenformate zusammen verwendet werden können.

Der Arbeitsbereich „Infrastructure/Operations“ stellt für die den Betrieb benötigten Basisdienste und Infrastruktur bereit und entwickelt diese zusammen mit den Datendomänen.

Mit den Forschungsdaten und Angeboten richtet sich Text+ vor allem an die universitäre und außeruniversitäre Forschung im Bereich der Linguistik, Literaturwissenschaft, Philologien (einschließlich sogenannter Kleiner Fächer), Philosophie sowie sprach- und textbasierte Forschung in den Sozialwissenschaften und der Politikwissenschaft[1].

Für die Bereiche Sammlungen, lexikalische Ressourcen und Editionen hat Text+ den Anspruch, vorhandene Daten der Partner der Forschung bereitzustellen, aber auch bei Forschungsdatenmanagementaufgaben zu unterstützen. Die Angebote sollen die Forschenden in allen Phasen des Forschungsdatenlebenszyklus unterstützen, insbesondere bei der „FAIRen“[2] Bereitstellung und Nachnutzung von Daten.

Dazu gehören Entwicklung, Bereitstellung und Betrieb von

  • Datenhaltungssystemen für Bestands- und Referenzdaten der Partner zur Nachnutzung durch andere Forschende
  • Datenarchivierungsdienste für Forschende anderer Forschungseinrichtungen
  • Nachweissysteme als Katalog für in Text+ vorhandene Daten, einschließlich persistenter Identifikatoren um Daten zitierbar zu machen
  • Software, um die Daten erstellen, analysieren und auswerten zu können.

Konsortium

Bearbeiten

Antragstellende Einrichtung

Bearbeiten

Mitantragstellende Einrichtungen

Bearbeiten

Weitere beteiligte Institutionen

Bearbeiten

Sonstige Beteiligte und Unterstützende

Bearbeiten

Verschiedene Fachverbände und Fachinformationsdienste der wissenschaftlichen Bibliotheken haben ihre Bereitschaft erklärt, Text+ zu unterstützen und mit dem Konsortium zusammenzuarbeiten.[3] Im Rahmen der Organisationsstruktur sind weitere Forschende auch als Einzelpersonen Teil des Konsortiums.

Geschichte

Bearbeiten

Auch wenn Text+ als Konsortium erst mit der Bewilligung zum 1. Oktober 2021 gebildet wurde, baut es auf vielfältigen Vorarbeiten auf. So bindet Text+ Daten und Dienste von Vorläuferinfrastrukturen wie CLARIN-D, DARIAH-DE sowie dem Projekt zur Zusammenführung von beiden (CLARIAH-DE) ein. Aber auch andere Partner habe bereits langjährige Erfahrungen.

Auf Basis verschiedener Vorarbeiten fand bereits 2018 eine Workshopreihe zu Wissenschaftsgeleiteten Forschungsinfrastrukturen für die Geistes- und Kulturwissenschaften in Deutschland statt,[4] in der über die Angebote und Anforderungen aus Sicht von Anbietenden, Nutzenden und unterschiedlichen Akteuren und Stakeholdern aus Wissenschaft und Politik diskutiert wurde.

Text+ hat mit anderen geisteswissenschaftlichen Konsortien und Initiativen (NFDI4Culture, NFDI4Memory, NFDI4Objects) ein Memorandum of Understanding unterzeichnet, in dem die Zusammenarbeit im Rahmen der NFDI beschrieben wird.[5] Ziel des Memorandum ist, die Zusammenarbeit der geistes- und kulturwissenschaftlichen Konsortien in der NFDI zu definieren, um auf diese Weise den vielfältigen Bedürfnissen der ausdifferenzierten geisteswissenschaftlichen Forschungslandschaft in Fragen des Forschungsdatenmanagements bestmöglich gerecht zu werden.

Einzelnachweise

Bearbeiten
  1. Thorsten Trippel: Mit Text+ Forschungsdaten digital vernetzen - ein Fall für die Sprachwissenschaft? In: Sprachreport. 38. Jahrgang, Nr. 1, 2022, doi:10.14618/sr-1-2022_trip (nbn-resolving.org).
  2. Mark D. Wilkinson, Michel Dumontier et al.: The FAIR Guiding Principles for scientific data management and stewardship. In: Scientific Data. 3. Jahrgang, Nr. 1, Dezember 2016, ISSN 2052-4463, S. 160018, doi:10.1038/sdata.2016.18 (nature.com [abgerufen am 20. Juli 2022]).
  3. "Liste weiterer Partner von Text+". Abgerufen am 21. September 2022.
  4. "Workshopreihe 2018: Wissenschaftsgeleitete Forschungsinfrastrukturen für die Geistes- und Kulturwissenschaften in Deutschland". Abgerufen am 21. September 2022.
  5. Sabine Brünger-Weilandt, Kai-Christian Bruhn, Alexandra W. Busch, Erhard Hinrichs, Gerald Maier, Johannes Paulmann, Andrea Rapp, Philipp von Rummel, Eva Schlotheuber, Dörte Schmidt, Torsten Schrade, Holger Simon, Regine Stein, Elke Teich: Memorandum of Understanding by NFDI Initiatives from the Humanities and Cultural Studies. 2020, abgerufen am 21. September 2022 (10.5281/zenodo.3265762).