Virtual Language Observatory

Metasuchmaschine

Das Virtual Language Observatory (VLO) ist eine Metasuchmaschine für wissenschaftliche Sprachdaten. Die Suchmaschine wird im Kontext des europäischen Forschungsinfrastrukturprojektes CLARIN entwickelt und betrieben. Sie weist derzeit über 1,6 Millionen Einträge nach (Stand: Januar 2018). Die Daten stammen aus den CLARIN-Datenzentren verschiedener Länder, aber auch aus weiteren online zugänglichen Quellen, sofern diese Lizenzen für die freie Nutzung sowie bestimmte Metadatenformate besitzen. Ziel ist es, bereits erhobene Daten/Quellen für weitere Forschung zur Verfügung zu stellen und miteinander kompatibel zu machen.

Suchoptionen

Bearbeiten

Die Suchoberfläche ermöglicht sowohl eine freie Textsuche in den vorhandenen Metadaten, als auch eine Facettensuche. Über die Facetten lassen sich Ressourcen nach den folgenden Kriterien aussuchen, bzw. filtern: Sprache, Sammlung (wie z. B. Europeana Newspapers), Ressourcentyp (wie z. B. Chanson, Chronik, Comedy), Modalität (wie z. B. gesprochene Sprache, Zeichensprache, Gesten, Schrift), Datenformat (wie z. B. text, audio, xml), sowie Stichwort/Schlagwort und Nutzungsbeschränkungen.

Verfügbarkeit

Bearbeiten

Die im VLO nachgewiesenen Daten besitzen bestimmte Lizenzen, die die Bedingungen für eine Nachnutzung regeln. Manche der Ressourcen sind frei zugänglich, andere für die akademische Nutzung freigegeben, für die sich Nutzer mit einer föderierten Identität ihrer Institutionen anmelden können. Einige Daten sind nur nach Einholung einer persönlichen Erlaubnis nutzbar.[1]

Technischer Hintergrund

Bearbeiten

Das Virtual Language Observatory nutzt die in CLARIN entwickelte Component Metadata Infrastructure (CMDI).[2] Existierende Metadaten müssen dahingehend angepasst werden, damit Ressourcen im VLO nachgewiesen werden können.

Bearbeiten

Literatur

Bearbeiten
  • S. Haaf, P. Fankhauser, T. Trippel, K. Eckart, T. Eckart, H. Hedeland, A. Herold, J. Knappen, F. Schiel, J. Stegmann, D. V. Uytvanck: CLARIN's Virtual Language Observatory (VLO) under scrutiny -- The VLO taskforce of the CLARIN-D centres. In: CLARIN Annual Conference, Soesterberg, Netherlands. 2014. (clarin.eu, PDF)
  • D. Van Uytvanck, H. Stehouwer, L. Lampen: Semantic metadata mapping in practice: The Virtual Language Observatory. In: N. Calzolari (Hrsg.): Proceedings of LREC 2012: 8th International Conference on Language Resources and Evaluation. European Language Resources Association (ELRA) 2012, S. 1029–1034. (lrec-conf.org)

Einzelnachweise

Bearbeiten
  1. Vgl. Erläuterungen zur Verfügbarkeit auf den VLO-Hilfeseiten (auf Englisch)
  2. D. Broeder u. a.: CMDI: a Component Metadata Infrastructure. In: V. Arranz u. a. (Hrsg.): Proceedings of the LREC 2012 Workshop Describing Language Resources with Metadata: Towards Flexibility and Interoperability in the Documentation of Language Resources. Istanbul 2012, S. 1–4. (clarin.eu, PDF). Vgl. auch Einführung in Component Metadata auf der europäischen CLARIN-Webseite (auf Englisch)clarin.eu