Zum Hauptinhalt springen

Repositorien für Forschungsdaten

Einleitung

Repositorien sind Orte, an denen digitale Objekte gespeichert und der Öffentlichkeit oder Datennutzern zur Verfügung gestellt werden. Sie können als das Herzstück des Publizierens und Teilens von Daten angesehen werden, da sie Plattformen für die Speicherung, Kuratierung, Veröffentlichung, Archivierung, Bewahrung und den Zugang zu Daten sind. Preprint-Server können ebenfalls als Repositorien betrachtet werden, wobei diese eher auf wissenschaftliche Artikel als auf Forschungsdaten zugeschnitten sind.

Repositorien können unterschiedlich klassifiziert werden nach:

  • der Art der zu speichernden Objekte (z. B. Publikationen oder Forschungsdaten),
  • dem Bereich der enthaltenen Daten (institutionell, fachspezifisch oder generisch)

Repositorien können auf institutionellen Servern gehostet werden oder werden von breiteren Organisationen oder Konsortien wie NFDI4Chem bereitgestellt. Die Nutzung von Repositorien ist für die Datenablage gemäß den FAIR Data Principles unerlässlich.

Wie funktionieren Repositorien?

Ein Repositorium besteht aus einer Repository-Software und einer Datenbank. Datenanbieter können die Daten in der Regel über eine webbasierte Benutzeroberfläche an das Repositorium übermitteln, oder die Betreiber des Repositoriums sammeln (ernten) die Daten automatisch von anderen Plattformen über geeignete Protokolle und Schnittstellen.

Einige, aber nicht alle, Repositorien kuratieren und prüfen die Daten vor der Eingabe auf ihren Inhalt und ihre Qualität, manchmal auch auf rechtliche Aspekte (Urheberrecht, Datenschutz, Lizenzen).

Um eine Weiterverwendung der Daten durch Dritte zu ermöglichen, werden neben den eigentlichen Daten auch Metadaten benötigt. Sie beschreiben den Inhalt der Forschungsdaten und geben Auskunft über ihre Entstehung, die verwendete Software oder Methoden sowie rechtliche Aspekte. Metadaten können entweder manuell hinzugefügt oder durch andere Anwendungen bereitgestellt werden. Die Metadaten sollten auch Nutzungsbedingungen in Form von Lizenzen enthalten, die den Zugang zu den Daten regeln (Registrierung, Embargo, usw.).

In der Regel bieten Repositorien eine Suchfunktion, mit der Nutzer Daten finden, ansehen und herunterladen können. Um sicherzustellen, dass die Daten dauerhaft referenziert und zitiert werden, vergeben Repositorien eindeutige persistent identifiers (PIDs). Dadurch wird auch die Auffindbarkeit und Zugänglichkeit von Forschungsdaten verbessert.

Repositorien können auch zertifiziert werden (z. B. CoreTrustSeal). Eine solche Zertifizierung garantiert den Datennutzern unter anderem, dass die Daten nutzbar, zitierfähig und langfristig erhalten sind.

Das richtige Repositorium finden

Aufgrund der Vielzahl der vorhandenen Repositorien können sich die Nutzer mit Hilfe eines Registers für Forschungsdaten-Repositorien (z. B. https://fairsharing.org/ oder https://www.re3data.org/) besser orientieren. Repository-Registrierungsdienste sind ein wesentlicher Bestandteil der FAIR Data Principles, da sie Forschenden dabei helfen sollen, sich unter Tausenden von Datenrepository-Diensten zurechtzufinden, um das am besten geeignete Repository für ihre Daten zu finden.

Aufgrund der komplexen Landschaft bestehender Repositorien neigen diese Register jedoch dazu, verwirrend lange Listen bereitzustellen, die die Auswahl eines geeigneten Repositoriums nicht unbedingt erleichtern. Darüber hinaus sollten Forschende die Wiederverwendungsrichtlinie, die gemeinsame Nutzung und Verfügbarkeit von Metadaten, die langfristige Verfügbarkeit von Daten und die öffentliche Zugänglichkeit eines Repositoriums berücksichtigen, was oft nicht offensichtlich oder leicht herauszufinden ist.

Info:

Um die Auswahl eines geeigneten Repositoriums für Forschungsdaten aus der Chemie zu erleichtern, stellt NFDI4Chem eine Liste vertrauenswürdiger, chemie-freundlicher Repositorien in dem Leitfaden zur Verfügung.

Quellen und weitere Informationen

Diese Seite ist lizenziert unter einer Creative Commons Universal (CC0 1.0) Public Domain Dedication International License.

CC0 badge


Hauptbeitragende: ORCID:0000-0002-6243-2840 and ORCID:0000-0003-4480-8661