Zum Hauptinhalt springen

Für Infrastruktur-Anbieter

Metadaten sollten Teil eines Datensatzes sein

Standard

Forschungsdatenrespositorien sollten die Metadaten in durch Forschende heruntergeladene Datensätze oder mit anderen Resourcen ausgetauschten Datensätzen einschließen.

Während Forschende ihre Daten hochladen und publizieren, werden Metadaten hinzugefügt. Bei generischen, multidisziplinären Repositorien werden zusätzliche Metadaten von den Forschern über einen Metadaten-Editor bereitgestellt. Bei fachspezifische Repositorien werden die Metadaten aus den Analysedaten extrahiert und/oder von den Forschenden entlang ihrer Arbeitsabläufe und Dokumentationspraxis im Labor bereitgestellt, wie dies bei Chemotion ELN der Fall ist. Sobald die Daten aus einem Repositorium abgerufen werden, sollten diese Metadaten nicht verloren gehen, sondern in das heruntergeladene Paket aufgenommen werden. Als Minimum sind die beschreibenden DataCite-Metadaten anzufügen.

[BagIt] (https://www.rfc-editor.org/rfc/rfc8493.html), eine Reihe von hierarchischen Dateisystemkonventionen, ist eine Lösung, um eine zuverlässige Dateiübertragung zu ermöglichen und Metadaten in heruntergeladene Datensätze aufzunehmen, wie dies bei RADAR bereits der Fall ist.

Strukturierte fachspezifische Metadaten sollten Teil eines Datensatzes sein

Standard

Forschungsdatenrepositorien sollten strukturierte, fachspezifische Metadaten in Datensätze einschließen, die von Forschenden heruntergeladen und/oder mit anderen Ressourcen ausgetauscht werden.

Neben den Metadaten, die generischen Schemata wie dem von DataCite folgen, sollten auch fachspezifische Metadaten Teil jedes Datensatzes sein. Diese Metadaten sollten auch in Datensätzen enthalten sein, die von Forschenden zur Wiederverwendung heruntergeladen oder mit anderen Ressourcen ausgetauscht werden.

Eine Lösung für dieses Problem ist die Einbindung von Schema.org-Metadaten unter Verwendung von [RO-Crate] (https://www.researchobject.org/) oder sogar eine [Kombination von RO-Crate und BagIt] (https://www.researchobject.org/ro-crate/specification/1.1/appendix/implementation-notes.html#adding-ro-crate-to-bagit). Während BagIt sich auf die zuverlässige Übertragung konzentriert, ist RO-Crate auf umfangreiche Metadaten fokussiert.

Sammlungs-DOIs

Standard

Forschungsdatenrepositorien sollten eine Sammlungs-DOI bereitstellen, um Forschungsdatenobjekte, die für einen einzelnen zu veröffentlichenden Artikel relevant sind, zusammenzufassen.

Fachspezifische Forschungsdatenrepositorien stellen DOIs bereit, um auf einzelne chemische Reaktionen, Moleküle und deren analytische Daten verweisen zu können. Generische, multidisziplinäre Forschungsdatenrepositories bieten DOIs für einen ganzen veröffentlichten Datensatz, während mehr als ein veröffentlichter Datensatz für die in einem Artikel veröffentlichten Studienergebnisse zugrunde liegen kann. Mit anderen Worten: Viele DOIs können für einen veröffentlichten Artikel relevant sein, während eine Datenverfügbarkeitserklärung einige DOIs, aber nicht viele DOIs enthalten kann. Um die Einreichung von Manuskripten und die Veröffentlichung von Artikeln zu erleichtern, sollte jedes Repositorium den Autorinnen und Autoren die Möglichkeit bieten, eine Sammlungs-DOI zu generieren, die mehrere relevante Datensätze zusammenfasst und auf die in der Erklärung zur Datenverfügbarkeit verwiesen werden kann.

Embargofrist und Zugänglichkeit der Metadaten

Standard

Daten von Datensätze, die mit einer Sperrfrist veröffentlicht werden, sollten unzugängliche sein, während die Metadaten verfügbar sein sollten.

Während eine Embargofrist den Zugang zu einem veröffentlichten Datensatz einschränkt, sollten die Metadaten zugänglich sein - Veröffentlichung mit Embargo. So können relevante Informationen über den Datensatz abgerufen werden und ermöglichen FAIR (A2), wobei den Autorinnen und Autoren die Erstrechte an den Daten garantiert werden. Auffindbare und zugängliche Metadaten sind erforderlich, um Artikel und Datensätze zu verknüpfen, da DOIs für Datensätze durch wissenschaftliche Verlage validiert werden müssen, bevor der Metadatensatz von Artikeln aktualisiert wird.

Scholix.org

Standard

Forschungsdaten-Repositorien sollten zu Scholix.org beitragen und es nutzen.

Scholix bietet den Rahmen für die Verbesserung der Verbindungen zwischen wissenschaftlicher Literatur und Forschungsdaten sowie zwischen Daten und Daten mit dem Ziel, einen High-Level-Interoperabilitätsrahmen für den Austausch von Informationen über diese Verbindungen bereitzustellen. So steuern Scholix-Hubs wie DataCite oder OpenAire Informationen über ihre Metadatensätze bei, die Informationen über verbundene digitale Objekte enthalten. Diese Informationen werden von akademischen Verlagen genutzt, um Datensätze zu finden, die zu einem Artikel korrespondieren, aber erst nach der Veröffentlichung des Artikels publiziert wurden, so dass die Metadaten des Artikels mit Links zu den Datensätzen aktualisiert werden können. Auch Repositorien sollten Scholix.org nutzen, um verwandte Datensätze zu finden und Links zu den in ihrer eigenen Infrastruktur veröffentlichten Datensätzen zu setzen, indem sie die Metadaten solcher Datensätze mit verwandten Identifikatoren aktualisieren.

Datensätze unter Begutachtung

Standard

Forschungsdatenrepositorien sollten Zugang zu Datensätzen gewähren, die im Status unter Begutachtung sind.

Um Datensätze in den Begutachtungsprozess von Manuskripten einzubeziehen, sollten die Repositorien den Begutachtenden Zugang gewähren. Es wird nachdrücklich empfohlen, dass Repositorien neben den Status Entwurf und Veröffentlicht auch den Status in Begutachtung erlauben. Ein in Begutachtung befindlicher Datensatz sollte nicht bearbeitbar, aber über eine URL zugänglich sein, während die DOI noch nicht registriert und auffindbar sein muss und die DOI-Metadaten noch nicht zugänglich sind, da der Datensatz noch nicht veröffentlicht wurde. Solchen Datensätzen, die sich in Begutachtung befinden, kann eine (intern) reservierte DOI zugewiesen werden.

Zugang der Gutachtenden zu Datensätzen in Begutachtung

Standard

URLs für den Zugang zu Datensätzen in Begutachtung sollten die Zugangsdaten codiert in der URL enthalten.

Link für Begutachtende zu Datensätze unter Begutachtung sollten die Zugangsdaten in der URL kodiert enthalten, anstatt separat Login und Passwort weiterleiten zu müssen. Damit entfällt die Notwendigkeit, den Begutachtenden diese Informationen über das Einreichungssystem oder den Brief an den Redakture zukommen zu lassen, was sich bereits als fehleranfällig erwiesen hat.

Publisher und PublisherIdentifier in DataCite-Metadaten

Standard

Forschungsdatenrepositorien sollten den Namen des Repositoriums als "publisher" sowie einen "publisherIdentifier" in den DataCite-Metadaten eines Datensatzes angeben.

DOI-Präfixe sind spezifisch für jeden Registranten. Da jeder Registrant mehr als ein Repository betreiben kann, ist das Präfix nicht unbedingt spezifisch für ein einzelnes Repositorium. Wie in der DataCite-Dokumentation zum Feld publisher angegeben, wird das erforderliche Feld "publisher" zur Formulierung der Zitierung der Daten verwendet und sollte daher der Name des Repositoriums enthalten. Darüber hinaus sollte eine Identifikator für das Repositorium wie der re3data-Identifikator angegeben werden, um das Repositorium eindeutig zu identifizieren. Beide Felder sollten automatisch vom Repositorium befüllt werden und von Einreichenden nicht bearbeitet werden können.

Im Falle von RADAR4Chem würde die Beziehung wie folgt beschrieben werden:

Herausgeber: RADAR4Chem

publisherIdentifier: http://doi.org/10.17616/R31NJNAY

publisherIdentifierScheme: re3data

schemeURI: https://re3data.org/

In XML:

<publisher xml:lang="en" publisherIdentifier="http://doi.org/10.17616/R31NJNAY" publisherIdentifierScheme="re3data" schemeURI="https://re3data.org/">RADAR4Chem</publisher>

Dadurch wird sichergestellt, dass sowohl Menschen als auch Maschinen nachvollziehen und interpretieren können, wo die Daten veröffentlicht wurden.

Korrekturen und Aktualisierungen von Metadaten

Standard

*Forschungsdatenspeicher sollten es Forschern ermöglichen, die Metadaten von Datensätzen zu korrigieren und zu aktualisieren.

Da das Hinzufügen von Metadaten über einen Metadaten-Editor fehleranfällig sein kann, sollten die Autorinnen und Autoren die Möglichkeit haben, die PID-Metadaten sowie alle anderen Metadaten zu korrigieren und zu aktualisieren. Für eine vollständige Transparenz sollten die Metadaten versioniert werden. Die landing page sollte den Betrachtenden mitteilen, dass Änderungen an den Metadaten vorgenommen wurden. Die Aktualisierung von Metadaten trägt zu FAIR (F2) bei, indem sie die Reichhaltigkeit der Metadaten erhöht und es den Erstellenden ermöglicht, zusätzliche verwandte Identifikatoren für kürzlich veröffentlichte verwandte Datensätze und Artikel hinzuzufügen.

Rechtliche Fragen zu Inhaltszusammenfassungen von Datensätzen

Standard

Forschungsdatenrepositorien sollten Autorinnen, Autoren, Datenkuratorinnen und Datenkuratoren über mögliche Rechtekonflikte für das Feld "Abstract" in den DataCite-Metadaten der Datensätze informieren.

Datensätze sollten ihre eigene Inhaltszusammenfassung erhalten. Das Kopieren der entsprechenden Artikelzusammenfassung kann zu einem Rechtskonflikt mit dem jeweiligen wissenschaftlichen Verlag führen. Dies ist insbesondere im deutschen Recht der Fall. Autorinnen, Autoren, Datenkuratorinnen und Datenkuratoren sollten über diesen Konflikt informiert werden, z. B. durch einen Tooltip beim Hinzufügen von Metadaten mit einem Metadaten-Editor.

Gruppieren von Lizenzen

Standard

In Forschungsdatenrepositorien sollten die Lizenzen in Gruppen für Forschungsdatenlizenzen und Softwarelizenzen unterteilt werden.

Repositorien neigen oft dazu, verwirrend lange Listen von Lizenzen anzubieten. Außerdem unterscheiden sich die Lizenzen für Datensätze und Software. Die Gruppierung erleichtert den Autorinnen und Autoren die Auswahl erheblich.

Ermutigung Creative-Commons-Lizenzen zu nutzen

Standard

Forschungsdatenrepositorien sollten Forschende ermutigen, sich für eine Creative-Commons-Lizenz zu entscheiden, um die Lizenzlandschaft und ihre Wahl zu vereinfachen.

In Übereinstimmung mit der Gruppierung von Lizenzen für Software oder Datensätzen erleichtert der Hinweis auf die Auswahl einer Creative-Commons (CC)-Lizenz den Auswahlprozess. Bei der Veröffentlichung von Forschungsdaten werden Creative-Commons-Lizenzen, die nicht restriktiver als CC BY sind, dringend empfohlen.

Förderung der am wenigsten restriktiven Creative-Commons-Lizenzen

Standard

Forschungsdatenrepositorien sollten Lizenzen wie CC0 oder CC BY vorschlagen, indem sie eine solche Lizenz vorauswählen, anstatt restriktivere Lizenzen wie CC BY-SA oder sogar CC BY-NC-ND, die die Wiederverwendung behindern können.

Veröffentlichte Daten sollten so offen wie möglich und so geschlossen wie nötig sein, damit andere Forschende die Daten wiederverwenden und darauf aufbauen können. Daher sollten eher offene Lizenzen wie CC0 und CC BY gefördert werden, im Gegensatz zu restriktiveren Lizenzen wie CC BY-SA oder sogar CC BY-NC-ND. Solche restriktiven Lizenzen können die Wiederverwendung von Daten erschweren.

Creators and Contributors

Standard

Forschungsdatenrepositorien sollten Felder für Creators in ihrem (DataCite-)Metadaten-Editor als Author/Creator bezeichnen.

Forschende sind es gewohnt, von Autorinnen und Autoren zu sprechen, wenn es um die Veröffentlichung von Ergebnissen bei einem der wissenschaftlichen Verlage geht. DataCite hingegen unterscheidet zwischen Creators und Contributors, wobei letzteren auch eine Rolle zugewiesen wird. Um Verwirrung bei Forschenden, die ihre Daten veröffentlichen wollen, zu vermeiden, sollten die Repositorien den Forschenden beim Hinzufügen von Metadaten helfen, indem sie das Feld für Creator in ihren (DataCite-)Metadaten-Editoren als Author/Creator kennzeichnen.


Hauptbeitragende: ORCID:0000-0003-4480-8661, ORCID: 0000-0002-6243-2840