Dokumentation der Daten
Nur weil Sie Ihre Daten "offen" machen, sind sie noch lange nicht nutzbar. Die Benutzerfreundlichkeit ergibt sich daraus, dass andere Personen Ihre Daten sinnvoll nutzen können: Die Qualität Ihrer Dateinamen, Ihrer Ordnerstruktur und Ihrer Dokumentation trägt wesentlich zum Grad der Wiederverwendbarkeit Ihrer Daten bei. Es ist weder schwierig noch zeitaufwändig, Ihre Daten so zu pflegen, dass andere Forscher sie untersuchen und erforschen können.
Andreas von der Dunk, Technische Universität Dresden, Service Center Forschungsdaten_
Allgemeine Grundlagen
Eine saubere und nachvollziehbare Organisation von Daten und Dokumenten ist ein wichtiger Bestandteil guter Forschungspraxis und ein wichtiger Schritt, um Forschungsdatenmanagement nach den FAIR Datenprinzipien zu realisieren.
Eine wesentliche Aufgabe ist es, die Organisation und Speicherung von Daten, Metadaten und Dokumenten im Vorfeld zu planen und die entsprechenden Maßnahmen zu dokumentieren.
Zentrale Anforderungen sind die Festlegung von formalen Zuständigkeiten, organisatorischen Konventionen und technischen Implementierungen zur Organisation der anfallenden Daten und Metainformationen. Die zu diesem Zweck gesammelten Informationen werden im Datenmanagementplan festgehalten. Beachten Sie, dass eine gute Datenorganisation in der frühen Anwendungsphase auch die Kosten abschätzt (siehe z.B. Kalkulationswerkzeug und Checkliste).
Formale Verantwortlichkeiten und organisatorische Konventionen
Um es kurz zu machen: Es geht vor allem darum, zu beschreiben, wer und wie mit den Dokumenten arbeiten soll. Erste Schritte könnten darin bestehen:
- Dokumentieren der Verantwortlichkeiten von Primärforschern und Projektmitarbeitern.
- Erstellen von Benutzerrollen: Festlegung detaillierter Rechte für Benutzer/Gruppen/Rollen für den Zugriff auf Daten und sensible Informationen.
- Beschreibung von Qualitätssicherungsprozessen, einschließlich geschützter Speicherung, Weitergabe und Zugänglichkeit auf kurze und lange Sicht.
- Datenverarbeitung: Wie, wo, wie schnell. Beschreiben Sie Eingabe- und Ausgabedaten. Entscheiden Sie, wie Sie Dateien und Ordner benennen und strukturieren wollen.
Das Ergebnis sollten beschreibende Dokumente sein, die für Dateien, die im Arbeitsalltag verwendet werden, eindeutig festlegen:
- mit welchem Status (z.B. Originaldatei, temporäre Arbeitsdatei; Entwurf, Zwischenversion, Endversion),
- wo (Arbeitsplatz-PC, zentraler Dateiserver, Datenbank),
- wie lange (temporär, Projektdauer, langfristige Verfügbarkeit),
- und in welchem Format sie gespeichert werden.
Technische Implementierungen
Verschaffen Sie sich einen Überblick über die anfallenden Daten- und Dokumentenflüsse. Eine kurze, für jeden Benutzer leicht verständliche Beschreibung sollte auf niedrigem Niveau zugänglich sein und die wichtigsten Konzepte erklären. Die Daten selbst müssen eine kugelsichere Datenorganisation einschließlich Metadaten und geeignete Datenformatstandards haben. Informieren Sie sich über die üblichen Best Practice an Ihrem Institut oder innerhalb Ihrer Disziplin. Planen Sie, wie Dokumente zwischen Projektmitarbeitern ausgetauscht werden können und was für die Datenveröffentlichung mit PIDs zugänglich gemacht werden muss.
Die Datensicherheit betrifft alle technischen und organisatorischen Aspekte zum Schutz der Daten vor Veränderung, Verlust und Zerstörung. In diesem Zusammenhang müssen Speichermethoden, Sicherungsverfahren, notwendige physische Ressourcen sowie automatisierte und administrative Routinen geplant und eingerichtet werden. Erkundigen Sie sich bei lokalen Ansprechpartnern oder externen Experten nach bereits etablierten Technologien zur Datenspeicherung und -archivierung sowie nach geeigneten Repositorien.
Synopse
Eine gute Datendokumentation entsteht nicht über Nacht - gehen Sie zunächst in kleinen Schritten vor. Die Dokumentation von Forschungsdaten ist in erster Linie ein organisatorisches Problem, das durch technische Maßnahmen begleitet und unterstützt wird:
- Erfassung des Status quo:
- Welche organisatorischen Abläufe wurden bisher genutzt und welche Technologien unterstützen sie?
- Wo liegen die rechtlichen und technischen Grenzen?
- Welche persönlichen Rollen sind betroffen?
- Welche Geräte oder Dateiformate werden oder wurden verwendet?
- Gibt es besondere Merkmale?
- Sensibilisierung: Wer produziert (Meta-)Daten, und wer nutzt die Daten wie weiter?
- Definieren Sie interne Regeln und Prozesse: Was sind die Ziele von FDM, und wie können sie erreicht werden?
- Regeln anwenden und bewerten, iterativ: Lernen, festlegen, befolgen, wiederholen. Keep it simple and smart (KISS).
- Entwickeln Sie eine geeignete Technologie: Bestimmen Sie in der ersten Projektphase die spezifischen Anforderungen und passen Sie diese kontinuierlich an die sich ändernden Bedingungen an.
- Unterstützende Technologie etablieren: Software wie ELN und Repositorien evaluieren und testen, Personal schulen.
- Holen Sie rechtlichen Rat ein, beziehen Sie lokale und übergeordnete Richtlinien und Verfahren ein: Wenden Sie sich an die Rechtsabteilung Ihrer Einrichtung oder an die NFDI Querschnittssektion "Ethik und Recht"
- Machen Sie Regeln und Entscheidungen frühzeitig für alle zugänglich, z. B. in Form eines kurzen Handouts.
- Überprüfen Sie das Konzept regelmäßig und aktualisieren Sie es bei Bedarf.
Quellen und weitere Informationen
- https://rdmkit.elixir-europe.org/metadata_management.html
- https://www.data.cam.ac.uk/data-management-guide/organising-your-data
- https://rfii.de/en/topics/
- https://datascience.codata.org/articles/10.5334/dsj-2020-032/
- Deutsch: "Was Forschende wollen - Bericht aus der Beratungspraxis zum Forschungsdatenmanagement"
- Deutsch: https://www.researchgate.net/publication/221657547_Handbuch_Forschungsdatenmanagement
- Deutsch: https://www.degruyter.com/document/doi/10.1515/9783110657807/html?lang=en
- Deutsch: https://handbuch.tib.eu/w/Lehrbuch_Forschungsdatenmanagement/_Druckversion