Zum Hauptinhalt springen

Wie man das richtige Repositorium auswählt

Einführung in unsere Empfehlungen

Das Konsortium für Chemie (NFDI4Chem) im NFDI hat sich zum Ziel gesetzt, die Mitglieder der Gemeinschaft (Datenproduzenten und -nutzer) bei der Sammlung, Speicherung, Verarbeitung, Analyse, Offenlegung und Wiederverwendung von Forschungsdaten zu unterstützen, indem es einen Verbund von Repositorien einrichtet. Mit dem Ziel, die wichtigsten Repositorien zu identifizieren, die Teil des Verbunds sind und über Entwicklungspotenzial verfügen, wählte das TA3-Team in seinem Vorschlag die folgenden Kriterien aus:

  • Das Repositorium ist für die Hinterlegung von molekülbezogenen Daten geeignet
  • Das Repositorium enthält wiederverwendbare Daten oder Funktionen (z. B. Viewer, Editoren oder Analysewerkzeuge), die den Bedürfnissen der NFDI4Chem-Gemeinschaft entsprechen
  • Die Software des Repositoriums ist quelloffen
  • Die Betreiber der Repositorien haben sich bereit erklärt, ihre Dienste an die von NFDI4Chem entwickelten Standards sowie die FAIR Data Principles anzupassen
  • Die Betreiber der Repositorien können gemäß den Förderrichtlinien der NFDI finanziert werden (d.h. der Hauptbetreiber hat seinen Sitz in Deutschland und ist eine Non-Profit-Organisation)

Die Repositorien, die die oben genannten Kriterien erfüllen, werden in der folgenden Liste als Kernrepositorien ausgewiesen. Falls nicht alle Kriterien erfüllt sind, werden sie als assoziierte oder relevante Repositorien aufgeführt:

Hinweis:

Fachspezifische Repositorien sollten die erste Wahl sein, da diese Repositorien die FAIRness der Daten im Auftrag der Forschenden verbessern. Um das gleiche Maß an FAIRness zu erhalten, ist bei der Veröffentlichung von Daten in generischen Repositorien eine manuelle FAIRifizierung erforderlich.

Assoziierte Repositorien

  • Chemotion Repositorium
    Feldspezifisches proben- und reaktionszentriertes Repository mit Analysedaten wie NMR-, IR- und Massendaten.
  • MassBank EU
    Feldspezifisches Ökosystem von Datenbanken und Werkzeugen für Massenspektrometrie-Referenzspektren.
  • RADAR4Chem
    Generisches, bereichsübergreifendes Repository, das ein kostenloses und zuverlässiges Zuhause für alle chemischen Forschungsdaten bietet, die nicht den Spezifikationen fachspezifischer Repositorien entsprechen.
  • Enzymkinetikdaten (derzeit keine) STRENDA DB
  • SUPRABANK
    Feldspezifisches Repository für Daten über intermolekulare Wechselwirkungen.

Andere relevante Repositorien

  • Cambridge Structural Database
    Vom Cambridge Crystallographic Data Centre (CCDC) betriebenes feldspezifisches Repository für Röntgenbeugungsdaten von Molekülen, die im Allgemeinen mindestens Kohlenstoff und Wasserstoff enthalten.
  • Inorganic Crystal Structure Database
    Feldspezifisches Repository für Röntgenbeugungsdaten von anorganischen Verbindungen, Elementen, Mineralien und intermetallischen Verbindungen, betrieben von FIZ Karlsruhe.
  • CSD, ICSD und gemeinsamer CCDC/FIZ Dienst für Zugriffsstrukturen

Andere relevante Repositorien

  • NOMAD
    Feldspezifisches Repository für materialwissenschaftliche Daten.
  • ioChem-BD
    Fachspezifisches Repository für computergestützte Chemie.
  • RADAR
    Generisches, multidisziplinäres Archiv für Forschungsdaten.
  • Zenodo
    Generisches Repository, das im Rahmen des europäischen OpenAIRE-Programms entwickelt und vom CERN betrieben wird.
  • EUDAT B2SHARE
    Generisches Repository, das von einem paneuropäischen Netz aus mehr als 25 Forschungseinrichtungen, Daten- und Rechenzentren betrieben wird.

Weitere Repositorien (derzeit im Aufbau):

  • nmrXiv (NMR-Daten)
  • VibSpecDB (Raman- und IR-Spektren)

Darüber hinaus unterstützt das Konsortium weitere Datenbanken und Repositorien in Fragen der Interoperabilität und ermutigt sie, sich an der Entwicklung von NFDI4Chem Standards und Schnittstellen zu beteiligen.

Hinweis:

Diese Listen werden laufend mit weiteren Empfehlungen für vertrauenswürdige und chemiefreundliche Repositorien aktualisiert. Wir haben kürzlich eine Analyse der Repositorienlandschaft in der Chemie in re3data und Kriterien für Chemie-Repositorien veröffentlicht. Wir werden die Liste der Repositorien im ersten Schritt weiter aktualisieren und diese Seite nach und nach aktualisieren.

Weitere Einzelheiten zu den oben aufgeführten Repositories finden Sie in den folgenden Abschnitten.

Mapping Matrix Daten-Repositorium

Dank der Ergebnisse der Umfrage des NFDI4Chem-Konsortiums (im Jahr 2020) und der vom TA3-Team durchgeführten Interviews mit den Leitern der Repositorien konnte eine Liste der in dieser Gemeinschaft am häufigsten verwendeten Datentypen und -formate erstellt werden, die in Tabelle 1 aufgeführt ist. Tabelle 1 zeigt, welche Datentypen in der Chemiegemeinschaft am häufigsten gesammelt werden, und gibt Hinweise darauf, welches Repositorium sich am besten für die Speicherung Ihres spezifischen Datentyps eignet. Tabelle 1 ist auch in der folgenden Abbildung zu sehen:

Die Empfehlungen in Tabelle 1 helfen Ihnen bei der effizienten und schnellen Auswahl des besten Repositorys für die Speicherung Ihrer Daten. Die Auswahl der am besten geeigneten Datenbank kann sich erheblich auf die Auffindbarkeit und Zitierfähigkeit der Daten sowie auf die Sichtbarkeit des Wissenschaftlers auswirken.

Tabelle 1: Datentypen und -formate in der NFDI4Chem-Gemeinschaft.

DatentypDatenformatVorgeschlagenes RepositoriumKriterien für die Auswahl
Magnetische KernresonanzBruker-Format (zip), jcamp-dxChemotionBestehen der Basiskontrollen, Kuration
Magnetische KernresonanzNuclear Magnetic Resonance (Bruker-Format), JOEL-Format NMReData, nmrML, ISA JSON nmrXivChemotion RepositoriumValidierungen / Mindeststandards für die Berichterstattung über Informationen
Moleküle und ihre Eigenschaften, Identifizierung, Reaktionen und experimentelle UntersuchungenAkzeptierte Datentypen: Massenspektrometrie: jcamp-dx, MzMl, MzXML (offen, visualisierbar und bearbeitbar), RAW für ausgewählte Massendaten (bearbeitet und konvertiert in JCAMP-dx), NMR: Bruker-Format (zip) und jcamp-dx, IR und Raman: jcamp-dx, XRD: jcamp-dx, UV-VIS: jcamp-dx, Zyklische Voltammetrie: jcamd-dx. *Chemotion repo bietet die Möglichkeit, Daten aus verschiedenen Dateiformaten in JCAMP-DX zu konvertieren.ChemotionBestehen der Basiskontrollen, Kuration
KernspinresonanzAnorganische Kristallstrukturen: Crystallographic Information File (CIF)ICSDKristallstrukturdaten verfügbar
Organische und metall-organische KristallstrukturenOrganische und metallorganische Kristallstrukturen: Crystallographic Information File (CIF), aber auch andere unterstützende Dateiformate werden akzeptiert.CSDMassBank EUZellparameter (Einkristall), vollständige Koordinaten (Pulver), im CIF-Format
Organische, anorganische und metall-organische KristallstrukturdatenOrganische, anorganische und metallorganische Kristallstrukturdaten, in erster Linie Crystallographic Information File (CIF), aber auch andere unterstützende Dateiformate werden akzeptiert joint CCDC/FIZ Access Structures ServiceDGemeinsamer CCDC/FIZ-Zugangsstrukturservice Kurzstatistiken:Mindestens eine CIF-Datei muss in der Einreichung enthalten sein und Strukturfaktordaten für alle Strukturen sollten (wenn möglich) bereitgestellt werden
Simulation50 unterstützte CodesNOMADSimulationsdaten Erkennung beim Upload
Generische Daten aus allen Disziplinen der Chemie, alle Daten, die nicht in die disziplinären Repositorien passen, formatunabhängigRADAR4ChemformatunabhängigRADAR4ChemValidierung gegen MD-Schema
Daten zur Enzymkinetikderzeit keineSTRENDA DBKeine; STRENDA-konforme, begutachtete Datenpublikation
Intermolekulare und supramolekulare Wechselwirkungen von molekularen SystemenJSON (DataCite), CDX* (für 2D/3D-Molekülstruktur), PNG, proprietäre FormateSUPRABANKUnbeurteilte Plausibilität

Zusammenfassung der Repositorien

Der folgende Abschnitt enthält eine Zusammenfassung der Ergebnisse unserer Umfrage und der Gespräche mit den Endlagerbetreibern, einschließlich der wichtigsten Informationen zu den einzelnen Endlagern.

Chemotion - Repositorium für Moleküle und Forschungsdaten

Quick Stats:

  • Moleküle und ihre Eigenschaften, Identifizierung, Reaktionen und experimentelle Untersuchungen Massenspektrometrie: jcamp-dx, MzMl, MzXML (offen, visualisierbar und verarbeitbar), RAW für ausgewählte Massendatenarten (verarbeitet und konvertiert in JCAMP-dx), IR und Raman: jcamp-dx, XRD: jcamp-dx, UV-VIS: jcamp-dx, Zyklische Voltammetrie: jcamd-dx. *Das Repositorium von Chemotion bietet die Möglichkeit, Daten aus verschiedenen Dateiformaten in jcamp-dx zu konvertieren.(https://www.chemotion-repository.net/welcome)
  • Verwendete Standards/Ontologien: DataCite Metadata Schema, InChI, SMILES, molfile V2000 und V3000 CHMO Ontology, RXNO Ontology
  • Zugangsrechte/Lizenzinformationen/Embargo: CC0, CCBY, CCBY-SA; Embargo für Public Domain möglich (unbegrenzt)
  • Empfehlung von Fachzeitschriften/Gesellschaften: noch nicht
Klicken Sie, um mehr Details über Chemotion zu erfahren!

Chemotion - Repositorium für Moleküle und Forschungsdaten

Das Chemotion Repositorium umfasst Forschungsdaten, die Molekülen, deren Eigenschaften und Charakterisierung sowie Reaktionen und experimentellen Untersuchungen zugeordnet sind. Es wird am Karlsruher Institut für Technologie (KIT) gehostet und von mehreren Gruppen in Deutschland und darüber hinaus genutzt. Wissenschaftler im Bereich der molekularen und synthetischen Chemie werden in ihrem Bemühen um einen FAIRen Umgang mit Daten unterstützt: Die Daten werden entsprechend der gängigen Praxis der Wissenschaftler, die Molekülen und Reaktionen zugeordnet sind, gespeichert und das System stellt die erforderlichen Digital Object Identifier (DOIs) ohne zusätzlichen Aufwand für den Wissenschaftler bereit. Die vorgegebenen Metadaten werden durch die Implementierung von Ontologiebegriffen unterstützt. Die Suchmöglichkeiten nach Text, Struktur und Identifikatoren sorgen für die Auffindbarkeit der Daten, und die eingereichten Proben und ihre Struktur werden in PubChem referenziert, um eine höhere Sichtbarkeit der Arbeit für die Wissenschaftler zu erreichen. The Repositorium ist interoperabel mit dem Chemotion ELN, was bedeutet, dass die Daten vom ELN zum Repositorium übertragen werden können. Die Daten werden von automatisch überprüft und einem Peer-Review-Verfahren kuratiert. Die Einbindung der im Repositorium gespeicherten Daten in Veröffentlichungen wurde anhand mehrerer Beispiele gezeigt, und seine Verwendung wird derzeit von Chemiemethoden empfohlen. Authors can be referenced by their ORCID iDs. Chemiker und Materialwissenschaftler können Daten für den offenen Zugang (Datenansicht) und den registrierten Zugang (Datensatzbeitrag und Download) veröffentlichen. Die gespeicherten Daten können nach chemischer Struktur, Autor, Datensatztyp, Status, Identifikator und DOI durchsucht werden. Die aktuelle AAI-Lösung basiert auf einer internen Benutzerverwaltung (Administrator, anonymer und registrierter Benutzer, Kurator). Metadata according to DataCite is compliant with the Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) scheme. Das Chemotion Repositorium bietet ein internes Stoffregister, einen Spektrenbetrachter (ChemSpectra), einen Struktureditor (Ketcher) und einen eigenen Datenkonverter.

Bitte beachten Sie: Das Chemotion Repositorium akzeptiert alle Datentypen, aber nur wenige davon können in den Viewern verarbeitet und bearbeitet werden.

MassBank EU - Hochwertige Massenspektraldatenbank

Quick Stats:

Details

Click to expand for more details about MassBank EU!

MassBank EU - High Quality Mass Spectral Reference Database

MassBank EU is a field-specific repository and the first public repository of mass spectral reference data for sharing them among the scientific research community. Their target user groups in the domains of chemistry and life sciences are analytical chemists, metabolomics, biochemists, and bioinformaticians. Datasets from community users and projects are openly accessible and represent the official database of the

Mass Spectroscopy Society of Japan

. GitHub is used as their current AAI environment (open read access, limited write access), whereas GitHub issues serves as their curation tracking system. The curation itself is performed by the MassBank record validator . The datasets can be searched for compound and mass spectrometry information and peaks. MassBank Record ID (Accession) and USI (Universal Spectrum Identifier) are used as persistent identifier systems. The MassBank EU spectral data is hosted in a revision control system with all spectral data and the corresponding metadata in a human-readable record format, and continuous integration (CI) checking record integrity for each change. Instances of the web interface are hosted at Helmholtz Centre for Environmental Research (UFZ) (Leipzig) and Leibniz Institute of Plant Biochemistry (IPB) (Halle) and can be installed locally as well. They offer interfaces for data import via Git (MassBank record format) and for data export (JSON-LD) and a REST API. On top of that RMassBank is provided as a separated data processing/analysis tool.

RADAR4Chem - Forschungsdaten Repositorium

Quick Stats:

  • Akzeptierte Datentypen: Alle Datentypen/Formate (Formatempfehlungen vorhanden)
  • Verwendete Standards/Ontologien: RADAR Metadata Schema (basierend auf DataCite Metadata Schema 4.0), Dublin Core, schema.org
  • Zugangsrechte/Lizenzinformationen/Embargo: Bedingungen für Datenanbieter und Datennutzer, obligatorische Lizenzen für Datensätze (z. B. Creative Commons), Embargofrist (1-12 Monate)
  • Empfohlen von Zeitschriften/Gesellschaften: noch nicht
Click to expand for more details about RADAR4Chem!

RADAR4Chem - Research Data Repository

RADAR4Chem is a generic repository for the publication of research data from all disciplines of chemistry. Es wurde 2022 eingerichtet und wird bei FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur gehostet. Radar4Chem basiert auf dem etablierten Forschungsdaten-Repositorium RADAR Cloud. RADAR Cloud wird vor allem von akademischen Einrichtungen für das institutionelle Forschungsdatenmanagement (Datenarchivierung und -publikation) genutzt. Die Nutzung von RADAR Cloud ist kostenpflichtig und bedarf einer vertraglichen Vereinbarung. RADAR4Chem, hingegen, richtet sich ausschließlich an Forscher im Bereich der Chemie an öffentlich geförderten Forschungseinrichtungen und Hochschulen in Deutschland. Es ist kein Vertrag erforderlich und es werden keine Gebühren erhoben. RADAR4Chem ermöglicht die disziplin- und formatunabhängige Veröffentlichung und Speicherung (mindestens 25 Jahre) von Forschungsdaten aus allen Disziplinen der Chemie. It serves as a catch-all repository, which complements the already existing portfolio of discipline specific repositories and is e.g. ideally suited for cross-disciplinary data or datasets with a multitude of different data formats. RADAR4Chem ist einfach und niedrigschwellig zu nutzen. Die Forscher sind für das Hochladen, Organisieren, Annotieren und Kuratieren der Forschungsdaten sowie für den Peer-Review-Prozess (als optionaler Schritt) und schließlich deren Veröffentlichung verantwortlich. Using the service requires advising from FIZ Karlsruhe, registration to RADAR4Chem, and consent to the RADAR4Chem licence and usage instructions. Authentication is supported after self-registration and via DFN-AAI (Shibboleth). Metadata are recorded using the internal RADAR Metadata Schema (based on DataCite Metadata Schema 4.0), which supports 10 mandatory and 13 optional metadata fields. Anmerkungen können auf der Ebene des Datensatzes und auf der Ebene der einzelnen Dateien und Ordner gemacht werden. A user licence which indicates re-use rules for the data, must be defined for each dataset. Each published dataset receives a DOI which is registered with DataCite. RADAR Metadaten verwenden eine Kombination aus kontrollierten Listen und Freitexteinträgen. Author identification is ensured by ORCID iD and funder identification by CrossRef Open Funder Registry (more interfacing options will be implemented in the future). Datensätze können über einen "related identifier" leicht mit anderen digitalen Ressourcen (z. B. Textpublikationen) verknüpft werden. To maximise data dissemination and discoverability, the metadata of published datasets are indexed in various formats (e.g. RADAR and DataCite) and offered for public metadata harvesting e.g. via an OAI-provider. Die Forschungsdaten werden dauerhaft auf Magnetbändern redundant in drei Kopien an verschiedenen Standorten im Steinbuch Centre for Computing (SCC) des Karlsruher Instituts für Technologie (KIT, 2 Kopien) und im Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH) der TU Dresden (1 Kopie) gespeichert.

Bitte beachten Sie: Die kostenlose Nutzung von RADAR4Chem ist derzeit auf ein maximales Speichervolumen von 10 GB pro Forschungsprojekt beschränkt. Researchers from the NFDI4Chem community whose research data volume exceeds this free quota and are interested in using RADAR functions institution-wide or in archiving research data, can stipulate a regular RADAR Cloud contract.

RADAR soll den Zugang zu und die langfristige Verfügbarkeit von archivierten und publizierten Datensätzen nach den FAIR-Kriterien sicherstellen. Deshalb ist RADAR als generische Infrastrukturkomponente in mehreren NFDI-Konsortien vorgesehen (z. B. NFDI4Culture neben NFDI4Chem). Zum Zweck der Interoperabilität berücksichtigt es die von NFDI empfohlenen Datentypen und unterstützt schrittweise disziplinspezifische Metadaten.

STRENDA DB - Standards für die Berichterstattung über enzymologische Daten

Quick Stats:

Details

Click to expand for more details about STRENDA DB!

STRENDA DB - Repository for Reporting Enzymology Data

STRENDA DB is a field-specific repository for enzymology data operated since 2016 and hosted at Beilstein Institute (BI) Frankfurt. It ensures that datasets are complete and valid before scientists submit them as part of a publication. Their target audience is biochemists, systems biologists, biocatalysts in the fields of life sciences, biological, molecular, and food chemists. The typical data contained in this repository consists of functional enzymology data (kinetic and experimental data) from manuscripts and publications. Data entered in the STRENDA DB are automatically checked (according to STRENDA Guidelines and a PDF fact sheet with submittable input data), allowing users to receive notifications for necessary but missing information. Currently, more than

55 international biochemistry journals

already include the STRENDA guidelines in their instructions for authors. DOI is used as the identification system for citations and ORCID iD as the identification system for authors. Data viewing is possible via open access and data contribution is possible after a required registration where the current AAI is provided through an internal user administration (user, administrator).

SupraBank

Quick Stats:

  • Akzeptierte Datentypen: JSON (DataCite), CDX (für 2D/3D-Molekülstruktur), PNG, proprietäre Formate
  • Verwendete Standards/Ontologien: DataCite 4.0, Dublin Core für Metadaten-Tags
  • Zugriffsrechte/Lizenzinformationen/Embargo: Nutzungsbestimmungen, kein Embargo
  • Empfohlen von Fachzeitschriften/Gesellschaften: in Arbeit
Click to expand for more details about SupraBank!

SupraBank

SupraBank is hosted at KIT (Karlsruhe) since 2019 and is a curated database that provides project data on intermolecular interactions of molecular systems and supramolecular interactions which are not available in other repositories or databases. SupraBank richtet sich vor allem an supramolekulare und physikalische Chemiker oder Biologen im Bereich der organischen Chemie, die sich mit Bindungs-, Aufbau- und Wechselwirkungsphänomenen beschäftigen. Molekulare Eigenschaften werden von PubChem abgerufen, was die Korrelation von Parametern intermolekularer Wechselwirkungen mit den molekularen Eigenschaften der interagierenden Komponenten ermöglicht. Alle Moleküle, Lösungsmittel und Zusatzstoffe können anhand ihrer chemischen Bezeichnungen gesucht werden. Gegenwärtig sind in der Suprabank mehr als 3500 kuratierte Datensätze mit Parametern intermolekularer Wechselwirkungen gespeichert. Die Daten sind frei zugänglich und können von registrierten Nutzern heruntergeladen und eingesehen werden. Sie können nach Experimenten und verwandten Komponenten, Molekülwechselwirkungen und Veröffentlichungen durchsucht werden, wobei die Kuratierung durch nicht wertende Plausibilitätsprüfungen erfolgt. Die derzeitige Implementierung von AAI besteht aus einer internen Benutzerverwaltung (anonymer und nicht-anonymer Benutzer, Datenanbieter, Administrator). DOI wird als Identifikationssystem für Zitate und ORCID iD als Identifikationssystem für Autoren verwendet. Die Weboberfläche bietet Dateiformatkompatibilität mit CSV, JSON, BibTex, RIS und Endnote und die Tool-Suite enthält Moleküldarstellungen in Form von Bildern, einen Struktureditor und ein Simulationsmodellierungswerkzeug.

CSD, ICSD und gemeinsamer CCDC/FIZ Dienst für Zugangsstrukturen

Quick Stats:

ICSD quick stats:

  • Akzeptierte Datentypen: CIF
  • Verwendete Standards/Ontologien: Keine
  • Zugangsrechte/Lizenzinformationen/Embargo: CC-Lizenzen (CC0, BY, BY-SA), Embargo möglich (unbegrenzt)
  • Recommended by Journals/Societies: List of the 80 most important journals covered by ICSD

CSD quick stats:

  • Akzeptierte Datentypen: hauptsächlich CIF, aber auch andere unterstützende Dateiformate werden akzeptiert
  • Verwendete Standards/Ontologien: CIF, DataCite
  • Zugriffsrechte/Lizenzinformationen/Embargo: Nutzungsbedingungen, Datenembargo, bis ein zugehöriger Artikel veröffentlicht wird oder ein Forscher die Veröffentlichung veranlasst
  • Empfohlen von Fachzeitschriften/Gesellschaften: IUCr, Royal Society of Chemistry, American Chemical Society, Wiley, Elsevier, Springer Nature, Taylor & Francis, Hindawi, Chemical Society of Japan

Joint CCDC/FIZ Access Structures Service quick stats:

  • Akzeptierte Datentypen: hauptsächlich CIF, aber auch andere unterstützende Dateiformate werden akzeptiert.
  • Verwendete Standards/Ontologien: CIF, DataCite
  • Zugriffsrechte/Lizenzinformationen/Embargo: Nutzungsbedingungen, Daten unter Embargo, bis ein zugehöriger Artikel veröffentlicht wird oder der Forscher die Veröffentlichung auslöst
  • Recommended by Journals/Societies: IUCr, Royal Society of Chemistry, American Chemical Society, Wiley, Elsevier, Springer Nature, Taylor & Francis, Hindawi, Chemical Society of Japan
Click to expand for more details about CSD, ICSD and joint CCDC/FIZ Access Structures Service!

CSD, ICSD and joint CCDC/FIZ Access Structures Service

The Inorganic Crystal Structure Database (ICSD) provided by FIZ Karlsruhe is the world's largest database of completely identified inorganic crystal structures. Es beinhaltet über 260.000 datenbanken. Complimentarily, the CCDC provides the Cambridge Structural Database (CSD), a certified trusted database of fully curated and enhanced organic and metal-organic crystal structures. First established over fifty years ago it now contains over one million entries. ICSD and CSD support scientists in the field of crystallography, chemistry, material science, physics and structural biology. The joint CCDC/FIZ Access Structures Service, launched in 2018, serves to deposit, register, and preserve structure data of inorganic crystalline compounds at no charge. Crystal structures mentioned in scientific publications are stored in the crystal structure depot. Upon deposition, each dataset is assigned a Digital Object Identifier (DOI) so that the crystal structure is unambiguously identified and registered. The DOI enables third parties to cite and reference data according to the rules of good scientific practice.

Beide Institutionen sind weltweit führende Experten auf dem Gebiet der Strukturdaten. Ihre Datenbanken enthalten zusammen alle veröffentlichten organischen, metallorganischen und anorganischen Kristallstrukturen und sind wichtige Ressourcen für die Strukturchemie. Jeder Datensatz muss strenge Qualitätskontrollen durchlaufen und wird von wissenschaftlichen Experten manuell kuratiert. Diese reichhaltigen, qualitativ hochwertigen Datenressourcen sowie die von den beiden Institutionen bereitgestellte fortschrittliche Software ermöglichen es Wissenschaftlern aus Industrie und Hochschule, neue Erkenntnisse aus den Daten zu gewinnen und neue wissenschaftliche Trends zu entdecken. Forscher in der Strukturchemie verlassen sich auf die Daten, sie sind für die Industrie relevant und werden genutzt, um neuen Generationen von Wissenschaftlern chemische Konzepte zu vermitteln. Insgesamt sind die lizenzierten Datenbanken in über 1 300 Einrichtungen weltweit installiert.

Bevor Daten hinterlegt werden können, muss man sich bei ICSD registrieren, wenn CSD geöffnet ist. Der gemeinsame CCDC/FIZ-Zugangsstrukturservice ist offen gemeinsame CCDC/FIZ-Zugangsstrukturservice ist offen für die Hinterlegung von Daten und alle Datensätze sind auf individueller Basis frei verfügbar. Zudem können sich Forscher registrieren, eine Registrierung ist jedoch nicht erforderlich, um Daten zu hinterlegen oder abzurufen. Die DOIs sind in beiden Fällen mit den entsprechenden Veröffentlichungen verknüpft. Die CIF (Crystallographic Information Framework) sind die Metadatenstandards und der akzeptierte Datentyp. Der gemeinsame CCDC/FIZ Access Structures Service und CSD sind CoreTrustSeal-zertifiziert.

NOMAD

Quick stats:

  • Akzeptierte Datentypen: 50 unterstützte Codes
  • Verwendete Standards/Ontologien: DataCite; derzeit keine Ontologie (geplant ist die Erstellung von Ontologien für bestimmte Teile der Daten)
  • Zugriffsrechte/Lizenzinformationen/Embargo: CC BY 4.0; Embargos bis zu 3 Jahren definierbar
  • Empfohlen von Zeitschriften/Gesellschaften: Das Repositorium wird empfohlen von Scientific Data
Details

Click to expand for more details about NOMAD!

NOMAD

Nomad is a public repository operating since 2015 that is hosted at the MPCDF (Max Planck Computing and Data Facility) in Garching, Munich. It contains over 12 million datasets (simulations) generated from over 500 users, 98% of which is published. DOIs are attributed to almost half of them. Their target audience are solid state physicists and theoretical chemists. Data on computational materials science, computational chemistry, and molecular physics are those typically contained in the repository. There is a simulation data recognition process during upload and the repository supports the input/output formats of 50 different codes. NOMAD offers an API for data import and export. The repository is recommended by

Scientific Data

of the Nature publishing group.

This page is licensed under a Creative Commons Universal (CC0 1.0) Public Domain Dedication International License.

CC0 badge


Main author: ORCID:0000-0001-7696-7662, ORCID:0000-0003-4480-8661 and ORCID:0000-0002-5035-7978