Zum Hauptinhalt springen

Wie Sie ein passendes Repositorium auswählt

Einführung in unsere Empfehlungen

Das Konsortium für Chemie (NFDI4Chem) im NFDI hat sich zum Ziel gesetzt, die Mitglieder der Gemeinschaft (Datenproduzenten und -nutzer) bei der Sammlung, Speicherung, Verarbeitung, Analyse, Offenlegung und Wiederverwendung von Forschungsdaten zu unterstützen, indem es einen Verbund von Repositorien einrichtet. Mit dem Ziel, die wichtigsten Repositorien zu identifizieren, die Teil des Verbunds sind und über Entwicklungspotenzial verfügen, wählte das TA3-Team zu Repositorien in seinem Vorschlag die folgenden Kriterien aus:

  • Das Repositorium ist für die Hinterlegung von molekülbezogenen Daten geeignet
  • Das Repositorium enthält wiederverwendbare Daten oder Funktionen (z. B. Viewer, Editoren oder Analysewerkzeuge), die den Bedürfnissen der NFDI4Chem-Gemeinschaft entsprechen
  • Die Software des Repositoriums ist quelloffen
  • Die Betreiber der Repositorien haben sich bereit erklärt, ihre Dienste an die von NFDI4Chem entwickelten Standards sowie die FAIR Data Principles anzupassen
  • Die Betreiber der Repositorien können gemäß den Förderrichtlinien der NFDI finanziert werden (d.h. der Hauptbetreiber hat seinen Sitz in Deutschland und ist eine Non-Profit-Organisation)

Die Repositorien, die die oben genannten Kriterien erfüllen, werden in der folgenden Liste als Kernrepositorien ausgewiesen. Falls nicht alle Kriterien erfüllt sind, werden sie als assoziierte oder relevante Repositorien aufgeführt:

Hinweis:

Fachspezifische Repositorien sollten die erste Wahl sein, da diese Repositorien die FAIRness der Daten im Auftrag der Forschenden verbessern. Um das gleiche Maß an FAIRness zu erhalten, ist bei der Veröffentlichung von Daten in generischen Repositorien eine manuelle FAIRifizierung erforderlich.

Kern-Repositorien

  • Chemotion Repositorium
    Fachspezifisches proben- und reaktionszentriertes Repository mit Analysedaten wie NMR-, IR- und Massendaten.
  • MassBank EU
    Fachspezifisches Ökosystem von Datenbanken und Werkzeugen für Massenspektrometrie-Referenzspektren.
  • nmrXiv
    Ein fachspezifisches Repositorium für NMR-Daten.
  • RADAR4Chem
    Generisches, fachübergreifendes Repositorium, das einen kostenlosen und zuverlässigen Ort für alle chemischen Forschungsdaten bietet, die nicht den Anforderungen fachspezifischer Repositorien entsprechen.
  • STRENDA DB
    Fachspezifisches Repositorium für enzymologische Daten, das den STRENDA-Leitlinien für die Berichterstattung über enzymologische Daten folgt.
  • SUPRABANK
    Fachspezifisches Repositorium für Daten über intermolekulare Wechselwirkungen.

Assoziierte Repositories

  • Cambridge Structural Database
    Vom Cambridge Crystallographic Data Centre (CCDC) betriebenes fachspezifisches Repositorium für Röntgenbeugungsdaten von Molekülen, die im Allgemeinen mindestens Kohlenstoff und Wasserstoff enthalten.
  • Inorganic Crystal Structure Database
    Fachspezifisches Repositorium für Röntgenbeugungsdaten von anorganischen Verbindungen, Elementen, Mineralien und intermetallischen Verbindungen, betrieben von FIZ Karlsruhe.
  • CSD, ICSD und gemeinsamer CCDC/FIZ Dienst für Zugriffsstrukturen

Andere relevante Repositorien

  • NOMAD
    Fachspezifisches Repositorium für materialwissenschaftliche Daten.
  • ioChem-BD
    Fachspezifisches Repository für computergestützte Chemie.
  • RADAR
    Generisches, multidisziplinäres Repositorium für Forschungsdaten.
  • Zenodo
    Generisches Repositorium, das im Rahmen des europäischen OpenAIRE-Programms entwickelt und vom CERN betrieben wird.
  • EUDAT B2SHARE
    Generisches Repositorium, das von einem paneuropäischen Netz aus mehr als 25 Forschungseinrichtungen, Daten- und Rechenzentren betrieben wird.

Weitere Repositorien (derzeit im Aufbau):

  • VibSpecDB (IR-, Raman-, UV/VIS- und Lumineszenzdaten)

Darüber hinaus unterstützt das Konsortium weitere Datenbanken und Repositorien in Fragen der Interoperabilität und ermutigt sie, sich an der Entwicklung von NFDI4Chem Standards und Schnittstellen zu beteiligen.

Hinweis:

Diese Listen werden laufend mit weiteren Empfehlungen für vertrauenswürdige und chemiefreundliche Repositorien aktualisiert. Wir haben kürzlich eine Analyse der Repositorienlandschaft in der Chemie in re3data und Kriterien für Chemie-Repositorien veröffentlicht. Wir werden die Liste der Repositorien im ersten Schritt weiter aktualisieren und diese Seite nach und nach aktualisieren.

Weitere Einzelheiten zu den oben aufgeführten Repositorien finden Sie in den folgenden Abschnitten.

Mapping Matrix Daten-Repositorium

Dank der Ergebnisse der Umfrage des NFDI4Chem-Konsortiums (im Jahr 2020) und der vom TA3-Team durchgeführten Interviews mit den Leitern der Repositorien konnte eine Liste der in dieser Gemeinschaft am häufigsten verwendeten Datentypen und -formate erstellt werden, die in Tabelle 1 aufgeführt ist. Tabelle 1 zeigt, welche Datentypen in der Chemiegemeinschaft am häufigsten gesammelt werden, und gibt Hinweise darauf, welches Repositorium sich am besten für die Speicherung Ihres spezifischen Datentyps eignet. Tabelle 1 ist auch in der folgenden Abbildung zu sehen:

Die Empfehlungen in Tabelle 1 helfen Ihnen bei der effizienten und schnellen Auswahl des besten Repositorys für die Speicherung Ihrer Daten. Die Auswahl der am besten geeigneten Datenbank kann sich erheblich auf die Auffindbarkeit und Zitierfähigkeit der Daten sowie auf die Sichtbarkeit des Wissenschaftlers auswirken.

Tabelle 1: Datentypen und -formate in der NFDI4Chem-Gemeinschaft.

DatentypDatenformatVorgeschlagenes RepositoriumKriterien für die Auswahl
Magnetische KernresonanzBruker-Format (zip), jcamp-dxChemotionBestehen der Basiskontrollen, Kuration
Magnetische KernresonanzNuclear Magnetic Resonance (Bruker-Format), JOEL-Format NMReData, nmrML, ISA JSON nmrXivChemotion RepositoriumValidierungen / Mindeststandards für die Berichterstattung über Informationen
Moleküle und ihre Eigenschaften, Identifizierung, Reaktionen und experimentelle UntersuchungenAkzeptierte Datentypen: Massenspektrometrie: jcamp-dx, MzMl, MzXML (offen, visualisierbar und bearbeitbar), RAW für ausgewählte Massendaten (bearbeitet und konvertiert in JCAMP-dx), NMR: Bruker-Format (zip) und jcamp-dx, IR und Raman: jcamp-dx, XRD: jcamp-dx, UV-VIS: jcamp-dx, Zyklische Voltammetrie: jcamd-dx. *Chemotion repo bietet die Möglichkeit, Daten aus verschiedenen Dateiformaten in JCAMP-DX zu konvertieren.ChemotionBestehen der Basiskontrollen, Kuration
KernspinresonanzAnorganische Kristallstrukturen: Crystallographic Information File (CIF)ICSDKristallstrukturdaten verfügbar
Organische und metall-organische KristallstrukturenOrganische und metallorganische Kristallstrukturen: Crystallographic Information File (CIF), aber auch andere unterstützende Dateiformate werden akzeptiert.CSDMassBank EUZellparameter (Einkristall), vollständige Koordinaten (Pulver), im CIF-Format
Organische, anorganische und metall-organische KristallstrukturdatenOrganische, anorganische und metallorganische Kristallstrukturdaten, in erster Linie Crystallographic Information File (CIF), aber auch andere unterstützende Dateiformate werden akzeptiert joint CCDC/FIZ Access Structures ServiceDGemeinsamer CCDC/FIZ-Zugangsstrukturservice Kurzstatistiken:Mindestens eine CIF-Datei muss in der Einreichung enthalten sein und Strukturfaktordaten für alle Strukturen sollten (wenn möglich) bereitgestellt werden
Simulation50 unterstützte CodesNOMADSimulationsdaten Erkennung beim Upload
Generische Daten aus allen Disziplinen der Chemie, alle Daten, die nicht in die disziplinären Repositorien passen, formatunabhängigRADAR4ChemformatunabhängigRADAR4ChemValidierung gegen MD-Schema
Daten zur Enzymkinetikderzeit keineSTRENDA DBKeine; STRENDA-konforme, begutachtete Datenpublikation
Intermolekulare und supramolekulare Wechselwirkungen von molekularen SystemenJSON (DataCite), CDX* (für 2D/3D-Molekülstruktur), PNG, proprietäre FormateSUPRABANKUnbeurteilte Plausibilität

Zusammenfassung der Repositorien

Der folgende Abschnitt enthält eine Zusammenfassung der Ergebnisse unserer Umfrage und der Gespräche mit den Endlagerbetreibern, einschließlich der wichtigsten Informationen zu den einzelnen Endlagern.

Chemotion - Repositorium für Moleküle und Forschungsdaten

Quick Stats:

  • Moleküle und ihre Eigenschaften, Identifizierung, Reaktionen und experimentelle Untersuchungen Massenspektrometrie: jcamp-dx, MzMl, MzXML (offen, visualisierbar und verarbeitbar), RAW für ausgewählte Massendatenarten (verarbeitet und konvertiert in JCAMP-dx), IR und Raman: jcamp-dx, XRD: jcamp-dx, UV-VIS: jcamp-dx, Zyklische Voltammetrie: jcamd-dx. *Das Repositorium von Chemotion bietet die Möglichkeit, Daten aus verschiedenen Dateiformaten in jcamp-dx zu konvertieren.(https://www.chemotion-repository.net/welcome)
  • Verwendete Standards/Ontologien: DataCite Metadata Schema, InChI, SMILES, molfile V2000 und V3000 CHMO Ontology, RXNO Ontology
  • Zugangsrechte/Lizenzinformationen/Embargo: CC0, CCBY, CCBY-SA; Embargo für Public Domain möglich (unbegrenzt)
  • Empfehlung von Fachzeitschriften/Gesellschaften: noch nicht
Klicken Sie, um mehr Details über Chemotion zu erfahren!

Chemotion - Repositorium für Moleküle und Forschungsdaten

Das Chemotion Repositorium umfasst Forschungsdaten, die Molekülen, deren Eigenschaften und Charakterisierung sowie Reaktionen und experimentellen Untersuchungen zugeordnet sind. Es wird am Karlsruher Institut für Technologie (KIT) gehostet und von mehreren Gruppen in Deutschland und darüber hinaus genutzt. Wissenschaftler im Bereich der molekularen und synthetischen Chemie werden in ihrem Bemühen um einen FAIRen Umgang mit Daten unterstützt: Die Daten werden entsprechend der gängigen Praxis der Wissenschaftler, die Molekülen und Reaktionen zugeordnet sind, gespeichert und das System stellt die erforderlichen Digital Object Identifier (DOIs) ohne zusätzlichen Aufwand für den Wissenschaftler bereit. Die vorgegebenen Metadaten werden durch die Implementierung von Ontologiebegriffen unterstützt. Die Suchmöglichkeiten nach Text, Struktur und Identifikatoren sorgen für die Auffindbarkeit der Daten, und die eingereichten Proben und ihre Struktur werden in PubChem referenziert, um eine höhere Sichtbarkeit der Arbeit für die Wissenschaftler zu erreichen. The Repositorium ist interoperabel mit dem Chemotion ELN, was bedeutet, dass die Daten vom ELN zum Repositorium übertragen werden können. Die Daten werden von automatisch überprüft und einem Peer-Review-Verfahren kuratiert. Die Einbindung der im Repositorium gespeicherten Daten in Veröffentlichungen wurde anhand mehrerer Beispiele gezeigt, und seine Verwendung wird derzeit von Chemiemethoden empfohlen. Autoren können durch Contributor iD (ORCID iD) referenziert werden. Chemiker und Materialwissenschaftler können Daten für den offenen Zugang (Datenansicht) und den registrierten Zugang (Datensatzbeitrag und Download) veröffentlichen. Die gespeicherten Daten können nach chemischer Struktur, Autor, Datensatztyp, Status, Identifikator und DOI durchsucht werden. Die aktuelle AAI-Lösung basiert auf einer internen Benutzerverwaltung (Administrator, anonymer und registrierter Benutzer, Kurator). Die Metadaten nach DataCite entsprechen dem Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) Schema. Das Chemotion Repositorium bietet ein internes Stoffregister, einen Spektrenbetrachter (ChemSpectra), einen Struktureditor (Ketcher) und einen eigenen Datenkonverter.

Bitte beachten Sie: Das Chemotion Repositorium akzeptiert alle Datentypen, aber nur wenige davon können in den Viewern verarbeitet und bearbeitet werden.

MassBank EU - Hochwertige Massenspektraldatenbank

Quick Stats:

Details

Klicken Sie, um weitere Details über MassBank EU zu erfahren!

MassBank EU - Hochwertige Massenspektraldatenbank

Die MassBank EU ist das erste öffentliche Repositorium für Massenspektraldaten zur gemeinsamen Nutzung durch die wissenschaftliche Forschungsgemeinschaft. Ihre Zielgruppen in den Bereichen Chemie und Biowissenschaften sind analytische Chemiker, Metabolomiker, Biochemiker und Bioinformatiker. Datensätze von Nutzern und Projekten der Gemeinschaft sind offen zugänglich und stellen die offizielle Datenbank der

Mass Spectroscopy Society of Japan

. GitHub wird als aktuelle AAI-Umgebung verwendet (offener Lesezugriff, eingeschränkter Schreibzugriff), während GitHub issues als Tracking-System für die Kuration dient. Die eigentliche Kuratierung wird vom MassBank-Datensatz-Validatordurchgeführt. Die Datensätze können nach Verbindungen und massenspektrometrischen Informationen und Peaks durchsucht werden. MassBank Record ID (Accession) und USI (Universal Spectrum Identifier) werden als dauerhafte Kennzeichnungssysteme verwendet. Die MassBank EU-Spektraldaten werden unter in einem Revisionskontrollsystem gehostet, wobei alle Spektraldaten und die entsprechenden Metadaten in einem für den Menschen lesbaren Datensatzformat vorliegen und die kontinuierliche Integration (CI) die Integrität des Datensatzes bei jeder Änderung überprüft. Instanzen des Webinterfaces werden am Helmholtz-Zentrum für Umweltforschung (UFZ) (Leipzig) und am Leibniz-Institut für Pflanzenbiochemie (IPB) (Halle) gehostet und können auch lokal installiert werden. Sie bieten Schnittstellen für den Datenimport über Git (MassBank-Record-Format) und für den Datenexport (JSON-LD) und eine REST-API. Darüber hinaus wird RMassBank als separates Datenverarbeitungs-/Analysetool bereitgestellt.

RADAR4Chem - Forschungsdaten Repositorium

Quick Stats:

  • Akzeptierte Datentypen: Alle Datentypen/Formate (Formatempfehlungen vorhanden)
  • Verwendete Standards/Ontologien: RADAR Metadata Schema (basierend auf DataCite Metadata Schema 4.0), Dublin Core, schema.org
  • Zugangsrechte/Lizenzinformationen/Embargo: Bedingungen für Datenanbieter und Datennutzer, obligatorische Lizenzen für Datensätze (z. B. Creative Commons), Embargofrist (1-12 Monate)
  • Empfohlen von Zeitschriften/Gesellschaften: noch nicht
Klicken Sie, um weitere Details über RADAR4Chem zu erfahren!

RADAR4Chem - Forschungsdaten Repositorium

RADAR4Chem ist ein generisches Repositorium für die Veröffentlichung von Forschungsdaten aus allen Disziplinen der Chemie. Es wurde 2022 eingerichtet und wird bei FIZ Karlsruhe - Leibniz-Institut für Informationsinfrastruktur gehostet. Radar4Chem basiert auf dem etablierten Forschungsdaten-Repositorium RADAR Cloud. RADAR Cloud wird vor allem von akademischen Einrichtungen für das institutionelle Forschungsdatenmanagement (Datenarchivierung und -publikation) genutzt. Die Nutzung von RADAR Cloud ist kostenpflichtig und bedarf einer vertraglichen Vereinbarung. RADAR4Chem, hingegen, richtet sich ausschließlich an Forscher im Bereich der Chemie an öffentlich geförderten Forschungseinrichtungen und Hochschulen in Deutschland. Es ist kein Vertrag erforderlich und es werden keine Gebühren erhoben. RADAR4Chem ermöglicht die disziplin- und formatunabhängige Veröffentlichung und Speicherung (mindestens 25 Jahre) von Forschungsdaten aus allen Disziplinen der Chemie. Es dient als Catch-All Repositorium, das das bereits bestehende Portfolio an disziplinspezifischen Repositorien ergänzt und ist z.B. ideal geeignet für disziplinübergreifende Daten oder Datensätze mit einer Vielzahl unterschiedlicher Datenformate. RADAR4Chem ist einfach und niedrigschwellig zu nutzen. Die Forscher sind für das Hochladen, Organisieren, Annotieren und Kuratieren der Forschungsdaten sowie für den Peer-Review-Prozess (als optionaler Schritt) und schließlich deren Veröffentlichung verantwortlich. Die Nutzung des Dienstes erfordert eine Beratung durch FIZ Karlsruhe, die Registrierung bei RADAR4Chem und die Zustimmung zu den RADAR4Chem-Lizenz- und Nutzungsbestimmungen. Die Authentifizierung wird nach Selbstregistrierung und über DFN-AAI(Shibboleth) unterstützt. Metadaten werden mit dem internen RADAR Metadata Schema (basierend auf DataCite Metadata Schema 4.0) erfasst, das 10 obligatorische und 13 optionale Metadatenfelder unterstützt. Anmerkungen können auf der Ebene des Datensatzes und auf der Ebene der einzelnen Dateien und Ordner gemacht werden. Für jeden Datensatz muss eine Lizenz definiert werden, die Regeln für die Weiterverwendung der Daten enthält. Jeder veröffentlichte Datensatz erhält einen DOI, der bei DataCite registriert wird. RADAR Metadaten verwenden eine Kombination aus kontrollierten Listen und Freitexteinträgen. Die Identifizierung des Autors wird durch die Verwendung von ORCID iD und die Identifizierung des Geldgebers durch CrossRef Open Funder Registry sichergestellt (weitere Schnittstellenoptionen werden in Zukunft implementiert). Datensätze können über einen "related identifier" leicht mit anderen digitalen Ressourcen (z. B. Textpublikationen) verknüpft werden. Um die Verbreitung und Auffindbarkeit der Daten zu maximieren, werden die Metadaten der veröffentlichten Datensätze in verschiedenen Formaten indexiert (z. B. RADAR und DataCite) und für das öffentliche Metadaten-Harvesting z. B. über OAI-Provider angeboten. Die Forschungsdaten werden dauerhaft auf Magnetbändern redundant in drei Kopien an verschiedenen Standorten im Steinbuch Centre for Computing (SCC) des Karlsruher Instituts für Technologie (KIT, 2 Kopien) und im Zentrum für Informationsdienste und Hochleistungsrechnen (ZIH) der TU Dresden (1 Kopie) gespeichert.

Bitte beachten Sie: Die kostenlose Nutzung von RADAR4Chem ist derzeit auf ein maximales Speichervolumen von 10 GB pro Forschungsprojekt beschränkt. Forscher aus der NFDI4Chem-Community, deren Forschungsdatenvolumen dieses kostenlose Kontingent übersteigt und die daran interessiert sind, RADAR-Funktionen institutionell zu nutzen oder Forschungsdaten zu archivieren, können einen regelmäßigen RADAR-Cloud-Vertrag abschließen.

RADAR soll den Zugang zu und die langfristige Verfügbarkeit von archivierten und publizierten Datensätzen nach den FAIR-Kriterien sicherstellen. Deshalb ist RADAR als generische Infrastrukturkomponente in mehreren NFDI-Konsortien vorgesehen (z. B. NFDI4Culture neben NFDI4Chem). Zum Zweck der Interoperabilität berücksichtigt es die von NFDI empfohlenen Datentypen und unterstützt schrittweise disziplinspezifische Metadaten.

STRENDA DB - Standards für die Berichterstattung über enzymologische Daten

Quick Stats:

Details

Klicken Sie hier, um weitere Details über STRENDA DB zu erhalten!

STRENDA DB - Standards für die Berichterstattung über enzymologische Daten

STRENDA DB ist ein seit 2016 betriebenes Repositorium für Enzymologiedaten, das am Beilstein Institut (BI) Frankfurt gehostet wird. Es stellt sicher, dass die Datensätze von vollständig und gültig sind, bevor die Wissenschaftler sie als Teil einer Veröffentlichung von einreichen. Ihr Zielpublikum sind Biochemiker, Systembiologen, Biokatalysatoren in den Bereichen Biowissenschaften, biologische, molekulare und Lebensmittelchemiker. Die in diesem Repository enthaltenen typischen Daten bestehen aus funktionalen Enzymdaten (kinetische und experimentelle Daten) aus Manuskripten und Veröffentlichungen. Die in die STRENDA-DB eingegebenen Daten werden automatisch überprüft (gemäß den STRENDA-Richtlinien und einem PDF-Informationsblatt mit einreichbaren Daten), so dass die Benutzer Benachrichtigungen über notwendige, aber fehlende Informationen erhalten können. Derzeit werden mehr als

55 internationale biochemische Fachzeitschriften

bereits die STRENDA-Richtlinien in ihre Anweisungen für Autoren aufgenommen. DOI wird als Identifikationssystem für Zitate und ORCID iD als Identifikationssystem für Autoren verwendet. Die Einsichtnahme in die Daten ist über den offenen Zugang möglich und die Einbringung von Daten ist nach einer erforderlichen Registrierung möglich, wobei die aktuelle AAI über eine interne Benutzerverwaltung (Benutzer, Administrator) bereitgestellt wird.

SupraBank

Quick Stats:

  • Akzeptierte Datentypen: JSON (DataCite), CDX (für 2D/3D-Molekülstruktur), PNG, proprietäre Formate
  • Verwendete Standards/Ontologien: DataCite 4.0, Dublin Core für Metadaten-Tags
  • Zugriffsrechte/Lizenzinformationen/Embargo: Nutzungsbestimmungen, kein Embargo
  • Empfohlen von Fachzeitschriften/Gesellschaften: in Arbeit
Klicken Sie, um mehr Details über SupraBank zu erfahren!

SupraBank

SupraBank wird seit 2019 am KIT (Karlsruhe) betreut und ist eine kuratierte Datenbank, die Projektdaten zu intermolekularen Wechselwirkungen von molekularen Systemen und supramolekularen Wechselwirkungen bereitstellt, die in anderen Repositorien oder Datenbanken nicht verfügbar sind. SupraBank richtet sich vor allem an supramolekulare und physikalische Chemiker oder Biologen im Bereich der organischen Chemie, die sich mit Bindungs-, Aufbau- und Wechselwirkungsphänomenen beschäftigen. Molekulare Eigenschaften werden von PubChem abgerufen, was die Korrelation von Parametern intermolekularer Wechselwirkungen mit den molekularen Eigenschaften der interagierenden Komponenten ermöglicht. Alle Moleküle, Lösungsmittel und Zusatzstoffe können anhand ihrer chemischen Bezeichnungen gesucht werden. Gegenwärtig sind in der Suprabank mehr als 3500 kuratierte Datensätze mit Parametern intermolekularer Wechselwirkungen gespeichert. Die Daten sind frei zugänglich und können von registrierten Nutzern heruntergeladen und eingesehen werden. Sie können nach Experimenten und verwandten Komponenten, Molekülwechselwirkungen und Veröffentlichungen durchsucht werden, wobei die Kuratierung durch nicht wertende Plausibilitätsprüfungen erfolgt. Die derzeitige Implementierung von AAI besteht aus einer internen Benutzerverwaltung (anonymer und nicht-anonymer Benutzer, Datenanbieter, Administrator). DOI wird als Identifikationssystem für Zitate und ORCID iD als Identifikationssystem für Autoren verwendet. Die Weboberfläche bietet Dateiformatkompatibilität mit CSV, JSON, BibTex, RIS und Endnote und die Tool-Suite enthält Moleküldarstellungen in Form von Bildern, einen Struktureditor und ein Simulationsmodellierungswerkzeug.

CSD, ICSD und gemeinsamer CCDC/FIZ Dienst für Zugangsstrukturen

Quick Stats:

ICSD-Kurzstatistiken:

  • Akzeptierte Datentypen: CIF
  • Verwendete Standards/Ontologien: Keine
  • Zugangsrechte/Lizenzinformationen/Embargo: CC-Lizenzen (CC0, BY, BY-SA), Embargo möglich (unbegrenzt)
  • Empfohlen von Zeitschriften/Gesellschaften: Liste der 80 wichtigsten Zeitschriften, die von ICSD abgedeckt werden

CSD-Kurzstatistiken:

  • Akzeptierte Datentypen: hauptsächlich CIF, aber auch andere unterstützende Dateiformate werden akzeptiert
  • Verwendete Standards/Ontologien: CIF, DataCite
  • Zugriffsrechte/Lizenzinformationen/Embargo: Nutzungsbedingungen, Datenembargo, bis ein zugehöriger Artikel veröffentlicht wird oder ein Forscher die Veröffentlichung veranlasst
  • Empfohlen von Fachzeitschriften/Gesellschaften: IUCr, Royal Society of Chemistry, American Chemical Society, Wiley, Elsevier, Springer Nature, Taylor & Francis, Hindawi, Chemical Society of Japan

Gemeinsamer CCDC/FIZ-Zugangsstrukturservice Kurzstatistiken:

  • Akzeptierte Datentypen: hauptsächlich CIF, aber auch andere unterstützende Dateiformate werden akzeptiert.
  • Verwendete Standards/Ontologien: CIF, DataCite
  • Zugriffsrechte/Lizenzinformationen/Embargo: Nutzungsbedingungen, Daten unter Embargo, bis ein zugehöriger Artikel veröffentlicht wird oder der Forscher die Veröffentlichung auslöst
  • Empfohlen von Fachzeitschriften/Gesellschaften: IUCr, Royal Society of Chemistry, American Chemical Society, Wiley, Elsevier, Springer Nature, Taylor & Francis, Hindawi, Chemical Society of Japan
Klicken Sie hier, um weitere Details über CSD, ICSD und den gemeinsamen CCDC/FIZ Access Structures Service zu erfahren!

CSD, ICSD und gemeinsamer CCDC/FIZ Dienst für Zugangsstrukturen

Die Anorganische Kristallstrukturdatenbank (ICSD) von FIZ Karlsruhe ist die weltweit größte Datenbank mit vollständig identifizierten anorganischen Kristallstrukturen. Es beinhaltet über 260.000 Datensätze. Ergänzend bietet das CCDC die Cambridge Structural Database (CSD), eine zertifizierte, vertrauenswürdige Datenbank mit vollständig kuratierten und erweiterten organischen und metallorganischen Kristallstrukturen. Sie wurde vor über fünfzig Jahren eingerichtet und enthält heute über eine Million Einträge. Die ICSD und CSD unterstützen Wissenschaftler aus den Bereichen Kristallographie, Chemie, Materialwissenschaft, Physik und Strukturbiologie. Der gemeinsame CCDC/FIZ Access Structures Service, der 2018 ins Leben gerufen wurde, dient dazu, Strukturdaten von anorganischen kristallinen Verbindungen kostenlos zu hinterlegen, zu registrieren und zu erhalten. Kristallstrukturen, die in wissenschaftlichen Publikationen erwähnt werden, werden im Kristallstrukturdepot gespeichert. Bei der Hinterlegung wird jedem Datensatz ein Digital Object Identifier (DOI) zugewiesen, damit die Kristallstruktur eindeutig identifiziert und registriert werden kann. Der DOI ermöglicht es Dritten, die Daten gemäß den Regeln der guten wissenschaftlichen Praxis zu zitieren und zu referenzieren.

Beide Institutionen sind weltweit führende Experten auf dem Gebiet der Strukturdaten. Ihre Datenbanken enthalten zusammen alle veröffentlichten organischen, metallorganischen und anorganischen Kristallstrukturen und sind wichtige Ressourcen für die Strukturchemie. Jeder Datensatz muss strenge Qualitätskontrollen durchlaufen und wird von wissenschaftlichen Experten manuell kuratiert. Diese reichhaltigen, qualitativ hochwertigen Datenressourcen sowie die von den beiden Institutionen bereitgestellte fortschrittliche Software ermöglichen es Wissenschaftlern aus Industrie und Hochschule, neue Erkenntnisse aus den Daten zu gewinnen und neue wissenschaftliche Trends zu entdecken. Forscher in der Strukturchemie verlassen sich auf die Daten, sie sind für die Industrie relevant und werden genutzt, um neuen Generationen von Wissenschaftlern chemische Konzepte zu vermitteln. Insgesamt sind die lizenzierten Datenbanken in über 1 300 Einrichtungen weltweit installiert.

Bevor Daten hinterlegt werden können, muss man sich bei ICSD registrieren, wenn CSD geöffnet ist. Der gemeinsame CCDC/FIZ-Zugangsstrukturservice ist offen gemeinsame CCDC/FIZ-Zugangsstrukturservice ist offen für die Hinterlegung von Daten und alle Datensätze sind auf individueller Basis frei verfügbar. Zudem können sich Forscher registrieren, eine Registrierung ist jedoch nicht erforderlich, um Daten zu hinterlegen oder abzurufen. Die DOIs sind in beiden Fällen mit den entsprechenden Veröffentlichungen verknüpft. Die CIF (Crystallographic Information Framework) sind die Metadatenstandards und der akzeptierte Datentyp. Der gemeinsame CCDC/FIZ Access Structures Service und CSD sind CoreTrustSeal-zertifiziert.

NOMAD

Quick Stats:

  • Akzeptierte Datentypen: 50 unterstützte Codes
  • Verwendete Standards/Ontologien: DataCite; derzeit keine Ontologie (geplant ist die Erstellung von Ontologien für bestimmte Teile der Daten)
  • Zugriffsrechte/Lizenzinformationen/Embargo: CC BY 4.0; Embargos bis zu 3 Jahren definierbar
  • Empfohlen von Zeitschriften/Gesellschaften: Das Repositorium wird empfohlen von Scientific Data
Details

Klicken Sie, um weitere Details über NOMAD zu erfahren!

NOMAD

Nomad ist ein öffentliches Repositorium, das seit 2015 am MPCDF (Max Planck Computing and Data Facility) in Garching, München, betrieben wird. Es enthält über 12 Millionen Datensätze (Simulationen), die von mehr als 500 Nutzern erstellt wurden, von denen 98 % veröffentlicht sind. Nahezu die Hälfte von ihnen ist mit DOIs versehen. Die Zielgruppe sind Festkörperphysiker und theoretische Chemiker. Das Repositorium enthält in der Regel Daten aus den Bereichen rechnergestützte Materialwissenschaft, rechnergestützte Chemie und Molekularphysik. Beim Hochladen werden die Simulationsdaten erkannt, und das Repositorium unterstützt die Eingabe-/Ausgabeformate von 50 verschiedenen Codes. NOMAD bietet eine API für den Datenimport und -export. Das Repositorium wird von

Scientific Data

der Verlagsgruppe Nature empfohlen.

Diese Seite ist lizenziert unter einer Creative Commons Universal (CC0 1.0) Public Domain Dedication International License.

CC0-Ausweis


Hauptbeitragende: ORCID:0000-0001-7696-7662, ORCID:0000-0003-4480-8661 und ORCID:0000-0002-5035-7978