Zum Hauptinhalt springen
Zusammenfassung:

Die physikalische Chemie ist eine interdisziplinäre Wissenschaft im Grenzbereich zwischen Chemie und Physik, deren Themen über die klassischen Bereiche der jeweiligen Einzelwissenschaften hinausgehen. Während sich die präparative Chemie auf Fragen der Methodik der chemischen Synthese bekannter und neuer Stoffe konzentriert, versucht die physikalische Chemie, die Eigenschaften von Stoffen und deren Umwandlung zu beschreiben, indem sie Konzepte der Physik mit theoretischen und experimentellen Methoden auf Objekte der Chemie anwendet. Neben der organischen und anorganischen Chemie stellt die physikalische Chemie daher eine der drei Schlüsseldisziplinen der "klassischen" Chemie dar, da sie die theoretische Grundlage für die technische Chemie und die Verfahrenstechnik liefert. Ihr Wissen ist aber auch integraler Bestandteil vieler anderer Disziplinen und wird beispielsweise zur Beschreibung und zum Verständnis in der Biologie und Medizin, der Meteorologie sowie den Geowissenschaften genutzt. Aufgrund dieser großen Interdisziplinarität und der Anwendung zahlreicher physikalisch-chemischer Methoden in fast allen Bereichen der Chemie ist eine vollständige Beschreibung der Physikalischen Chemie als Profil kaum möglich, weshalb dieser Artikel ausdrücklich keinen Anspruch darauf erhebt.

Methoden-Profile

EPR-Spektroskopie

Was ist das?

  • Die Elektronen Paramagnetische Resonanzspektroskopie gehört zusammen mit der NMR (Nukleare Magnetische Resonanz) Spektroskopie zur Gruppe der magnetischen Resonanzmethoden
  • misst die resonante Mikrowellenabsorption einer paramagnetischen Probe in einem äußeren Magnetfeld (d.h. die Messung benötigt ungepaarte Elektronen)

Wofür?

  • liefert Informationen über die elektronische/atomare Struktur und die chemische Umgebung (z. B. lokale Umgebungspolarität) der Probe
  • zur Charakterisierung der Molekulardynamik auf der Zeitskala von ca. 10 ps-1 μs (lässt z. B. Rückschlüsse auf die lokale Nanoviskosität zu)
  • für Abstandsmessungen im Bereich von etwa 1-8 nm

Welche Arten von Daten werden generiert?

  • fast ausschließlich proprietäre Dateiformate (z.B. .spe oder .DTA/.DSC) der Firma "Bruker Corporation"
  • Übertragung in offene Dateiformate (z.B. .txt oder .csv) entweder über Bruker-Software am Messgerät selbst oder über Tools wie SpinToolbox
  • Auswertung der Daten mit Bruker-Software oder z.B. EasySpin als Open-Source-Toolbox für MATLAB

Wie wird es FAIR gemacht?

  • die Dokumentation aller Forschungsdaten und Metadaten erfolgt digital mit einem geeigneten ELN (ggf. zusätzlich zu einem manuellen Laborjournal in Papierform)
  • Versuchsbedingungen (z. B. Probenkonzentration, Lösungsmittel usw.) und Messparameter (z. B. Häufigkeit, Temperatur) werden im ELN notiert
  • Beobachtungen, Abweichungen vom geplanten Messprotokoll oder andere Besonderheiten während der Messung ohne digitale Ausgabe (d. h. ohne Datendateien) werden manuell zum ELN-Eintrag des Experiments hinzugefügt
  • erhaltene unbearbeitete Rohdateien von Messungen werden in offenen Dateiformaten in ELN hochgeladen und direkt an den jeweiligen ELN-Eintrag des Experiments angehängt, einschließlich Metadaten mit Daten zum Instrument (z. B.
  • Temperatur oder Lösungsmittel der Messung, folgen gängigen Metadaten-Standards
  • die Forschungsdaten werden mit offenen, nicht-proprietären Softwaretools verarbeitet, analysiert und verglichen
  • gleichzeitig mit der Veröffentlichung als Forschungsartikel in einer wissenschaftlichen Zeitschrift werden die zugrundeliegenden Forschungsdaten in einem offenen Forschungsdaten-Repositorium veröffentlicht und mit dem Artikel verlinkt (einschließlich semantisch reichhaltig annotierter Roh- und verarbeiteter Daten in offenen Datenformaten zur Wiederverwendung)
  • ein eindeutiger persistent identifier (z. B. DOI) wird für jeden Datensatz sowie für die Zeitschriftenveröffentlichung erstellt

Quantenmechanische (QM) Berechnungen

Was ist das?

  • Quanten-Mechanische Berechnungen sind eines der wichtigsten Berechnungsinstrumente, um molekulare Eigenschaften auf der Grundlage erster Prinzipien zu ergründen
  • Die Lösung der Schrödinger-Gleichung liefert die elektronische Energie eines Moleküls/Molekülsystems, aus der sich die Eigenschaften als Ableitungen höherer Ordnung ableiten lassen. Deskriptoren können auch aus Orbital-/Dichtedaten berechnet werden, die ebenfalls verfügbar sind

Wofür?

  • Molekülstrukturen (in der Regel lokale Minima und Übergangszustände), Energien, spektroskopische Parameter/Eigenschaften, Dipolmomente, Polarisierbarkeiten und nicht beobachtbare Größen wie atomare Ladungen und topologische Analysen
  • die Eigenschaften können vor der Durchführung experimenteller Messungen berechnet werden, um die Synthese zu steuern (computergestütztes Screening) oder im Nachhinein, um die Interpretation experimenteller Ergebnisse auf atomarer Ebene zu unterstützen
  • der Anwendungsbereich hängt von der verwendeten Theorie ab. Korrelierte Wellenfunktionsmethoden werden üblicherweise auf Systeme mit weniger als 100 Atomen angewandt, Dichtefunktionaltheorie (DFT) bis zu 500 Atomen, semiempirische Methoden können routinemäßig im Bereich von Tausenden von Atomen angewendet werden.

Welche Arten von Daten werden generiert?

  • Die Datenformate hängen stark von dem Programm ab, das für die QM-Berechnungen verwendet wird, z. B. Gaussian, ORCA, Molpro, TURBOMOLE oder Jaguar, aber im Allgemeinen werden formatierte Textdateien als Eingabe- und Protokolldateien verwendet. Komprimierte Datenformate werden zur Speicherung von Wellenfunktionen, Dichteinformationen und Operatoren verwendet. Die Molekülstrukturen werden in einem für den Menschen lesbaren Format bereitgestellt
  • Die Datenanalyse wird mit Hilfe von benutzerdefinierten Skripten durchgeführt. Einige wenige Programme bieten eigene Skripte für allgemeine Aufgaben (z. B. das Plotten von Molekülorbitalen) und spezielle grafische Benutzeroberflächen

Wie wird es FAIR gemacht?

  • Der Anwendungsbereich hängt von der verwendeten Theoriestufe ab Korrelierte Wellenfunktionsmethoden werden üblicherweise auf Systeme mit weniger als 100 Atomen angewandt, Dichtefunktionaltheorie (DFT) bis zu 500 Atomen, semiempirische Methoden können routinemäßig im Bereich von Tausenden von Atomen angewendet werden
  • Die Reproduzierbarkeit von Berechnungen mit numerischer Genauigkeit kann durch Speicherung der Eingabedateien und Hinzufügen des Programms und seiner Version (idealerweise auch der Compiler-Version und etwaiger Compiler-Flags) als Metadaten gewährleistet werden. Numerische Schwellenwerte sind gut definiert, aber die Reproduzierbarkeit von Berechnungen über verschiedene Programme und Versionen hinweg ist nicht garantiert. Dies rechtfertigt die Aufbewahrung von versionsspezifischen Quelldateien für denselben Zeitraum wie die gespeicherten Daten
  • Skripte zur Datenanalyse sollten in offenen Dateiformaten in das Repositorium hochgeladen, direkt an den entsprechenden Dateneintrag angehängt und mit entsprechender Dokumentation versehen werden.
  • die Analyse und Auswertung der Berechnungen sollte nach Möglichkeit mit offenen, nicht-proprietären Softwaretools durchgeführt werden
  • gleichzeitig mit der Veröffentlichung als Forschungsartikel in einer wissenschaftlichen Zeitschrift werden die Daten im Forschungsdaten-Repositorium mit dem Artikel verlinkt (einschließlich semantisch reichhaltig annotierter Roh- und verarbeiteter Daten, wenn möglich in offenen Datenformaten zur Wiederverwendung)
  • ein eindeutiger persistenter Identifikator (z. B. DOI) wird für jeden Datensatz sowie für die Zeitschriftenpublikation generiert
  • XML und CML (Chemical Markup Language) werden von einigen wenigen Softwarepaketen verwendet, sind aber keine gängige Praxis

Herausforderungen, um Daten FAIR zu machen

  • keine standardisierte Übertragung in offene Dateiformate. Alle bisherigen Repositorien für quantenchemische Berechnungen verwenden eigene Parser, um die Berechnungsdaten aus hochgeladenen Protokollen zu extrahieren. Dieser Trend behindert die Verbesserung der FAIR-Praktiken, da neuen Entwicklern keine Vorlage für Protokolldateien zur Verfügung gestellt wird. Jede neue Software kann erst dann in die Repositories aufgenommen werden, wenn ein eigener Parser entwickelt wurde.
  • Fehlen offener Meta-Eingabe- und -Ausgabedateiformate, die für eine vollständige Interoperabilität verschiedener Programme und Werkzeuge für QM-Berechnungen erforderlich sind. Besonders bedenklich ist das Fehlen von Standards für: z-Matrix- und xyz-Dateiformate, Trajektoriendateien in der Molekulardynamik oder Strukturoptimierung, Definition von Isotopen, potenziellen Energieflächen sowie Gleichungen zur Ableitung von Eigenschaften einschließlich thermodynamischer Größen

Molekularmechanische (MM) Simulationen

Was ist das?

  • Molekulare Mechanische Simulationen beschreiben die intra- und intermolekularen Wechselwirkungen mit Hilfe der einfachen Newtonschen Mechanik und vernachlässigen Quanteneffekte
  • Das System wird mit einem geeigneten Kraftfeld parametrisiert und durch Lösen der Newtonschen Bewegungsgleichungen des Systems in der Zeit propagiert. Potentiale oder Modifikationen der Kraftfeldparameter können angewendet werden, um thermodynamische/kinetische Daten zu gewinnen.

Wofür?

  • Systeme können bis zu Millionen von Atomen umfassen, was die Untersuchung von Proteindynamik und Protein-Ligand-Wechselwirkungen auf einer Mikrosekunden-Zeitskala ermöglicht. Komplexere Systeme wie Protein-Protein-Wechselwirkungen oder in eine Biomembran eingebettete Proteine können ebenfalls simuliert werden
  • Simulationen von reinen Flüssigkeiten, Gemischen oder Grenzflächen zwischen Flüssigkeiten und Festkörpern oder Gasen ermöglichen die Untersuchung solcher Systeme
  • das Verhalten makroskopischer Systeme zu erklären und zu interpretieren, indem sie auf mikroskopischer Ebene untersucht werden

Welche Arten von Daten werden generiert?

  • die Datenformate hängen stark von dem Programm ab, das für die MM-Berechnungen verwendet wird, z. B. AMBER, CHARMM, GROMACS, LAMMPS oder NAMD, aber im Allgemeinen werden speziell formatierte Textdateien als Eingabe- und Protokolldateien und eine binäre Darstellung für Checkpoint- und Trajektoriendateien verwendet
  • Analyse der Daten mit Hilfe von Werkzeugen, die vom Hersteller der Software zur Verfügung gestellt werden, oder durch eigene Skripte

Wie wird es FAIR gemacht?

  • die Dokumentation aller Forschungsdaten und Metadaten erfolgt digital unter Verwendung eines geeigneten Repositoriums zur Speicherung der Daten
  • die Reproduzierbarkeit von Berechnungen durch Speicherung der Eingabedatei und Hinzufügen des Programms und seiner Version (idealerweise einschließlich des Compilers und etwaiger Compiler-Flags) als Metadaten gewährleistet werden kann
  • die Analyse und Auswertung der Berechnungen sollte nach Möglichkeit mit offenen, nicht-proprietären Softwaretools durchgeführt werden
  • gleichzeitig mit der Veröffentlichung als Forschungsartikel in einer wissenschaftlichen Zeitschrift werden die Daten im Forschungsdaten-Repositorium mit dem Artikel verlinkt (einschließlich semantisch reichhaltig annotierter Roh- und verarbeiteter Daten, wenn möglich in offenen Datenformaten zur Wiederverwendung)
  • ein eindeutiger persistent identifier (z. B. DOI) wird für jeden Datensatz sowie für die Zeitschriftenveröffentlichung erstellt

Herausforderungen, um Daten FAIR zu machen

  • keine standardisierte Übertragung in offene Dateiformate für verschiedene Simulationspakete
  • Die Entwicklung offener Meta-Eingabe- und Ausgabedateiformate ist erforderlich, um die Vielzahl verschiedener Programme und Werkzeuge, die bei MM-Berechnungen verwendet werden, gemäß den FAIR-Prinzipien zu handhaben. Werkzeuge wie PLUMED können den Nutzern bei diesem Problem helfen
  • Trajektoriendateien sind in der Regel zu groß, um sie in gängigen Repository-Umgebungen zu speichern, selbst wenn komprimierte Dateiformate verwendet werden. Um diese Daten FAIR zu machen, müssen Standards für den Umgang mit großen Datenmengen entwickelt oder Lösungen aus anderen Bereichen angewendet werden
  • Die Reproduzierbarkeit der Molekulardynamik auf langen Zeitskalen ist unerreichbar (numerisches Rauschen beeinträchtigt schließlich die resultierenden Trajektorien, insbesondere in einer Multicore-Umgebung). Abhängig von der numerischen Genauigkeit und der spezifischen Implementierung können Abweichungen bereits im Pikosekundenbereich beobachtet werden. Thermodynamische Mittelwerte oder andere probabilistische Messungen sollten jedoch innerhalb einer angemessenen Fehlermarge erzielt werden. Dieser Spielraum müsste von den Autoren einer Veröffentlichung geschätzt und angegeben werden.

Methoden Datenformat Übersicht

Click to filter:
Analytical methodExemplary proprietary file extensionsTypical size of proprietary fileConverterf to open file formatRecommendation for open file extension*File formatFile size of open formatMonomer characterizationPolymer characterization
NMR spectroscopyset of files, no typical extension<1-50 MBnmrium.org.jdx
.zip
JCAMP-DX (raw)
NMReDATA (assignments)
<1-50 MB
Mass spectrometry.raw
.d
.baf
~250 MBProteowizard.mzMLmzML~250 MB
IR spectroscopy.ispd
.icIR
<1 MB.dxJCAMP-DX<1 MB
Raman spectroscopy.dpt
.spc
.icRaman
.sps
.acs
<1 MBproprietary software.dxJCAMP-DX<1 MB
UV/vis spectroscopy.dsw
.str
.bsk
.bkn
.ksd
.jws
.jwb
.str8
.spc
.sre
<1 MBproprietary software.csvcomma-separated values<1 MB
Fluorescence spectroscopy.fds
.fs2f
.jws
.opj
<1 MBproprietary software.dxJCAMP-DX<1 MB
Single crystal XRD.raw~1 GBproprietary software.cifcrystallographic information file<1 MB
Powder XRD.raw<1 MBproprietary software.xydtext file<1 MB
Gas chromatography.gcd
.d
~2 MBproprietary software.txttext file<1 MB
HPLC.xls<1 MBproprietary software.csvcomma-separated values<1 MB
Cyclic voltammetry.nox
.pssession
~8 MBproprietary software.txttext file<1 MB
EPR spectroscopy.spe<1 MBproprietary software.txttext file<1 MB
Differential scanning calorimetry.ngb-dsu
.ngb-taa
<1 MBproprietary software.csvcomma-separated values<1 MB
Physisorption.smp<1 MBproprietary software.csvcomma-separated values<1 MB
Isothermal titration calorimetry (ITC)
Dynamic light scattering (DLS).apkw .xlsx<1 MBproprietary software.csvcomma-separated values<1 MB
Atomic force microscopy (AFM)
Transmission electron microscopy (TEM)
Transmission electron microscopy (TEM)proprietary software.jpg
.tif
Image<10 MB
*Diese Tabelle wird laufend mit neuen Empfehlungen zu interoperablen offenen Dateiformaten aktualisiert.