Forschungsdatenlebenszyklus

Der entscheidende Punkt des Lebenszyklus' von Forschungsdaten (Abb. 1) ist die Nachnutzung – denn nur wenn Daten nachgenutzt werden können, sind sie Teil der Raum und Zeit (und Personen) transzendierenden Wissenschaft. Zur Erinnerung: Forschungsdatenmanagement ist letztlich nichts anderes als die Grundvoraussetzung für Wissenschaft, und als solches stellt Forschungsdatenmanagement auf jeder Stufe des Forschungsdatenlebenszyklus' die Wissenschaftlichkeit sicher. Zudem ist die Nachnutzung durch die einzelnen Forschenden selbst („future-me“) ein entscheidender Aspekt – zumindest für die Motivation des Forschungsdatenmanagements. Nachnutzung durch andere ist Kern der Wissenschaft, aber aus Sicht der Einzelperson zu abstrakt und nur als Motivation tauglich, wenn viel Idealismus existiert.

Abbildung 1: Der Forschungsdatenlebenszyklus. Entscheidend ist die Nachnutzung – denn nur wenn Daten nachgenutzt werden können, sind sie Teil der Raum und Zeit (und Personen) transzendierenden Wissenschaft. Im Laufe des Forschungsdatenlebenszyklus' verändert sich, was genau unter „Forschungsdaten“ zu verstehen ist. Auf jeden Fall sind es nicht nur die (Roh-)Daten, sondern genauso die Auswertungen, die daraus entstehenden Artefakte, die zur Auswertung verwendeten Werkzeuge und die schriftlichen, letztlich idealerweise zum Erkenntnisgewinn beitragenden Berichte (Veröffentlichungen i.e.S.), die die Ergebnisse in einen größeren Kontext einbetten.

Im Laufe des Forschungsdatenlebenszyklus' verändert sich, was genau unter „Forschungsdaten“ zu verstehen ist. Auf jeden Fall sind es nicht nur die (Roh-)Daten, sondern genauso die Auswertungen, die daraus entstehenden Artefakte, die zur Auswertung verwendeten Werkzeuge und die schriftlichen, letztlich idealerweise zum Erkenntnisgewinn beitragenden Berichte (Veröffentlichungen i.e.S.), die die Ergebnisse in einen größeren Kontext einbetten.

Warum ist der Forschungsdatenlebenszyklus so zentral für das Forschungsdatenmanagement?

Ein paar wesentliche Aspekte zum Forschungsdatenlebenszyklus

Nachfolgend sei aber zunächst stichwortartig auf die einzelnen sechs Stationen des Forschungsdatenlebenszyklus' eingegangen. Zu jeder dieser Stationen wird darüber hinaus kurz angemerkt, welcher Teil des vom Autor entwickelten Laborinformationssystems LabInform jeweils eine Rolle spielt. Hierbei sei angemerkt, dass LabInform auf individuelle Forschende und kleine Gruppen fokussiert und gerade nicht auf Abhängigkeiten von Institutionen.

Planen

wissenschaftliche Aspekte:

organisatorische Aspekte:

Verantwortlich:

LabInform:

  • Anlegen von Projekten
    • Zielstellung
    • Ablage der Dokumentation etc. von Kooperationspartnern
    • parallel Anlegen entsprechender Verzeichnisstrukturen?
  • Anlegen von Batches/Proben
    • Ablage der Informationen von Kooperationen zu den zur Verfügung gestellten Materialien
  • Zuordnung von Proben zu Projekten
    • eine Probe kann in mehreren Projekten auftauchen

Erheben

Verantwortlich:

LabInform:

  • Wiki als eLN
  • eindeutige Bezeichner (PIDs) für Proben etc. (M-Komponente des LIMS)
  • Datensafe als Ablageort (internes Repositorium) für die Rohdaten
  • ggf. Messpläne etc. über Wiki-Komponente (M-Komponente in LIMS)

Auswerten

Verantwortlich:

LabInform:

  • Zugriff auf die Daten über PIDs (LOIs) aus dem Datensafe
  • ggf. Ablage der Rezepte (ASpecD) sowie der erzeugten Artefakte (meist Bilder) im Datensafe
  • automatisierte Ablage der Berichte in der Wiki-Komponente von LabInform (bei den Projekten?)

Speichern

Verantwortlich:

LabInform:

  • Datensafe
  • LOI als PID

Veröffentlichen

Verantwortlich:

LabInform:

  • Veröffentlichung in der Wiki-Komponente anlegen
  • gleichzeitig Verzeichnisstruktur lokal anlegen (und ggf. lokales git-Repository)

Wiederverwenden

Verantwortlich:

LabInform:

  • Datensafe
  • LOI als PID
  • Übersicht über Proben/Batches
    • auch in den einzelnen Projekten
1)
Qualitätsmanagement ist, wie Forschungsdatenmanagement, tendenziell ein Reizwort für Forschende. Allerdings führt an einem realen Qualitätsmanagement nichts vorbei, wenn man Wissenschaft und Forschung ernst nimmt (was selten genug der Fall ist). Zum Qualitätsmanagement bei der Datenerhebung gehören – in einem experimentellen Labor – auch die korrekte Bedienung der Geräte, die Kalibration etc. dazu. Der Übergang zum nächsten Punkt, „Protokolle“, kann fließend sein, allerdings setzt Qualitätsmanagement ein Verständnis der Zusammenhänge voraus, während ein Protokoll stur abgearbeitet werden kann.
2)
Dient hauptsächlich dazu, im Nachhinein nachvollziehen zu können, wer beigetragen hat.
3)
Daten/Auswertungen ohne verbale Beschreibung und Kontextsetzung sind i.d.R. nutzlos. Aus eigener Erfahrung: Publikationen, die beschreiben, aber darüber hinaus keine Schlussfolgerungen ziehen, gibt es durchaus, aber sie tragen wenig/nichts zum wissenschaftlichen Erkenntnisgewinn bei und sind deshalb letztlich unbrauchbar.