Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:forschungsdatenmanagement:faq:index

Häufig gestellte Fragen (FAQ)

Der Versuch, kurze Antworten auf häufig gestellte Fragen zum Thema Forschungsdatenmanagement zu geben.

  

Was ist Forschungsdatenmanagement?

Der Umgang mit Forschungsdaten (neudeutsch: Forschungsdatenmanagement) ist letztlich nichts anderes als sauberes wissenschaftliches Arbeiten. Als solches ist es die notwendige, aber nicht hinreichende Voraussetzung für den wissenschaftlichen Erkenntnisgewinn. Wissenschaft gründet auf der Nachvollziehbarkeit und Nachnutzbarkeit der Ergebnisse und Erkenntnisse anderer. Entsprechend sollte der Umgang mit Forschungsdaten vom Gedanken der Nachvollziehbarkeit und Nachnutzbarkeit durch andere Personen – inklusive mir selbst zu einem späteren Zeitpunkt – geprägt sein. Das Forschungsdatenmanagement umfasst daher (fast) alle Teilaspekte des Forschungsprozesses von der anfänglichen Idee und konkreten Planung über die eigentliche Datenerhebung und Auswertung bis zur Veröffentlichung und Nachnutzung der Erkenntnisse und der zugrundeliegenden Daten (siehe den Forschungsdatenlebenszyklus).

Die meisten Aspekte des Umgangs mit Forschungsdaten können nur von den Forschenden selbst umgesetzt werden. Da jede nichttriviale Forschung ein komplexes Unterfangen ist, bedarf es hierfür klarer Strukturen, die von den Forschenden selbst aus einem Verständnis der Abläufe und Zusammenhänge heraus entwickelt, zumindest aber mit Leben gefüllt werden. Im ureigenen Interesse der Forschenden liegt der Fokus hierbei auf der Nachvollziehbarkeit und Nachnutzbarkeit der Ergebnisse und Erkenntnisse der (eigenen) Forschung.

Warum Forschungsdatenmanagement?

Kurz: um Wissenschaft zu ermöglichen – sowohl für mich selbst als auch für andere.

Der professionelle Umgang mit Forschungsdaten ist nichts anderes als sauberes wissenschaftliches Arbeiten und die Voraussetzung für den wissenschaftlichen Erkenntnisgewinn. Wissenschaft ist ein systematisches Unterfangen und Forschung in ihrem Kern ein strukturiertes Vorgehen. Struktur ist aber immer nur Mittel zum Zweck. Jede nichttriviale Forschungsfrage erfordert ein komplexes Vorgehen, und deshalb ist ein strukturiertes Vorgehen eine notwendige Voraussetzung für qualitativ hochwertige Forschung. Struktur fängt dabei auf unterster Ebene an (Konventionen für Dateinamen und Verzeichnisse, Auswahl von Metadaten, Vorgehen bei der Datenerhebung, …).

Das Ziel eines professionellen Umgangs mit Forschungsdaten („Forschungsdatenmanagement“) ist die Nachvollziehbarkeit und Nachnutzbarkeit der Ergebnisse und Erkenntnisse anderer – auch wenn diese andere Person ich selbst vor zwei Wochen, Monaten, Jahren bin – und damit die Sicherstellung der Wissenschaftlichkeit der eigenen Forschung. Insofern ist Forschungsdatenmanagement im ureigenen Interesse jeder und jedes Forschenden.

Die Motivation für gelebtes Forschungsdatenmanagement ergibt sich aus der doppelten Verantwortung der Forschenden: gegenüber der Wissenschaft (Nachvollziehbarkeit, Reproduzierbarkeit, Redlichkeit) und der Gesellschaft (Gesellschaftsrelevanz der Ergebnisse und Erkenntnisse, Finanzierung der Forschung durch die Gesellschaft).

Was sind Forschungsdaten?

Forschungsdaten sind alle Daten, die im Zuge wissenschaftlicher Vorhaben z.B. durch Digitalisierung, Quellenforschungen, Experimente, Messungen, Erhebungen oder Befragungen entstehen. Sie beschränken sich aber nicht auf Rohdaten (ein selbst schwer zu definierender Begriff), sondern umfassen auch die durch Auswertung erzeugten Ergebnisse sowie die während der Datenerhebung und -Auswertung erzeugten Metadaten. In einem weiteren Sinn sind auch wissenschaftliche Veröffentlichungen zu den Forschungsdaten zu zählen, zumal Ergebnisse nur durch Kontextualisierung zum Erkenntnisgewinn beitragen können.

Die Präambel der „Grundsätze zum Umgang mit Forschungsdaten“ der Allianz der deutschen Wissenschaftsorganisationen formuliert treffend die Bedeutung von Forschungsdaten: „Qualitätsgesicherte Forschungsdaten bilden einen Grundpfeiler wissenschaftlicher Erkenntnis und können unabhängig von ihrem ursprünglichen Erhebungszweck vielfach Grundlage weiterer Forschung sein.“ Wissenschaft dient dem Erkenntnisgewinn, und Forschungsdaten, also die Ergebnisse und Erkenntnisse anderer, sind die Grundlage aller Wissenschaft. Entscheidend für die Nachnutzung und den Erkenntnisgewinn und damit die Wissenschaft selbst ist, dass die Qualität der Forschungsdaten sichergestellt wird. Dazu dient u.a. die Erhebung von Metadaten bereits während der Datenaufnahme und während der weiteren Datenverarbeitung.

Die Sicherstellung der Qualität der Forschungsdaten über ihren gesamten Lebenszyklus hinweg ist die Aufgabe des „Forschungsdatenmanagements“, seine Umsetzung die Aufgabe und Verantwortung der Forschenden.

Wer ist für das Forschungsdatenmanagement verantwortlich?

Die Forschenden selbst sind für den Umgang mit ihren Forschungsdaten verantwortlich, und sie sind auch die einzigen, die diese Aufgabe erfüllen können, weil nur sie wirklich mit ihren Forschungsdaten vertraut sind. Der Umgang mit Forschungsdaten sollte immer von der Nachvollziehbarkeit und Nachnutzbarkeit her gedacht werden, und das Ziel des Forschungsdatenmanagements ist nicht die Erfüllung von Vorgaben, sondern die Sicherstellung sauberen wissenschaftlichen Arbeitens. Nur die Forschenden selbst können feststellen, ob sie Zugriff auf alle notwendigen Informationen haben, um Ergebnisse und Erkenntnisse nachvollziehen und für eigene Arbeiten nachnutzen zu können.

Natürlich sind viele grundlegende Aspekte und Voraussetzungen der Nachvollziehbarkeit und Nachnutzbarkeit für viele Forschungsdaten gleich oder ähnlich, und es gibt bekannte und bewährte Heuristiken, Lösungen und Werkzeuge, die beim Umgang mit Forschungsdaten helfen. Insofern soll und muss keine Wissenschaftlerin und kein Wissenschaftler das Rad neu erfinden. Letztlich ist der Umgang mit Forschungsdaten aber eine Frage der Einstellung, weniger eine Frage der verfügbaren Werkzeuge. Das beste Werkzeug hilft wenig, wenn ich es nicht beherrsche – d.h. wirklich verstanden habe – und entsprechend einsetzen kann.

Gibt es Werkzeuge für das Forschungsdatenmanagement?

Die kurze Antwort: Ja, aber kein einzelnes Werkzeug kann die Nachvollziehbarkeit und Nachnutzbarkeit der Forschungsergebnisse sicherstellen. Werkzeuge können helfen, aber die Nutzung von Werkzeugen kann sauberes wissenschaftliches Arbeiten (und genau das verbirgt sich hinter dem Begriff „Forschungsdatenmanagement“) nicht sicherstellen.

Der Umgang mit Forschungsdaten ist letztlich eine Frage der Einstellung, und er sollte immer von der Nachvollziehbarkeit und Nachnutzbarkeit und damit der Wissenschaftlichkeit her gedacht werden. Wissenschaft braucht Struktur, und Werkzeuge können helfen, diese Struktur aufzubauen. Gleichzeitig dürfen die Werkzeuge aber nicht zu sehr einschränken, weil Wissenschaft ein kreativer und in letzter Konsequenz nicht planbar Prozess ist, bei dem unerwartete Ergebnisse eher die Regel als die Ausnahme sind.

Beispiele für Werkzeuge, die beim Umgang mit Forschungsdaten helfen können, sind:

  • eine Liste bzw. ein Formular (egal ob auf Papier oder digital) mit Metadaten, die bei der Datenaufnahme mit erhoben werden sollen
  • Konventionen für die Benennung von Dateien und Verzeichnissen
  • eindeutige Bezeichner für Messobjekte (Proben, …)
  • modular kombinierbare Datenverarbeitungsschritte, die alle für die Nachvollziehbarkeit wichtigen Parameter automatisch mitprotokollieren
  • strukturierte und dokumentierte Abläufe für die Datenerhebung/Messung
  • Laborjournale/Laborbücher (egal ob auf Papier oder digital)

In letzter Konsequenz muss jede und jeder Forschende selbst die eigene Arbeit strukturieren und für Nachvollziehbarkeit und Nachnutzbarkeit sorgen. Und genauso können nur die Forschenden selbst beurteilen, ob diese Ziele erreicht wurden, die Ergebnisse also nachvollziehbar und nachnutzbar sind.

Was ist ein Datenmanagementplan?

Der Begriff „Datenmanagementplan“ hat mindestens zwei Bedeutungen, deren Unterscheidung in der Praxis durchaus relevant ist.

Zunächst einmal ist ein Datenmanagementplan ein von Fördermittelgebern mitunter gefordertes formales Dokument, das den Umgang mit in einem Projekt erhobenen Forschungsdaten inklusive ihrer Nachnutzung beschreibt. Papier ist geduldig, insofern wird ein solches Dokument zwar formalen Ansprüchen genügen, kann aber per se Nachvollziehbarkeit und Nachnutzbarkeit und somit die Qualität von Forschungsdaten weder garantieren noch sicherstellen.

In einer praktischen Bedeutung ist ein „Datenmanagementplan“ ein durch akzeptierte interne Konventionen und Strukturen geprägter bewusster Umgang mit Forschungsdaten mit dem Fokus auf Nachvollziehbarkeit und Nachnutzbarkeit und damit Wissenschaftlichkeit.

Während ein formaler Datenmanagementplan also eine mitunter zwingende Voraussetzung für Drittmittelanträge ist, ist ein gelebter Umgang mit Forschungsdaten eine notwendige Voraussetzung für wissenschaftliche Erkenntnis. Zur Erstellung formaler Datenmanagementpläne gibt es Werkzeuge und Vorlagen, der Umgang mit Forschungsdaten mit Fokus auf Nachvollziehbarkeit und Nachnutzbarkeit ist die Verantwortung der Forschenden, aber gleichzeitig Teil ihrer professionellen Arbeit.

Im besten Fall liefert ein formaler Datenmanagementplan ein Gerüst, um sich der notwendigen Abläufe, Konventionen und Strukturen für einen sinnvollen Umgang mit den eigenen Forschungsdaten neu bewusst zu werden.

Was sind Metadaten? Wozu brauche ich sie?

Metadaten sind Daten bzw. Informationen über Daten. Daten ohne Metadaten sind in der Regel nutzlos, da Daten nur in einem durch die Metadaten vermittelten Kontext eingeordnet und interpretiert werden können und nur so zum Erkenntnisgewinn beitragen können.

Metadaten existieren auf unterschiedlichen Abstraktionsebenen. Einige Beispiele:

  • Metadaten zu Rohdaten umfassen alle (für die Nachvollziehbarkeit und Reproduzierbarkeit) relevanten, während der Datenerhebung verfügbaren Informationen.
  • Metadaten der Datenauswertung umfassen alle für die Nachvollziehbarkeit und Reproduzierbarkeit relevanten Parameter, inklusive eindeutiger Bezeichner für die verarbeiteten Datensätze und Namen und Versionen der eingesetzten Programme.
  • Metadaten zu Datensammlungen eines Projektes umfassen projektspezifische Informationen und ggf. aggregierte Informationen zu den verfügbaren Daten, wie Größe, Liste der Verarbeitungswerkzeuge etc.
  • Metadaten zu Veröffentlichungen umfassen Informationen zu den Autoren, dem Titel, der Art der Veröffentlichung etc.

Idealerweise werden Metadaten in einer strukturierten Form abgelegt, die es Maschinen ermöglicht, sie einzulesen und zu verarbeiten. Metadaten, die während der Datenerhebung manuell mit erhoben werden, sollten möglichst formalisiert erhoben werden (egal ob auf Papier oder digital), um Vollständigkeit zu gewährleisten.

Welche Metadaten für die Nachvollziehbarkeit und Nachnutzbarkeit relevant sind, lässt sich in letzter Konsequenz immer nur im Einzelfall für eine Art von Daten entscheiden, insbesondere auf der Ebene der Rohdaten, und ist eine Frage der Erfahrung. Diese Erfahrung sollte innerhalb einer Gruppe formalisiert und einfach nutzbare Strukturen zur Erhebung der Metadaten etabliert werden, die eine möglichst vollständige Erhebung sicherstellen, ohne die Forschenden einzuschränken.

Was ist der Unterschied zwischen Datensicherung und Datenarchivierung?

Unter Datensicherung (engl. backup) versteht man das regelmäßige Kopieren von Daten auf ein anderes Speichermedium mit dem Ziel, Datenverlust vorzubeugen. Idealerweise sollte das Speichermedium für die Datensicherung räumlich getrennt und geschützt vom primären Speichermedium lokalisiert sein.

Datenarchivierung ist hingegen die revisionssichere langfristige Aufbewahrung von Daten gemäß gesetzlicher Ansprüche. Revisionssicherheit beinhaltet eine ganze Reihe von Kriterien wie Richtigkeit, Vollständigkeit, Schutz vor Veränderung und Verfälschung, Zugriffsbeschränkung, Einhaltung von Aufbewahrungsfristen und Dokumentation des Gesamtverfahrens. Datenarchivierung kann i.d.R. von Einzelpersonen und ohne unterstützende technische und qualifizierte personelle Infrastruktur nicht umgesetzt werden.

Die Aufbewahrungsfristen für Forschungsdaten (seitens der DFG werden aktuell zehn Jahre vorgeschlagen) beziehen sich am Ehesten auf eine Datensicherung über diesen Zeitraum. Die eigentliche Archivierung von Forschungsdaten ist ein in Teilen nach wie vor ungelöstes Problem, insbesondere hinsichtlich langfristig zugreifbarer Formate.

Welche rechtlichen Aspekte sind beim Umgang mit Forschungsdaten zu beachten?

Grundsätzlich relevant sind Datenschutz und Schutzrechte an geistigem Eigentum.

Sobald personenbezogene Daten erhoben werden, greift der Datenschutz. Das betrifft insbesondere Ergebnisse von Umfragen oder andere persönliche Daten. Für medizinische Daten gelten darüber hinaus noch strengere Schutzvorschriften. Bei der Kooperation mit Industriepartnern und Unternehmen können Schutzrechte an deren geistigem Eigentum dazu kommen.

Grundsätzlich gilt: Forschungsdaten sollten wann immer möglich veröffentlicht werden, dürfen aber nur dann dritten zugänglich gemacht werden, wenn weder Datenschutz noch Urheberrechte dem entgegenstehen. Allerdings fallen Forschungsdaten in den meisten Fällen unter keine der entsprechenden Schutzkategorien.

Bei der Veröffentlichung sollte den Forschungdaten immer eine Lizenz (Übertragung von Nutzungsrechten an dritte) beigefügt werden. Es gibt eine Reihe anerkannter offener Lizenzen (u.a. Creative Commons) für diesen Zweck.

de/forschungsdatenmanagement/faq/index.txt · Zuletzt geändert: 2023/09/06 08:27 von 127.0.0.1