Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:lehre:forschungsdatenmanagement:ss2024:07:index

07: Auswerten

Themen
Wissenschaftliche Aspekte
Organisatorische Aspekte
Verantwortung
Anforderungen und notwendige Werkzeuge
Folien
PDF
Glossar
PDF


Zentrale Aspekte

  • Datenauswertung umfasst die Vorverarbeitung und Analyse
    sowie die Zusammenfassung und Bewertung der Ergebnisse.
  • Wissenschaftlichkeit und Nachvollziehbarkeit erfordern ein
    lückenloses Protokoll aller Verarbeitungsschritte.
  • Werkzeuge zur Datenauswertung müssen modular, flexibel und
    automatisierbar sein – und möglichst einfach zu bedienen.
  • Zur Auswertung implementierte Software sollte publiziert werden,
    die zugrundeliegenden Programme/Sprachen frei verfügbar sein.
  • Praktisch verantwortlich sind die einzelnen Forschenden,
    die Projektleitung für die Etablierung der Prozesse.

Fragen zur Vertiefung und Wiederholung

Diese Fragen dienen der persönlichen Beschäftigung mit der Thematik, werden aber nicht separat in der Vorlesung besprochen.

  • Warum ist es wichtig, mit den eigenen Auswertungswerkzeugen in einem ersten Schritt bekannte Ergebnisse zu reproduzieren?
  • Warum sollte jeder Schritt der Datenauswertung mit allen expliziten und impliziten Parametern und eindeutigen Referenzen auf die verwendeten Werkzeuge dokumentiert werden?
    Welcher Kernaspekt der Wissenschaft ist hier entscheidend?
  • Welche entscheidende Rolle kommt der Datenauswertung für die Wissenschaft zu?
    Was bedeutet das für die Automatisierbarkeit der Datenauswertung?
  • Was sind abstrakt die drei Schritte wissenschaftlicher Datenauswertung?
    Wie sind die jeweiligen Schritte charakterisiert?
  • Welche Gründe kann es geben, um Forschungsdaten zu löschen?
    Warum ist es wichtig, Daten (ggf. dokumentiert) zu löschen, wenn sie diese Kriterien erfüllen?
    Was sollte mindestens passieren, wenn die Daten nicht gelöscht werden?
  • Warum sollten alle Abläufe, die sich sinnvoll automatisieren lassen, automatisiert werden?
    Welche Vorstufe zur Automatisierung ist oft einfach etablierbar und welche Vorteile bietet sie?
  • Welche Vor- und Nachteile ergeben sich aus dem Einsatz von Software für die wissenschaftliche Datenauswertung?
  • Für welche Aspekte der Datenauswertung brauchen Sie für eine Nachvollziehbarkeit eindeutige Kennungen (PID)? Wie könnten diese Kennungen jeweils aussehen?
  • Welche grundlegenden Anforderungen sollten Sie an Werkzeuge zur wissenschaftlichen Datenauswertung anlegen?
  • Warum benötigen Sie für die Nachvollziehbarkeit und damit Wissenschaftlichkeit letztlich ein Gesamtsystem zur wissenschaftlichen Datenauswertung?
  • Welche Aufgaben sollte ein solches Gesamtsystem zur wissenschaftlichen Datenauswertung übernehmen, welche Anforderungen erfüllen?

Weiterführende Literatur

Eine kommentierte und handverlesene Liste mit weiterführender Literatur zum Thema. Die Auswahl ist zwangsläufig subjektiv.

Das Buch von K. Briney [Briney, 2015Briney, Kristin (2015): Data Management for Researchers: Organize, Maintain and Share your Data for Research Success, Pelagic Publishing, Exeter, UK], insbesondere Kapitel 6, liefert wertvolle Hinweise zur Auswertung von Forschungsdaten und zum Umgang mit selbst geschriebener Software.

Zum Thema nachvollziehbare (rechnergestützte) Forschung (reproducible research) siehe den von Stodden et al. herausgegebenen Sammelband [Stodden, 2014Stodden, Victoria; Leisch, Friedrich; Peng, Rodger D. (Hg.) (2014): Implementing Reproducible Research, CRC Press, Boca Raton]. Ausführlich diskutiert wird die Thematik in [Popp, 2022Popp, Jara; Biskup, Till (2022): ASpecD: A modular framework for the analysis of spectroscopic data focussing on reproducibility and good scientific practice, Chem. Methods 2:e202100097] und gleichzeitig ein Beispiel für ein System zur wissenschaftlichen Datenverarbeitung und -Analyse vorgestellt.

Visualisierung von Daten ist ein eminent wichtiges und oft unterschätztes Thema. Für eine grundlegende Einführung vgl. Tufte [Tufte, 2001Tufte, Edward R. (2001): The Visual Display of Quantiative Information, Graphics Press, Cheshire, Connecticut], für sehr viele praktische Beispiele hauptsächlich aus den Naturwissenschaften Wilke [Wilke, 2019Wilke, Claus O. (2019): Fundamentals of Data Visualization: A Primer on Making Informative and Compelling Figures, O'Reilly, Sebastopol, CA].

Wissenschaftliche Softwareentwicklung ist ein weiterer sehr großer Themenkomplex. Sehr empfehlenswerte breite Einführungen in die kompetente Nutzung von Computern in den Naturwissenschaften sind [Scopatz, 2015Scopatz, Anthony; Huff, Kathryn D. (2015): Effective Computation in Physics, O'Reilly, Sebastopol, Allesina, 2019Allesina, Stefano; Wilmes, Madlen (2019): Computing Skills for Biologists, Princeton University Press, Princeton and Oxford]. Darüber hinaus sei auf die Vorlesung zur wissenschaftlichen Softwareentwicklung des Dozenten verwiesen, zu der es online neben Folien, Glossaren, etc. auch Webcasts gibt.

  • Stodden, Victoria; Leisch, Friedrich; Peng, Rodger D. (Hg.) (2014): Implementing Reproducible Research, CRC Press, Boca Raton
  • Allesina, Stefano; Wilmes, Madlen (2019): Computing Skills for Biologists, Princeton University Press, Princeton and Oxford
  • Briney, Kristin (2015): Data Management for Researchers: Organize, Maintain and Share your Data for Research Success, Pelagic Publishing, Exeter, UK
  • Popp, Jara; Biskup, Till (2022): ASpecD: A modular framework for the analysis of spectroscopic data focussing on reproducibility and good scientific practice, Chem. Methods 2:e202100097
  • Scopatz, Anthony; Huff, Kathryn D. (2015): Effective Computation in Physics, O'Reilly, Sebastopol
  • Tufte, Edward R. (2001): The Visual Display of Quantiative Information, Graphics Press, Cheshire, Connecticut
  • Wilke, Claus O. (2019): Fundamentals of Data Visualization: A Primer on Making Informative and Compelling Figures, O'Reilly, Sebastopol, CA
de/lehre/forschungsdatenmanagement/ss2024/07/index.txt · Zuletzt geändert: 2024/05/05 18:14 von till