Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:lehre:programmierkonzepte:ws2017:31:index

31. Datenverarbeitung und -Analyse: selbstdokumentierend

Themen
Zielstellung: Nachvollziehbarkeit und Reproduzierbarkeit
Voraussetzung: vollständiger Parametersatz und Archivierung von Daten und Routinen
Umsetzung in einem Gesamtsystem zur Datenverarbeitung
Offensichtliche Vorteile bei Verwendung des Systems
Folien
PDF


Zentrale Aspekte

  • Nachvollziehbarkeit ist essentiell für Wissenschaftlichkeit.
    Trotzdem ist sie in den seltensten Fällen real gegeben.
  • Jeder Verarbeitungsschritt sollte vollständig mit Parametern
    und Version der Routine dokumentiert werden.
  • Nur Automatisierung kann eine lückenlose Dokumentation
    aller Verarbeitungsschritte gewährleisten.
  • Nachvollziehbarkeit setzt die Archivierung sowohl der Rohdaten
    als auch der Verarbeitungsroutinen voraus.
  • Eine lückenlose, automatisierte Selbstdokumentation lässt sich
    nur in einem modularen Gesamtsystem realisieren.

Weiterführende Literatur

Eine kommentierte und handverlesene Liste mit weiterführender Literatur zum Thema. Die Auswahl ist zwangsläufig subjektiv.

Die Wichtigkeit der Reproduzierbarkeit von Auswertungen ist ein Thema, das immer mal wieder durch die wissenschaftliche Öffentlichkeit geistert, oftmals im Zusammenhang mit aufgedecktem Betrug durch Datenfälschung [Crocker, 2011Crocker, Jennifer; Cooper, M. Lynne (2011): Addressing scientific fraud, Science 334:1182, Jasny, 2011Jasny, Barbara R.; Chin, Gilbert; Chong, Lisa; Vignieri, Sacha (2011): Again, and again, and again..., Science 334:1225, Peng, 2011Peng, Roger D. (2011): Reproducible research in computational science, Science 334:1226-1227].

Ein lesenswerter Artikel, der sich mit der Reproduzierbarkeit rechnergestützter Datenauswertung befasst und zehn einfache Regeln aufstellt, ist [Sandve, 2013Sandve, Geir Kjetil; Nekrutenko, Anton; Taylor, James; Hovig, Eivind (2013): Ten simple rules for reproducible computational research, PLoS Computational Biology 9:e1003285]. Die behandelten Themen reichen über die dieses Kapitels hinaus. Manches dort behandelte wird erst im folgenden Kapitel behandelt werden.

  • Crocker, Jennifer; Cooper, M. Lynne (2011): Addressing scientific fraud, Science 334:1182
  • Jasny, Barbara R.; Chin, Gilbert; Chong, Lisa; Vignieri, Sacha (2011): Again, and again, and again..., Science 334:1225
  • Peng, Roger D. (2011): Reproducible research in computational science, Science 334:1226-1227
  • Sandve, Geir Kjetil; Nekrutenko, Anton; Taylor, James; Hovig, Eivind (2013): Ten simple rules for reproducible computational research, PLoS Computational Biology 9:e1003285
de/lehre/programmierkonzepte/ws2017/31/index.txt · Zuletzt geändert: 2020/09/30 21:35 von 127.0.0.1