Reproduzierbarkeit und insbesondere Nachvollziehbarkeit der Datenverarbeitung ist ein zentrales Gebot empirischer Wissenschaft. Bei der rechnergestützten Datenanalyse bietet es sich daher an, die einzelnen Prozessierungsschritte so auszugestalten, dass sie jeweils automatisiert einen vollständigen Eintrag im Historie-Feld eines Datensatzes erzeugen.
Gemeinsam mit einer Versionsverwaltung für den Quellcode der verarbeitenden Routinen gewährleistet dieses Konzept der Historie der Prozessierungsschritte eines Datensatzes die vollständige Reproduzierbarkeit.
Nachfolgend eine (minimale) Liste von Feldern für den Eintrag eines einzelnen Prozessierungsschrittes im Historie-Feld eines Datensatzes.
Hinweis: Momentan entsprechen die Feldnamen noch nicht den endgültigen Gegebenheiten.
Ein wichtiger Aspekt ist nicht nur die konsequente Erzeugung der Historie, sondern auch die einfache Ausgabe in menschenlesbarer Form.
Im Zusammenspiel mit einem Template-System wird es deshalb für jede Funktion, die auf einem Datensatz operiert und demzufolge einen „history record“ schreibt, einen Satz an Templates geben, die den jeweiligen Verarbeitungsschritt in diversen Ausgabeformaten (LaTeX, HTML, DokuWiki, …) menschenlesbar ausgeben.
Für die Dateinamen der jeweiligen Templates müsste noch ein allgemeingültiges Schema gefunden werden. Was sich aber auf jeden Fall als Teilaspekte anbietet:
Der Vorteil einer derartigen Trennung ist, dass, wenn die Templates immer gleichzeitig mit den auf Datensätzen operierenden Funktionen erzeugt werden, jeweils nur das Template und die zugehörige Funktion wissen müssen, welche Parameter sich wo im „history record“ verbergen.