30. Datenaufnahme: Metadaten
- Themen
- Bedeutung: Daten ohne zusätzliche Informationen sind wertlos
- Zielstellung: semantisches Verständnis durch Auswertungsroutinen
- Kriterien für eine formalisierte Ablage von Metadaten
- Ein reales Beispiel: die Infodatei
- Folien
Zentrale Aspekte
- Daten ohne Metadaten sind wertlos.
Beide zusammen bilden eine untrennbare Einheit. - Die Information ist bei Datenaufnahme maximal.
Eine sinnvolle Reduktion ist die eigentliche Herausforderung. - Metadaten sollen den Auswertungsroutinen ein
semantisches Verständnis ermöglichen. - Metadaten sollten strukturiert und für Mensch und
Maschine lesbar abgelegt werden. - Ein Format für Metadaten sollte plattformunabhängig
und möglichst einfach nutzbar sein.
Weiterführende Literatur
Eine kommentierte und handverlesene Liste mit weiterführender Literatur zum Thema. Die Auswahl ist zwangsläufig subjektiv.
Metadaten werden in den allermeisten Fällen zumindest zwischendurch als Textdateien abgelegt werden, es sei denn, man hat mit einer Software zur Datenerhebung zu tun, die alle notwendigen Metadaten automatisch mit erfasst (was in den seltensten Fällen vorkommt). Insofern gelten für Datenformate für Metadaten all die Kriterien, die im vorangegangenen Kapitel zu Datenformaten aufgeführt wurden.
In Kapitel 5 von [Raymond, 2004Raymond, Eric S. (2004): The Art of UNIX Programming, Addison Wesley, Boston] finden sich viele sehr gute (und praxisrelevante) Hinweise zur Erstellung eigener textbasierter Formate. Darüber hinaus diskutiert dieser Autor diverse bekannte Textformate wie DSV/CSV, XML, Windows-INI-Dateien etc.
Einige der in [Hart, 2016Hart, Edmund M.; Barmby, Pauline; LeBauer, David; Michonneau, François; Mount, Sarah; Mulrooney, Patrick; Poisot, Timothée; Woo, Kara H.; Zimmerman, Naupaka B.; Hollister, Jeffrey W. (2016): Ten simple rules for digital data storage, PLoS Comput. Biol. 12:e1005097] vorgestellten Aspekte für den Umgang mit digitalen Daten betreffen explizit Metadaten. Ansonsten findet sich relativ viel Literatur im breiteren Kontext der Reproduzierbarkeit, auf die im folgenden Kapitel eingegangen wird.
- Hart, Edmund M.; Barmby, Pauline; LeBauer, David; Michonneau, François; Mount, Sarah; Mulrooney, Patrick; Poisot, Timothée; Woo, Kara H.; Zimmerman, Naupaka B.; Hollister, Jeffrey W. (2016): Ten simple rules for digital data storage, PLoS Comput. Biol. 12:e1005097
- Raymond, Eric S. (2004): The Art of UNIX Programming, Addison Wesley, Boston