Inhaltsverzeichnis

28. Datenaufnahme: Metadaten

Themen
Bedeutung: Daten ohne zusätzliche Informationen sind wertlos
Zielstellung: semantisches Verständnis durch Auswertungsroutinen
Kriterien für eine formalisierte Ablage von Metadaten
Ein reales Beispiel: die Infodatei
Folien
PDF
Glossar
PDF


Zentrale Aspekte

Fragen zur Vertiefung und Wiederholung

Diese Fragen dienen der persönlichen Beschäftigung mit der Thematik, werden aber nicht separat in der Vorlesung besprochen.

Weiterführende Literatur

Eine kommentierte und handverlesene Liste mit weiterführender Literatur zum Thema. Die Auswahl ist zwangsläufig subjektiv.

Metadaten werden in den allermeisten Fällen zumindest zwischendurch als Textdateien abgelegt werden, es sei denn, man hat mit einer Software zur Datenerhebung zu tun, die alle notwendigen Metadaten automatisch mit erfasst (was in den seltensten Fällen vorkommt). Insofern gelten für Datenformate für Metadaten all die Kriterien, die im vorangegangenen Kapitel zu Datenformaten aufgeführt wurden.

In Kapitel 5 von [Raymond, 2004Raymond, Eric S. (2004): The Art of UNIX Programming, Addison Wesley, Boston] finden sich viele sehr gute (und praxisrelevante) Hinweise zur Erstellung eigener textbasierter Formate. Darüber hinaus diskutiert dieser Autor diverse bekannte Textformate wie DSV/CSV, XML, Windows-INI-Dateien etc.

Einige der in [Hart, 2016Hart, Edmund M.; Barmby, Pauline; LeBauer, David; Michonneau, François; Mount, Sarah; Mulrooney, Patrick; Poisot, Timothée; Woo, Kara H.; Zimmerman, Naupaka B.; Hollister, Jeffrey W. (2016): Ten simple rules for digital data storage, PLoS Computational Biology 12:e1005097] vorgestellten Aspekte für den Umgang mit digitalen Daten betreffen explizit Metadaten. Ansonsten findet sich relativ viel Literatur im breiteren Kontext der Reproduzierbarkeit, auf die im folgenden Kapitel eingegangen wird.

Das vorgestellte Datenformat zum Speichern von Metadaten während der Datenaufnahme, die Infodatei, ist mittlerweile publiziert: [Paulus, 2023Paulus, Bernd; Biskup, Till (2023): Towards more reproducible and FAIRer research data: documenting provenance during data acquisition using the Infofile format, Digital Discovery 2:234-244]. In der Publikation wird das Format auch detailliert im Licht moderner Formate wie YAML diskutiert.

Zwei grundlegende Werke zu Metadaten sind [Haynes, 2018Haynes, David (2018): Metadata for Information Management and Retrieval, Facet Publishing, London, Zeng, 2022Zeng, Marcia Lei (2022): Metadata, Facet Publishing, London], kürzer gefasste, online digital verfügbare Werke der National Information Standards Organisation (NISO) sind [Brand, 2003Brand, Amy; Daly, Frank; Meyers, Barbara (2003): Metadata Demystified, The Sheridan Press & NISO Press, Hanover, PA, Riley, 2017Riley, Jenn (2017): Understanding Metadata, National Information Standards Organization (NISO), Baltimore, MD]. Unbedingt lesenswert und in Tiefe und Breite der Frage nach der Dokumentation in den Wissenschaften nachgehend ist [Shankar, 2007Shankar, Kalpana (2007): Order from chaos: The poetics and pragmatics of scientific recordkeeping, Journal of the American Society for Information Science and Technology 58:1457-1466].