Inhaltsverzeichnis
18: Metadaten während der Datenerhebung
- Themen
- Problemstellung, Herausforderungen und Anforderungen
- Konzept und Umsetzung: Infofile
- Anwendung auf die eigene Praxis
- Vorteile gegenüber Alternativen
- Folien
- Glossar
Zentrale Aspekte
- Daten ohne Kontext (Metadaten) sind wertlos.
Die Information während der Datenerhebung ist maximal. - Eine Formalisierung der Metadatenaufnahme ist essentiell
für Vollständigkeit und reale Umsetzbarkeit. - Metadaten sollten maschinenlesbar vorliegen,
um bei der Datenverarbeitung genutzt zu werden. - Ein Dateiformat für Metadaten muss menschenschreibbar sein,
ohne die Maschinenlesbarkeit zu korrumpieren. - Kernaspekte sind Modularität und Erweiterbarkeit,
wesentliche Felder Zweck und Kommentar.
Fragen zur Vertiefung und Wiederholung
Diese Fragen dienen der persönlichen Beschäftigung mit der Thematik, werden aber nicht separat in der Vorlesung besprochen.
- Warum sollten Metadaten während der Datenerhebung aufgezeichnet werden?
Was ist das Problem an einer nachträglichen Erhebung? - Welche Bedeutung haben Metadaten zur Datenerhebung?
- Welchen Anforderungen muss eine Lösung zur Metadatenerhebung während der Datenaufnahme mindestens erfüllen?
- Warum sind maschinenverarbeitbare Metadaten so wichtig?
- Wie könnten konkrete Schritte aussehen, um die vorgestellte Lösung auf die eigene Praxis anzuwenden?
- Welche Heuristiken gibt es, um relevante Metadaten/Informationen herauszufinden?
- Welche Vorteile hat das Format gegenüber etablierten Formaten wie XML, JSON und YAML?
- Wie kann man die Verwendung und Verbreitung eines solchen Werkzeugs zur Metadatenerhebung während der Datenaufnahme sicherstellen?
Weiterführende Literatur
Eine kommentierte und handverlesene Liste mit weiterführender Literatur zum Thema. Die Auswahl ist zwangsläufig subjektiv.
Die Veröffentlichung zum Infofile ist [Paulus, 2023Paulus, Bernd; Biskup, Till (2023): Towards more reproducible and FAIRer research data: documenting provenance during data acquisition using the Infofile format, Digit. Discov. 2:234-244]. Das Format ist allerdings viel älter, wurde ca. 2012 entwickelt. In der Veröffentlichung wird darüber hinaus nicht nur das Format beschrieben, sondern der Kontext der Metadatenaufnahme während der Datenerhebung und allgemein anwendbare Ideen für diesen Zweck.
Metadatenaufnahme während der Datenerhebung ist letztlich ein Teilaspekt von scientific recordkeeping. Siehe hier z.B. [Shankar, 2007Shankar, Kalpana (2007): Order from chaos: The poetics and pragmatics of scientific recordkeeping, J. Am. Soc. Inf. Sci. Technol. 58:1457-1466], aber auch [Ebel, 2004Ebel, Hans F.; Bliefert, Claus; Russey, William E. (2004): The Art of Scientific Writing, Wiley-VCH, Weinheim].
Zu Metadaten allgemein sind zwei grundlegende Werke [Haynes, 2018Haynes, David (2018): Metadata for Information Management and Retrieval, Facet Publishing, London, Zeng, 2022Zeng, Marcia Lei (2022): Metadata, Facet Publishing, London], kürzer gefasste, online digital verfügbare Werke der National Information Standards Organisation (NISO) sind [Brand, 2003Brand, Amy; Daly, Frank; Meyers, Barbara (2003): Metadata Demystified, The Sheridan Press & NISO Press, Hanover, PA, Riley, 2017Riley, Jenn (2017): Understanding Metadata, National Information Standards Organization (NISO), Baltimore, MD].
- Brand, Amy; Daly, Frank; Meyers, Barbara (2003): Metadata Demystified, The Sheridan Press & NISO Press, Hanover, PA
- Ebel, Hans F.; Bliefert, Claus; Russey, William E. (2004): The Art of Scientific Writing, Wiley-VCH, Weinheim
- Haynes, David (2018): Metadata for Information Management and Retrieval, Facet Publishing, London
- Paulus, Bernd; Biskup, Till (2023): Towards more reproducible and FAIRer research data: documenting provenance during data acquisition using the Infofile format, Digit. Discov. 2:234-244
- Riley, Jenn (2017): Understanding Metadata, National Information Standards Organization (NISO), Baltimore, MD
- Shankar, Kalpana (2007): Order from chaos: The poetics and pragmatics of scientific recordkeeping, J. Am. Soc. Inf. Sci. Technol. 58:1457-1466
- Zeng, Marcia Lei (2022): Metadata, Facet Publishing, London