Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:lehre:programmierkonzepte:ptb2023:28:index

28. Datenaufnahme: Metadaten

Themen
Bedeutung: Daten ohne zusätzliche Informationen sind wertlos
Zielstellung: semantisches Verständnis durch Auswertungsroutinen
Kriterien für eine formalisierte Ablage von Metadaten
Ein reales Beispiel: die Infodatei
Folien
PDF
Glossar
PDF


Zentrale Aspekte

  • Daten ohne Metadaten sind wertlos.
    Beide zusammen bilden eine untrennbare Einheit.
  • Die Information ist bei Datenaufnahme maximal.
    Eine sinnvolle Reduktion ist die eigentliche Herausforderung.
  • Metadaten sollen den Auswertungsroutinen ein
    semantisches Verständnis ermöglichen.
  • Metadaten sollten strukturiert und für Mensch und
    Maschine lesbar abgelegt werden.
  • Ein Format für Metadaten sollte plattformunabhängig
    und möglichst einfach nutzbar sein.

Fragen zur Vertiefung und Wiederholung

Diese Fragen dienen der persönlichen Beschäftigung mit der Thematik, werden aber nicht separat in der Vorlesung besprochen.

  • Welche beiden Kriterien sind essentiell für die elektronische Ablage von Metadaten?
  • Warum kommt ein Format wie XML für die Ablage von Metadaten eher nicht in Betracht?
  • Welche Möglichkeiten der (automatisierten) Datenverarbeitung eröffnet ein semantisches Verständnis der Messungen durch die Auswertungsroutinen? Nennen Sie ein paar Beispiele.
  • Welche Art von Datentyp ist essentiell dafür, den Auswertungsroutinen ein semantisches Verständnis zu ermöglichen? Was zeichnet diesen Datentyp funktional z.B. gegenüber gewöhnlichen Listen aus?
  • Welche Auswirkungen hat ein semantisches Verständnis auf den Code von Auswertungsroutinen?

Weiterführende Literatur

Eine kommentierte und handverlesene Liste mit weiterführender Literatur zum Thema. Die Auswahl ist zwangsläufig subjektiv.

Metadaten werden in den allermeisten Fällen zumindest zwischendurch als Textdateien abgelegt werden, es sei denn, man hat mit einer Software zur Datenerhebung zu tun, die alle notwendigen Metadaten automatisch mit erfasst (was in den seltensten Fällen vorkommt). Insofern gelten für Datenformate für Metadaten all die Kriterien, die im vorangegangenen Kapitel zu Datenformaten aufgeführt wurden.

In Kapitel 5 von [Raymond, 2004Raymond, Eric S. (2004): The Art of UNIX Programming, Addison Wesley, Boston] finden sich viele sehr gute (und praxisrelevante) Hinweise zur Erstellung eigener textbasierter Formate. Darüber hinaus diskutiert dieser Autor diverse bekannte Textformate wie DSV/CSV, XML, Windows-INI-Dateien etc.

Einige der in [Hart, 2016Hart, Edmund M.; Barmby, Pauline; LeBauer, David; Michonneau, François; Mount, Sarah; Mulrooney, Patrick; Poisot, Timothée; Woo, Kara H.; Zimmerman, Naupaka B.; Hollister, Jeffrey W. (2016): Ten simple rules for digital data storage, PLoS Computational Biology 12:e1005097] vorgestellten Aspekte für den Umgang mit digitalen Daten betreffen explizit Metadaten. Ansonsten findet sich relativ viel Literatur im breiteren Kontext der Reproduzierbarkeit, auf die im folgenden Kapitel eingegangen wird.

Das vorgestellte Datenformat zum Speichern von Metadaten während der Datenaufnahme, die Infodatei, ist mittlerweile publiziert: [Paulus, 2023Paulus, Bernd; Biskup, Till (2023): Towards more reproducible and FAIRer research data: documenting provenance during data acquisition using the Infofile format, Digital Discovery 2:234-244]. In der Publikation wird das Format auch detailliert im Licht moderner Formate wie YAML diskutiert.

Zwei grundlegende Werke zu Metadaten sind [Haynes, 2018Haynes, David (2018): Metadata for Information Management and Retrieval, Facet Publishing, London, Zeng, 2022Zeng, Marcia Lei (2022): Metadata, Facet Publishing, London], kürzer gefasste, online digital verfügbare Werke der National Information Standards Organisation (NISO) sind [Brand, 2003Brand, Amy; Daly, Frank; Meyers, Barbara (2003): Metadata Demystified, The Sheridan Press & NISO Press, Hanover, PA, Riley, 2017Riley, Jenn (2017): Understanding Metadata, National Information Standards Organization (NISO), Baltimore, MD]. Unbedingt lesenswert und in Tiefe und Breite der Frage nach der Dokumentation in den Wissenschaften nachgehend ist [Shankar, 2007Shankar, Kalpana (2007): Order from chaos: The poetics and pragmatics of scientific recordkeeping, Journal of the American Society for Information Science and Technology 58:1457-1466].

  • Brand, Amy; Daly, Frank; Meyers, Barbara (2003): Metadata Demystified, The Sheridan Press & NISO Press, Hanover, PA
  • Hart, Edmund M.; Barmby, Pauline; LeBauer, David; Michonneau, François; Mount, Sarah; Mulrooney, Patrick; Poisot, Timothée; Woo, Kara H.; Zimmerman, Naupaka B.; Hollister, Jeffrey W. (2016): Ten simple rules for digital data storage, PLoS Computational Biology 12:e1005097
  • Haynes, David (2018): Metadata for Information Management and Retrieval, Facet Publishing, London
  • Paulus, Bernd; Biskup, Till (2023): Towards more reproducible and FAIRer research data: documenting provenance during data acquisition using the Infofile format, Digital Discovery 2:234-244
  • Raymond, Eric S. (2004): The Art of UNIX Programming, Addison Wesley, Boston
  • Riley, Jenn (2017): Understanding Metadata, National Information Standards Organization (NISO), Baltimore, MD
  • Shankar, Kalpana (2007): Order from chaos: The poetics and pragmatics of scientific recordkeeping, Journal of the American Society for Information Science and Technology 58:1457-1466
  • Zeng, Marcia Lei (2022): Metadata, Facet Publishing, London
de/lehre/programmierkonzepte/ptb2023/28/index.txt · Zuletzt geändert: 2024/01/18 21:03 von till