Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:lehre:programmierkonzepte:ws2017:30:index

30. Datenaufnahme: Metadaten

Themen
Bedeutung: Daten ohne zusätzliche Informationen sind wertlos
Zielstellung: semantisches Verständnis durch Auswertungsroutinen
Kriterien für eine formalisierte Ablage von Metadaten
Ein reales Beispiel: die Infodatei
Folien
PDF


Zentrale Aspekte

  • Daten ohne Metadaten sind wertlos.
    Beide zusammen bilden eine untrennbare Einheit.
  • Die Information ist bei Datenaufnahme maximal.
    Eine sinnvolle Reduktion ist die eigentliche Herausforderung.
  • Metadaten sollen den Auswertungsroutinen ein
    semantisches Verständnis ermöglichen.
  • Metadaten sollten strukturiert und für Mensch und
    Maschine lesbar abgelegt werden.
  • Ein Format für Metadaten sollte plattformunabhängig
    und möglichst einfach nutzbar sein.

Weiterführende Literatur

Eine kommentierte und handverlesene Liste mit weiterführender Literatur zum Thema. Die Auswahl ist zwangsläufig subjektiv.

Metadaten werden in den allermeisten Fällen zumindest zwischendurch als Textdateien abgelegt werden, es sei denn, man hat mit einer Software zur Datenerhebung zu tun, die alle notwendigen Metadaten automatisch mit erfasst (was in den seltensten Fällen vorkommt). Insofern gelten für Datenformate für Metadaten all die Kriterien, die im vorangegangenen Kapitel zu Datenformaten aufgeführt wurden.

In Kapitel 5 von [Raymond, 2004Raymond, Eric S. (2004): The Art of UNIX Programming, Addison Wesley, Boston] finden sich viele sehr gute (und praxisrelevante) Hinweise zur Erstellung eigener textbasierter Formate. Darüber hinaus diskutiert dieser Autor diverse bekannte Textformate wie DSV/CSV, XML, Windows-INI-Dateien etc.

Einige der in [Hart, 2016Hart, Edmund M.; Barmby, Pauline; LeBauer, David; Michonneau, François; Mount, Sarah; Mulrooney, Patrick; Poisot, Timothée; Woo, Kara H.; Zimmerman, Naupaka B.; Hollister, Jeffrey W. (2016): Ten simple rules for digital data storage, PLoS Computational Biology 12:e1005097] vorgestellten Aspekte für den Umgang mit digitalen Daten betreffen explizit Metadaten. Ansonsten findet sich relativ viel Literatur im breiteren Kontext der Reproduzierbarkeit, auf die im folgenden Kapitel eingegangen wird.

  • Hart, Edmund M.; Barmby, Pauline; LeBauer, David; Michonneau, François; Mount, Sarah; Mulrooney, Patrick; Poisot, Timothée; Woo, Kara H.; Zimmerman, Naupaka B.; Hollister, Jeffrey W. (2016): Ten simple rules for digital data storage, PLoS Computational Biology 12:e1005097
  • Raymond, Eric S. (2004): The Art of UNIX Programming, Addison Wesley, Boston
de/lehre/programmierkonzepte/ws2017/30/index.txt · Zuletzt geändert: 2020/09/30 21:35 von 127.0.0.1