Benutzer-Werkzeuge

Webseiten-Werkzeuge


de:lehre:programmierkonzepte:ss2020:30:index

30. Datenaufnahme: Metadaten

Themen
Bedeutung: Daten ohne zusätzliche Informationen sind wertlos
Zielstellung: semantisches Verständnis durch Auswertungsroutinen
Kriterien für eine formalisierte Ablage von Metadaten
Ein reales Beispiel: die Infodatei
Folien
PDF
Glossar
PDF
Video
MP4


Webcast

Hinweis: Der Webcast wurde mit Tiny Webcasts for Lecture(r)s erstellt.

Zentrale Aspekte

  • Daten ohne Metadaten sind wertlos.
    Beide zusammen bilden eine untrennbare Einheit.
  • Die Information ist bei Datenaufnahme maximal.
    Eine sinnvolle Reduktion ist die eigentliche Herausforderung.
  • Metadaten sollen den Auswertungsroutinen ein
    semantisches Verständnis ermöglichen.
  • Metadaten sollten strukturiert und für Mensch und
    Maschine lesbar abgelegt werden.
  • Ein Format für Metadaten sollte plattformunabhängig
    und möglichst einfach nutzbar sein.

Fragen zur Vertiefung und Wiederholung

Diese Fragen dienen der persönlichen Beschäftigung mit der Thematik, werden aber nicht separat in der Vorlesung besprochen.

  • Welche beiden Kriterien sind essentiell für die elektronische Ablage von Metadaten?
  • Warum kommt ein Format wie XML für die Ablage von Metadaten eher nicht in Betracht?
  • Welche Möglichkeiten der (automatisierten) Datenverarbeitung eröffnet ein semantisches Verständnis der Messungen durch die Auswertungsroutinen? Nennen Sie ein paar Beispiele.
  • Welche Art von Datentyp ist essentiell dafür, den Auswertungsroutinen ein semantisches Verständnis zu ermöglichen? Was zeichnet diesen Datentyp funktional z.B. gegenüber gewöhnlichen Listen aus?
  • Welche Auswirkungen hat ein semantisches Verständnis auf den Code von Auswertungsroutinen?

Weiterführende Literatur

Eine kommentierte und handverlesene Liste mit weiterführender Literatur zum Thema. Die Auswahl ist zwangsläufig subjektiv.

Metadaten werden in den allermeisten Fällen zumindest zwischendurch als Textdateien abgelegt werden, es sei denn, man hat mit einer Software zur Datenerhebung zu tun, die alle notwendigen Metadaten automatisch mit erfasst (was in den seltensten Fällen vorkommt). Insofern gelten für Datenformate für Metadaten all die Kriterien, die im vorangegangenen Kapitel zu Datenformaten aufgeführt wurden.

In Kapitel 5 von [Raymond, 2004Raymond, Eric S. (2004): The Art of UNIX Programming, Addison Wesley, Boston] finden sich viele sehr gute (und praxisrelevante) Hinweise zur Erstellung eigener textbasierter Formate. Darüber hinaus diskutiert dieser Autor diverse bekannte Textformate wie DSV/CSV, XML, Windows-INI-Dateien etc.

Einige der in [Hart, 2016Hart, Edmund M.; Barmby, Pauline; LeBauer, David; Michonneau, François; Mount, Sarah; Mulrooney, Patrick; Poisot, Timothée; Woo, Kara H.; Zimmerman, Naupaka B.; Hollister, Jeffrey W. (2016): Ten simple rules for digital data storage, PLoS Computational Biology 12:e1005097] vorgestellten Aspekte für den Umgang mit digitalen Daten betreffen explizit Metadaten. Ansonsten findet sich relativ viel Literatur im breiteren Kontext der Reproduzierbarkeit, auf die im folgenden Kapitel eingegangen wird.

  • Hart, Edmund M.; Barmby, Pauline; LeBauer, David; Michonneau, François; Mount, Sarah; Mulrooney, Patrick; Poisot, Timothée; Woo, Kara H.; Zimmerman, Naupaka B.; Hollister, Jeffrey W. (2016): Ten simple rules for digital data storage, PLoS Computational Biology 12:e1005097
  • Raymond, Eric S. (2004): The Art of UNIX Programming, Addison Wesley, Boston
de/lehre/programmierkonzepte/ss2020/30/index.txt · Zuletzt geändert: 2020/09/30 21:35 von 127.0.0.1