Inhaltsverzeichnis
16: Antimuster: Beispiele für ungeeignete Lösungen
- Themen
- Falsch verstandene Transparenz statt Qualität
- Zentralistische und kurzlebige politische Initiativen
- Große monolithische allumfassende Systeme
- Overengineering und vermeintliche technische Lösungen
- Folien
- Glossar
Zentrale Aspekte
- FDM ist viel zu wichtig für die Wissenschaft, als dass es
zum Spielball kurzlebiger politischer Initiativen werden darf. - Vertrauen ist die Voraussetzung für das Teilen von Ergebnissen.
Open Data und Open Science werden dem nicht gerecht. - Die FAIR-Prinzipien sagen nichts über die Datenqualität.
Ungeeignete Daten führen zu falschen Schlussfolgerungen. - Große monolithische Systeme scheitern an der Komplexität
der Anforderungen, ihrer Unflexibilität und Unbeherrschbarkeit. - Viele technische Lösungen lösen irrelevante Probleme,
statt die wirklich drängenden Fragen anzugehen.
Fragen zur Vertiefung und Wiederholung
Diese Fragen dienen der persönlichen Beschäftigung mit der Thematik, werden aber nicht separat in der Vorlesung besprochen.
- Welche Rolle kommt Daten in der Wissenschaft zu? Was bedeutet das für ihre Veröffentlichung, Wiederverwendung und langfristige Archivierung?
- Was ist ein Grundproblem bei der Veröffentlichung von Daten, das ihrer sinnvollen Nachnutzung oft genug im Weg steht – auch wenn das nicht immer allen Nutzenden bewusst ist?
- Für was steht das „R“ in FAIR? Was bedeutet das für die Wissenschaft und den Einfluss der FAIR-Prinzipien?
- Welche grundlegenden Probleme ergeben sich aus der Verwendung von Algorithmen des maschinellen Lernens für die Wissenschaftlichkeit?
- Warum sind Open Data und Open Science, obwohl gut gemeint, letztlich zu wenig durchdacht und an vielen Stellen nicht umsetzbar?
- Wieso sind „professionelle Forschungsdatenverantwortliche“ (Data Stewards, Data Architects) keine Lösung für das Problem mangelnden Forschungsdatenmanagements? Welche grundlegenden Qualifikationen fehlen diesen Personen?
- Warum sind zentrale (einheitliche) Lösungen i.d.R. zum Scheitern verurteilt? Wie müssten brauchbare Lösungen stattdessen aussehen?
- Wie entsteht die mangelnde Fachlichkeit politischer Gremien?
- Was ist die Motivation hinter der Nutzung zentral bereitgestellter Infrastrukturen, und welche Probleme bei ihrer Nutzung werden i.d.R. viel zu wenig beachtet?
- Woran scheinter große, monolithische, allumfassende Systeme, und wie sähe eine Lösungsstrategie aus?
Weiterführende Literatur
Eine kommentierte und handverlesene Liste mit weiterführender Literatur zum Thema. Die Auswahl ist zwangsläufig subjektiv.
Maßgeblich für die Idee, dass Forschungsdaten auch außerhalb ihres ursprünglichen Kontextes relevant und deshalb von wirtschaftlichem und politischem Interesse sind, sind die entsprechenden Prinzipien und Leitlinien der OECD [OECD, 2007OECD, (2007): OECD Principles and Guidelines for Access to Research Data from Public Funding, OECD Publishing, Paris].
Die FAIR-Prinzipien wurden 2016 von Wilkinson et al. veröffentlicht [Wilkinson, 2016Wilkinson, Mark D.; Dumontier, Michel; Aalbersberg, IJsbrand Jan; Appleton, Gabrielle; Axton, Myles; Baak, Arie; Blomberg, Niklas; Boiten, Jan-Willem; da Silva Santos, Luiz Bonino; Bourne, Philip E.; Bouwman, Jildau; Brookes, Anthony J.; Clark, Tim; Crosas, Mercè; Dillo, Ingrid; Dumon, Olivier; Edmunds, Scott; Evelo, Chris T.; Finkers, Richard; Gonzalez-Beltran, Alejandra; Gray, Alasdair J. G.; Groth, Paul; Goble, Carole; Grethe, Jeffrey S.; Heringa, Jaap; 't Hoen, Peter A. C; Hooft, Rob; Kuhn, Tobias; Kok, Ruben; Kok, Joost; Lusher, Scott J.; Martone, Maryann E.; Mons, Albert; Packer, Abel L.; Persson, Bengt; Rocca-Serra, Philippe; Roos, Marco; van Schaik, Rene; Sansone, Susanna-Assunta; Schultes, Erik; Sengstag, Thierry; Slater, Ted; Strawn, George; Swertz, Morris A.; Thompson, Mark; van der Lei, Johan; van Mulligen, Erik; Velterop, Jan; Waagmeester, Andra; Wittenburg, Peter; Wolstencroft, Katherine; Zhao, Jun; Mons, Barend (2016): The FAIR Guiding Principles for scientific data management and stewardship, Sci. Data 3:160018]. Ihre „Umdeutung“, genauer gesagt Fokussierung auf den Kontext von KI/ML findet sich im Beitrag von Barend Mons [Mons, 2020Mons, Barend (2020): Invest 5%; of research funds in ensuring data are reusable, Nature 578:491]. Vom gleichen Autor gibt es einen flammender Appell für professionelle Forschungsdatenmanager in Form von Data Stewards und Data Architects [Mons, 2018Mons, Barend (2018): Data Stewardship for Open Science. Implementing FAIR Principles, CRC Press, Boca Raton, FL].
Für eine wirklich intellektuelle Auseinandersetzung mit vielen Fragen rund um Forschungsdaten und den Umgang mit ihnen vgl. immer wieder die Veröffentlichungen von C. L. Borgman, sowohl ihr Buch [Borgman, 2015Borgman, Christine L. (2015): Big Data, Little Data, No Data: Scholarship in the Networked World, MIT Press, Cambridge, MA] als auch ein zeitlich vorher veröffentlichter kürzerer Artikel, der sich kritisch mit dem Veröffentlichen und Teilen von Forschungsdaten auseinandersetzt [Borgman, 2012Borgman, Christine L. (2012): The conundrum of sharing research data, J. Am. Soc. Inf. Sci. Technol. 63:1059-1078].
Wer sich für Vorläufer-Initiativen der NFDI interessiert, die im aktuellen politischen Diskurs und auch in den Begründungen für die Notwendigkeit der neuen Initiative keinerlei Beachtung finden, dem sei ein Blick auf das UK e-Science Programme [Hey, 2003Hey, Tony; Trefethen, Anne (2003): e-Science and its implications, Philos. Trans. R. Soc. A-Math. Phys. Eng. Sci. 361:1809-1825, Hey, 2002Hey, Tony; Trefethen, Anne (2002): The UK e-science core programme and the grid, Futur. Gener. Comput. Syst. 18:1017-1031] und das deutsche Projekt D-Grid [Hegering, 2004Hegering, Heinz-Gerd (2004): D-Grid: Schritte zu einer nationalen e-Science-Initiative, in von Knop, Jan; Haverkamp, Wilhelm; Jessen, Eike (Hg.): E-Science und Grid Ad-hoc Netze Medienintegration, 18. DFN-Arbeitstagung über Kommunikationsnetze, Kap. CHAPTER, S. 285-291, Gesellschaft für Informatik e.V., Bonn, Ludwig, 2013Ludwig, Jens; Enke, Harry (Hg.) (2013): Leitfaden zum Forschungsdaten-Management: Handreichungen aus dem WissGrid-Projekt, Verlag Werner Hülsbusch, Glückstadt] empfohlen. Nichts davon wird in den politisch relevanten Arbeiten des RfII [Informationsinfrastrukturen, 2016für Informationsinfrastrukturen, RfII – Rat (2016): Leistung aus Vielfalt. Empfehlungen zu Strukturen, Prozessen und Finanzierung des Forschungsdatenmanagements in Deutschland, Informationsinfrastrukturen, 2017für Informationsinfrastrukturen, RfII – Rat (2017): Entwicklung von Forschungsdateninfrastrukturen im internationalen Vergleich. Bericht und Anregungen, Informationsinfrastrukturen, 2022für Informationsinfrastrukturen, RfII – Rat (2022): Datenpolitik, Open Science und Dateninfrastrukturen: Aktuelle Entwicklungen im europäischen Raum] erwähnt.
Eine hilfreiche Diskussion zu „Overengineering“, wenn auch im Kontext der Softwareentwicklung und hier spezifisch dem Wechselspiel zwischen Mustern und Refactoring, findet sich in Kap. 1 von [Kerievsky, 2005Kerievsky, Joshua (2005): Refactoring to Patterns, Addison-Wesley, Boston].
- Ludwig, Jens; Enke, Harry (Hg.) (2013): Leitfaden zum Forschungsdaten-Management: Handreichungen aus dem WissGrid-Projekt, Verlag Werner Hülsbusch, Glückstadt
- Borgman, Christine L. (2012): The conundrum of sharing research data, J. Am. Soc. Inf. Sci. Technol. 63:1059-1078
- Borgman, Christine L. (2015): Big Data, Little Data, No Data: Scholarship in the Networked World, MIT Press, Cambridge, MA
- Hegering, Heinz-Gerd (2004): D-Grid: Schritte zu einer nationalen e-Science-Initiative, in von Knop, Jan; Haverkamp, Wilhelm; Jessen, Eike (Hg.): E-Science und Grid Ad-hoc Netze Medienintegration, 18. DFN-Arbeitstagung über Kommunikationsnetze, Kap. CHAPTER, S. 285-291, Gesellschaft für Informatik e.V., Bonn
- Hey, Tony; Trefethen, Anne (2002): The UK e-science core programme and the grid, Futur. Gener. Comput. Syst. 18:1017-1031
- Hey, Tony; Trefethen, Anne (2003): e-Science and its implications, Philos. Trans. R. Soc. A-Math. Phys. Eng. Sci. 361:1809-1825
- für Informationsinfrastrukturen, RfII – Rat (2016): Leistung aus Vielfalt. Empfehlungen zu Strukturen, Prozessen und Finanzierung des Forschungsdatenmanagements in Deutschland
- für Informationsinfrastrukturen, RfII – Rat (2017): Entwicklung von Forschungsdateninfrastrukturen im internationalen Vergleich. Bericht und Anregungen
- für Informationsinfrastrukturen, RfII – Rat (2022): Datenpolitik, Open Science und Dateninfrastrukturen: Aktuelle Entwicklungen im europäischen Raum
- Kerievsky, Joshua (2005): Refactoring to Patterns, Addison-Wesley, Boston
- Mons, Barend (2018): Data Stewardship for Open Science. Implementing FAIR Principles, CRC Press, Boca Raton, FL
- Mons, Barend (2020): Invest 5%; of research funds in ensuring data are reusable, Nature 578:491
- OECD, (2007): OECD Principles and Guidelines for Access to Research Data from Public Funding, OECD Publishing, Paris
- Wilkinson, Mark D.; Dumontier, Michel; Aalbersberg, IJsbrand Jan; Appleton, Gabrielle; Axton, Myles; Baak, Arie; Blomberg, Niklas; Boiten, Jan-Willem; da Silva Santos, Luiz Bonino; Bourne, Philip E.; Bouwman, Jildau; Brookes, Anthony J.; Clark, Tim; Crosas, Mercè; Dillo, Ingrid; Dumon, Olivier; Edmunds, Scott; Evelo, Chris T.; Finkers, Richard; Gonzalez-Beltran, Alejandra; Gray, Alasdair J. G.; Groth, Paul; Goble, Carole; Grethe, Jeffrey S.; Heringa, Jaap; 't Hoen, Peter A. C; Hooft, Rob; Kuhn, Tobias; Kok, Ruben; Kok, Joost; Lusher, Scott J.; Martone, Maryann E.; Mons, Albert; Packer, Abel L.; Persson, Bengt; Rocca-Serra, Philippe; Roos, Marco; van Schaik, Rene; Sansone, Susanna-Assunta; Schultes, Erik; Sengstag, Thierry; Slater, Ted; Strawn, George; Swertz, Morris A.; Thompson, Mark; van der Lei, Johan; van Mulligen, Erik; Velterop, Jan; Waagmeester, Andra; Wittenburg, Peter; Wolstencroft, Katherine; Zhao, Jun; Mons, Barend (2016): The FAIR Guiding Principles for scientific data management and stewardship, Sci. Data 3:160018