Was kann ein Data Steward für uns tun?
Data Stewards, ihre Bedeutung im Forschungsdatenmanagement und im Kontext wissenschaftlicher Bibliotheken.
First, taking care of data is an ethical duty, and should be part of good research practice. Second, if data are treated properly, researchers will have significantly more time to do research. Consider the losses incurred under the current system. Students in PhD programmes spend up to 80% of their time on ‘data munging’, fixing formatting and minor mistakes to make data suitable for analysis — wasting time and talent.[1]
Der sorgfältige Umgang mit Daten ist eine ethische Pflicht und sollte Teil einer guten Forschungspraxis sein. Wenn die Daten richtig behandelt werden, haben die Forscher*innen wesentlich mehr Zeit für ihre Forschung, heißt es in einem Artikel von Nature.
Wenn Forschende zu viel Zeit beim Korrigieren von Formatierungs- und kleineren Fehlern verbringen, um die Forschungsdaten für die Analyse geeignet zu machen, ist das eine Verschwendung von kostbarer Zeit und Talent.
Data Stewards sind längst ein wichtiger Bestandteil im Forschungsdatenmanagement
Deshalb sind Data Stewards an vielen Universitäten im deutschsprachigen Raum längst ein wichtiger Bestandteil im Forschungsdatenmanagement geworden, immer mit einer Schnittstelle zwischen der Wissenschaft und der zentralen Infrastruktur.
Data Stewards unterstützen ihre Forscherinnen und Forscher in ihrem Bereich, d.h. innerhalb ihres Forschungsgebietes, beim FDM im Sinne von FAIR und Open Science. Data Stewards kommen im Idealfall selbst aus der Forschung ihrer jeweiligen Disziplin mit interdisziplinärer Ausrichtung, da Forschung in 2023 über die Fakultätsgrenzen hinausgeht. Sie arbeiten oft in einzelnen mehrjährigen Forschungsprojekten, auch in Sonderforschungsbereichen, oder sie interessieren sich bereits in Graduiertenkollegs für das fachnahe Datenmanagement, während wissenschaftliche Bibliotheken doch in der Regel im allgemeinen eher das generische Forschungsdatenmanagement adressieren.
Data Stewards sind Ansprechpersonen für die leitende FDM-Koordination und die Forschenden selbst. FDM-Konzepte für die jeweiligen Bereiche sollen durch Data Stewards geschaffen werden können. Das praktische und aktive Data Stewardship befindet sich überall auf der Welt noch in der Entwicklung. Eine einheitliche Definition des Data Stewardships und einheitliche Definitionen der Aufgaben existieren außerdem bewusst keine, denn überall gibt es andere Gegebenheiten in der Forschungsarbeit.
Das Data Stewardship der TU Delft war ein gutes Vorbild für Deutschland, aber das Data Stewardship lässt sich nicht in Fakultäten eingrenzen
Viele Universitäten in Deutschland haben sich die TU Delft mit ihrem Data Stewardship Projekt als Vorbild genommen[2] und Ideen von dort an ihre eigenen Erfordernisse angepasst. Data Stewards sind in Delft auf Fakultätsebene angesiedelt.
Diese Abgrenzung wird inzwischen von vielen Kolleginnen und Kollegen in der FDM-Community als zu eng angesehen, weil ja das FDM immer über einzelne Disziplinen hinweg geht. Der 11. DINI/nestor-Workshop hatte das “Data Stewardship im Forschungsdatenmanagement – Was ist das? Rollen, Aufgabenprofile, Einsatzgebiete” zum Inhalt.[3]
Aufgaben und Rollen des Data Stewards in der Theorie
In einer Breakout Session wurde über Aufgaben und Rollen diskutiert, z.B. über Schnittstellenarbeit zwischen Forschenden und einer wissenschaftlichen Bibliothek.
- Data Stewards stimmen sich beispielsweise mit dem Forschungsreferat über Finanzierung von FDM ab.
- Ein Data Steward muss zwischen unterschiedlichen Gruppen Übersetzungsfähigkeiten aufweisen und führt immer auch ganz spezifische Workshops durch.
- Es geht in der Arbeit zum Data Stewardship um das Aufbereiten von Forschungsdaten, die Nachnutzbarkeit von Forschungsdaten sowie um eine Qualitätssicherung von Forschungsdaten in aktuellen Projekten und außerdem um disziplinbezogene Qualitätskriterien.
Aufgaben und Rolle von Data Stewards in der Praxis
Die RWTH Aachen hat einen sehr informativen Blog zum Forschungsdatenmanagement mit Posts zum Data Stewardship.[4] In den Exzellenzclustern der RWTH Aachen University wird jeweils ein Data Steward gefördert. Frau Katharina Grünwald beschreibt in einem Blogpost und hier ihre Aufgaben und Tätigkeiten[5]:
Mein Fokus liegt auf den praktischen Anwendungen, von denen Forschende an der RWTH Aachen und im NFDI-Konsortium einen direkten Nutzen haben. So beispielsweise die Einführung von Elektronischen Laborbüchern (ELN) bzw. Labor Inventarisierungs- und Managementsystemen (LIMS).
Das gerade auch die Vernetzung als Data Steward wichtig ist zeigt sie so:
Eine weitere wichtige Aufgabe als Data Steward ist die Vernetzung: Ich nehme wöchentlich an Meetings zum Austausch bezüglich FDM innerhalb und außerhalb der NFDI-Konsortien teil.
Auch die Archäologin Dr. phil. Sophie Helas ist seit 2021 Data Steward an der RWTH Aachen.[6] In einem anderen Blogbeitrag fasst sie zusammen, was ihre Motivation war, sich als Data Steward zu bewerben, wie ihr Aufgabenfeld und ihre Herausforderungen im Alltag aussehen. Sie erklärt auch warum eine enge Zusammenarbeit mit der Forschungscommunity nützlich ist:
Die Aachener Projektstelle hat mich sehr angesprochen, da ich die Notwendigkeit, Forschungsdaten strukturiert abzulegen und zugänglich zu machen, aus eigener Erfahrung kenne. Außerdem habe ich ein Faible für Architektur und ich bearbeitete auch immer als Archäologin architektonische Themen (…) Für besonders vielversprechend halte ich den Ansatz, das Forschungsportal in enger Abstimmung mit der Fachcommunity zu entwickeln, da ich auch bereits die Erfahrung machte, dass den wissenschaftlich arbeitenden Personen fertige Konzepte vorgesetzt werden, die sich dann als nicht praxistauglich erwiesen und mehr nervten als halfen. Damit hatten sie keine Zukunft.
Nicole Parks gab für dieselbe Blogpost-Reihe[7] im Sommer 2022 ein Interview zu ihren Aufgaben im Data Stewardship.[8] Sie ist selbst als Data Steward tätig und betreut das INF den Sonderforschungsbereich SFB 985 Functional Microgels and Microgel Systems[9] sowie den Bereich NFDI4Chem.
The INF project continues to provide and support the central web-based platform for the storage and exchange of data, the collaboration among researchers, and the management of samples. It will integrate and automate workflows that produce and curate data, such as dynamic light scattering and other analytical methods.[10]
Als Masterabsolventin kommt Nicola Parks von der OVGU in Magdeburg und hier aus dem Chemieingenieurwesen. Das Forschungsdatenmanagement setzt sie mit der Digitalisierung gleich:
Die Digitalisierung der Forschung und des Labors – was FDM heutzutage im Grunde ist – finde ich nicht nur spannend, sondern auch richtig.
Data Stewardship und wissenschaftliche Bibliotheken
Gutes Data Stewardship kann durch wissenschaftliche Bibliotheken unterstützt werden, denn oft sind ja die Bibliotheksmitarbeitenden zentrale Anlaufstellen hinsichtlich der Langzeitarchivierung von Forschungsdaten oder anderen Anliegen. Eine Kernaufgabe wissenschaftlicher Bibliotheken ist die Kompetenzförderung.
Die Bibliotheken wirken oft mit den Instituten und einzelnen Fächern zusammen, aber um Kompetenzen fördern zu können, fehlt in den meisten Bibliotheken das gute Personal. Es gibt nur sehr wenige Ausschreibungen von Stellen mit Metadatenbetreuung, Schulungen entlang des Data Life Cycle oder Unterstützung beim Schreiben von Datenmanagementplänen.
Wissenschaftliche Bibliotheken wirken bei der Förderung von medien- und informationsbezogenen Kompetenzen mit, weil diese ihren Aufgabenstellungen und ihrem Selbstverständnis am nächsten stehen. Sie beziehen sich auf das Suchen und Finden, auf das Auswählen und Bewerten, auf das Analysieren und das produktive Verarbeiten von Informationen und Medien in allen ihren Formen und Zugänglichkeiten.[11]
Das Data Science Center (DSC@UB) der Universität Bremen[12] wurde mit Unterstützung des Landes Bremen aufgebaut. Es bietet gute Rahmenbedingungen hinsichtlich zentraler, interdisziplinärer Infrastruktur für die datenintensive Forschung. Bei den Vorbereitungen zum Data Stewardship an anderen Universitäten helfen die Best Practices sehr, denn hier werden die disziplinären Silos aufgebrochen. Es dient dem fachübergreifenden Austausch und stellt forschungsnahe Dienste zur Verfügung. Das Data Stewardship wurde hier von Anfang an gleich bestmöglich interdisziplinär mitgedacht:
Das Data Science Center (DSC) ist ein interdisziplinäres Institut, das die Kompetenzen und Vorhaben der Universität Bremen im Bereich Data Science bündelt, koordiniert und weiterentwickelt. Das Ziel des DSC ist es, disziplinäre Silos aufzubrechen, die Datenkompetenzen von Forschenden zu steigern und die wertschöpfende Nutzung von Daten in allen Forschungsbereichen nachhaltig zu ermöglichen. Das DSC agiert als zentrale Kontaktstelle für Fragestellungen zur datenintensiven Forschung und bietet umfangreiche Dienste für Forschende rund um die Themen Datenmanagement und Data Science.
Data Literacy
Während sich seit den 1990er Jahren die Förderung von Informationskompetenz in den wissenschaftlichen Bibliotheken etabliert hatte, mit Blick auf Gymnasialschüler und junge Studierende, haben viele wissenschaftliche Bibliotheken in 2023 mit ihrer Beschäftigung von Data Librarians[13] Forscherinnen und Forscher im Fokus und auch die Datenkompetenzen.
Neue Trainingsprogramme im Zusammenhang mit Data Literacy entstehen gerade, auch in Kooperationen mit der NFDI.[14]
Die Abgrenzung zur Informationskompetenz wäre darin zu sehen, dass digitale Kompetenzen sich nicht auf die Informationspraxis beschränken, sondern darüber hinaus die im Zuge der digitalen Transformation verwendeten Tools, aber auch die kognitiven Herangehensweisen an digitale Räume und Dimensionen einschließen.
Letzteres schreibt Wilfried Sühl-Strohmenger in seinem Beitrag “Digitale Kompetenz, Informationskompetenz, Medienkompetenz, Datenkompetenz, Schreibkompetenz …? Was sollen wissenschaftliche Bibliotheken fördern und für wen?”
Data Stewardship goes Deutschland
Daniela Hausen, Britta Steinke und Dzulia Terzijska veröffentlichten in Heft 6 der Fachzeitschrift B.I.T.online einen Nachrichtenbeitrag, der über den im Oktober 2022 mit 50 Teilnehmenden stattfindenden Workshop “Data Stewardship goes Germany” berichtet: https://b-i-t-online.de/heft/2022-06-nachrichtenbeitrag-hausen.pdf (Zugriff am 23.02.2023). Hier vernetzten sich Data Stewards aus Deutschland, vor allem aus den MINT-Fächern.
An der OVGU in Magdeburg soll in 2023 ein Data Stewardship mit Personen aufgebaut werden, die direkt aus der Forschung aus unterschiedlichen Disziplinen kommen. Am 02. März 2023 wird dazu der “Kick-Off”-Workshop stattfinden. Data Stewards werden in einer ersten Phase vom Land Sachsen-Anhalt finanziert werden können. Dabei geht es vor allem um die Bereiche Medizin, Ingenieurwissenschaften und die Digital Humanities, aber alle Fächer und Forschungsdaten aus allen Instituten der Universität und außeruniversitären Zentren und Forschungsprojekten sollen hier eingebunden werden.
Forschungsdaten- und Metadatenstandards können oft nur oder am besten in den Forschungs-Communities entwickelt werden“, bekräftigt die Koordinatorin. „Deshalb ist eine intensive Kooperation der Kompetenzträger des Forschungsdatenmanagements in den Forschungsverbünden erforderlich. Über ein Anreizsystem, beispielsweise ko-finanzierte Positionen im Forschungsdatenmanagement, Fortbildungen, Workshops, Reisemittel, Software und technische Ausstattung, soll Begeisterung für ein breites Engagement der Kompetenzträger generiert werden. Mittel- und langfristig geht es darum, ein FDM-Netzwerk an der OVGU aufzubauen, von dem sowohl Forschende der Universität, der Universitätsmedizin, der Forschungszentren als auch Partner in Forschung, Wirtschaft und Gesellschaft profitieren.
Best practice, Standards und Leitlinien
Über das OVGU Data Stewardship-Konzept sollen zunächst „Kristallisationskeime“ geschaffen werden (Stand März 2022). Die Konzepte einzelner Data Stewards sollen jeweils unterschiedlich aussehen. Das Data Stewardship geht über Fachbereiche hinaus. Die Datenvernetzungsstrukturen, die durch die Data Stewards vorangetrieben werden, werden offen für eine solche Dynamik sein und kontinuierlich, nachhaltig und qualitätsgerecht aus der Wissenschaft immer wieder neu definiert. Dabei sind die Aufgaben der zentralen Data Stewardship – Koordination die folgenden:
- Foren für die gegenseitige Zusammenarbeit der Data Stewards schaffen
- Schulungen für die Data Stewards organisieren
- Vermittlung zwischen den Data Stewards und zentralen Service-Einrichtungen der OVGU wie dem Universitätsrechenzentrum (URZ) und der Universitätsbibliothek (UB)
- Konsolidierung des fächerspezifische FDM und Identifikation von FDM-Synergien (Entwicklung von interdisziplinären, fächerspezifischen und universitätsweiten Lösungen)
- Koordination von FDM-Leitlinien zur Anwendung in den Forschungsbereichen mit Support der Data Stewards für die Forschungsbereiche
Die Schaffung von Best Practices, Standards und Leitlinien werden also in Magdeburg gemeinsam – in Kooperationen – erarbeitet.
Weitere Informationen siehe hier: https://www.ovgu.de/unimagdeburg_media/Organisation/NEWSLETTER/Archiv/NL_11_2022_CONTENT/Forschungsdatenmanagement.pdf (Zugriff am 23.02.2023)
Literaturempfehlungen:
- Steinmann, Lena, und Rolf Drechsler. 2021. „Verzahnung Von Data Stewardship Und Data Science – Wege Und Perspektiven“. Bausteine Forschungsdatenmanagement, Nr. 3 (Dezember). German:82-91. https://doi.org/10.17192/bfdm.2021.3.8342
- Griesbaum, Joachim: Informationskompetenz. In: Knackstedt et al.: Kompetenzmodelle für den Digitalen Wandel (wie Anm. 4), S. 67–9
- Gesellschaft für Informatik (2018): Data Literacy und Data Science Education: Digitale Kompetenzen in der Hochschulausbildung https://gi.de/themen/beitrag/data-literacy-und-data-science-education-digitale-kompetenzen-in-der-hochschulausbildung/
- Martin, N. (2019): Forbes. https://www.forbes.com/sites/nicolemartin1/2019/08/07/ how-much-data-is-collected-every-minute-of-the-day/#3941e8453d66 (Zugriff am 22.02.2023)
- Rothfritz, Laura. 2021. „Data Stewardship Als Boundary-Work“. Bausteine Forschungsdatenmanagement, Nr. 3 (Dezember). German:106-18. https://doi.org/10.17192/bfdm.2021.3.8344
- Schmidt C, Hanne J, Moore J et al. Research data management for bioimaging: the 2021 NFDI4BIOIMAGE community survey [version 2; peer review: 2 approved]. F1000Research 2022, 11:638 (https://doi.org/10.12688/f1000research.121714.2)
- Matthias Scheffler, Martin Aeschlimann, Martin Albrecht, Tristan Bereau, Hans-Joachim Bungartz, Claudia Felser, Mark Greiner, Axel Groß, Christoph T. Koch, Kurt Kremer, Wolfgang E. Nagel, Markus Scheidgen, Christof Wöll & Claudia Draxl, FAIR data enabling new horizons for materials research, Nature (27. April 2022), DOI: 10.1038/s41586-022-04501-x
- Sühl-Strohmenger, Wilfried. “Digitale Kompetenz, Informationskompetenz, Medienkompetenz, Datenkompetenz, Schreibkompetenz …? Was sollen wissenschaftliche Bibliotheken fördern und für wen?” Bibliotheksdienst, vol. 56, no. 12, 2022, pp. 729-751. https://www.degruyter.com/document/doi/10.1515/bd-2022-0116/html
Zur Autorin:
Annette Strauch-Davey (M.A.), war mehrere Jahre für den Sonderforschungsbereich 1187 und im Zentrum für Informations- und Medientechnologie (ZIMT) an der Universität Siegen im Bereich Forschungsdatenmanagement (FDM) tätig. Dort kam sie mit den unterschiedlichen Anforderungen an die Fachdisziplinen in Berührung. In der UB Hildesheim war sie fünf Jahre die Ansprechpartnerin für das FDM. Sie war vier Jahre lang Mitglied der Kommission für forschungsnahe Dienste des VDB und beschäftigte sich dort mit Open Science und mit dem vertrauenswürdigen Umgang von Daten aller Arten und Formate. Seit Oktober 2022 ist sie Leitende Koordinatorin Forschungsdatenmanagement der OVGU Magdeburg.
Quellenangaben:
[1] https://www.nature.com/articles/d41586-020-00505-7 (Zugriff am 23.02.2023)
[2] https://www.tudelft.nl/en/library/research-data-management/r/support/data-stewardship (Zugriff am 22.02.2023)
[3] https://drive.google.com/file/d/1PtyipgiWIZTpQ6OCaKANCmzLJdGbUqhp/view (Zugriff am 22.02.2023)
[4] https://blog.rwth-aachen.de/forschungsdaten?s=data+steward (Zugriff am 22.02.2023)
[5] https://blog.rwth-aachen.de/forschungsdaten/2023/02/16/was-macht-eigentlich-ein-data-steward-teil-3/ (Zugriff am 22.02.2023)
[6] https://blog.rwth-aachen.de/forschungsdaten/2022/09/01/data-steward-teil-2/ (Zugriff am 22.02.2023)
[7] https://www.rwth-aachen.de/cms/root/Forschung/Forschungsdatenmanagement/FDM-Netzwerk/~retpu/Data-Stewards/ (Zugriff am 22.02.2023)
[8] https://blog.rwth-aachen.de/forschungsdaten/2022/07/28/was-macht-eigentlich-ein-data-steward/ (Zugriff am 22.02.2023)
[9] https://www.microgels.rwth-aachen.de/ (Zugriff am 22.02.2023)
[10] https://www.microgels.rwth-aachen.de/?page_id=979 (Zugriff am 22.02.2023)
[11] https://www.degruyter.com/document/doi/10.1515/bd-2022-0116/html?lang=de (Zugriff am 22.02.2023)
[12] https://www.dsc-ub.de/ (Zugriff am 22.02.2023)
[13] Förstner, Konrad U.; Georgy, Ursula; Seidler-de Alwis, Ragna: Aktuelle Wege zum Data Librarian. In: b.i.t.online 25.4 (2022), S. 339–345
[14] https://www.nfdi.de/datenkompetenz/?lang (Zugriff am 22.02.2023)