Übersicht aktueller Services, die einen FAIRen Zugang zu medizinischen Forschungsdaten ermöglichen.
Für alle Fachbereiche an den Universitäten ist das Forschungsdatenmanagement essentiell, vor allem natürlich immer die Arbeiten an den guten Infrastrukturen zu einem vertrauenswürdigen, rechtssicheren und forschungsethischen Umgang mit den Forschungsdaten überall, so natürlich auch in der Medizin.
Am Beispiel der medizinischen Forschung handelt es sich bei Forschungsdaten beispielsweise um die folgenden Daten:
- Bilddaten aus bildgebenden Verfahren (z.B. MRT)
- Sensordaten aus Biosignal- oder Vitalparametermessung (z.B. EKG, EEG)
- Biomaterialdaten aus Laboruntersuchungen (z.B. Blutproben, Genom-Daten)
- Befunddaten aus der ärztlichen Diagnostik (z.B. Anamnese)
- Statistikdaten (z.B. aus anonymisierten Befunddaten)
- Klassifikationen und Codes zu Krankheiten oder Materialien (z.B. International Statistical Classification of Diseases and Related Health Problems (ICD))
- Stammdaten der Patientenverwaltung (z.B. aus Krankenhausinformationssystemen)[1]
Bei Forschungsdaten in der Medizin und im Forschungsdatenmanagement geht es auch darum, welche Datenquellen angebunden werden sollen, wie z.B. administrative Daten (Abrechnungsdaten der Krankenkassen, aber keine Versorgungsdaten aus Krankenhäusern), die rechtlichen Themen (Vorschriften zur Löschung, Datentransparenzvorschriften, Data Sharing. Nicht nur Patientendaten, sondern vor allem auch gesunde Personen liefern Forschungsdaten, die den Studienteilnehmenden selbst gehören. Das volle Potential medizinischer Forschungsprojekte wird mit der Reproduzierbarkeit von Experimenten und Analysen sowie der Nachnutzbarkeit von Forschungsdaten ausgeschöpft.
Es geht in erster Linie aber tatsächlich darum, dass die erhobenen Forschungsdaten aus der Medizin nachgenutzt werden. Dabei hilft z.B. das ZB MED.
ZB MED
Das Infrastruktur- und Forschungszentrum für lebenswissenschaftliche Informationen und Daten
ZB MED[2] kooperiert in den folgenden Partnerschaften:
- Charité – Universitätsmedizin Berlin, Berlin Institute of Health
- Leibniz Institute for Prevention Research and Epidemiology – BIPS
- German Institute for Human Nutrition Potsdam-Rehbrücke – DIfE
- Fraunhofer Society (Fraunhofer Institute for Applied Information Technology – FIT; Fraunhofer Institute for Digital Medicine – MEVIS; Fraunhofer Institute for Algorithms and Scientific Computing SCAI)
- Heidelberg Institute for Theoretical Studies – HITS
- Network of Coordinating Centers for Clinical Trials – KKSN
- Max Delbrück Center for Molecular Medicine – MDC
- Robert Koch Institute – RKI
- Technology, Methods, and Infrastructure for Networked Medical Research – TMF
- University of Bonn (Institute for Agricultural Science)
- University of Bremen (Institute for Information, Health and Medical Law – IGMR)
- University of Cologne (University and City Library of Cologne)
- University of Leipzig (Institute for Medical Informatics, Statistics and Epidemiology (IMISE); LIFE-Research Centre for Civilisation Diseases; Centre for Clinical Trials (ZKS))
- University of Applied Sciences Mittweida (Faculty Applied Computer and Bio Sciences)
- University of Göttingen (University Medical Center)
- University of Greifswald (Institute for Community Medicine)
ZB MED bietet Forschenden viele Serviceangebote in allen Stadien des Forschungskreislaufs in der Medizin im Sinne von Open Science an. ZB MED stellt beispielsweise eine Publikationsinfrastruktur bereit, auf die weiter unten näher eingegangen werden soll.[3] Die Plattform “forschungsdaten.info” hat eine Auflistung von institutionellen Ressourcen zusammengestellt, die Herausforderungen im biomedizinischen Forschungsdatenmanagement aufgreifen und die recht nützlich ist.[4]
Die Publikationsinfrastruktur der ZB MED
Das Zentrum ZB MED[12] bietet standortunabhängig deutschlandweiten Zugang zu aktueller lebenswissenschaftlicher elektronischer Fachinformation (Fernzugriffslizenz). ZB MED beteiligt sich außerdem an einer transformativen Beschaffung und der Umstellung von traditionellen Subskriptionsmodellen hin zu publikationsbasierten Kostenmodellen. ZB MED wird im Rahmen der Beteiligung an der NFDI Services zur Datenversorgung bereitstellen.
“Die Services von ZB MED im Bereich Datenmanagement- und Publikationsinfrastruktur leisten einen Beitrag zur Literaturversorgung in den Lebenswissenschaften. Dabei stehen Qualitätssicherung und niedrigschwellige Publikations- und Datenmanagement-Angebote im Vordergrund. ZB MED bietet einen umfassenden Service von der Begleitung bei der Auswahl von elektronischen Laborbüchern und der individuellen (Publikations-)Beratung im Bereich Open Access und Open Science bis zum Angebot einer entsprechenden (Publikations-)Infrastruktur. Das Publikationsportal PUBLISSO ist der Zugang zu den verschiedenen Services.”
NFDI4Health
Die Plattform forschungsdaten.info stellt das Konsortium NFDI4Health (Nationale Forschungsdateninfrastruktur für personenbezogene Gesundheitsdaten) vor. Es ist als Konsortium ein Teil der nationalen Forschungsdateninfrastruktur (NFDI) und arbeitet für die Bereichen der Forschung in der Epidemiologie, im Gesundheitswesen und im Zusammenhang mit klinischen Studien.
Wichtig ist auch hier, dass gesundheitliche Forschungsdaten nach den FAIR-Prinzipien zugänglich gemacht werden. Der Förderzeitraum des Konsortiums in der ersten Runde ist vom 1.10.2020 bis zum 30.9.2025. Die medizinischen Projekte an den Universitäten und Klinika sind auf die Lösungen in den Task Areas sehr gespannt und unterstützen selbst das Konsortium mit ihren Fallbeispielen und Anforderungen und Bedarfen.
“NFDI4Health fokussiert sich auf Daten, die in klinischen, epidemiologischen und Public Health-Studien generiert werden. Im Vergleich zu klinischen Routinedaten oder Daten aus der ambulanten Versorgung erfüllen diese Daten bereits hohe inhaltliche Qualitätsstandards. Sie werden nach genau definierten Studienprotokollen generiert, sind hoch strukturiert, qualitätsgeprüft und kuratiert. (…) Die Daten, die in klinischen Studien von vielen PatientInnen generiert werden, unterstützen u.a. die Weiterentwicklung der personalisierten Medizin und helfen neue Therapieoptionen zu finden und die PatientInnenversorgung zu verbessern.”
Die Sammlung und Analyse der Forschungsdaten über den Gesundheits- und Krankheitszustand und wichtige Faktoren, die den Krankheitszustand beeinflussen, sind ein wesentlicher Bestandteil für die Entwicklung neuer Therapien, Versorgungsansätze und Präventionsmaßnahmen in einem modernen Gesundheitssystem. Das Konsortium NFDI4Health möchte die Voraussetzungen verbessern, dass Forschende sich schnell und einfach über die Studien informieren können. Hürden für gemeinsame Datennutzungen sollen gesenkt werden.
Im Februar 2023 fand die Veranstaltung “Wind of Change – Sharing is Caring: How to Improve Research Data and its Benefits in the Life Sciences” statt, welche vom Konsortium NFDI4Health initiiert worden war. Dort diskutierten anhand von Best-Practice-Beispielen Experten aus verschiedenen Bereichen der Life Sciences die Bedeutung datengestützter Entscheidungen.[5] Eine riesige Chance der NFDI4Health ist es, die Forschungsdaten der zur Verfügung stellenden Institution bekannter zu machen. Im Verzeichnis re3data können wir Repositorien aus dem Bereich der Medizin finden: https://www.re3data.org/search?subjects[]=22%20Medicine (Zugriff am 19.04.2023).
White Paper „Record Linkage“
Das White Paper “Record Linkage”[6] kann im Kontext der NFDI4Health erwähnt werden, denn es schafft eine erste Basis zur Verbesserung der Gesundheitsforschung in Deutschland. Es geht darin um die Auffindbarkeit und Zugänglichkeit von Sekundär- und Registerdaten. Im Dezember 2022 führte die NFDI4Health eine Veranstaltung durch, in der darüber diskutiert wurde, dass man während der ersten Phase von Covid-19 häufig feststellen musste, dass medizinische Forschungsdaten nicht auffindbar waren. Das war einer schnellen und guten Forschungstätigkeit natürlich und leider hinderlich. Im Bericht zum Community-Workshop zur Verbesserung des Record Linkage in Deutschland für die Gesundheitsforschung heißt es dazu:
“In der Corona-Pandemie wurde ein Schlaglicht auf die häufig unzureichende Verarbeitung und wissenschaftliche Nutzung von Gesundheitsdaten in Deutschland geworfen. Die Verbesserung der wissenschaftlichen Nutzung ebendieser Daten steht im Zentrum der Bestrebungen der von der Deutschen Forschungsgemeinschaft geförderten NFDI4Health-Initiative.”
Studien haben gezeigt, dass eindeutige Identifikatoren wie Krankenversichertennummern oft nicht für die Forschung zur Verfügung stehen und dass es zu viele unterschiedliche Regelungen in den einzelnen Bundesländern gibt. Neben den rechtlichen Fragen zum Record Linkage muss außerdem zuallererst die Verknüpfung von Gesundheitsdaten zu Forschungszwecken in der Bevölkerung akzeptiert werden. Prof. Dr. Ulrich Sax von der Universitätsmedizin Göttingen hat sich mit “Linkage von Daten aus Routinedaten und -proben und klinischen Erhebungen innerhalb eines rechtlichen Trägers” beschäftigt. Seine Datenquellen sind Informationssysteme aus der Krankenversorgung, validierte Daten. Die Forschungsdaten sind pseudonymisiert. An der Universitätsmedizin Göttingen gibt es sehr gute Methoden zum Record Linkage.
Zwei Fallbeispiele zum Record Linkage finden wir unter den folgenden Links:
1. Study of Health in Pomerania (SHIP) https://www.nfdi4health.de/images/Powerpoint/003%20-%20UseCase%201%20SHIP.pdf?_t=1664373168 (Zugriff am 19.04.2023)
2. Use Case/Fallbeispiel:
Linkage von Krankenkassen- und Krebsregisterdaten am Beispiel des Projekts DFG-Linkage: https://www.nfdi4health.de/images/Powerpoint/004%20-%20UC_2.pdf?_t=1664373168 (Zugriff am 19.04.2023)
In diesem Kontext empfehlen wir folgende Literatur:
- Pigeot et al (2021) Verknüpfung von Abrechnungsdaten gesetzlicher Krankenkassen mit Daten epidemiologischer Krebsregister:
Möglichkeiten und Limitationen. Bundesgesundheitsblatt – Gesundheitsforschung – Gesundheitsschutz 65, S.615 – S.623
- Pigeot et al (2021) Nutzung von Sekundärdaten für die pharmakoepidemiologische Forschung – machen wir das Beste draus! Gesundheitswesen 83, S.69 – S.76
Es gibt des Weiteren eine PowerPoint Präsentation zu den Rechtsfragen beim Record Linkage.[7] Darin werden die verfassungsrechtlichen Grenzen erwähnt, die Gefahr von Persönlichkeitsprofilbildung. Eine möglichst EU-weite Kommission sollte eingesetzt werden, um ein angemessenes ID-System für die Nutzung der Forschungsergebnisse zu ermöglichen, denn noch gibt es nicht einmal eine standardisierte Einwilligung (Standard Broad Consent) in der Gesundheitslandschaft. Damit beschäftigt sich weiterhin die Medizininformatik-Initiative, die in eine medizinische Forschungs- und Versorgungslandschaft eingebettet ist. Hier geht es um Aufbau von IT-Infrastrukturen, Datenschutz, Datennutzung, Forschungsdatenmanagement, Interoperabilität, Patienteninformation und -einwilligung und Anonymisierung.
Das Thema der Anonymisierung spielt gerade im medizinischen Forschungsdatenmanagement eine sehr wichtige und entscheidende Rolle bezüglich des Data Sharing. Ein Workshop zum Thema „Anonymisierung und Datentreuhand“ wurde am 12. und 13. Oktober 2022 in Berlin von der NFDI angeboten.[8] Ziel des Workshops war u.a. die Vernetzung und der Austausch der Konsortien zu Anonymisierungslösungen. Bei der Bekämpfung des Coronavirus hat das Forschungsdatenmanagement von Anfang an eine bedeutende Rolle gespielt, denn um ein Virus bekämpfen zu können, muss man es zunächst einmal kennen. Data Sharing der Forschungsergebnisse zu COVID-19 ist seit 2020 sehr hilfreich für die weitere Forschung gewesen, um zu neuen Erkenntnissen und „um zum Wohle der Menschen“, zu gelangen.
NFDI4Health Task Force COVID-19 Studienportal
Die Entwicklung eines Inventars deutscher Gesundheitsstudien zu COVID-19 ist eines der zentralen Ziele der NFDI4Health Task Force COVID-19.[9] Ziel ist es dabei, die Auffindbarkeit von Studien und den Zugang zu strukturierten Gesundheitsdaten zu ermöglichen, um das Management von Public-Health-Daten zur COVID-19-Pandemie zu verbessern. Der Study Hub NFDI4Health COVID-19 nicht nur auf die klinische Forschung konzentrieren, sondern auch auf Studien, die sich mit den Folgen der Pandemie für die öffentliche Gesundheit befassen (Inanspruchnahme von Gesundheitsdiensten, Lebensqualität, den Auswirkungen der sozialen Isolation). Darüber hinaus bietet diese Drehscheibe Zugang zu Instrumenten wie (Muster-)Fragebögen und weiteren Informationen bis hinunter zur Ebene der Variablen. In die Studiendrehscheibe ist ein Metadatenmodell eingebettet. Eine Veröffentlichungsrichtlinie für dieses Metadatenmodell wurde kürzlich veröffentlicht.
Publication Policy der NFDI4Health und der NFDI4Health
Task Force COVID-19
Die Publikationsrichtlinien[10] beschreiben die Anforderungen für die Veröffentlichung von Forschungsdaten aus gesundheitsbezogenen Studien im Study Hub.
Forschende oder Forschungsgruppen, die ihre Studien auffindbar machen wollen und entsprechende Forschungsdaten FAIR veröffentlichen wollen, sollten bestimmte Anforderungen erfüllen. Die Abbildung zeigt die Schritte, die für die Veröffentlichung je nach Art der Forschungsdaten erforderlich sind.[11]
Um die in gesundheitsbezogenen Studien erhobenen Forschungsdaten FAIR zu machen, ist ein erster Schritt die Veröffentlichung von umfassenden Informationen über den Kontext und die Zugänglichkeit der Daten (Metadatensatz). Darüber hinaus enthalten die Dokumente weitere detaillierte Informationen, die für die Interpretation der erhobenen Daten benötigt werden. Sie sollten ebenfalls veröffentlicht werden.
Vor allem sind zwei Typen von Forschungsdaten oder Ressourcen im Study Hub zu finden:
- Studienbeschreibungen, die umfassende Informationen (Metadaten) über intervenierende oder nicht-interventionelle Studien aus dem klinischen, epidemiologischen oder öffentlichen Gesundheitsbereich.
- Studiendokumente, die Informationen über Studien oder forschungsbezogene Inhalte enthalten, wie die Gestaltung, Durchführung oder Instrumente. Die Studiendokumente werden den Nutzern des Study Hub zum Herunterladen zur Verfügung gestellt.
Im Folgenden sind die gängigsten Arten von Studiendokumenten aufgeführt:
- Studienprotokoll (Studienplan, Studienvorschlag)
- Protokolländerung
- Datenwörterbuch (Datenkatalog)
- Informationsblatt für Teilnehmer/Patienten
- Formular für die Einwilligung nach Aufklärung (Vorlage)
- Betriebshandbuch/Standardarbeitsanweisungen
- Statistischer Analyseplan
- Plan zur Datenverwaltun
Eine besondere Art von Studiendokumenten, die im Study Hub veröffentlicht werden können, bezieht sich auf die Art und Weise wie Daten gesammelt werden:
- Fragebogen/Fallberichtsformular
- Codebuch
- Interviewschema und Themen
- Beobachtungsleitfaden
- Diskussionsleitfaden
Individuelle Daten von Teilnehmern/Patienten, die in Studien erhoben werden, gelten nicht als Ressourcentyp und werden nicht im Study Hub veröffentlicht.
Literaturempfehlung: Lindstädt, Birte, & Shutsko, Aliaksandra. (2022). Publication Policy of the National Research Data Infrastructure for Personal Health Data (NFDI4Health) and the NFDI4Health Task Force COVID-19 (1.0). https://doi.org/10.4126/FRL01-006431467
EBRAIN-Health
Das Projekt EBRAIN-Health[13] am Berlin Institute of Health in der Charité (BIH) und an der Klinik für Neurologie mit Experimenteller Neurologie der Charité, hat das Ziel, eine dezentrale, datenschutzkonforme Forschungsplattform zu entwickeln, die komplexe neurobiologische Phänomene des Gehirns simuliert. Dies soll nur ein Projekt aus der medizinischen Forschung sein, in dem das Forschungsdatenmanagement und die Infrastrukturen eine essentielle Rolle spielen.
Medizinische Zentralbibliotheken
An einigen Universitäten, wie an der OVGU in Magdeburg, gibt es medizinische Zentral- oder Spezialbibliotheken, die seit den letzten Jahren verstärkt auch zum Umgang mit medizinischen Forschungsdaten schulen. Diese Fachbibliotheken beraten, unterstützen beim Publizieren und beim Vernetzen, manchmal geben sie Support bei der DOI-Vergabe.
Eine Herausforderung der NFDI4Health ist also auch die Kooperation, sowohl mit den Universitäten, als mit den Bibliotheken. Biobanken wiederum bilden einen weiteren Baustein in der medizinischen Forschung, neben den Forschungsdatenrepositorien. Diese sammeln und bewahren Bioproben und zugehöriger Daten für Forschungszwecke.[14]
Weiterführende Literatur:
- Schickhardt, C., Winkler, E., Sax, U. et al. Dateninfrastrukturen für die Gesundheitsforschung. Bundesgesundheitsbl 66, 160–167 (2023): https://doi.org/10.1007/s00103-022-03648-2
- Spitz M, Cornelius K (2022): Einwilligung und gesetzliche Forschungsklausel als Rechtsgrundlagen für die Sekundärnutzung klinischer Daten zu Forschungszwecken. MedR 40:191–198
- Fröhlich W, Spiecker gen. Döhmann I (2022): Die breite Einwilligung (Broad Consent) in die Datenverarbeitung zu medizinischen Forschungszwecken – der aktuelle Irrweg der MII. GesR 6:346–353
- Forschungsergebnisse NFDI4Health: https://www.nfdi4health.de/aktuelles/forschungsergebnisse.html
- Fluck, Juliane, Birte Lindstädt, Wolfgang Ahrens, Oya Beyan, Benedikt Buchner, Johannes Darms, Ralf Depping, Jens Dierkes, Hubertus Neuhausen, Wolfgang Müller, Hajo Zeeb, Martin Golebiewski, Markus Löffler, Matthias Löbe, Frank Meineke, Sebastian Klammt, Holger Fröhlich, Horst Hahn, Matthias Schulze, Tobias Pischon, Ute Nöthlings, Ulrich Sax, Harald Kusch, Linus Grabenhenrich, Carsten Oliver Schmidt, Dagmar Waltemath, Sebastian Semler, Juliane Gehrke, Toralf Kirsten, Fabian Praßer, Sylvia Thun, Lothar Wieler, und Iris Pigeot. 2021. „NFDI4Health – Nationale Forschungsdateninfrastruktur für Personenbezogene Gesundheitsdaten“. Bausteine Forschungsdatenmanagement, Nr. 2 (Juli). German:72-85: https://doi.org/10.17192/bfdm.2021.2.8331
- Pigeot I, Intemann T, Kollhorst B, Sax U, Ahrens W. FAIRifizierung von Real World Data für die Gesundheitsforschung – Ein Petitum für modernes Record Linkage. Prävention und Gesundheitsförderung. 2023; (Epub 2022 Sep 28): https://doi.org/10.1007/s11553-022-00973-x
Zur Autorin:
Annette Strauch-Davey (M.A.), war mehrere Jahre für den Sonderforschungsbereich 1187 und im Zentrum für Informations- und Medientechnologie (ZIMT) an der Universität Siegen im Bereich Forschungsdatenmanagement (FDM) tätig. Dort kam sie mit den unterschiedlichen Anforderungen an die Fachdisziplinen in Berührung. In der UB Hildesheim war sie fünf Jahre die Ansprechpartnerin für das FDM. Sie war vier Jahre lang Mitglied der Kommission für forschungsnahe Dienste des VDB und beschäftigte sich dort mit Open Science und mit dem vertrauenswürdigen Umgang von Daten aller Arten und Formate. Seit Oktober 2022 ist sie Leitende Koordinatorin Forschungsdatenmanagement der OVGU Magdeburg.
[1] https://www.o-bib.de/bib/article/view/2015H4S73-77/3325 (Zugriff am 19.04.2023)
[2] https://www.zbmed.de/ueber-uns/profil-zbmed (Zugriff am 19.04.2023)
[3] https://www.zbmed.de/ueber-uns/profil-zbmed/informationsinfrastruktur (Zugriff am 19.04.2023)
[4] https://forschungsdaten.info/wissenschaftsbereiche/lebenswissenschaften/medizinische-forschung/ (Zugriff am 19.04.2023)
[5] https://www.nfdi4health.de/aktuelles/veranstaltungen/item/179-wind-of-change-%E2%80%93-sharing-is-caring-how-to-improve-research-data-and-its-benefits-in-the-life-sciences.html (Zugriff am 19.04.2023)
[6] https://www.nfdi4health.de/aktuelles/veranstaltungen/item/182-community-workshop-white-paper-zur-verbesserung-des-record-linkage-in-deutschland.html (Zugriff am 19.04.2023)
[7] https://www.nfdi4health.de/images/Powerpoint/010%20-%20NFDI4H%20White%20Paper%202022%20IRS.pdf?_t=1664373168 (Zugriff am 19.04.2023)
[8] https://www.nfdi.de/elsa-workshop-oktober-2022/ (Zugriff am 19.04.2023)
[9] https://covid19.studyhub.nfdi4health.de/ (Zugriff am 19.04.2023)
[10] https://www.nfdi4health.de/en/task-force-covid-19/research-findings.html (Zugriff am 19.04.2023)
[11] file:///C:/Users/gare42fa/Downloads/NFDI4Health_Publication%20Policy_V1_0.pdf (Zugriff am 19.04.2023)
[12] https://www.zbmed.de/ueber-uns/profil-zbmed/informationsinfrastruktur (Zugriff am 19.04.2023)
[13] https://www.bihealth.org/de/aktuell/millionenfoerderung-fuer-gehirnsimulation (Zugriff am 19.04.2023)
[14] https://www.akek.de/biobanken/ (Zugriff am 19.04.2023)