Competence Unit für föderierte KI & bioinformatische Analysen (KIBCU)

KI und Bioinformatik

Durch die Digitalisierung im Gesundheitswesen und in der Forschung entstehen im BZKF klinische Daten, Bilddaten, Bioprobeninformationen und molekulare Daten, die für innovative bioinformatische Verfahren und Methoden der Künstlichen Intelligenz genutzt werden können. Dadurch sollen die onkologischen Versorgungs- und Forschungsprozesse verbessert werden, um die klinische Entscheidungsfindung zu unterstützen und die onkologische Patientenversorgung zu optimieren. 

Die IT-Strategie des BZKF basiert auf Konzepten der deutschen Medizininformatik-Initiative (MII) mit dem Ziel „Real World Daten (RWD)“ aus der Patientenversorgung lokal an den Universitätskliniken zu halten und die Analyse zu den Daten zu bringen (föderierte Analyse und föderiertes maschinelles Lernen). Hierfür wurde eine Basisinfrastruktur (basierend auf DataSHIELD) etabliert. Die Pipeline für die Datenextraktion, die Pseudonymisierung und das Mapping auf das MII Kerndatensatzmodul Onkologie wird kontinuierlich überprüft und weiterentwickelt, um onkologische Daten in die FHIR-Datenbank der BZKF-Standorte zu überführen. Hierbei arbeitet die KI & Bioinformatik Competence Unit (KIBCU) eng mit den klinischen Fachpersonen, den Datenintegrationszentren (DIZ) an den BZKF-Standorten und der Arbeitsgruppe IT des BZKF zusammen.

  • Heterogene IT-Systeme an den Standorten (z.B. Tumordokumentations- oder Biobankenmanagementsystem)
  • Unterschiedliche Datenformate und Datenelemente
  • Zentrale Datenzusammenführung retrospektiver Routinedaten (RWD) aufgrund fehlender Einwilligungen nicht zulässig
  • Keine nachhaltige Forschungsinfrastruktur (Secondary Use)
  • Fehlende Kompetenzen für verteiltes maschinelles Lernen (KI)
  • Mangel an großer hochwertiger Datenbasis (KI)
  • Komplexität der Aufbereitung, Speicherung und Analyse bioinformatischer Daten
  • Dadurch keine standortübergreifende retrospektive Datennutzung für wissenschaftlichen Kenntnisgewinn möglich 

  • Datenharmonisierung
  • Entwicklung/Überarbeitung standardisierter Pipelines
  • Datenqualitäts- und Plausibilitätschecks
  • Datenintegration
  • Föderierte Auswertungen
  • Verteiltes maschinelles Lernen (KI)
  • BZKF-weite Weiterbildung und Schulung in Grundlagen und Methoden der KI-Entwicklung sowie Konzepten föderierten maschinellen Lernens


  • Etablierung eines BZKF-weiten Forschungsdaten-Repositories mit klinischen Daten, Bilddaten, Probeninformationen und molekularen Daten
  • Entwicklung innovativer bioinformatischer Pipelines und neuer KI-basierter Entscheidungsunterstützung
  • Sicherstellen einer Governance-Struktur für die Datennutzung und den Datenaustausch
  • Datenqualitätsanalyse und kontinuierliches Feedback zur Datenverbesserung
  • Unterstützung von Studiengruppen und medizinisch Forschenden bei der Bioinformatikanalyse und KI-Entwicklungen
  • Verfolgung der Entwicklung und Analyse föderierter KI-Modelle basierend auf der etablierten Infrastruktur
  • Entwicklung neuer Algorithmen für föderiertes maschinelles Lernen auf verschiedenen Datentypen
  • Kontinuierliche BZKF-weite Weiterbildung und Schulung in Konzepten föderierten maschinellen Lernens

Prof. Dr. Hans-Ulrich Prokosch, Universitätsklinikum Erlangen 
Prof. Dr. Thomas Ganslandt, Universitätsklinikum Erlangen


Aufzeichnung der KI-Webinarreihe 

Zur Youtube Aufzeichnung vom 16.10.2024

Real World Federated Learning in Radiology: Hurdles to overcome and Benefits to gain
Welche Hindernisse müssen gemeistert werden, um Federated Learning in reale radiologische Anwendungen zu integrieren?
Referent: Markus Bujotzek, DKFZ Heidelberg

 

Zur Youtube Aufzeichnung vom 13.1.2024

An Experimental Survey of Incremental Transfer Learning for Multicenter Collaboration – Wie kann Incremental Transfer Learning Datenschutzprobleme bei der Zusammenarbeit mehrerer Kliniken lösen?
Referent: Dr. Florian Putz, Universitätsklinikum Erlangen

Publikation: An Experimental Survey of Incremental Transfer Learning for Multicenter Collaboration

Publikation: Multicenter privacy-preserving model training for deep learning BM autosegmentation

 

Zur YouTube Aufzeichnung vom 11.12.2024

Evaluation and mitigation of the limitations of large language models in clinical decision-making
Referent: Paul Hager, TUM