Data Semantics Gruppe

Die CAIRO Data Semantics Gruppe beschäftigt sich mit klarer Definition und Strukturierung von Daten in der Radioonkologie. Hierdurch werden die Grundlagen für die Anwendung von Informationstechnologie (IT) und künstlicher Intelligenz (KI) gelegt. Zur exakten Beschreibung von klinischen, physikalischen, biologischen und technischen Daten in der Radioonkologie wird das Konzept der Common Data Elements (CDEs) verwendet, welches von den National Institutes of Health (NIH) etabliert wurde. 

Durch CDEs können relevante Daten sowohl für Forschungszwecke als auch für die klinische Anwendung mit Real-World Data (RWD) exakt abgebildet werden. Medizinische Informationen werden hierbei in einem strukturierten, standardisierten und maschinenlesbaren Format erhoben, was semantische Interoperabilität ermöglicht. Gleichzeitig können Informationen sowohl für die Informatik als auch die Medizin sinnvoll abgebildet werden. Dies ermöglicht die direkte Einbettung von medizinischen IT- und KI-Anwendungen. Dieser Ansatz wurde von der Union for International Cancer Control (UICC), welche das in der Onkologie fundamentale TNM-Klassifizierungssystem begründet hat, bestätigt und hat unsere Arbeit hierzu als beste wissenschaftliche Arbeit am Weltkrebskongress 2024 ausgezeichnet.

Die Entwicklung von KI ist direkt abhängig von qualitativ hochwertigen und exakt definierten Daten. Innerhalb von CAIRO bildet die Data Semantics Group die Grundlagen zur Etablierung einer umfassenden Dateninfrastruktur, die es ermöglicht, medizinische Informationen systematisch zu erfassen und für KI zu nutzen.

Projekte und Ziele

Folgende Projekte und Ziele werden von der Data Semantics Gruppe verfolgt

  • Entwicklung der notwendigen Systeme für die Abbildung von medizinischen Informationen mit CDEs
  • Definition von klinischen, physikalischen, biologischen und technischen Daten der Radio-Onkologie
  • Bildung der Grundlagen für Projekte von CAIRO durch Aufbau einer strukturierten Datenbank
  • Durchführung retrospektiver und prospektiver Analysen radiotherapeutischer Daten
  • Entwicklung und Anwendung von Systemen zum automatisierten Auslesen, Verwalten und Analysieren von Daten mithilfe von Techniken der Computerlinguistik (NLP), und generativer KI, wie grossen Sprachmodellen (LLMs).
  • Unterstützung von klinischen und wissenschaftlichen Projekten der Universitätsklinik für Radio-Onkologie (UKRO).