AI in der klinische Forschung

Diese Veranstaltung fand in Kooperation mit der Medizinischen Universität Wien statt Donnerstag, 27. November 2025, 15:00 Uhr Online-Fortbildung

Mit dem ersten Vortrag „KI in der akademischen Forschung – Vom Hype zur praktischen Anwendung“ adressierte Georg Langs, Comprehensive Center for AI in Medicine (CAIM), MUW, gleich einmal die zentrale Frage, die sich wohl viele von uns stellen: was ist wirklich dran an der KI und wo kann sie sinnvoll genutzt werden?

Schon in der Einleitung präsentierte Georg Langs einige praktische Beispiele, die den Nutzen aufzeigen: KI-unterstützte Schnelldiagnosen während neurochirurgischer Eingriffe können binnen weniger Minuten erfolgen, mehrfach während einer OP wiederholt werden und damit helfen, den Eingriff zu steuern. KI-unterstützte Beurteilungen von Thorax-CTs machen die Bilddaten quantifizierbar, dadurch können sie in den Kontext mit klinischen Verläufen gebracht werden und einen Beitrag zu Entscheidungen zum weiteren Patienten-Management leisten.

Natürlich ist KI nur eine Unterstützung, die Entscheidung selbst bleibt immer beim behandelnden Team – durch die hohe Leistungsfähigkeit und die Geschwindigkeit dieser Systeme wird die Entscheidungsgrundlage jedoch verbreitert und ggf. auch verfeinert.

Weitere Ziele der KI-Anwendung neben Diagnose und Verlaufsbeobachtungen sind die Identifizierung von Prognosemarkern und das Erkennen neuer Targets. Ein Beispiel hierfür ist das nicht-invasive Tracking von neuen Behandlungen von NASH/MASH: ausgehend von MR-Bildern der Leber werden unterschiedliche Gewebe-„Texturen“ identifiziert, quantitativ erfasst und die Veränderungen über die Zeit abgebildet. Im Vergleich zu den eher wenig sensitiven etablierten Markern können hiermit Veränderungen viel früher erfasst werden. Das nächste Ziel ist die Validierung hinsichtlich prognostischer Aussagekraft und dann der Versuch, hierdurch auch neue Targets zu identifizieren. Ein anderes Projekt befasst sich mit der Vorhersage des Ansprechens auf eine neoadjuvante Chemotherapie bei Brustkrebs: über einen Vergleich von pre-treatment zu early treatment imaging sind Zeitketten darstellbar. Die Veränderungen über die Zeit können genaue Aussagen liefern, was während der Behandlung mit dem Gewebe passiert: es kann früh sichtbar gemacht werden, ob die Behandlung funktioniert und wie die Veränderung im Tumor aussehen kann. Potentiell könnten damit auch Mechanismen erkennbar werden, um neue Therapien zu identifizieren.

Ein anderer großer Anwendungsbereich ist der Einsatz von large Language Models, um strukturierte Patientenpfade/Behandlungspfade aus großen Mengen unstrukturierter Patientendaten zu erstellen.

Zori Cheshmedzhieva, Celerion, erweiterte mit ihrem Vortrag „From Mistery to Mastery – AI in Clinical Trials“ die Perspektive auf die klinische Forschung.

Zunächst machte Zori Cheshmedzhieva darauf aufmerksam, dass AI bzw. die Verwendung derselben Einfluss auf das menschliche Gehirn bzw. uns und unser Denken und Handeln hat. AI kann uns viel „Detail- und Sucharbeit“ ersparen und ermöglicht es, riesige Datenmengen rasch zu analysieren. Wenn wir uns allerdings zu sehr auf AI verlassen, so kann das unser eigenes Erinnerungsvermögen schwächen und unsere Fähigkeit zum unabhängigen kritischen Denken beeinträchtigen. Entscheidend sind auch hier der passende Kontext und die „richtige Dosis“.

Im Anwendungsfall klinische Forschung kann AI viele Hilfestellungen sowohl für Sponsoren, Prüfzentren und Behörden bieten. Dabei geht es um eine erhöhte Effizienz, um ein rascheres Drug Development und insbesondere auch um eine höhere Sicherheit für die Patient*innen. Ein zentrales Thema ist die Patientenrekrutierung, wo AI durch Screening vorhandener Daten potentiell geeignete Patient*innen identifizieren und bereits vorab auf Einschluss- und Ausschlusskriterien überprüfen kann, was letztlich die Rekrutierung beschleunigen sollte. Weitere Bereiche sind die Unterstützung von remote Monitoring und die Datenanalyse aus Wearables und Health Apps inklusive der entsprechenden Qualitätskontrolle oder im Supply-Management von Studienmedikation und sonstigen Materialien – eine große Hilfe könnte dies speziell bei dezentralisierten Studien darstellen. Und natürlich der Einsatz im Bereich Dokumentation, wie das Erstellen von Studienprotokollen und Unterlagen für Patient*innen. Hoch interessant ist der Einsatz bei der Generierung strukturierter Studienreports aus den erfassten Daten inklusive Qualitätskontrolle komplexer Datensätze und Signal Detection hinsichtlich Wirksamkeit und Safety/Toxizität. Idealerweise sollte dies die Datenintegrität verbessern und somit zu einer höheren Verlässlichkeit führen, sowie den Review und auch die Entscheidungsfindung erleichtern und beschleunigen. Gleichzeitig sind viele zentrale Limitationen der zugrundeliegenden Modelle zu beachten, z.B. ein algorithmisches Bias aufgrund nicht-repräsentativer Trainingsdaten. Und natürlich Themen wie mangelnde Erklärbarkeit der Modelle, Reproduzierbarkeit und auch Haftungsfragen.

Die Motivation hinter all dem sei, gut geeignete (personalisierte) Behandlungen für die Patient*innen zu entwickeln, und dies natürlich möglichst rasch, ohne unnötige Verzögerungen. Dazu passt das Abschlusszitat „Balance innovation with ethics“.

Der Vortrag „Regulatory Perspectives: AI Guidance Development & EMA Reflection Paper“ von Tobias Fellinger, BASG/AGES widmete sich den aktuellen Richtlinien sowie den dahinterliegenden Grundsätzen.

Im EMA Reflection Paper (Reflection paper on the use of Artificial Intelligence (AI) in the medicinal product lifecycle, 9Sept2024) ist die Definition von AI sehr weit gefasst: „..an AI system is a machine-based system designed to operate with varying levels of autonomy and that may exhibit adaptiveness after deployment and that, for explicit or implicit objectives, infers, from the input it receives, how to generate outputs such as predictions, content, recommendations, or decisions that can influence physical or virtual environment. In this reflection paper the term AI/ML is used to cover all models developed through the process of ML, regardless of the specific model architecture.“

Es ist unbestritten, dass der Einsatz von AI/ML helfen kann, Daten auch im Bereich medizinischer Therapien/Produkte grundsätzlich effektiver zu generieren, transformieren, analysieren und zu interpretieren. Entscheidend ist die Validität des zugrundeliegenden Modells – speziell zu beachten ist der jeweilige Kontext und damit die Frage, welche Auswirkungen potentielle Fehler haben können. Das Reflection Paper fordert demgemäß einen strikten Risiko-basierten Ansatz für die Entwicklung, die Bereitstellung und das Perfomance Monitoring solcher Tools.

Relevant ist zunächst der Kontext, in dem das Tool eingesetzt wird (was soll es können?). Dies muss genau definiert sein, um Entwicklung und Validierung korrekt durchführen zu können. Spezielle Anforderungen gibt es an die Datengrundlage, da die Trainingsdaten absolut entscheidend für das „Verhalten“ des Tools sind. Es muss eine genaue Dokumentation der Datenquellen und des Daten Cleaning geben, eine saubere Trennung von Testdaten und Trainingsdaten ist unerlässlich. Für high risk Anwendungen wird ein prospektiv erhobener Test-Datensatz empfohlen.

Beim Performance Assessment sind die Auswahl relevanter Metriken entscheidend, sowie Sensitivitätsanalysen, insbesondere auch in Hinblick auf Zeittrends (Diskrepanz „alte“ Trainingsdaten mit aktueller Anwendung). Hinsichtlich Interpretierbarkeit und Erklärbarkeit wären transparente Modelle zu bevorzugen. Meist sind es jedoch sog. „black box Modelle, somit ist zumindest auf erklärbare AI-Techniken zu achten. Beim Performance Monitoring müssen präspezifizierte Kriterien für die Performance festgelegt sein, außerdem müssen Veränderungen in Behandlungsalgorithmen beachtet werden und ggf. die Validität erneut überprüft werden. In diesem Kontext ist ein Risiko-Minimisierungsplan unerlässlich, inklusive festgelegter Kriterien, wann die Verwendung des Modells eingestellt werden muss.

Insgesamt unterscheiden sich die Anforderungen entsprechend dem Lifecyle ders Produktes und der damit verbundenen Risiken für die Patient*innen bzw. regulatorische Risiken (drug discovery, non-clinical development, clinical trials, post-authorisation phase). Nach Markteinführung könnten AI/ML-Tools eine wichtige Unterstützung bei der Signal-Detection leisten, sei es im Kontext von PASS/PAES-Studien oder generell zur Analyse der Pharmakovigilanzdaten.

Alle drei Vortragende hatten ein ähnliches Fazit, wenn es darum ging, den Stellenwert von KI (AI, ML) zu bewerten: KI ist wertvoll als Entscheidungshilfe oder erweiterte Entscheidungsgrundlage. Die finale Entscheidung muss aber immer „der Mensch“ selbst treffen. KI soll eingesetzt werden, wenn sich daraus eine Verbesserung für die Patient*innen ergeben kann. Dazu gehören auch neue oder genauere Prognosemarker sowie Hypothesen-generierende Ansätze für neue Targets. KI muss aber genauso über Studien verifiziert werden, wie alle Maßnahmen in der Medizin, ob medikamentöse Therapien, Biomarker, bildgebende Verfahren oder jede andere Technologie.

Die Slides dieser Vorträge sind nur für Mitglieder abrufbar. Den Link erhalten Sie wenn Sie Mitglied werden

Koordinationszentrum für Klinische Studien, 1090 Wien, Kinderspitalgasse 25a, OG 1, Tel (+43-1)40160 25183, kks@meduniwien.ac.at, http://www.meduniwien.ac.at/kks

Archive