Künstliche Intelligenz in der Medizin ist oft als lernfähige Software verstanden. Sie erkennt Muster in großen Datenmengen und zieht daraus Zusatzinformationen. Es handelt sich dabei nicht um „denkende Maschinen“, sondern um Verfahren, die Wahrscheinlichkeiten berechnen und Hinweise liefern. KI in der Medizin dient vor allem der Analyse, nicht der Automatisierung.
Der Wert medizinischer Daten zeigt sich oft erst im Vergleich vieler Fälle. Einzelne Messwerte wirken banal, in Summe werden sie aussagekräftig. Dies gilt für Blutdruckreihen, Laborwerte, Sauerstoffsättigung und EKG-Kurven. Ebenso für Ultraschall, MRT-Aufnahmen und mikroskopische Zellbilder.
Im KI im Gesundheitswesen ist die Datenbasis entscheidend. Je konsistenter die Daten erfasst werden, desto stabiler sind die Ergebnisse. Ungenaue Messungen, fehlende Angaben oder wechselnde Geräte können Modelle in die Irre führen. Auch unterschiedliche Patientengruppen müssen abgebildet sein, sonst entstehen Verzerrungen.
Als Medizintechnologie wird KI in den nächsten Jahren ein dominierendes Thema bleiben. Diagnostik, Therapieplanung und Versorgungsprozesse können datengetrieben schneller werden. In der Forschung lassen sich Hypothesen schneller prüfen, weil mehr Fälle gleichzeitig ausgewertet werden. In der Praxis können Ärztinnen und Ärzte bei Routineaufgaben entlastet werden.
Damit ist eine Grundspannung gesetzt: messbare Chancen stehen klaren Risiken gegenüber. Zu den Chancen zählen präzisere Erkennung, bessere Priorisierung in der Diagnostik und belastbarere Entscheidungsgrundlagen. Zu den Risiken gehören Black-Box-Modelle, Bias durch nicht repräsentative Trainingsdaten und eine Überabhängigkeit vom System. Hinzu kommen Haftungsfragen, wenn eine Empfehlung falsch war.
Die folgenden Abschnitte ordnen diese Punkte strukturiert ein. Es werden Lernprinzipien erklärt und Praxisbeispiele aus Bildgebung und Blutanalytik dargestellt. Außerdem werden Anwendungen in Onkologie, Diabetes und Pflege eingeordnet. Abschließend werden deutsche Rahmenbedingungen wie Datenschutz, fragmentierte Datenstrukturen und aktuelle Gesetzesinitiativen im KI im Gesundheitswesen beleuchtet.
Warum künstliche Intelligenz Medizin gerade jetzt verändert
Heute fallen im klinischen Alltag mehr digitale Messpunkte an als je zuvor. Künstliche Intelligenz Medizin wird nicht mehr nur in Laboren entwickelt, sondern direkt in der Versorgung angewendet. Für KI im Gesundheitswesen ist es entscheidend, dass Daten vergleichbar, sauber dokumentiert und sicher nutzbar sind.
Wenn diese Grundlagen gelegt sind, entsteht Gesundheitsinnovation nicht durch spektakuläre Einzelfälle. Vielmehr werden durch die Auswertung vieler ähnlicher Verläufe Muster sichtbar. Diese Muster könnten im Tagesgeschäft leicht übersehen werden. Das führt zu Veränderungen in Abläufen, ohne die Verantwortung zu mindern.
Der „Datenschatz“ im Gesundheitssystem: Vitalwerte, Labor, Bildgebung und Mikroskopie
Blutdruckmessungen, Sauerstoffsättigung und andere Vitalwerte aus Monitoren und Wearables gelten als Datenschatz. Hinzu kommen Blutwerte und Labordaten, die echte Trends über Zeitreihen zeigen. Ultraschallaufnahmen und MRT-Bildgebung liefern große Mengen strukturierter Informationen.
Auch die Mikroskopie von Blutzellen ist wichtig, da sie feine Unterschiede in Form und Verteilung sichtbar macht. Der Nutzen entsteht, wenn viele Datensätze zusammengeführt und nach einheitlichen Kriterien ausgewertet werden. Für KI im Gesundheitswesen ist die Standardisierung entscheidend, damit Ergebnisse stabil bleiben.
| Datenquelle | Typische Beispiele | Stärke bei großen Datensätzen | Praktischer Nutzen für Teams |
|---|---|---|---|
| Vitalwerte | Blutdruck, Sauerstoffsättigung, Puls, Atemfrequenz | Früherkennung von Abweichungen über Stunden und Tage | Priorisierung auffälliger Verläufe, weniger Alarmmüdigkeit |
| Labor | Blutwerte, Entzündungsmarker, Elektrolyte | Robuste Referenzbereiche je Alter, Kontext und Begleiterkrankung | Schnellere Einordnung von Grenzwerten, bessere Verlaufskontrolle |
| Bildgebung | Ultraschallaufnahmen, MRT-Bildgebung | Wiedererkennbare Muster trotz unterschiedlicher Geräte und Aufnahmetechnik | Markierung verdächtiger Areale als zweite Sicht |
| Mikroskopie | Mikroskopie von Blutzellen, Zellmorphologie | Feinere Klassifikation durch viele Beispiele seltener Zellbilder | Unterstützung bei Routinen, Fokus auf strittige Befunde |
Maschinelles Lernen als Treiber der Gesundheitsinnovation
Im Mittelpunkt steht maschinelles Lernen. Es extrahiert Merkmale aus Rohdaten, trainiert Modelle mit neuen Fällen und verbessert die Trefferquote Schritt für Schritt. So wird Gesundheitsinnovation messbar, etwa durch konsistentere Befundvorschläge oder klarere Risikoprofile.
Wichtig ist die Nutzung vieler, gut beschriebener Datensätze. So wird vermieden, dass Zufallseffekte als Regel gelernt werden. In der Praxis heißt das: gleiche Messbedingungen, definierte Labels und dokumentierte Datenqualität. Künstliche Intelligenz Medizin bleibt so ein verlässliches Werkzeug, auch unter Alltagsdruck.
Computer als „Sparring-Partner“ statt Ersatz für ärztliche Entscheidungen
Als Leitprinzip gilt: Erkennung kann durch Systeme erfolgen, Interpretation und Verantwortung bleiben ärztlich. KI im Gesundheitswesen wird zum Sparring-Partner, der Hinweise liefert, aber keine Entscheidung erzwingt. Das reduziert Fehlstellen, ohne die klinische Einordnung zu ersetzen.
Michael Levitt betont die Interaktion von biologischer, menschlicher und maschineller Intelligenz. In diesem Zusammenspiel wird erwartet, dass die Kombination leistungsfähiger bleibt als Mensch oder Maschine allein. Damit diese Zusammenarbeit trägt, sollten Verständlichkeit, Transparenz und Kontrollierbarkeit als Kriterien angesetzt werden.
- Begründbarkeit: Die Schlussfolgerung sollte in klaren Schritten erklärbar sein.
- Nachvollziehbare Herkunft: Es sollte erkennbar sein, aus welchen Daten und Vorverarbeitungen ein Ergebnis entsteht.
- Gezielte Prüfung: Es sollte möglich sein, Annahmen zu testen, Parameter zu ändern und Ergebnisse zu verifizieren.
Unter diesen Bedingungen lässt sich künstliche Intelligenz Medizin in Prozesse einbetten, ohne die klinische Sorgfalt zu verwässern. Gesundheitsinnovation bleibt an klare Regeln gebunden, statt auf reine Automatisierung zu setzen. KI im Gesundheitswesen wird so zu einer Unterstützung, die im Team arbeitet und im Zweifel überprüfbar bleibt.
So funktioniert Lernen mit medizinischen Daten: überwacht und unüberwacht
Diagnose KI im Klinikalltag zu nutzen, erfordert das Lernen aus Messwerten, Bildern und Laborbefunden. In der Medizintechnologie werden dafür zwei Methoden angewandt: überwachtes und unüberwachtes Lernen. Beide Methoden nutzen ähnliche Datenquellen, unterscheiden sich jedoch in Vorgaben und Zielen.
Für die Gesundheitsinnovation ist diese Unterscheidung entscheidend. Sie beeinflusst Prüfverfahren, Fehlerbilder und Einsatzgrenzen. Beim Bewertungsprozess ist es wichtig zu prüfen, ob ein Modell auf markierten Beispielen trainiert wurde oder ob es Muster ohne feste Zielvorgabe sucht.
Überwachtes Lernen: Training mit markierten Beispielen (gesund vs. pathologisch)
Beim überwachten Lernen werden viele ähnliche Datensätze mit einem Label versehen, zum Beispiel „gesund“ oder „pathologisch“. Das Modell lernt, diese Zuordnung nach dem Training selbstständig zu treffen. Für Diagnose KI ist das der Standard, da eine klare Zielgröße testbar ist.
Damit die Klassifikation stabil bleibt, werden die Daten vorab vereinheitlicht. Zum Beispiel durch feste Bildauflösung und gleiche Messskalen. Uneinheitliche Labels erhöhen das Risiko für Fehlklassifikationen. Deshalb investiert man in Annotation, Interrater-Abgleich und saubere Testdaten.
Beispiel Ultraschall: Algorithmus zur Plazenta-Vermessung und Unterstützung beim Schallen
Ein Beispiel ist die Arbeit von Julia Schnabel (Technische Universität München; Helmholtz Munich). Ein Algorithmus wird so trainiert, dass Plazenta und Umrisse in Ultraschallbildern erkannt werden. Für das Training werden viele Aufnahmen benötigt, in denen die Plazenta zuvor präzise markiert ist.
Ultraschalldaten sind vergleichsweise leicht zu gewinnen, da keine Strahlenbelastung entsteht und die Untersuchung Teil der Vorsorge ist. Es entsteht für Patientinnen meist kein Mehraufwand. So lässt sich der Datenbestand für Diagnose KI schneller ausbauen.
Technisch wird mit einer Konstruktion gearbeitet, bei der mehrere Ultraschallköpfe nahezu gleichzeitig Bilddaten speichern. Aus den synchronen Ansichten kann ein Computer das Plazenta-Volumen bestimmen. In der Medizintechnologie ist das ein typisches Vorgehen, um aus 2D-Schnitten robuste 3D-Messgrößen abzuleiten.
Der medizinische Zweck ist klar: Die Plazenta versorgt den Fetus. Wenn sie zu klein ist, droht eine Unterversorgung. Ist die Schwangerschaft weit genug fortgeschritten, kann eine frühere Geburt erforderlich werden, um bleibende Schäden zu vermeiden.
In der Praxis ist die Plazentagröße schwer zu ermitteln. In Kontrollen wird daher oft primär das fetale Wachstum beobachtet, wodurch eine Unterversorgung relativ spät auffallen kann. Hier wird Gesundheitsinnovation greifbar, weil eine zusätzliche Messgröße in den Ablauf eingebracht wird, ohne das Verfahren zu verändern.
Der Algorithmus wurde zudem mit weiteren Daten erweitert, sodass Organe und Körperteile des Fetus erkannt werden. Daraus können Hilfestellungen beim Schallen direkt am Ultraschallkopf abgeleitet werden, etwa für die Ausrichtung und die Auswahl geeigneter Schnittebenen. Diagnose KI wird damit weniger zur „Endentscheidung“ und stärker zur assistierenden Funktion.
Unüberwachtes Lernen: Musterfindung in der Einzelzellanalyse für neue biologische Erkenntnisse
Beim unüberwachten Lernen werden möglichst wenige Vorgaben gemacht. Der Computer erhält Daten, sucht Ähnlichkeiten und ordnet sie zu Clustern, oft ergänzt durch wenige Zusatzinformationen. Ziel sind Muster, neue Zusammenhänge und Hypothesen, nicht sofort eine feste Klassifikation.
Fabian Theis (Helmholtz Munich) steht für diesen Ansatz in der Einzelzellanalyse. Dabei werden Profile einzelner Zellen betrachtet, etwa Genaktivität und Stoffwechselzustände. Ohne „richtig/falsch“-Vorgaben lassen sich Zellzustände entdecken, die in der Routine untergehen.
Ein konkretes Beispiel ist Diabetes: Es können Stoffwechselprofile einzelner Zellen der Bauchspeicheldrüse bei Menschen mit Diabetes mit Profilen Gesunder verglichen werden. Unterschiede defekter Zellzustände werden so sichtbar, auch wenn sie nicht vorher benannt wurden. In einem Folgeschritt wird die gezielte Suche nach Medikamenten möglich, die diese Stoffwechselveränderungen „reparieren“ sollen.
| Aspekt | Überwachtes Lernen | Unüberwachtes Lernen |
|---|---|---|
| Benötigte Vorgaben | Viele Daten mit Labels, z. B. „gesund“ vs. „pathologisch“ | Wenig Vorgaben, Fokus auf Ähnlichkeiten und Strukturen |
| Typisches Ziel | Spätere Klassifikation oder Messung mit definierter Ausgabe | Cluster, neue Zusammenhänge, Hypothesen für weitere Tests |
| Beispiel aus der Medizintechnologie | Ultraschall: Plazenta-Umrisse markieren, Volumen automatisiert bestimmen | Einzelzellen: Stoffwechselprofile gruppieren, Zellzustände vergleichen |
| Stärken im Alltag | Gut prüfbar, klare Kennzahlen, geeignet für Assistenzfunktionen | Findet unerwartete Muster, hilfreich für Forschung und Target-Entwicklung |
| Typische Stolpersteine | Fehlerhafte Labels, Verzerrung durch nicht repräsentative Daten | Cluster schwer interpretierbar, Bedarf an biologischer Validierung |
Für Gesundheitsinnovation werden beide Ansätze oft kombiniert. Überwachtes Lernen liefert robuste Assistenz in der Diagnostik, unüberwachtes Lernen erweitert das Verständnis von Krankheitsmechanismen. Beim Systemeineordnen ist es wichtig, die Datenbasis, die Labels und die Validierung zu prüfen, bevor Diagnose KI in Prozesse übernommen wird.
Diagnose KI in der Praxis: Bildgebung, Pathologie und digitale Blutanalysen
In Deutschland wird Diagnose KI hauptsächlich dort eingesetzt, wo Daten bereits standardisiert vorliegen. Dies gilt für die Bildgebung, digitale Pathologie und Laborprozesse. Künstliche Intelligenz kann in diesen Bereichen entlasten, indem sie Muster in großen Bildserien prüft.
Medizintechnologie wird als Assistenzsystem eingesetzt. Auffälligkeiten werden markiert, Prioritäten gesetzt und Befunde schneller zur Sichtung bereitgestellt. Dennoch bleibt die ärztliche Prüfung als letzter Schritt wichtig.
Radiologie und Pathologie als Vorreiter: schnellere und präzisere Erkennung pathologischer Veränderungen
KI-Verfahren gelten in Radiologie und Pathologie als frühe Einsatzfelder. Röntgen, CT, MRT und digitale Schnittpräparate liefern strukturierte Bilddaten. Bilderkennung kann kleine Abweichungen hervorheben, wie Dichteunterschiede oder Zellmustern.
„KI erkennt Auffälligkeiten, aber Interpretation und Verantwortung liegen weiterhin beim Arzt.“ — Adrian Ringelstein, Kliniken Maria Hilf, Mönchengladbach
Diagnose KI wird als Sparring-Partner genutzt. Ein System priorisiert bestimmte Regionen, die jedoch fachlich eingeordnet werden. Bei unklaren Fällen wird zusätzlich mit Verlauf, Vorbefunden und klinischem Bild abgeglichen.
Brustkrebs-Screening und Hautkrebs-Erkennung: Wo KI bereits unterstützt
Ein Beispiel ist die Mammographie im Brustkrebs-Screening. Künstliche Intelligenz unterstützt, indem sie Verdachtsareale markiert und die Lesereihenfolge steuert. Das ist besonders wichtig, wenn viele Aufnahmen in kurzer Zeit geprüft werden müssen.
Bei der Diskussion „Artificial Intelligence and Medicine“ auf der LINO23 wurde erwähnt, dass maschinelles Lernen beim Brustkrebs-Screening, bei der Hautkrebs-Bestimmung und bei der Prognose des Krankheitsverlaufs von Diabetes hilft. Medizintechnologie wird dabei als Ergänzung verstanden, nicht als Ersatz der Diagnose im ärztlichen Sinne.
Blutausstrich bei Verdacht auf Blutkrebs: Neuronale Netze klassifizieren weiße Blutzellen auf Histologen-Niveau
Bei Verdacht auf Blutkrebs werden im Blutausstrich oft mehrere Hundert Zellen geprüft. Histologen klassifizieren diese Zellen über Stunden bis Tage. Die Ergebnisse stützen Diagnose, Schweregrad-Einschätzung und mögliche Therapieverläufe.
Carsten Marr (Physiker, Helmholtz Munich) beschreibt einen Ansatz mit neuronalen Netzen. Trainiert wird mit Hunderttausenden Bildern einzelner weißer Blutzellen plus Zelltyp-Information. Auf neuen Bildern liefern die Modelle Zelltyp-Vorhersagen, die in der Güte mit der Einstufung durch Histologen vergleichbar sind.
Gleichzeitig wird das Verfahren als Black Box eingeordnet. Die genauen Entscheidungskriterien sind nicht direkt sichtbar. Daher wird an besserer Interpretierbarkeit gearbeitet, damit Fehler, falsche Lernstrategien und nicht-medizinische Scheinmerkmale erkannt werden.
Als Warnbild dient eine bekannte Fehlanpassung: Ein Modell kann „Hund“ und „Wolf“ scheinbar sicher unterscheiden, nutzt aber unbemerkt den Hintergrund „Wald“ statt Tiermerkmale. In der medizinischen Bildanalyse muss daher geprüft werden, ob Diagnose KI auf Zellform, Färbung und Struktur reagiert oder nur auf Artefakte, Scannerprofile und Aufnahmebedingungen. Diese Prüfung gehört zur sicheren Einführung von Medizintechnologie im Alltag.
| Einsatzfeld | Typische Datenbasis | Was das System markiert | Worauf in Deutschland geachtet wird |
|---|---|---|---|
| Radiologie | CT-, MRT- und Röntgenserien mit festen Protokollen | Auffällige Regionen, Dichteunterschiede, Konturabweichungen | Abgleich mit Vorbefunden, Indikation, klinischem Kontext; ärztliche Verantwortung bleibt |
| Digitale Pathologie | Hochauflösende Scanbilder von Gewebeschnitten | Zell- und Gewebemuster, auffällige Areale zur Priorisierung | Qualitätskontrolle der Färbung, Scannerartefakte, nachvollziehbare Kriterien |
| Digitale Blutanalysen | Einzelzellbilder aus Blutausstrichen plus Zelltyp-Labels | Klassifikation weißer Blutzellen, Wahrscheinlichkeiten pro Zelltyp | Black-Box-Risiko, Prüfung auf Scheinmerkmale; Validierung gegen Labor- und Klinikdaten |
KI in Medizin: Personalisierte Medizin, Therapieplanung und Versorgung
KI im Gesundheitswesen wird zunehmend eingesetzt, um nach der Diagnose Entscheidungen zu treffen. Aus Routinedaten, Bildern und Verlaufswerten werden Hinweise für die Therapieplanung abgeleitet. So wird personalisierte Medizin nicht nur ein Schlagwort, sondern eine tatsächliche Arbeitsweise.
Dafür ist es wichtig, dass Daten sauber erfasst und geprüft werden. Nur so kann personalisierte Medizin im Alltag erfolgreich sein.
Onkologie: Therapieentscheidungen durch Analyse großer Datenmengen und personalisierte Behandlungsansätze
In großen Krebszentren werden Algorithmen zur Markierung von Tumorgewebe genutzt. Damit können Zielvolumina konsistent vorbereitet werden, bevor die ärztliche Freigabe erfolgt. KI im Gesundheitswesen wird hier als Assistenz verstanden, nicht als Ersatz.
Am Deutschen Krebsforschungszentrum arbeitet Lena Maier-Hein an präziseren Messungen in der Krebsdiagnostik. Spektralkamera-Daten werden zur Messung und Differenzierung der Gewebedurchblutung ausgewertet. Dadurch soll eine genauere Abgrenzung gelingen als mit dem menschlichen Auge; als Nutzen wird eine bessere Grundlage für personalisierte Medizin erwartet.
Für die Chirurgie wird perspektivisch eine Auswertung vergangener Operationen diskutiert, um Entscheidungen zu stützen. In Krankenhäusern liegen Millionen abgeschlossener Fälle vor, die Erfahrungen teilbar machen könnten. Als Engpass gilt, dass Daten vor, während und nach der OP oft nicht aufgezeichnet oder nicht dauerhaft gespeichert werden; zudem bleiben vorhandene Informationen wegen bürokratischer Hürden häufig ungenutzt.
Chronische Erkrankungen: Prognosen und Monitoring bei Diabetes sowie Potenziale bei Adipositas
Bei chronischen Erkrankungen wird KI im Gesundheitswesen für Prognosen und Monitoring eingesetzt. Laut LINO23-Panel und Ringelstein können bei Diabetes Vorhersagen zum Krankheitsverlauf unterstützt werden, etwa auf Basis von Glukoseverläufen, Medikation und Aktivitätsdaten. In der Adipositas-Therapie werden Potenziale genannt, wenn Verhaltensmuster, Gewichtskurven und Begleiterkrankungen zusammengeführt werden.
Wichtig bleibt eine klare Rollenverteilung: Hinweise werden geliefert, Entscheidungen werden ärztlich getroffen. Damit personalisierte Medizin im Alltag funktioniert, werden nachvollziehbare Modelle, definierte Grenzwerte und eine saubere Dokumentation benötigt.
Digitale Medizin Zukunft: häusliche Pflege, Vitalparameter-Überwachung und Anpassung von Medikamentendosierungen
Für die digitale Medizin Zukunft wird ein stärkerer Fokus auf Versorgung und Entlastung erwartet. In Kliniken kann eine KI radiologische Bilder nach Schweregrad sortieren, damit dringliche Fälle zuerst bearbeitet werden. Zusätzlich können vorstrukturierte Befundberichte erstellt werden, um Dokumentation zu beschleunigen und Fehler durch Zeitdruck zu senken.
In der häuslichen Pflege kann eine kontinuierliche Vitalparameter-Überwachung ermöglicht werden, zum Beispiel bei Blutdruck, Herzfrequenz oder Sauerstoffsättigung. Wenn definierte Schwellenwerte überschritten werden, kann eine Anpassung von Medikamentendosierungen vorbereitet und anschließend ärztlich freigegeben werden. So wird die digitale Medizin Zukunft als kontrollierter Prozess umgesetzt, nicht als Automatismus.
Auch in der Gesprächspsychotherapie werden KI-basierte Systeme in Studien als niedrigschwellige Unterstützung beschrieben, etwa bei Angststörungen oder in der Trauerbegleitung. Vorgesehen ist eine Ergänzung, keine Ablösung. Für KI im Gesundheitswesen gilt dabei derselbe Maßstab: transparente Grenzen, Datenschutz und klare Verantwortlichkeiten.
| Einsatzfeld | Typische Datenbasis | Nutzen in der Versorgung | Praktischer Engpass |
|---|---|---|---|
| Onkologie (Strahlentherapie) | CT/MRT, Segmentierungen, Planungsdaten | Schnellere Vorbereitung, konsistentere Markierung von Tumorgewebe, Grundlage für personalisierte Medizin | Qualität der Annotationen, heterogene Workflows, begrenzte Standardisierung |
| Chirurgie (Entscheidungsunterstützung) | OP-Verläufe, Instrumentendaten, Video, prä- und postoperative Befunde | Erfahrungen aus vielen Fällen werden nutzbar, Vorgehen kann besser vergleichbar werden | Daten werden oft nicht dauerhaft gespeichert, Zugriff durch Bürokratie erschwert |
| Chronische Erkrankungen (Diabetes, Adipositas) | Glukosewerte, Labor, Medikation, Gewicht, Aktivitäts- und Ernährungsdaten | Prognosen, frühzeitiges Erkennen von Risiken, feinere Therapieanpassung als Teil digitaler Medizin Zukunft | Uneinheitliche Datenerfassung, fehlende Interoperabilität, Messlücken im Alltag |
| Häusliche Pflege und Monitoring | Vitalparameter, Symptomtagebücher, Wearables, Pflegedokumentation | Kontinuierliche Überwachung, Schwellenwert-Alarmierung, ärztlich freigegebene Dosisanpassungen | Gerätequalität, Datenflut, klare Zuständigkeiten und Freigabeprozesse nötig |
Grenzen und Risiken: Black Box, Bias und Überabhängigkeit
Bei Diagnose KI zählt nicht nur die Trefferquote. Es muss auch klar sein, warum ein System zu einem Ergebnis kommt. Für KI in Medizin und Medizintechnologie wird damit Transparenz zu einer Sicherheitsfrage.
Black-Box-Problem: Warum Nachvollziehbarkeit der Kriterien entscheidend ist
Carsten Marr beschreibt neuronale Netze als Black Box: Die Klassifikation kann funktionieren, die Kriterien bleiben im Detail aber oft verborgen. Dadurch wird es schwer, Fehlerquellen gezielt zu finden.
Ein bekanntes Warnsignal sind Scheinkorrelationen, etwa wenn ein Modell Hund und Wolf trennt, aber unbemerkt das Merkmal „Wald“ statt Tiermerkmale nutzt. In der KI in Medizin kann das ähnlich passieren: Aufnahmebedingungen, Geräteprofile oder Hintergrundartefakte dürfen nicht stärker wirken als die Pathologie.
Für Medizintechnologie sollte daher gefordert werden: Kriterien müssen prüfbar und verständlich gemacht werden. Wenn das nicht gelingt, kann in die falsche Richtung gelernt werden, ohne dass es im Alltag sofort auffällt.
Bias durch nicht repräsentative Trainingsdaten: Risiken für bestimmte Bevölkerungsgruppen
Bias ist ein zentrales Risiko, weil Trainingsdaten oft nicht alle Gruppen gleich gut abdecken. Dann wird Diagnose KI für einzelne Patientengruppen unzuverlässig, obwohl die Gesamtleistung gut aussieht.
Beobachtet wurde zum Beispiel, dass einzelne Systeme bei asiatischen Frauen weniger zuverlässig arbeiten, wenn überwiegend auf anderen ethnischen Gruppen trainiert wurde. Für KI in Medizin sollte deshalb Repräsentativität als fester Qualitätsnachweis verlangt werden.
- Trainingsdaten müssen auf Alter, Geschlecht, Ethnie und relevante Vorerkrankungen geprüft werden.
- Qualitätskriterien und Datenquellen sollten dokumentiert werden, inklusive Geräte- und Standortmix.
- Validierungen für Untergruppen müssen eingefordert werden, bevor Medizintechnologie in die Versorgung geht.
Automation Bias: Wenn ärztliches Urteilsvermögen durch zu viel Vertrauen in KI verdrängt wird
Avram Hershko warnt vor Automation Bias: Wenn KI-Ergebnisse ständig „stimmen“, wird das eigene Urteil seltener hinterfragt. So kann KI in Medizin schleichend zur Autorität werden, statt zum Werkzeug.
Als Gegenmaßnahme sollte menschliche Kontrolle organisatorisch verpflichtend bleiben. Das gilt besonders bei risikoreichen Entscheidungen, bei Grenzfällen und wenn Datenqualität oder Kontext unklar sind.
Haftungsfragen: Wer trägt Verantwortung bei Fehlentscheidungen?
Auch hier verweist Hershko auf eine offene Baustelle: Bei Fehlern ist die Verantwortung oft nicht sauber verteilt. Betroffen sein können Ärztinnen und Ärzte, Einrichtungen sowie Hersteller oder Anbieter von Medizintechnologie.
Vor der Einführung von Diagnose KI sollten Verantwortlichkeiten, Dokumentationspflichten, Auditierbarkeit und Freigabeprozesse festgelegt werden. Nach Michael Levitt lassen sich Einführungsbedingungen zudem operationalisieren: Verständlichkeit, Transparenz und Kontrollierbarkeit als Kriterien für Zulassung, Beschaffung und klinische Nutzung.
| Risiko | Typische Ursache | Prüfpunkt in der Klinik | Praktische Absicherung |
|---|---|---|---|
| Black Box | Intransparente Merkmalsnutzung im Modell | Sind die Entscheidungsgründe nachvollziehbar und testbar? | Erklärbarkeitstests, Fallreviews, Monitoring von Drift und Fehlalarmen |
| Scheinkorrelation | Störmerkmale wie Gerät, Hintergrund, Protokoll | Bleibt die Leistung stabil über Geräte und Standorte hinweg? | Standort-Validierung, Protokollharmonisierung, Artefakt-Checks |
| Bias | Unrepräsentative Trainings- und Testdaten | Gibt es Kennzahlen getrennt nach Untergruppen? | Subgruppen-Reporting, gezieltes Nachtrainieren, Mindestanforderungen an Datendeckung |
| Automation Bias | Übervertrauen durch Routine und Zeitdruck | Wird der KI-Vorschlag aktiv gegengeprüft? | Vier-Augen-Prinzip bei Hochrisiko, verpflichtende Begründung bei Abweichung oder Zustimmung |
| Haftung | Unklare Rollen zwischen Klinik und Anbieter | Sind Verantwortung und Freigabe klar dokumentiert? | Audit-Logs, SOPs, definierte Freigabestufen, geregelte Eskalationswege |
Daten, Datenschutz und Vertrauen im deutschen Gesundheitssystem
Ein stabiler Datenfluss ist für die KI im Gesundheitswesen unerlässlich. In Deutschland wird dieser Fluss oft unterbrochen. Trotzdem liegen Messwerte, Befunde und Bilder digital vor. Für die Gesundheitsinnovation ist nicht nur Rechenleistung wichtig, sondern auch einheitliche Praxis im Umgang mit Daten. Planbarkeit bei Zugriff, Format und Freigabe ist für die digitale Medizin Zukunft entscheidend.
Fragmentierung in Deutschland: unterschiedliche Datenerfassung je Bundesland und Krankenhaus
Deutschland ist föderal organisiert, was zu unterschiedlichen Gesundheitsministerien in jedem Bundesland führt. Vorgaben, Prioritäten und Prozesse variieren, selbst bei der Behandlung der gleichen Krankheit. Dies beeinträchtigt die Vergleichbarkeit von Versorgungsdaten.
Krankenhäuser sammeln Daten oft in eigenen Systemen und Formaten. Die Kodierung, Bildformate und Dokumentationstiefe sind unterschiedlich. Das macht die Zusammenführung von Datensätzen schwierig. Für KI im Gesundheitswesen bedeutet das, dass Modelle schlechter skalieren und Ergebnisse weniger robust sind.
Datenschutz und Forschung: hohe Hürden trotz anonymisierbarer Auswertung
Datenschutz ist unverzichtbar, doch der Zugang zu Forschungsdaten ist streng reguliert. Carsten Marr spricht von hohen Hürden, obwohl Forschende meist keine Namen benötigen. Die Abstimmungswege sind oft lang und verzögern Projekte.
Bürokratische Hürden, wie Lena Maier-Hein sie beschreibt, behindern besonders bei chirurgischen Daten. Auch bei anonymisierbaren Auswertungen werden Freigaben oft so komplex, dass Daten in der Forschung kaum nutzbar sind. Deutschland war deshalb bei Studien zu COVID-19-Medikamenten nur begrenzt vertreten, da Genehmigungen lange dauerten.
Internationale Vergleiche: Vertrauen in zentrale Systeme wie den NHS vs. deutsche Zurückhaltung
Julia Schnabel verweist auf Großbritannien, wo dem National Health Service (NHS) ein hohes Vertrauen entgegengebracht wird. Es wird erwartet, dass sensibel mit Gesundheitsdaten umgegangen wird, auch wenn Daten zentral organisiert sind. Dieses Vertrauen beschleunigt Prozesse.
Auch Dänemark wird häufig genannt, wo Gesundheitsdaten seit Jahren elektronisch erfasst und genutzt werden. In Deutschland wurde dagegen lange um die Gesundheitskarte gerungen. Dieser Abstand in der Routine, nicht zwingend in der Technik, ist spürbar.
Ansätze für mehr Datenzugang: Digitalisierungsgesetz, Datenspende-Idee und Kooperationen mit Auslandspartnern
Mit dem Digitalisierungsgesetz soll der Datenschutz im Medizinsektor verbessert werden. Daten sollen sicher bleiben und zugänglicher werden. Entscheidend ist, dass Verfahren standardisiert und Fristen berechenbar werden. So kann Gesundheitsinnovation schneller in die Versorgung gelangen, ohne Schutzrechte zu schwächen.
Lena Maier-Hein bringt die Idee eines Datenspendeausweises ins Spiel, ähnlich dem Organspendeausweis. Patientendaten könnten freiwillig für Forschung freigegeben werden, mit klaren Regeln zur Nutzung. Das würde die Entwicklung und Prüfung von Modellen für KI im Gesundheitswesen deutlich erleichtern.
Pragmatisch werden außerdem Kooperationen mit Auslandspartnern genutzt, wie Fabian Theis es beschreibt. So wird Forschung mit passenden Datensätzen abgesichert. Parallel wird in Deutschland Infrastruktur ausgebaut, wie das Helmholtz Computational Health Center bei Helmholtz Munich. Ergänzend werden die Helmholtz Information & Data Science School for Health (HIDSS4Health) in Karlsruhe und Heidelberg sowie die Helmholtz Information & Data Science Academy gestärkt; Andreas Kosmider nennt dabei die Förderung von 280 Doktoranden als zentrales Programm.
| Hebel im System | Typisches Hindernis | Praktischer Ansatz | Wirkung auf KI im Gesundheitswesen |
|---|---|---|---|
| Föderale Steuerung | Unterschiedliche Regeln je Bundesland und Behörde | Abgestimmte Standards für Datenschemata und Freigabeprozesse | Bessere Vergleichbarkeit, stabileres Training über Standorte |
| Krankenhaus-IT und Dokumentation | Eigene Formate, uneinheitliche Kodierung, wechselnde Qualität | Gemeinsame Mindestanforderungen für Struktur, Metadaten und Qualitätssicherung | Weniger Datenbruch, leichtere Skalierung in der Routine |
| Datenschutzpraxis | Aufwändige Genehmigungen trotz Anonymisierung | Klare, wiederholbare Verfahren für anonymisierbare Auswertung und Auditierung | Schnellere Studienstarts, mehr Validierung im Versorgungsalltag |
| Freiwillige Beteiligung | Unklare Zuständigkeit und fehlende Einwilligungsmodelle | Datenspendeausweis mit definierten Nutzungszwecken und Widerruf | Mehr Datentiefe, breitere Basis für Gesundheitsinnovation |
| Forschungsnetzwerke | Begrenzter Zugang zu passenden Datensätzen im Inland | Internationale Kooperationen plus Ausbau von Helmholtz Munich und HIDSS4Health | Mehr Trainings- und Testdaten, schnellere Reife für digitale Medizin Zukunft |
Fazit
KI in der Medizin bietet heute bereits wertvolle Unterstützung, besonders bei der schnellen Bewertung großer Datenmengen. In Bereichen wie Radiologie und Pathologie hilft KI dabei, Bildmaterial zu priorisieren. Es markiert auffällige Stellen und setzt Befunde in den richtigen Kontext.
Im Labor zeigt sich der Nutzen von KI, zum Beispiel bei der Klassifikation von Blutzellen. Hier erreicht die Technik Leistungen, die früher nur Experten zustanden.
Werner Ringelstein betont, dass KI eine wertvolle Unterstützung darstellt, aber keine Entscheidung ersetzt. Gary Levitt sieht KI als Teammitglied, das oft besser arbeitet als Einzelpersonen. Diese Teamarbeit ist entscheidend für die Diagnose.
Die Einführung von KI in die Medizin erfordert eine sorgfältige Planung. Es ist wichtig, dass Verständlichkeit, Transparenz und Kontrollierbarkeit gewährleistet sind. Edd Dumbill Marr betont, dass ein Modell, das als Black Box fungiert, seine Interpretierbarkeit verbessern muss.
Trainingsdaten müssen auf ihre Repräsentativität hin überprüft werden, um Bias zu vermeiden. Ringelstein und Sakpere plädieren für offene, globale Datenräume. Hershko warnt davor, dass Automation Bias Urteilsvermögen verdrängen könnte.
Bei Fehlern ist es wichtig, Haftung, Dokumentation und Freigaben vorab zu regeln. Deutschland muss Fragmentierung abbauen und datenschutzkonforme Forschung erleichtern. Internationale Kooperationen sind notwendig, um personalisierte Medizin sicher zu skalieren.