00:00:04: Hallo und herzlich willkommen zu KI in der Medizin, einem Audio-Lernangebot der Charité und des KI-Campus, der Lernplattform für künstliche Intelligenz.
00:00:14: Ich bin Mike Bernd vom KI-Campus Team und habe heute wieder Kerstin Ritter zu Gast. Hallo Kerstin! Hallo Mike!
00:00:22: Nach einem allgemeinen Einstieg in das Thema KI in unserer letzten Folge machen wir heute den versprochenen Deep Dive in das Thema KI in der Medizin. Kerstin, vielleicht kannst du uns kurz sagen, worüber wir heute sprechen werden.
00:00:37: Ja, wir werden heute über vielfältige Beispiele sprechen, wie KI in der Medizin eingesetzt werden kann. Das werden ganz unterschiedliche Beispiele sein: aus der medizinischen Bildgebung, aber auch im Bereich Chatbots.
00:00:51: Wie kann KI in der Medizin für Patienten und Mediziner nützlich sein?
00:00:57: Ja, also Medizin ist natürlich ein riesiger Bereich, in dem sehr viele Daten erhoben werden und Daten sind
00:01:06: super wichtig für KI, wie wir das letzte Mal auch schon herausgestellt haben. Es gibt hier sehr viele Anwendungen. Es gibt ja ganz unterschiedliche Daten überhaupt: es gibt tabellarische Daten, es gibt
00:01:18: Bilder, es gibt Fallberichte und es ist auch ein Bereich, der sowohl
00:01:25: für Individuen sehr wichtig ist - Gesundheit ist natürlich essentiell - aber natürlich auch für die Wirtschaft und auch volkswirtschaftlich. Das haben auch die Krankenhäuser erkannt und es wurden auch in 90% der Krankenhäuser Digitalisierungsstrategien entwickelt.
00:01:40: Kannst du uns vielleicht ein konkretes Fallbeispiel nennen, wo oder wie KI in der Medizin konkret angewendet wird?
00:01:48: Ich kann einfach mal ein Fallbeispiel nennen, wie
00:01:54: mehr oder weniger hypothetisch KI in der Medizin eingesetzt werden kann. Das wäre im Bereich Dermatologie. In der Regel ist das ja so, dass man eben bestimmte Muttermale hat,
00:02:05: die guckt
00:02:05: man sich an und dann stellt man vielleicht irgendwann mal fest: Oh, ein Muttermal sieht aber etwas komisch aus. Dann würde man erstmal zum Hausarzt gehen, dafür muss man erstmal ein Termin bekommen, dann war man beim Hausarzt, dann muss man eine Termin beim Facharzt, beim Dermatologen bekommen. Da man häufig längere Wartezeiten, sodass man dann
00:02:25: meistens schon ein bisschen Zeit verliert, bis man überhaupt beim Arzt ist. Im Unterschied wenn man jetzt z.B. eine App
00:02:32: auf dem eigenen Smartphone hätte, mit der man einfach selber ein Foto von dem Muttermal machen kann, das einschickt, das mit ganz vielen Bildern verglichen wird und geguckt
00:02:43: wird, ähnelt es jetzt eher einem bösartigen oder einem gutartigen Muttermal,
00:02:50: würde man direkt auch eine Rückmeldung bekommen und könnte dann, wenn das noch weiterentwickelt worden ist, vielleicht sogar sofort einen Termin bekommen und gegebenenfalls könnte sogar sofort herausgeschnitten werden. Man würde die ganzen Prozesse extrem verkürzen und auch das Risiko
00:03:06: verringern, dass sich wirklich
00:03:08: tiefer Hautkrebs entwickelt. Aber hier ist es tatsächlich so, dass in diesem Prozess die KI nicht für sich alleine funktioniert, sondern dass der Arzt untrennenbar in diesen Prozess der Diagnostik mit eingebunden ist.
00:03:20: Es geht immer darum erstmal so eine Art Vordiagnose zu machen oder eine Empfehlung. Das muss natürlich immer auch mit einem Arzt oder mit einer Ärztin abgeklärt werden und
00:03:30: erst recht, wenn dann das auch rausgeschnitten werden muss. Da muss man natürlich im Kontakt mit einem Dermatologen oder auch einem Chirurgen sein.
00:03:37: Hier haben wir nun ein konkretes Fallbeispiel für KI in der Medizin. Welche unterschiedlichen Möglichkeiten gibt es, KI in der Medizin anzuwenden?
00:03:47: Traditionell wurde häufig versucht, Expertensysteme zu entwickeln. Expertensysteme sind Systeme,
00:03:57: wo man versucht, das Wissen von einem Experten nachzubilden, also indem man eine Wissensbasis gründet, in der man Wissen speichert, da muss man sich auch überlegen, wie man Wissen gut darstellen kann, und dann kann ein Anwender, das kann ein Arzt sein, der
00:04:13: in einem bestimmten Bereich nicht so erfahren ist oder auch ein Laie, der bestimmte Anfragen stellt und dann bekommt man die Antwort eben aus diesem Expertensystem zurück. Da gibt's
00:04:23: verschiedene Programme, die früher entwickelt worden sind, z.B. das Programm MYCIN, 1972. Das wurde für die Diagnose und Therapie von Infektions-
00:04:31: Krankheiten durch Antibiotika eingesetzt.
00:04:33: Es gab auch ein anderes Programm in den 80er Jahren, DXplain. Da ging es darum, klinische Informationen zu sammeln und dann einen Ranking anzugeben, was denn nun die wahrscheinlichste Diagnose ist.
00:04:48: Relativ bekannt in der heutigen Zeit ist IBM Watson. Das ist im Prinzip auch ein großangelegtes Expertensystem. Man versucht hier ganz viele
00:04:59: Daten zu speichern: Das sind bestimmte Datenbanken das, sind aber auch medizinische Guidelines, das sind
00:05:06: Fallbeispiele und auch klinische Studien. Das hat man so auf der einen Seite, das ist die Wissensbasis und auf der anderen Seite hat man dann einen konkreten Patienten, für den man bestimmte Daten hat. Diese Daten werden in dieses System gefüttert.
00:05:21: IBM Watson stellt dann noch mal bestimmte Rückfragen. Dann kann man weitere Daten nachliefern und letztendlich
00:05:28: schlägt das System dann eine Diagnose vor, die dann natürlich wieder mit Ärzten diskutiert werden muss, um dann zu gucken, kann das jetzt die richtige sein oder
00:05:38: nicht. Es geht im Prinzip um eine Form der Risikoberechnung oder Risikoberechnungen?
00:05:45: Genau, das kann man auch für eine Risikoberechnung [nutzen]. Es ist immer die Frage, ob man das... Also man kann z.B. ein Wahrscheinlichkeit für eine
00:05:51: Diagnose geben. Die meisten Systeme arbeiten dann mit so eine Art Ranking, was ist die wahrscheinlichste Diagnose und was ist vielleicht eine weniger wahrscheinliche Diagnose. Bei IBM Watson gibt es einen Fall, der auch ein bisschen durch die Presse ging:
00:06:07: da wurde bei einer Frau ein bestimmter Krebs diagnostiziert von den Ärzten im Krankenhaus
00:06:14: und dann hat meine Therapie gemacht.
00:06:17: Diese Therapie ist aber nicht angeschlagen. Man hat dann diese Daten mit IBM Watson abgeglichen und er hat festgestellt, dass diese Frau eine besonders seltene Form der Leukämie hat, die nur sehr selten vorkommt und da natürlich
00:06:31: nicht unbedingt jeder Arzt den Zugriff auf dieses Wissen hat
00:06:34: und dann dieser Frau eben auch geholfen werden könnte. Auf der anderen Seite gibt es aber auch viele Berichte, in denen IBM Watson auch mal daneben lag oder einfach nicht die die richtige Diagnose gemacht hat. Deswegen ist
00:06:46: unglaublich wichtig, dass die Ärzte
00:06:50: und solche Systeme immer eng miteinander zusammenarbeiten und auch sich gegenseitig überprüfen.
00:06:57: Du du es gerade mit den Risikoberechnungen angesprochen hast:
00:07:01: es gibt die sogenannte Framingham-Studie. Das ist eine bekannte und sehr umfangreiche Kohortenstudie,
00:07:08: die den Einfluss kardiovaskuläre Risikofaktoren untersucht hat, also Blutdruck, Cholesterin, Rauchen, Adipositas und so weiter und dann für einzelne Individuen bestimmt, wie groß das Risiko ist
00:07:20: z.B. einen Herzinfarkt
00:07:22: zu bekommen. Solche Daten sind unglaublich wichtig, um überhaupt dann Systeme trainieren zu können, die diese
00:07:31: Daten benutzen, um eine bestimmte Diagnose zu machen. Apple z.B. arbeitet an bestimmten Systemen, die dann anhand der Herzfrequenz und auch auf Basis von dieser Framingham-Studie bestimmte Erkrankungen
00:07:45: wie Schlafapnoe oder Hypertonie zu erkennen, aber auch z.B. Diabetes.
00:07:52: Okay, also hier haben wir ein konkretes Fallbeispiel mit den Expertensystemen. Kommen wir mal zu dem
00:07:59: prominentesten Teil der künstlichen Intelligenz, über den wir ja auch in der letzten Folge schon kurz gesprochen haben,
00:08:06: dem maschinellen Lernen, welches in sehr vielen Bereichen mittlerweile Anwendung findet, wie wir wissen.
00:08:14: Kerstin, was würdest du sagen: was sind Bereiche in der Medizin wo konkret maschinelles Lernen Anwendung findet?
00:08:21: Maschinelles Lernen ist vor allen Dingen erfolgreich in der medizinischen Bildgebung. Es fallen ja ganz viele ganz unterschiedliche Bilder
00:08:30: in der Medizin an. Es gibt z.B. Röntgenaufnahmen von unterschiedlichen Teilen des Körpers, es gibt
00:08:39: MRT-Aufnahmen,
00:08:42: es gibt hier strukturelle Daten und auch funktionelle Daten. Man kann Bilder der Netzhaut erstellen, man kann auch einfache Bilder von Muttermalen machen. Das wäre
00:08:52: auch eine Bildgebung. Wenn wir jetzt gerade mal bei dem Beispiel Hautkrebs bleiben: genau das ist z.B. eine Anwendung, wo maschinelles Lernen sehr erfolgreich ist. Hier hätte man ganz viele Bilder von einzelnen Muttermalen
00:09:05: und zusätzlich zu den
00:09:07: Bildern hätte man immer eine Diagnose, also ob es eine gutartige oder eine bösartige Läsion ist, oder Muttermal.
00:09:16: Dann könnte man all diese Bilder zusammen mit diesen Labels einem maschinellen Lernalgorithmus geben und der lernt dann selbstständig eine Beziehung
00:09:25: herzustellen, zwischen den Bildern auf der einen Seite und dem Label auf der anderen Seite. Wenn jetzt jemand ein neues Bild von einem Muttermal hat, dann
00:09:34: kann dieses Bild dem KI-System übergeben werden und des sagt dann, mit einer so und so großen Wahrscheinlichkeit ist dies bösartig
00:09:43: oder gutartig oder auch etwas völlig anderes.
00:09:48: Und das wurde auch im größeren Stil gemacht. Es gibt hier große Datensätze von 130.000
00:09:54: Bildern mit über 2000 Erkrankungen, also ganz unterschiedliche Hautmerkmale. Es wurde gezeigt dass KI-Systeme
00:10:07: tatsächlich so gut sind wie zertifizierte Dermatologen und in einigen Bereichen tatsächlich sogar besser.
00:10:16: Du meinst ja, dass das ein durchaus erfolgreiches Verfahren ist. Gibt es möglicherweise aber auch Probleme, die bei dieser Form der Diagnostik entstehen?
00:10:26: Ja, auf der einen Seite [sind dieses Systeme] wirklich sehr gut, sehr erfolgreich. Das kommt auch
00:10:31: durch diese Deep Learning-Verfahren, die anhand von den mehr oder weniger Roh-Bildern lernen können, also die es selbstständig schaffen, Repräsentation zu lernen. Das macht diese Systeme sehr erfolgreich.
00:10:42: Aber jedes KI-System hängt ganz stark von den Daten ab, auf denen sie trainiert
00:10:49: wurden und auch wie repräsentativ die Daten sind. Hier, bei dem Beispiel, waren die Bilder überwiegend von weißer Haut gemacht worden, das heißt,
00:10:58: Muttermale auf schwarze Haut sind unterrepräsentiert.
00:11:02: Allerdings muss man hier auch wieder sagen, dass es eine Erkrankung ist, Hautkrebs generell, eher eine Erkrankung ist, die bei weißer Haut eine Rolle spielt.
00:11:10: Bei anderen Erkrankungen oder auch bei anderen Teilbereichen der Dermatologie mag das ganz anders sein. Das heißt, man muss sich auch immer fragen,
00:11:19: auf welchem Daten wurden sie trainiert und wie aussagekräftig sind sie jetzt
00:11:25: für bestimmte Gruppen. Ein anderes Beispiel ist: Männer vs. Frauen. Es gibt auch eine KI-Anwendung bei Nieren-Behandlungen.
00:11:32: Da waren nur 6% der Daten von Frauen. Da ist es natürlich
00:11:36: relativ klar, dass es vielleicht nicht so gut bei Frauen funktioniert wie bei Männern. Das gleiche gilt auch für bestimmte Altersgruppen, wenn man einen KI-System nur auf älteren Leuten trainiert,
00:11:48: muss es nicht unbedingt auf jüngeren Leute gut funktionieren. Das heißt, man muss ich bei jeder
00:11:52: Anwendung im Kopf behalten bzw. auch angeben, für welche Gruppen das System eigentlich gut funktioniert.
00:12:01: Würdest du sagen, dass perspektivisch diese Probleme gelöst werden können, also dass man beispielsweise, je mehr Daten man hat, dann tatsächlich auch die diagnostischen Methoden in diesen Bereichen noch verbessern kann?
00:12:15: Ja, absolut! Je mehr Daten man hat, desto besser kann so ein KI-System werden. Es ist aber nicht nur wichtig, dass wir viele Daten haben, sondern dass es auch
00:12:24: gute Daten sind, die auch vergleichbar sind. Das Problem, was wir heutzutage im Krankenhäuser und auch überall haben, ist, dass Daten auf eine sehr unterschiedliche Weise erhoben und gewonnen werden.
00:12:37: Beispiel MRT-Bildgebung: Hier gibt es ganz unterschiedliche Sequenzen und es gibt auch unterschiedliche Parameter, die eingestellt werden, es gibt unterschiedliche Feldstärken beim MRT-Gerät
00:12:47: und es gibt auch unterschiedliche Arten, wie man die Daten vorprozessiert. Das heißt, die Daten sind nicht unbedingt vergleichbar zwischen unterschiedlichen Krankenhäusern und teilweise auch nicht zwischen unterschiedlichen Kliniken innerhalb eines Krankenhauses.
00:13:01: Damit diese KI-Systeme aber gut arbeiten können, kann man einerseits sagen, man versucht das soweit wie möglich zu standardisieren. Das heißt, alle
00:13:09: stimmen einem bestimmten Standard zu und alle versuchen dann die Daten auf eine bestimmte Weise zu erheben.
00:13:15: Das wäre das eine, das würde aber bedeuten, dass man versucht ganz viele Abstimmungen zu treffen. Die andere Möglichkeit ist, dass man versucht, auf sehr heterogen Datensätzen zu lernen, die dann darüber
00:13:28: hinweg generalisieren über den bestimmten Typ an Daten, die man hat.
00:13:35: Das ist beides wichtig. Eigentlich wäre es schön, wenn man wirklich
00:13:39: gleichartige Daten hätte. Das würde das Trainieren wesentlich einfacher machen. Aber natürlich muss so ein System auch mit heterogenen Daten umgehen können, aber dann braucht man gegebenenfalls noch viel mehr Daten,
00:13:50: um gut daraus lernen zu können. Wir bewegen uns nun in dem Kontext des maschinellen Lernens,
00:13:59: um kurz auf die terminologische Ebene zurückzukommen, aber du hast jetzt auch den Begriff des Deep Learning verwendet. Kannst du vielleicht uns ganz kurz, in wenigen Sätzen, erklären,
00:14:09: worin der Unterschied zwischen maschinellem Lernen einerseits und Deep Learning andererseits liegt?
00:14:15: Also Deep Learning ist ein Teilbereich des maschinellen Lernens. In beiden Bereichen ist es so, dass
00:14:24: anhand von Beispielen selbstständig gelernt wird. Der Hauptunterschied zwischen maschinellem Lernen und Deep Learning ist, dass man beim maschinellen Lernen, also beim traditionellen maschinellen Lernen, bestimmte Features aus den Daten extrahiert
00:14:40: und dann auf Basis von diesen Features z.B. klassifiziert. Bei Hautkrebs z.B. könnte man
00:14:49: aus den Bildern extrahieren: wie groß sind die Muttermale, welche Farbe haben sie, was für eine Form haben sie. Diese Features übergibt man dann einem relativ einfachen Klassifikations-Algorithmus.
00:15:01: Beim Deep Learning im Unterschied
00:15:05: sind die Verfahren in der Lage, direkt anhand von den Rohdaten, also anhand der Bilder, selbst Repräsentation zu lernen.
00:15:14: Das kann man mit bestimmten Netzen, auf die wir später noch mal eingehen werden, machen. Man findet dann eine hierarchische Repräsentation der Daten und
00:15:23: auf denen wird dann trainiert. Das heißt, das Modell bezieht die Repräsentation der Daten und auch das Lernen, das
00:15:31: passiert quasi in einem Schritt. Dafür braucht man besonders Tiefe neuronale Netzwerke.
00:15:37: Nun haben wir ja so ein Stück weit über die Terminologie gesprochen, du hast auch einige Beispiele und Form der Diagnostik genannt. Vielleicht kannst du uns noch so ein bisschen was dazu erzählen, welche
00:15:49: konkreten Chatbots, Apps, Anwendungen gibt es beispielsweise, die heutzutage in der Medizin Anwendung finden?
00:15:57: Ein bekanntes Beispiel in Deutschland ist die Ada Health-App.
00:16:02: Das ist ein System, um Krankheiten zu diagnostizieren, das kann man sich auf seinem Smartphone runterladen.
00:16:10: Man muss sich anmelden und muss bestimmte...
00:16:13: man nennt seinen Namen, sagt wie alt man ist, welches Geschlecht man hat und dann wird man nach Symptomen gefragt. Da sagt man: ja, man hat z.B. Kopfschmerzen und dann wird weiter gefragt.
00:16:25: Treten die Kopfschmerzen auf einer bestimmten Seite auf? Sind die Schmerzen eher pulsierend oder stechend? Wie oft trat das schon mal auf? Und so weiter. Dieser Chat
00:16:35: versucht mit diesen Fragen herauszufinden, welche Erkrankungen man hat. Am Ende kriegt man dann, wie ich auch schon gesagt habe,
00:16:43: eine Liste an Vorschlägen, was für eine Erkrankung das ist und wie wahrscheinlich die ist
00:16:49: und ob man gegebenenfalls auch Hilfe suchen kann. Es gibt auch noch andere Apps in diesem Bereich: Babylon Health Apps ist sowas ähnliches. Da wird auch versucht eine Diagnostik zu machen.
00:16:59: Hierbei handelt es sich konkret um Apps, die für den User gedacht sind, also konkret für eine potentielle Patienten oder einen Patienten.
00:17:08: Genau, wobei es auch hier wieder nicht den Arzt oder die Ärztin ersetzen soll, sondern es wird eine Vordiagnose gemacht und
00:17:17: dann muss man immer noch, je nachdem was für das für eine Diagnose ist oder wie schwerwiegend das ist, das bei einem Arzt absichern lassen. Hast du Ada selbst schon mal ausprobiert? Was würdest du sagen: funktioniert es
00:17:31: besser als ein Arzt oder würdest du nach wie vor den Arzt vorziehen? Ja, das kommt immer auf die Frage an, die man hat
00:17:39: und wie wichtig das ist. Ich habe es selber ausprobiert. Mein Eindruck war, dass es bei einfachen Erkrankungen recht gut funktioniert. Wenn es aber ein bisschen schwieriger und detailierter
00:17:51: wird, hatte ich auch schonmal Diagnosen, die daneben
00:17:58: liegen. Aber da macht jeder seinen ganz unterschiedlichen Erfahrungen. Ich habe eine Bekannte, die hat eine seltene Erkrankung. Sie hat 15 Jahre lang nach ihrer Diagnose gesucht mit sehr starken Schmerzen,
00:18:11: die immer wieder gekommen sind
00:18:14: und hat dann letztendlich die Diagnose auch bekommen, nach vielen Ärzten und Ärztinnen, mit den sie gesprochen hat und sie hat das dann auch bei Ada
00:18:23: Health eingegeben und hat dann sofort ihre Diagnose bekommen. Sie fragt sich natürlich schon, warum hat das so lange gedauert, warum war das so ein langer Prozess
00:18:33: bis sie die richtige Diagnose bekommen hatte, dann auch behandelt werden konnte, wenn eine App das eigentlich so schnell kann.
00:18:42: Okay, wir haben jetzt
00:18:43: viele Beispiele von dir gehört, wir haben angefangen mit den Expertensystemen, wir haben über maschinelles Lernen, über Deep Learning gesprochen, über Apps und Anwendungen. Gibt es noch weitere Bereiche,
00:18:55: beispielsweise in der Robotik, wo KI in der Medizin verwendet oder angewendet wird?
00:19:03: Robotik ist auch natürlich ein riesiges Forschungsgebiet und da passiert wahnsinnig viel.
00:19:09: Ein großer Bereich sind Pflegeroboter, die ärztliches Personal oder auch Pflegekräfte darin unterstützen sollen,
00:19:18: bestimmte Verrichtungen zu übernehmen z.B. Menschen zu heben oder auch umzulagern. Das
00:19:25: braucht ja immer relativ viel Ressourcen und auch viel Kraft von den Pflegekräften. Das ist ein wichtiger Bereich.
00:19:32: Dann gibt es die sogenannte Roboter-Robbe "Paro". Das ist eine Robbe, die
00:19:39: speziell für Demenzerkrankte entwickelt worden ist. Das ist ein Kuscheltier, das sieht
00:19:44: ganz süß aus und es bewegt sich ganz langsam und hat einen langsamen Augenaufschlag und es zeigt sich, dass Demenzkranke
00:19:56: sehr gerne diese Robbe im Arm haben und mit dieser auch kommunizieren und ihnen das ein gutes Gefühl gibt.
00:20:03: Ein anderer Bereich ist noch der Bereich Smart Hospitals, dass
00:20:07: bestimmte Sensoren in den Zimmern sind und dann erkannt wird, ob irgendwas bestimmtes gebraucht wird oder ob jemand Hilfe braucht. Ja, wir haben heute in unserem
00:20:17: ersten Deep Dive zu KI in der Medizin vielfältige Anwendungsbeispiele gehört, wo konkret künstliche Intelligenz angewendet wird. Wir werden in der nächsten Folge über
00:20:31: Daten sprechen, eine wichtige Grundlage für künstliche Intelligenz und die verschiedenen Anwendungsbereiche. Für die heutige Folge möchte ich mich
00:20:40: erneut bei Kerstin bedanken und sage tschüss, bis zum nächsten Mal! Tschüss, vielen Dank.