00:00:04: Hi hier ist wieder Markt Bernburg icampus Team bei mir ist Kerstin Ritter von der Charité Hi Kerstin.
00:00:12: Herzlich willkommen zu folge 4 unseres Lernangebote ki in der Medizin noch mal kurz als wrap-up in der ersten Folge sprachen wir über Kay im allgemeinen das vorletzte Mal hatten wir dann ersten.
00:00:26: Wie sieht deep dive in ki in der Medizin und in der letzten Folge sind wir eingestiegen in den Bereich data science wo wir heute weitermachen werden wir hatten in der letzten Folge ganz viele Kategorien gebildet wir haben darüber gesprochen
00:00:41: wie Daten die sich Daten mathematisch beschreiben und bündeln lassen
00:00:47: wir gehen heute direkt weiter in den Bereich data Science in der Medizin und da kommt dann meine erste Frage an dich Kerstin
00:00:55: was für Daten gibt es in der Medizin unglaublich viele sehr sehr unterschiedliche Daten
00:01:02: man kann sich hier unterschiedliche Sachen anschauen das was man womit man am häufigsten zu tun hat sind tabellarische Daten.
00:01:11: Hier sind Daten quasi schon in einer Matrix Form gespeichert das hat mir das letzte Mal dass wir häufig Matrizen als.
00:01:18: Lager haben für unsere Berechnung man hat hier in den Zeilen die einzelnen Personen z.b. gekennzeichnet über eine ID und.
00:01:27: Daneben dann in den einzelnen Spalten Informationen zu der Personen z.b. demografische Variablen aber auch klinische variablen wir haben Informationen zum untersuchungsdatum welche Medikamente genommen werden
00:01:43: und so weiter also werden wir zum zum zum einen Aldi tabellarischen Daten des Weiteren gibt es die sogenannten Zeitreihendaten Kerstin was sind Zeit
00:01:54: rein Daten und worum handelt es sich hierbei ja aber Zeit von Zeitreihendaten spricht
00:02:00: Anwender bestimmte Signale des Körpers über die Zeit gemessen werden das ist z.b. das EKG hier werden Herzströme gemessen das EEG hier werden Hirnströme gemessen oder auch das funktionelle MRT hier werden.
00:02:16: Bilder über die Zeit aufgenommen die die Aktivität des Gehirns.
00:02:22: Zeigen genau also wir haben tabellarische Daten Zeitreihendaten das nächste Feld der Daten das sollten wir alle kennen auch mittlerweile aus unserem Alltagsleben ist es das sogenannte ambulante
00:02:34: ambulant assessment worum handelt es sich hierbei ja das sind Daten die man quasi nicht in einem klinischen setting aufnimmt sondern die man tatsächlich.
00:02:43: Zu Hause aufnehmen kann und eine ganz ganz wichtige Rolle spielt hier natürlich das Smartphone
00:02:50: alles gibt z.b. elektronische Tagebücher an den Mann
00:02:53: wie man einträgt wo man sich gerade aufhält was man gerade macht wie man sich fühlt ob Leute um einen herum sind sowas kann sehr sehr wichtig sein wenn man
00:03:03: versuchen möchte mit einer bestimmten Erkrankung zudem oder auch bestimmte.
00:03:11: Krankheitsschübe oder auch Veränderung verhindern möchtest du mich über Depression oder Migräne also bei Migräne gibt es z.b. eine App
00:03:18: bei der man auch eben ein gibt wie gut hat man geschlafen was hat man gemacht hat man Sport gemacht und so weiter und solche Daten sollen daneben dazu verwendet werden herauszufinden wann üblicherweise
00:03:32: Migräne Auftritt um einen danach zu warnen dass man sich z.b. vielleicht mal wieder hinlegen sollte und.
00:03:40: Bei psychischen Erkrankung spielt es auch immer eine immer größere Rolle zu schauen wann geht es den Leuten eigentlich gut oder wann haben Sie z.b. das Bedürfnis Alkohol zu trinken.
00:03:51: Aber es gibt auch hier es gibt ja auch noch weitere Daten die gemessen werden können körperlich ab
00:03:57: geht und Bewegungsmuster das machen mittlerweile ja sehr sehr viele dass sie schauen wie weit sind Sie besorgt wie viele Tage wie viele schritte sind sie an einem Tag
00:04:07: gelaufen da gibt es ja Leute die das auch sehr sehr exzessiv nutzen und sich auch selber
00:04:13: Arm zu optimieren hier sprichst du ja schon konkret auch in ethische Aspekte von den sogenannten health-apps beispielsweise an also mich hier würde sich möglich würde möglicherweise die Frage aufkommt
00:04:26: geht es hier nicht schon zu stark in den Bereich der Kontrolle was ist deine deine persönliche Meinung also ich denke jetzt beispielsweise daran dass es
00:04:34: bei Krankenkassen mittlerweile Bonusprogramme gibt wenn ich beispielsweise 6000 oder 7000 Schritte pro Tag
00:04:41: laufe greift das nicht zu stark schon in unseren Alltag ein was was denkst du darüber her hatte zunächst mal denke ich dass das natürlich jeder so für sich selbst auch entscheiden muss ne wie hilfreich er diese Daten findet und wie sehr einem das hilft.
00:04:56: Das ist natürlich ansich gut wenn man den Anreiz hat sich mehr zu bewegen und wenn dann solche Apps dabei helfen ist es natürlich gut
00:05:03: inwieweit sowas dann von Krankenkassen dafür genutzt wird und ein Belohnungssystem aufgebaut wird muss man sehr genau abschätzen dazu bevor ich immer Angst hatte dass es irgendwann in die Richtung gehen könnte
00:05:19: dass man dann schuld an einer Erkrankung essen oder dann gesagt
00:05:24: ja man hat hier nicht genug Sport gemacht und das ist nicht gut genug ernährt und deswegen ist eine bestimmte Erkrankung aufgetreten aber das ist halt von daher schon schwierig weil diese Wirkmechanismen nicht so einfach sind.
00:05:37: Es gibt einfach keine Garantie selbst wenn man sich gesund ernährt wenn man Sport macht wenn man
00:05:43: kann man trotzdem erkranken da dafür spielt halt so viel mit rein Lebensumstände die man nicht kontrollieren kann die Genetik Epigenetik und so weiter sodass ich hier immer.
00:05:55: Sehr sehr vorsichtig.
00:05:58: Wer also wie wir sehen ist ein zentraler Aspekt wie Daten eben auch verwendet werden oder wofür Daten verwendet werden
00:06:06: also wir hatten die tabellarischen Daten die Zeitreihendaten das
00:06:10: ambulant assessment dass wir heutzutage mehr oder weniger alle benutzen in nächster. Werden die sogenannten.
00:06:17: Daten kathinkas uns kurz was zu den Bilddaten erzählen
00:06:21: ja bilddaten spielen eine sehr sehr große Rolle in der Medizinmann versucht mittels verschiedener Techniken Aufnahmen des Körpers zu erzeugen man benutzt sie sehr unterschiedliche Techniken also Röntgen Computertomographie Magnetresonanztomographie Pad Positronen-Emissions-Tomographie das Ziel ist
00:06:40: immer dass man etwas Bestimmtes darstellt dass es mir spiel das Herz darstellt oder die Lunge oder das Gehirn und
00:06:49: je nachdem was man sich eigentlich anschauen möchte ob man sich ziemlich viel Knochen anschauen oder ein bestimmtes Gewebe benutzt man eben unterschiedliche Techniken
00:06:58: okay ja du hast jetzt für verschiedene Formen der der
00:07:01: Bildgebung beschrieben was würdest du sagen wie sieht ein Computer ein Bild drauf an ob man ein farbiges oder ein Schwarz-Weiß-Bild hat
00:07:11: na wenn man einfarbiges Bild hat dann hat man ja die drei Grundfarben Typen blau rot und grün die sind in unterschiedlichen channels.
00:07:20: Speichert das kann man sich so vorstellen wie eine Erweiterung von der Matrix so dass man dann noch eine dritte Dimension nach hinten hat.
00:07:29: Aber der einfache Fall wäre eben schwarz-weiß die hat man Grauwerte für jeden Pixel oder im dreidimensionalen sagt man auch
00:07:38: Boxen hat für jedes Wachs oder jeden Pixel einen Wert ein Grauwert der ihm durch eine Zahl beschrieben werden kann
00:07:47: also letztendlich hat man eine riesengroße Matrix von Zahlen die man dann je nachdem was man für eine Auswertung hat auch als Vektor schreiben kann das wäre dann quasi ein eindimensionaler langer.
00:07:59: Sektor und mit diesem Gebilden arbeitet dann der Computer weiter.
00:08:04: Und das ist vor allen Dingen auch wichtig das dazu kommen wir auch später noch mal das
00:08:11: es eben bestimmte Programme gibt die die Struktur beachten von den Bildern also die gucken das räumlich benachbarte
00:08:19: Voxel zusammen prozessiert werden das gibt andere die das nicht machen und diese Techniken die besonders erfolgreich sind die
00:08:27: wir beziehen diese Struktur von diesem Bildern in die Analyse mit einem Kerstin
00:08:34: wie viele Gesundheitsdaten gibt es insgesamt
00:08:38: eine genaue Abschätzung für den Gesundheitsdaten habe ich nicht aber man sich so anschaut was allein an der Charité erhoben wenn das sind
00:08:46: Unmengen an Daten aber es wichtig ist dass man nur ich nicht
00:08:50: all diese Daten tatsächlich auch benutzen kann also hier kommen wir dann schon zu dem zu dem Aspekt der Nutzbarkeit der Daten also dass das Daten tatsächlich dass es Daten
00:09:00: gibte die man die man verwenden kann und Verwendung finden oder die die die guten Taten eben noch sagst gibt es daneben auch dann natürlich erst Kontrast die die die schlechten Taten wie
00:09:15: lassen sich diese Daten Formen unterscheiden also was sind schlechte Daten und was sind gute Daten
00:09:21: ja also was sind gute Daten zunächst einmal würde ich sagen digitalisiert.
00:09:26: Das bedeutet also dass man sie direkt am Computer verarbeiten kann dass man nicht Zettel hat auf den bestimmte Dinge angekreuzt worden sind oder aufgeschrieben worden sind.
00:09:38: Na wobei man natürlich immer fragen muss wie man von gut spricht für wen gut also ich sage jetzt gute Daten die man in ki Algorithmen benutzen kann an sie müssen zunächst digitalisiert vorliegen das ist erstmal eine Grundvoraussetzung und das ist bei vielen Daten tatsächlich nicht der Fall ist wird oft immer noch viel was handschriftlich auch in den Kliniken gemacht wird wobei sie auch
00:09:57: große Unterschiede der nächste wichtige Punkt ist dass die Daten standardisiert sind.
00:10:05: Das heißt dass man sie einheitlich erhebt dass man jede Person wenn möglich das Gleiche fragt dass man zumindest einen Z an ähnlichen Daten hat natürlich muss man immer auch individuelle auf die Situation gucken was ist jetzt relevant bei dem Patienten
00:10:20: aber man muss auch man muss eben gucken wenn man jetzt
00:10:23: was bestimmtes wie z.b. das Alter abfragt dass man das standardisiert erhebt dass man nicht bei einem das Geburtsdatum hin schreibt bei dem anderen aber das Alter in Jahren.
00:10:34: Zum Zeitpunkt der Untersuchung weitere wichtiges Thema als Interoperabilität da beschäftigen sich auch ganze Arbeitsgruppen mit
00:10:43: hier geht es darum unter anderem die IT Systeme miteinander kommunizieren kann das spielt immer dann eine Rolle wenn man auch möchte das
00:10:51: Daten über Kliniken hinweg über Krankenhäuser in Weg auch miteinander kommunizieren können und diese Daten eben auch einheitlich erhoben werden auch das ist oft nicht der Fall jede Klinik hat so auch die eigenen Maßstäbe oder die eigenen
00:11:05: Vorgaben wie sieht Daten erheben das macht.
00:11:08: Das macht eigentlich jeder Arbeitsbereich für sich alleine und da wird jetzt eben sehr sehr stark dran gearbeitet auch eine einheitliche Sprache zu finden aber sobald man da auch tiefer einsteigt merkt man erstmal wie wie schwierig das einiges und wie viele.
00:11:22: Missverständliche Begriffe es gibt.
00:11:25: Vielleicht noch mal eine Frage zu zu den guten und schlechten Taten du hast gesagt dass die Entscheidung ob Daten gut oder schlecht sind dass das sehr stark kontextgebunden ist kann man das
00:11:38: pauschal in dieser Form sagen also gute Daten oder schlechte Daten beziehen sich immer auf einen spezifischen Kontext
00:11:46: ja wobei ich jetzt in context relativ weit fassen würde also ich würde jetzt sagen diese Eigenschaft nicht gerade genannt habe und da, noch ein paar mehr dazu die sind
00:11:56: immer wichtig wenn man
00:11:58: ki algorithmenentwicklung man könnte jetzt sagen wenn man jetzt nur eine Anwendung an einem bestimmten Ort für eine bestimmte Fragestellung entwickeln möchte dann ist es relativ egal ob die Daten jetzt in dem anderen Krankenhaus genauso erhoben worden sind oder nicht.
00:12:13: Na dann wäre die Interoperabilität z.b. nicht so wichtig aber es ist immer noch wichtig dass die Daten digitalisiert vorliegen und auch dass sie standardisiert.
00:12:23: Und was würdest du sagen wie wichtig ist heutzutage gerade im Kontext einer zunehmenden Mobile rin Gesellschaft wie wichtig ist Interoperabilität insbesondere im Kontext der Medizin.
00:12:37: Ich würde sagen das ist super wichtig also das man verschenkt soviel indem man
00:12:45: Daten nicht einheitlich
00:12:48: erheb also vor allen Dingen so ein gutes Beispiel sind hier seltene Erkrankungen wo man sowieso schon relativ wenig Daten hat weil so wenig Fälle vorliegen.
00:12:56: Wenn man jetzt sagen wir mal 100 Fälle von einer Erkrankung haben und dann sie von 80 unterschiedlichen Krankenhäusern kommen und die
00:13:04: jeder die unterschiedlich erhebt und auch ganz unterschiedliche Daten hat dann sind diese Daten überhaupt nicht vergleichbar und man kann keine keine Analyse machen das ist auch nicht nur relevant für Kai Eisen und das ist relevant für jede.
00:13:16: Statistische Auswertung die man machen möchte das ist absolut essentiell.
00:13:23: Kerstin wir hatten in der Früh eine folge das konkrete Beispiel Hautkrebs und da sagtest du das
00:13:30: in erster Linie Menschen mit weißer Hautfarbe hier eingeschlossen sind in welcher Form ist das repräsentativ das ist natürlich erstmal nicht repräsentativ und das ist nämlich ein weiterer wichtiger. Wie repräsentativ sind die Daten eigentlich
00:13:44: und das hängt dann natürlich auch wieder von der Erkrankung ab wenn es um Hautkrebs geht ist es
00:13:50: macht es vielleicht Sinn dass die Bilder überwiegend von Menschen mit weißer Hautfarbe, aber in anderen Kontext macht das natürlich keinen Sinn und wenn man sich medizinische Datenbanken anguckt auch
00:14:02: große Bild Gerungs Datenbank merkt man relativ schnell dass sie oft nicht repräsentativ sind also sind.
00:14:10: Häufig zu mich auch in genetischen Datenbank sind die meisten europäischer Abstammung das ist natürlich nicht repräsentativ das ist auch was was uns auch später noch mal beschäftigen wird was man natürlich auch bei der Programmierung von diesem ki Algorithmen
00:14:27: besuchen.
00:14:28: Kann einzubeziehen aber was auch ein Problem ist was nicht so einfach lösbar ist trotzdem sollte man sich natürlich bei der Datenerhebung auch darauf konzentrieren oder
00:14:38: zu fokussieren oder zu überlegen was für Daten brauchen wir eigentlich und wer musste alles vertreten sein das hört gehört zum Spiel auch dazu dass bei Erkrankung die Männer und Frauen betreffen das dann auch beide mindestens gleichermaßen
00:14:52: was denkst du wie wichtig ist dass die die Daten frei zugänglich und nutzbar sind
00:14:59: auch sehr sehr wichtiger sie müssen natürlich aufjedenfall nutzbar sein damit man da auch gute Anwendung entwickeln kann und auch interessante Analysen
00:15:10: man kann es gibt hierzu den ganzen Kriterien die wir jetzt besprochen und genannt haben gibt es die sogenannten fair Kriterien
00:15:18: pineapple Festival interoperabel entry usable und das beschreibt eigentlich alles was wir brauchen und das klingt relativ einfach aber viele Daten liegen so nicht vor.
00:15:31: Ja als Nichtmediziner wäre für mich die Frage wer hat diese vier Kriterien den eigentlich entwickelt ja das war ein großes Konsortium von Wissenschaftlern
00:15:43: die von ganz unterschiedlichen Universitäten kommen und auch
00:15:46: aus ganz unterschiedlichen Ländern also z.b. den Niederlanden den USA der Schweiz Deutschland und so weiter und die haben eben 2016 Artikel geschrieben
00:16:01: der.
00:16:03: Firda bei Center big data and erschienen ist und diese fährt Kriterien dargelegt hat dann hast du
00:16:11: glaube ich fast ausschließlich Wissenschaftlerinnen und Wissenschaftler aus westlichen Ländern genannt was würdest du sagen werden diese faire Kriterien heutzutage global
00:16:22: eingehalten
00:16:23: also global eingehalten kann man sicherlich nicht sagen es sind aber schon die leitenden Kriterien an die sich die meisten eigentlich halten sollen und die sind ja auch an sich relativ ein gegen dich und jeder würde sag's ja natürlich sollen Daten in dieser Form.
00:16:39: Vorliegen es ist halt nur relativ schwierig in der Praxis tatsächlich solche Daten zu erheben.
00:16:47: Kommen wir vielleicht zum Ende hin noch mal konkreten bisschen in anschaulicher Form auch zu zu Beispielen aus der Medizin wie
00:16:56: insbesondere gute Daten Anwendung finden kannst du da noch noch ein bisschen was einige Sachen nennen.
00:17:03: Ja ich kann hier vor allen Dingen ein paar gegen Beispiele nennen wann das z.b. nicht so gut funktioniert.
00:17:10: Als Beispiel eine große Sache die nicht standardisiert sind sind Befundberichte.
00:17:18: Und hier ist das ist was womit man wo ein Computer nur sehr sehr schwer mit umgehen kann ja das ist ein Häufchen Freitag das vor.
00:17:26: Bestimmten Regeln das ist etwas Wunde von Computer Schwierigkeiten mit hat ein anderes Beispiel sind wechselnde diagnostische leid
00:17:33: 10 Mal auch in der Medizin das ist natürlich so dass man wissen anhäuft dass es neues Wissen gibt dass man die Leitfäden ändert dass man die Therapie Möglichkeiten verändert.
00:17:44: Und das ist immer der der schwierig für den ki Algorithmus als Beispiel und konkretes Beispiel ist dass sich bei der Multiplen Sklerose 2017 die Kriterien zu 2010 verändert haben und jetzt.
00:17:58: Viel schneller Multiple Sklerose diagnostiziert werden kann als zu 2010 und das ist natürlich etwas schwierig ist für den Computer.
00:18:06: Gibt ja auch viele weitere Beispiele MRT-Bilder werden an unterschiedlichen Scannern erhoben mit unterschiedlichen Feldstärken mit unterschiedlichen Parametern und sind dann eben um nicht unbedingt vergleichbar und das ist zum Computer und Marille.
00:18:19: Schwierig die Daten dann so zu verarbeiten dass sie dann wirklich.
00:18:23: Wieder vergleichbar sein du hast jetzt einige problematische Beispiele aufgegriffen da würde mich natürlich interessieren wie wird diesen Problem begegnet kommen wir vielleicht noch mal auf den
00:18:33: Befundbericht gibt es da möglicherweise Formen der Standardisierung um um um
00:18:38: da gute Daten sozusagen zu bündeln ja an sowas wird natürlich gearbeitet dass auch die elektronische Patientenakte geht natürlich in so eine Richtung na dass man versucht nach bestimmten Kriterien bestimmte Daten zu erheben
00:18:52: es ist aber eben auch so dass natürlich gerade in der Klinik Bereiche ja über jahrelange
00:18:59: Erfahrungen sich gebildet haben und sich auf bestimmte Brax.
00:19:03: Praktiken quasi draußen Bilder wie man etwas aufschreibt und wie man hier vorgeht und da hast du so oft.
00:19:11: Da muss dann halt eben auch die Klinik oder muss man sich auch die Verantwortlichen entscheiden was da auch Sinn macht und die haben natürlich auch immer das Ziel dass die Klinik einfach gut funktioniert und dass die Patienten gut versorgt
00:19:22: werden und das ist natürlich dann erstmal auch so ein Zusatzaufwand aber ich denke dass das halt langfristig einfach sehr sehr helfen kann weil sie mehr
00:19:32: interessante gute Daten man über einzelne Person hat desto einfacher kann man daneben auch Berechnungen machen.
00:19:42: Ja also mit dem mit dem befundberichten und den und den Leitlinien hast du nur zwei Beispiele genannt wo es nicht so gut läuft was würdest du sagen könntest du uns noch vielleicht das ein oder andere Beispiel geben wo.
00:19:54: Die das Sammeln von guten Daten die Standardisierung wo das schon in in in der wo das schon gut läuft
00:20:02: ja somit mit den diagnostischen lightscene das kann man nicht so richtig sagen dass kann man auch nicht so richtig zum Vorwurf machen weil das einfach was ganz natürlich ist dass das ist einfach was womit solche ki Algorithmen und daneben noch umgehen können müssen wo man Standardisierung.
00:20:19: Gut verfolgen kann sind eigentlich in der Bildgebung
00:20:26: dir hat man das nitration das Problem man hat unterschiedliche Scanner aber man kann sich ziemlich wir auch bestimmte Sequenzen einlegen man kann sich auf eine Feldstärke einigen und es gibt auch schon relativ viele große
00:20:39: Bildgebung Konsortien die Bilder von unterschiedlichen Scannern.
00:20:44: Erheben und dir aber eben bestimmte Sequenzen vorgeben sodass die daten relativ
00:20:49: einheitlich sind dann muss man natürlich noch einiges am Postprocessing machen und gucken dass man die Daten noch weiter fallen hat.
00:20:56: Grundsätzlich hat man immer so ein bisschen die zwei Wege entweder man versucht von Anfang an alles extrem standardisiert zu erheben das natürlich super ist wenn das funktioniert.
00:21:06: Und auf der anderen Seite hätte man eben hat man benutzt man dann eben wieder die ki Algorithmen um darüber hinweg zu lernen dass die Daten eben von unterschiedlichen Scannern und so gibt aber hier gibt's dann gibt's eben auch.
00:21:19: Grenzen ich kann hier ein Beispiel nennen wo wir mal versucht haben direkt aus der Klinik
00:21:24: bestimmte Daten aus dem Bildgebung System heraus zu extrahieren und das war wirklich das war einfach das Sandarten aus der klinischen Routine und das Wachsen wirklich.
00:21:34: Kraut und Rüben so unterschiedliche Daten unterschiedliche Sequenzen unterschiedliche Anzahl an Schichten und so das war dann das sind solche Daten die kann man dann wirklich nicht in der Auswertung verwenden weil egal was auch immer man danach raus kriegt
00:21:47: man weiß nie woran es liegt es an den Daten oder hat man jetzt tatsächlich was interessantes festgestellt.
00:21:56: Das ist dann einfach der sehr schade weil diese Daten dann tatsächlich einfach nicht nutzbar sind.
00:22:01: Ja aber wir kommen schon zum Ende unserer vierten Folge wir haben heute gesehen dass für KI und KI Algorithmen
00:22:09: das Sammeln guter Daten die Standardisierung eine notwendige Grundlage sind wir werden in unserer letzten Folge noch weiter in den Bereich der data science vordringen und ich sag
00:22:20: aber für heute erstmal tschüss bis zum nächsten Mal tschüss.