RSS-Feed abonnieren
DOI: 10.1055/a-2300-6235
Einsatz von Künstlicher Intelligenz in der Notaufnahme
Über den Einsatz von Künstlicher Intelligenz (KI) in der Notfallmedizin zu schreiben, scheint auf den ersten Blick ungefähr so weit hergeholt wie die Besiedelung des Mondes. Diese Wahrnehmung speist sich vor allem aus dem zum Teil erheblichen Delta zwischen der im Privatleben erlebten KI einerseits und der erhofften „Digitalisierung“ in der Notaufnahme andererseits. So streamen wir mit unserem Smartphone den individuell vorgeschlagenen Filmtipp auf Netflix, diktieren ganz selbstverständlich Kurznachrichten, lassen uns von unserer Navigations-App ans Ziel führen, bestellen mit Hilfe von Alexa bei Amazon und übersetzen mit Google-Translator fremdsprachige Speisekarten bequem in Echtzeit.
In der Klinik hingegen informiert uns zumeist niemand und insbesondere kein digitales System über Verzögerungen oder Befundänderungen bei CT-Untersuchungen, die Wunddokumentation erfolgt immer noch per Fotokamera mit Speicherkarte, freie Betten müssen telefonisch abgefragt werden, die Arztbrieferstellung erfordert das zeitaufwändige Abtippen – oder zumindest „Copy-Pasten“ – von Vordiagnosen und vermeintlich digitale Rettungsdienstprotokolle müssen bei der Übergabe nicht selten ausgedruckt werden – nur um sie anschließend wieder einzuscannen und als Bild-PDF in die elektronische Patientenakte zu importieren.
In Arztpraxen werden teilweise bereits Tablets zur Anamneseerhebung, Datenabgleich und Befundbesprechung eingesetzt. Im Krankenhaus hingegen sind die kabellosen und touchbasierten Endgeräte bislang echte Mangelware. Das liegt nicht nur an bürokratischen Beschaffungswegen und unterbesetzten IT-Abteilungen in den Krankenhäusern, sondern auch an den gängigen Krankenhausinformationssystemen, die sich in den letzten Jahren weder durch Innovation noch durch Interoperabilität ausgezeichnet haben. Auch die aus der Zeit gefallene Telematikinfrastruktur (TI) kommt seit Jahren nicht vom Fleck, weshalb das Faxgerät bis auf weiteres das Rückgrat der digitalen Kommunikation zwischen Notaufnahme(n) und Praxis bleiben wird. Lohnt es sich in dieser verfahrenen Situation ernsthaft über den Einsatz von KI in der Notaufnahme nachzudenken? Die Antwort ist ein vorsichtig-optimistisches „durchaus“!
In den letzten 10 Jahren wurden zahlreiche Studien veröffentlicht, die den grundsätzlichen Nutzen und perspektivischen Einsatz von KI in der Notfallmedizin eindrucksvoll belegen. Inhaltlich geht es dabei fast immer um die Frage „Kann KI das nicht besser als der Mensch?“ im Kontext originärer notfallmedizinischer Forschungsschwerpunkte wie Diagnosefindung, Interpretation radiologischer Verfahren, Ersteinschätzung und Entscheidungsfindung. Beispielsweise übertraf der geboostete Machine-Learning-Algorithmus „KATE“ Pflegende bei der korrekten Ersteinschätzung (ESI-Triage) in 27% der Fälle [1]. Die Interpretation von 12-Kanal-EKGs gelingt Deep Neural Networks (DNN) deutlich besser als ÄrztInnen bzw. den bisherigen Standardroutinen [2]. Hervorzuheben ist die enorme Präzision, mit der diese DNNs nicht-okklusive Myokardinfarkte (OMI), auch ohne klassische ST-Hebungen, korrekt identifizieren können [3] [4]. Dies funktioniert mittlerweile schon mit einer (kostenpflichtigen) App auf dem Smartphone, mit der man EKG-Ausdrucke abfotografieren und analysieren lassen kann [5].
Auch im Bereich der Bildanalyse hat KI spannende Innovationen ermöglicht. So beherrschen moderne Ultraschallgeräte bereits die KI-basierte Quantifizierung von B-Linien in der Lunge, der Atemvariabilität der Vena cava inferior, sowie der linksventrikulären Ejektionsfraktion und des Herzzeitvolumens [6] [7] [8]. Studien zum klinischen Nutzen dieser smarten Tools stehen allerdings derzeit noch aus. In der Neuroradiologie ist man da schon einen Schritt weiter. Dort reduziert der Einsatz einer KI zur Detektion von Großgefäßverschlüssen bei SchlaganfallpatientInnen die Zeit bis zur Thrombektomie um ca. 10 Minuten. Allerdings sind echte NeuroradiologInnen derzeit noch etwas genauer – und leider langsamer [9] [10]. Auch wenn diese konkreten KI-Anwendungen bereits Marktreife erlangt haben und zugelassen sind, gibt es zahlreiche weitere Proof-of-Concept-Studien zur Diagnosevorhersage und Entscheidungsunterstützung, deren prospektive Validierung und Nutzenbewertung noch aussteht [11] [12] [13].
Während die Rolle der KI bei der Verbesserung der Notfallversorgung zunehmend anerkannt wird, eröffnet das Aufkommen von großen Sprachmodellen (large Language Models, LLMs) und vortrainierten generativen Transformatoren (generative pre-trained Transformers, GPTs) völlig neue Perspektiven. Das neueste dieser multimodalen Sprachmodelle, bekannt als GPT-4, wurde im März 2023 von OpenAI veröffentlicht. Im Gegensatz zu früheren LLMs ist GPT-4 in der Lage, Inhalte aus natürlicher Sprache, Musik, Text und Bildern zu erkennen und in Echtzeit zu interpretieren bzw. zu generieren [14] [15]. Die GPTs sind dabei wahre Alleskönner: ChatGPT kann Fallvignetten aus dem MSD-Handbuch (Merck, Sharp & Dohme, Merck Manual) hinsichtlich Differentialdiagnose und Management mit einer Genauigkeit von 71,7% lösen [16]. GPT-4 schnitt im australischen Eingangstest für angehende NotfallmedizinerInnen (360 multiple Choice-Fragen) besser ab als der Durchschnitt der KandidatInnen (75,8% vs. 71,6%) [17].
Die wohl innovativste Anwendung von GPTs ist jedoch die KI-gestützte Dokumentation in der elektronischen Patientenakte. Die Idee dabei ist, dass die KI z.B. über ein Smartphone das Arzt-PatientInnen- oder Arzt-Arzt-Gespräch mithört, transkribiert und die wichtigsten medizinisch relevanten Sachverhalte in der elektronischen Patientenakte zusammenfasst – unter Aussortierung nicht-medizinischer Inhalte. In einer hochrangig publizierten Head-to-Head Studie wurden 8 verschiedene LLMs mit derartigen Zusammenfassungen von klinischen Verlaufsnotizen (unstrukturierter Text mit Fachjargon und Abkürzungen) und Arzt-PatientInnen-Dialogen (Aufnahme- oder Visitengespräch) beauftragt. Im Vergleich zu den Zusammenfassungen des Fachpersonals wurden die Zusammenfassungen des GPT-4 von medizinischen Lektoren in Bezug auf Vollständigkeit, Korrektheit und Prägnanz als mindestens gleichwertig (45%) oder sogar überlegen (36%) bewertet [18]. Bei Bedarf kann GPT-4 in Sekundenschnelle die Epikrisen und Empfehlungen von Entlassungsbriefen in einfache, patientenverständliche (Mutter-)Sprache umformulieren [19].
Seit Ende letzten Jahres bieten Microsoft und Nuance in den USA die KI-basierte Dokumentationslösung Dragon Ambient eXperience (DAX) Copilot kommerziell an. Eine Machbarkeitsstudie zeigte, dass der Einsatz der DAX-App auf dem iPhone zur Erfassung von Arzt-Patienten-Gesprächen im niedergelassenen Bereich gut funktioniert und der KI-Lauschangriff von den PatientInnen sehr gut akzeptiert wird [20]. Allerdings scheint der DAX-Workflow (Gespräch aufzeichnen, in die Cloud senden, gegenlesen, signieren und in die PatientInnenakte „copy-pasten“) noch keinen großen Zeit- oder Produktivitätsgewinn zu bringen.
Den größten Nutzen entfalten solche ambient-KIs vermutlich erst, wenn sie vollständig in das klinische PatientInneninformationssystem und alle damit verbundenen Workflows integriert sind und neben der reinen KI-Dokumentation auch eine nutzerfreundliche Darstellung komplexer Inhalte der elektronischen Patientenakte ermöglichen. Da trifft es sich gut, dass GPTs gescannte Arztbriefe, Medikationslisten mit handschriftlichen Änderungen und andere Befunde in Sekundenschnelle im Wortsinn vollständig erfassen und beliebig aufbereiten können (z.B. in Form eines Dashboards). Derart von der KI aufbereitete Aufnahmedokumente konnten von jungen AssistenzärztInnen im Durchschnitt um 18% schneller erfasst werden [21].
Auch wenn der Einsatz dieser disruptiven Innovation in vermeintlich greifbare Nähe rückt, gibt es doch einige Themen, die es zu beachten gilt:
-
Ein allzu beliebiger Einsatz von KI zur Diagnoseunterstützung und Entscheidungsfindung ist zwar verlockend, aber derzeit noch nicht für alle möglichen Probleme und Fragestellungen hinreichend wissenschaftlich validiert.
-
Ein zu autonomer Einsatz von KI kann schnell zu ethisch und medizinrechtlich komplexen Situationen führen, für die es noch keine guten Lösungen gibt.
-
Mit zunehmender Zuverlässigkeit von KI-Systemen könnte zudem die menschliche Entscheidungskompetenz abnehmen. Schlimmstenfalls würden wir ohne oder gegen die KI keine Entscheidungen mehr fällen.
-
Der umfassende Einsatz von KI kann zu Datenschutzverletzungen und Überwachung führen. Regelungen für den sicheren Einsatz von KI im Gesundheitswesen müssen daher laufend überprüft und gegebenenfalls angepasst werden, ohne die technischen Möglichkeiten zu Lasten unserer PatientInnen oder des medizinischen Fachpersonals zu sehr einzuschränken.
Am Ende dieses Editorials stellen wir fest: KI in der Notaufnahme ist keine Fiktion, sondern teilweise bereits gelebte Realität. Gut gemachte und vertrauenswürdige KI-Lösungen haben ein enormes Potenzial die kognitive und physische Belastung des medizinischen Personals in der Notaufnahme durch Entlastung von administrativen Aufgaben zu reduzieren und gleichzeitig die Effizienz und Genauigkeit der Patientenversorgung deutlich zu steigern [22]. Das disruptive Potenzial dieser Innovation ist damit enorm und wird unseren Arbeitsalltag maßgeblich verändern – nur die Zeitachse und die Wucht dieser Veränderung sind noch unklar. Gut möglich, dass uns in zehn Jahren das stupide Abtippen von Vordiagnosen aus extern erstellten Berichten so fremd vorkommen wird wie die Nutzung eines Autoatlas im Zeitalter von Navigations-Apps.
Philipp Kümpers, Münster
Sebastian Casu, Hamburg
Bernhard Kumle, Villingen-Schwenningen
Publikationsverlauf
Artikel online veröffentlicht:
05. Juli 2024
© 2024. Thieme. All rights reserved.
Georg Thieme Verlag KG
Rüdigerstraße 14, 70469 Stuttgart, Germany
-
Literatur
- 1 Ivanov O, Wolf L, Brecher D. et al. Improving ED Emergency Severity Index Acuity Assignment Using Machine Learning and Clinical Natural Language Processing. J Emerg Nurs 2021; 47: 265-278 e267 DOI: 10.1016/j.jen.2020.11.001. (PMID: 33358394)
- 2 Herman R, Demolder A, Vavrik B. et al. Validation of an automated artificial intelligence system for 12‑lead ECG interpretation. J Electrocardiol 2024; 82: 147-154 DOI: 10.1016/j.jelectrocard.2023.12.009. (PMID: 38154405)
- 3 Al-Zaiti SS, Martin-Gill C, Zegre-Hemsey JK. et al. Machine learning for ECG diagnosis and risk stratification of occlusion myocardial infarction. Nat Med 2023; 29: 1804-1813 DOI: 10.1038/s41591-023-02396-3. (PMID: 37386246)
- 4 Herman R, Meyers HP, Smith SW. et al. International evaluation of an artificial intelligence-powered electrocardiogram model detecting acute coronary occlusion myocardial infarction. Eur Heart J Digit Health 2024; 5: 123-133 DOI: 10.1093/ehjdh/ztad074. (PMID: 38505483)
- 5 Himmelreich JCL, Harskamp RE. Diagnostic accuracy of the PMcardio smartphone application for artificial intelligence-based interpretation of electrocardiograms in primary care (AMSTELHEART-1). Cardiovasc Digit Health J 2023; 4: 80-90 DOI: 10.1016/j.cvdhj.2023.03.002. (PMID: 37351331)
- 6 Gohar E, Herling A, Mazuz M. et al. Artificial Intelligence (AI) versus POCUS Expert: A Validation Study of Three Automatic AI-Based, Real-Time, Hemodynamic Echocardiographic Assessment Tools. J Clin Med 2023; 12: 1352 DOI: 10.3390/jcm12041352. (PMID: 36835888)
- 7 Mika S, Gola W, Gil-Mika M. et al. Ultrasonographic Applications of Novel Technologies and Artificial Intelligence in Critically Ill Patients. J Pers Med 2024; 14: 286 DOI: 10.3390/jpm14030286. (PMID: 38541028)
- 8 Baloescu C, Rucki AA, Chen A. et al. Machine Learning Algorithm Detection of Confluent B-Lines. Ultrasound Med Biol 2023; 49: 2095-2102 DOI: 10.1016/j.ultrasmedbio.2023.05.016. (PMID: 37365065)
- 9 Martinez-Gutierrez JC, Kim Y, Salazar-Marioni S. et al. Automated Large Vessel Occlusion Detection Software and Thrombectomy Treatment Times: A Cluster Randomized Clinical Trial. JAMA Neurol 2023; 80: 1182-1190 DOI: 10.1001/jamaneurol.2023.3206. (PMID: 37721738)
- 10 Yahav-Dovrat A, Saban M, Merhav G. et al. Evaluation of Artificial Intelligence-Powered Identification of Large-Vessel Occlusions in a Comprehensive Stroke Center. AJNR Am J Neuroradiol 2021; 42: 247-254 DOI: 10.3174/ajnr.A6923. (PMID: 33384294)
- 11 Boonstra A, Laven M. Influence of artificial intelligence on the work design of emergency department clinicians a systematic literature review. BMC Health Serv Res 2022; 22: 669 DOI: 10.1186/s12913-022-08070-7. (PMID: 35585603)
- 12 Chenais G, Lagarde E, Gil-Jardine C. Artificial Intelligence in Emergency Medicine: Viewpoint of Current Applications and Foreseeable Opportunities and Challenges. J Med Internet Res 2023; 25: e40031 DOI: 10.2196/40031. (PMID: 36972306)
- 13 Masoumian Hosseini M, Masoumian Hosseini ST, Qayumi K. et al. The Aspects of Running Artificial Intelligence in Emergency Care; a Scoping Review. Arch Acad Emerg Med 2023; 11: e38 DOI: 10.22037/aaem.v11i1.1974. (PMID: 37215232)
- 14 Preiksaitis C, Ashenburg N, Bunney G. et al. The Role of Large Language Models in Transforming Emergency Medicine: Scoping Review. JMIR Med Inform 2024; 12: e53787 DOI: 10.2196/53787. (PMID: 38728687)
- 15 Thirunavukarasu AJ, Ting DSJ, Elangovan K. et al. Large language models in medicine. Nat Med 2023; 29: 1930-1940 DOI: 10.1038/s41591-023-02448-8. (PMID: 37460753)
- 16 Rao A, Pang M, Kim J. et al. Assessing the Utility of ChatGPT Throughout the Entire Clinical Workflow: Development and Usability Study. J Med Internet Res 2023; 25: e48659 DOI: 10.2196/48659. (PMID: 37606976)
- 17 Smith J, Choi PM, Buntine P. Will code one day run a code? Performance of language models on ACEM primary examinations and implications. Emerg Med Australas 2023; 35: 876-878 DOI: 10.1111/1742-6723.14280. (PMID: 37414729)
- 18 Van Veen D, Van Uden C, Blankemeier L. et al. Adapted large language models can outperform medical experts in clinical text summarization. Nat Med 2024; 30: 1134-1142 DOI: 10.1038/s41591-024-02855-5. (PMID: 38413730)
- 19 Zaretsky J, Kim JM, Baskharoun S. et al. Generative Artificial Intelligence to Transform Inpatient Discharge Summaries to Patient-Friendly Language and Format. JAMA Netw Open 2024; 7: e240357 DOI: 10.1001/jamanetworkopen.2024.0357. (PMID: 38466307)
- 20 Haberle T, Cleveland C, Snow GL. et al. The impact of nuance DAX ambient listening AI documentation: a cohort study. J Am Med Inform Assoc 2024; 31: 975-979 DOI: 10.1093/jamia/ocae022. (PMID: 38345343)
- 21 Chi EA, Chi G, Tsui CT. et al. Development and Validation of an Artificial Intelligence System to Optimize Clinician Review of Patient Records. JAMA Netw Open 2021; 4: e2117391 DOI: 10.1001/jamanetworkopen.2021.17391. (PMID: 34297075)
- 22 Gandhi TK, Classen D, Sinsky CA. et al. How can artificial intelligence decrease cognitive and work burden for front line practitioners?. JAMIA Open 2023; 6: ooad079 DOI: 10.1093/jamiaopen/ooad079. (PMID: 37655124)