Rofo 2023; 195(06): 483
DOI: 10.1055/a-1989-7785
Brennpunkt

Kommentar zu KI – Künstliche Intelligenz entdeckt Vorhofflimmern aus Röntgenbild

Christopher Kloth

In ihrer retrospektiven Single-Center-Arbeit untersuchten Matsumoto et al. als erste Studie überhaupt die Detektion von Vorhofflimmern (AF) mittels künstlicher Intelligenz anhand von 13868 Röntgenaufnahmen des Thorax bei 7047 Patienten. Als Goldstandart lagen Echokardiografien und Elektrokardiogramme (EKG) vor. Ein Labeling in Vorhofflimmern ja oder nein erfolgte. Eine zusätzliche Unterteilung in Vorhofflimmern und paroxysmales Vorhofflimmern wurde durchgeführt. Sowohl inhaltlich als auch methodisch müssen einige Punkte der Publikation kritisch hinterfragt werden.

Der Zeitraum zwischen Röntgenaufnahme und Echokardiografie/EKG ist mit bis zu 30 Tagen als verhältnismäßig lang anzusehen. Auf zusätzliche kardiale Erkrankungen oder Interventionen wird nicht eingegangen.

Als Röntgenbilder wurden einheitlich nur Postero-anterior-Aufnahmen im Stehen verwendet, was das Kollektiv homogen gestaltete. Demgegenüber wurden jedoch Röntgengeräte von verschiedenen Herstellern verwendet. Alle Röntgenaufnahmen wurden auf 512 × 512 Pixel verkleinert unter Aufrechterhaltung des Seitenverhältnisses, was einerseits den Datensatz homogenisiert und andererseits die ursprünglichen Bilder verändert.

Fremdmaterial wie Herzschrittmacher und Drahtcerclagen werden nicht gesondert berücksichtigt, was als Einschränkung zu sehen ist, wenngleich die Autoren angeben, dass dies nur bei einem Fall des Testkollektives der Fall war. Äußerst positiv muss die enorme Größe der Datensätze hervorgehoben werden.

Zur Visualisierung wurde eine Komposition von 2 Attributionsmethoden (Grad-CAM und Guided Backprop) verwendet, was als positiv zu bewerten ist, wenngleich nicht begründet wird, warum die Methoden gewählt wurden.

Das Modell wurde unter Verwendung der EfficientNet-Architektur entwickelt und von Grund auf mit dem Trainingsdatensatz trainiert. Nähere Informationen werden leider durch die Autoren nicht angegeben: Welches EfficientNet wurde genau verwendet? Welches Tuning-Verfahren wurde verwendet? Wie wurde die Modellarchitektur selbst festgelegt?

Positiv muss das strukturierte Vorgehen mit einer zufälligen Aufteilung der Datensätze in einem Verhältnis von 8:1:1 von Trainingsdatensatz, Validierungsdatensatz und Testdatensatz angesehen werden. Die Bilder aus den Validierungs- und Testdatensätzen wurden extrahiert, um einen nicht duplizierten Validierungsdatensatz und einen nicht duplizierten Testdatensatz zu erstellen. Die Aufteilung wurde allerdings zufällig und nicht stratifiziert gemacht, was bei unbalancierten Klassen unüblich ist und die Evaluation verzerren kann. Der steile Anstieg der Lernkurve (Supplementary Material) deutet auf ein mögliches Overfitting hin, die Autoren gehen hierauf nicht näher ein.

Die Ergebnisse wurden mittels Heat-Map-Karten visualisiert und von 2 Radiologen gesichtet. Die Heat-Maps wurden mit den ursprünglichen Röntgenaufnahmen überlagert, um eine klassenunterscheidende Visualisierung zu ermöglichen. Die Position wurde in 5 Abschnitte unterteilt: oben rechts vom Herzschatten, unten rechts vom Herzschatten, oben links vom Herzschatten, unten links vom Herzschatten und andere. In Röntgenaufnahmen des Brustkorbs, die das Modell als korrekt als AF-positiv identifiziert hat, waren die für das Modell interessanten Bereiche die linken und rechten Vorhofregionen. Die Ergebnisse der Salienzkarten/Heat-Maps zeigen hierbei teils auch hervorgehobene Areale, welche nichts mit dem Vorhofflimmern zu tun haben wie auch Areale am Zwerchfell, was am Modell an sich zweifeln lässt.

Fazit

Als Fazit für die Praxis lässt sich ableiten, dass sich mittels Deep-Learning-Ansatz zwar ein KI-Modell trainieren ließe, die Methodik aber kritisch hinterfragt werden muss. Ferner muss mehr als kritisch betrachtet werden, dass man versucht, ein Feature wie Vorhofflimmern aus dem Bild abzuleiten, welches man allenfalls nur indirekt am Röntgenbild erahnen kann und eigentlich mittels EKG als Diagnose gestellt wird. Die Autoren versuchen dies zu relativieren, indem man versucht, einen etablierten aber auch nur indirekt damit zusammenhängen Faktor wie die der linksventrikulären Ejektionsfraktion (LVEF) auf dem Boden der Echokardiografie zu korrelieren.



Publikationsverlauf

Artikel online veröffentlicht:
24. Mai 2023

© 2023. Thieme. All rights reserved.

Georg Thieme Verlag KG
Rüdigerstraße 14, 70469 Stuttgart, Germany