Z Orthop Unfall 2016; 154(03): 220-222
DOI: 10.1055/s-0036-1584847
Orthopädie und Unfallchirurgie aktuell
Georg Thieme Verlag KG Stuttgart · New York

Qualitätssicherung – „Mit Lebensbäumen à la QSR kann man Krankenhausqualität nicht bewerten.“

Weitere Informationen

Publikationsverlauf

Publikationsdatum:
28. Juni 2016 (online)

 
    Zoom Image

    Burkhard Fischer ist Leiter des Referats Qualitätsmanagement, IT und Datenanalyse bei der Krankenhausgesellschaft Nordrhein-Westfalen (KGNW) in Düsseldorf. Der Medizinische Informatiker ist Mitautor einer aktuellen Publikation, die Methoden des QSR-Verfahrens hinterfragt und kritisiert.

    Im ZfOU-Interview erläutert der Mitautor einer aktuellen Studie, warum die Ergebnisse bei QSR nicht zuverlässig sind. Vor allem der Einfluss der Fallzahlen auf die Ergebnisse einzelner Häuser lege nahe, diese Daten zumindest nicht in Form eines Krankenhausnavigators zu veröffentlichen.

    ? Sie haben sich in Ihrer neuen Publikation mit QSR befasst [1]. Dabei formulieren Sie eine Kritik an dem Verfahren auf mehreren Ebenen. So monieren Sie einmal die Zuweisung von Daten nach längerem Follow-up zu einem Krankenhaus, in dem die Erstoperation stattfand, warum?

    Wir haben uns die QSR-Daten zu 940 Krankenhäusern und –verbünden angeschaut. Und dies zunächst für die Indikation Implantation eines künstlichen Hüftgelenks nach einem hüftgelenksnahem Bruch. QSR nennt da unter anderem die Häufigkeit von Komplikationen bis zu 365 Tage nach der Implantation des künstlichen Hüftgelenks. Komplikationen, die nach so langer Zeit bei einem Patienten, lange nach Verlassen des Krankenhauses entstehen, gehen aber womöglich gar nicht auf das Verschulden des Krankenhauses zurück. Das kann man nicht eins zu eins dem Klinikum zuordnen.

    ? Sollte man solche Daten nicht erheben, da sie keine Aussagekraft haben?

    Nein, darum geht es nicht. Wir brauchen solche Daten natürlich. Was ist 30 Tage später, 90 Tage, was ist 365 Tage nach einer Operation mit dem Patienten? Das sind sehr wohl wichtige Informationen für die Krankenhäuser, denn letztendlich machen wir Medizin, damit es den Menschen gut geht und nicht nur dafür, dass es ihnen gut geht zu dem Zeitpunkt, zu dem sie aus dem Krankenhaus entlassen werden.

    ? Also ist der Ansatz von QSR da doch richtig?

    Nein – wir teilen die Art der Auswertung bei QSR nicht. Das langfristige Ergebnis einer Operation hängt wesentlich von Faktoren ab, die ein Krankenhaus, in dem die Operation stattfand, nicht mehr steuert. Etwa, wie gut jemand danach betreut wird, wie gut sein Gesundheitszustand insgesamt ist und wie engagiert er selbst ist. Und mal angenommen, ein Patient verstirbt binnen eines Jahres an einem Autounfall – dann wäre das nach dieser Art von Darstellung über Routinedaten auch ein Tod nach Hüftgelenksfraktur – hätte aber mit der Erstoperation wohl kaum etwas zu tun.

    Wir nennen das in der Statistik die Attribuierbarkeit eines Ereignisses in Bezug auf die mögliche Ursache, die Zuschreibbarkeit. Und da sind nach wie vor viele Fragen offen. Man kann außerdem ja kaum davon ausgehen, dass jedes Krankenhaus die gleiche Patientenklientel hat, die immer ähnlich gesundheitsbewusst lebt, sobald sie aus dem Krankenhaus entlassen ist. Da gibt es Unterschiede im sozialen Umfeld und vieles mehr.

    ? Das WIdO erklärt aber, dass es Dinge wie Begleiterkrankungen, Alter des Patienten bei seiner Kalkulation der SMR adjustiert – eine so genannte Risikoadjustierung.

    Das sozioökonomische Umfeld der Patienten geht in den SMR aber nicht ein. Es werden ausschließlich zu anderen Zwecken dokumentierte medizinische und demographische Daten genutzt. Das Verfahren halten wir aus diesem und weiteren Gründen aber nicht für ausreichend. Wir sprechen hier ja von den Abrechnungsdaten der Krankenhäuser. Und in denen fehlen oft ganz entscheidende Angaben zu Begleiterkrankungen. Wenn ein Krankenhaus eine DRG-Ziffer abrechnet, muss es bestimmte Diagnosen, die Haupt- und die Nebendiagnose liefern. Was dabei konkret eingetragen wird, richtet sich in der Praxis oft danach, welche DRG zur Abrechnung möglich ist. Fehlt in den Abrechnungsdaten die Angabe eines essentiellen Bluthochdrucks oder eines Diabetes mellitus, ist das keine Garantie, dass dieser nicht vorgelegen hat, sondern lediglich, dass er für die akute Behandlung und deren Abrechnung keine Relevanz hat. Die Datengrundlage ist daher für eine saubere Risikoadjustierung nur mit großen Einschränkungen geeignet. Ich bin absolut dafür, dass man diese Abrechnungsdaten nutzt, um Orientierungswerte zu generieren, damit man weiß, wo man steht. Aber man muss dabei immer wissen, wo die Unsicherheiten stecken.

    ? Ein Beispiel?

    Bei den Daten zum Herzkatheter, der PCI, nutzt QSR Angaben zur Risikoadjustierung, ob ein Patient einen Bluthochdruck hat oder nicht. Und das Ergebnis bei QSR ist, dass Bluthochdruck in Bezug auf die Überlebenswahrscheinlichkeit bei einer Herzkatheteruntersuchung oder mit Einsetzen eines Stents nach Herzinfarkt protektiv ist.

    ? Patienten mit Hochdruck überleben solche Eingriffe eher?

    Ja. Da steckt allerdings vermutlich ein krasser Dokumentationsbias dahinter. Denn für jene Patienten, die tragischerweise während solcher Untersuchungen versterben, für die wird ein womöglich bestehender Bluthochdruck erst gar nicht mehr in den Abrechnungsdaten dokumentiert. Abrechnungsdaten haben gar nicht das Ziel, solche Dinge noch eigens zu dokumentieren.

    ? Dann müssten solche Werte aus der Statistik fallen?

    Ja, sie bleiben aber bei QSR drinnen. Ein anderes Beispiel betrifft Diabetes bei Komplikationen innerhalb von 30 Tagen. Da ist dann plötzlich ein Diabetes protektiv. Was aus medizinischer Sicht einfach Quatsch ist. Auch da gibt es wieder den Punkt, dass diese Begleiterkrankungen gar nicht mehr in den Abrechnungsdaten der Krankenhäuser erfasst werden.

    ? Kurzum, Sie halten die Risikoadjustierung bei QSR für nicht valide?

    Ja. Wenn dann noch das Abschneiden aus den Einzelindikatoren in eine Gesamtnote für ein Krankenhaus fließt – die 1–3 Lebensbäume, an dieser Stelle weiß man spätestens dann nicht mehr, welche Unsicherheiten noch alles darin stecken.

    ? Das läuft auf die Forderung hinaus, eine Auswertung wie bei QSR kann man vielleicht für interne Diskussionen machen, die Werte sind für uns Krankenhäuser interessant – wir wollen aber nicht, dass sie veröffentlicht werden, weil viele der Ergebnisse nicht eindeutig sind?

    So ist es. Komplikationsraten bis 365 Tage nach der Erstimplantation eines Kunstgelenks zu zählen, das ist viel zu lang, als dass man dafür allein das operierende Haus verantwortlich machen könnte. Die objektive Qualitätsmessung zu veröffentlichen und nicht dazu zu schreiben, dass die Daten mit Vorsicht zu interpretieren sind, ist verantwortungslos und irreführend.

    AOK und WIdO generieren ja Klinikberichte, die den Häusern - meist erst auf Anfrage - zur Verfügung gestellt werden. Das ist durchaus wertvoll, wenngleich auch da wieder nicht mit dieser Absolutheit, die im Anspruch von WIdO und AOK zum Ausdruck gebracht wird. Jeder Qualitätsindikator gibt Hinweise bei einer Analyse auf Verbesserungsmöglichkeiten. Es misst aber nicht Qualität. Schon gar nicht die Qualität in der Medizin.

    Und aufsetzend auf diesen schon für sich unreifen Datensätzen, gibt es dann im AOK-Krankenhausnavigator eben noch das Lebensbaumkonzept, das in sich problematisch ist. Unser Artikel setzt sich daher im Wesentlichen damit auseinander.

    ? Dabei stören Sie sich vor allem am Verfahren des WIdOs, die Qualität der Häuser nach den oberen und unteren Grenzwerten des so genannten 95 %-Konfidenzintervalls zu berechnen. Können Sie das etwas erläutern?

    Wir kritisieren nicht die grundsätzliche Kalkulation eines Konfidenzintervalls um die SMR-Werte. Da gibt es in der Wissenschaft zwar unterschiedliche Methoden, keine davon ist wirklich genau, aber da steckt nicht unsere Kritik.

    Wir kritisieren vielmehr den Einsatz des Konfidenzintervalls zum Vergleich der Krankenhäuser.

    ? Was meinen Sie?

    Nehmen wir ein Beispiel. Angenommen ein Haus landet bei einem beliebigem Qualitätsindikator bei einem SMR von 1,2 mit einem 95 %-Konfidenzintervall von 0,8–1,6, dann weicht das Haus, wenn man die Werte an sich betrachtet, statistisch nicht signifikant vom Durchschnitt aller Häuser ab. Der Durchschnitt liegt bei 1,0 – und der wird vom Konfidenzintervall ja hier mit umfasst. Wenn Sie einen p-Wert von 0,05 ansetzen, wäre der Unterschied zu einem anderen Haus mit SMR von 1,0 nicht signifikant.

    ? Die beiden Häuser unterscheiden sich also statistisch gesehen bei diesem Qualitätsparameter gar nicht?

    So ist es.

    ? Dabei spielt auch das 95 %-Konfidenzintervall des zweiten Hauses keine Rolle mehr?

    Ja. Aber das WIdO nimmt jetzt die Grenzen der jeweiligen Konfidenzintervalle und nutzt sie, um doch ein Ranking aufzumachen. Und das geht gar nicht.

    ? Das WIdO reiht ein Haus zu der Gruppe jenes Fünftels an Krankenhäusern mit vergleichsweise guter Qualität, wenn es einen relativ niedrigen oberen Grenzwerte für das 95 %-Konfidenzintervall hat.

    Ja, und wenn das Intervall bei hoher Fallzahl schmal ist, und der SMR in der Nähe von 1,0 liegt, kann das dazu führen, dass ein Haus positiv bewertet wird, zugleich aber einen hohen unteren Grenzwert aufweist, was wiederum zur Abwertung führen wird. Mehr noch – es ist bei diesem seltsamen Verfahren sogar denkbar, dass ein Haus sowohl in der Gruppe Plus als auch bei Minus landet. Also gleich zweimal in den beiden Qualitätsgruppen auftaucht.

    ? Haben Sie solch einen Fall gefunden?

    Nein. Auf jeden Fall liefert das Verfahren aber Werte, die von der Fallzahl des Krankenhauses abhängen.

    ? Was meinen Sie?

    Es benachteiligt eher Kliniken mit hohen Fallzahlen. Bei ihnen wird das Konfidenzintervall vergleichsweise schmal ausfallen. Je größer die Klinik, je mehr Fälle sie hat, desto kleiner ist dieses Intervall.

    ? Was ja im Prinzip ein gutes Zeichen ist, die Werte erlauben eine zuverlässigere Prognose.

    Ja, aber aus statistischen Gründen führt das WIdO-Verfahren mit den Konfidenzintervallen dazu, dass die Häuser mit hoher Fallzahl unverhältnismäßig oft extrem bewertet werden – also 1 oder gleich 3 Lebensbäume erhalten.

    ? Wie haben Sie das gezeigt?

    Wir haben dafür einmal durchgerechnet, wie die Gesamtnote eines Hauses mit dem mit Abstand wichtigsten Parameter für Qualität steht, nämlich der 90-Tages-Mortalität nach der Implantation einer Hüftprothese nach hüftnahem Oberschenkelbruch. Das ist eine Indikation mit einer hohen Sterblichkeit, sie liegt bei 14,4 %. Wir haben die 3 Gruppen bei den Lebensbäumen genommen und in so genannten Kontingenztafeln geschaut, wo diese Häuser jeweils beim Abschneiden für die Sterblichkeit bis 90 Tage nach der Operation stehen. Dafür haben wir die SMR-Werte genommen. Einmal SMR-Werte unter 0,8, dann zwischen 0,8 und 1,2 und dann über 1,2.

    ? Sie argumentieren hierbei, dass die Sterblichkeit der wichtigste Qualitätsindikator überhaupt ist und sich ein gutes Abschneiden dabei auch in der Gesamtnote widerspiegeln müsste?

    Ja.

    ? Wobei in die Kalkulation der Lebensbäume auch noch 2 weitere Indikatoren eingehen. Das Abschneiden beim Indikator 365-Tage-Revisionsrate und die Komplikationsrate binnen 90 Tagen.

    Schon richtig. Aber wir finden auf jeden Fall heraus, dass längst nicht alle Häuser, die bei der Sterblichkeit sehr gut abschneiden, dann auch in der Gesamtbilanz 3 Lebensbäume erhalten. Und auch hier deutet sich eben an, dass die Kategorisierung nach Lebensbäume, die eine Klinik erhält, mehr mit der Fallzahl zu tun haben könnte, als mit der medizinischen Qualität. Häuser mit großen Fallzahlen landen überproportional oft in der Gruppe mit nur 1 Lebensbaum oder mit gleich 3 Bäumen. Wir lehnen diese Art der Auswertung zumindest bei den Lebensbaumbewertungen ab.

    ? Was sollte man stattdessen rechnen?

    In Ordnung wäre es, wenn Sie den SMR-Wert für eine Qualitätseinschätzung nehmen. Und das 95 %-Konfidenzintervall als das verwenden, was es ist: Als Maß der Unsicherheit. Es gibt den Bereich an, in dem der wahre Mittelwert des SMR noch liegen könnte. Das kann man, so wie es ist, darstellen.

    ? Am Ende sollte bei einer Darstellung auch nach QSR der SMR-Wert im Vordergrund stehen, wenn man Kliniken vergleichen möchte.

    Richtig. Natürlich kann der Patient seine Entscheidung aus einer Risikoperspektive treffen. Wer ein Krankenhaus sucht, kann sich durchaus überlegen – bin ich bereit, ein relativ großes Risiko einzugehen, um ein relativ wahrscheinliches gutes Ergebnis zu erzielen? Anders gesagt – nehme ich ein Krankenhaus, das einen niedrigen SMR-Wert hat, auch dann, wenn das Konfidenzintervall dazu groß ist? So macht die Betrachtung eines Konfidenzintervalls Sinn. Als Maß der Unsicherheit, die hinter dem SMR-Wert steckt.

    ? Was schlagen Sie vor, um Qualität von Krankenhäusern zu messen?

    Unser besseres Modell ist das, was wir gemeinsam mit den Krankenkassen im G-BA beschlossen haben, nämlich das, was BQS und AQUA entwickelt haben und das IQTiG jetzt weiterentwickeln soll. Dazu brauchen wir sicher eine breite fachliche Debatte. Zumal jetzt mit dem neuen Krankenhausstrukturgesetz, Qualitätsindikatoren auch für die Krankenhausplanung herangezogen werden sollen. Wichtig ist es dafür, Erhebungsdaten aus der gesetzlichen Qualitätssicherung zu nutzen.

    ? Also keine Routinedaten? Viele Ärzte monieren, dass der Dokumentationsaufwand für diese gesetzliche Qualitätssicherung schon heute hoch bis zu hoch ist, auf keinen Fall noch steigen darf.

    Das ist durchaus eine legitime Forderung. Vielleicht können wir da auch Routinedaten zur Entlastung mitnützen. Nur müssen wir uns dann überlegen, ob wir bei ICD- und OPS-Dokumentationen nicht eben bestimmte weitere Angaben verpflichtend sein müssen. Wir haben ja eben über die Beispiele von Diabetes und Bluthochdruck gesprochen, wo die Daten einfach fehlen. Ich habe schon vor 5 Jahren gesagt, wir sollten die AOKen davon überzeugen, dass sie ihre Indikatoren an eine neutrale Stelle, heute etwa das IQTiG, geben, damit die dort auf Herz und Nieren geprüft und weiterentwickelt werden.

    ? Gegen einen Wettbewerb der Häuser um Qualität sind Sie nicht?

    Wir sind unbedingt dafür. Aber je stringentere Entscheidungen auf der Basis von Qualitätsindikatoren getroffen werden, demnächst sogar Entscheidungen zur Krankenhausplanung, desto wichtiger ist, erst die zugrunde liegenden Indikatoren sauber zu prüfen.

    Das Interview führte Bernhard Epping


    #

    Zoom Image