Gesundheitswesen 2023; 85(S 02): S101-S110
DOI: 10.1055/a-1806-2115
Originalarbeit

Nutzung von Krankenkassenroutinedaten zur Bestimmung von Krankheitshäufigkeiten im Projekt BURDEN 2020

Utilizing Routine Health Insurance Data for Calculation of Disease Frequencies in the Project BURDEN 2020
1   Wissenschaftliches Institut der AOK (WIdO), Berlin, Germany
,
Jan Breitkreuz
1   Wissenschaftliches Institut der AOK (WIdO), Berlin, Germany
,
Gabriela Brückner
1   Wissenschaftliches Institut der AOK (WIdO), Berlin, Germany
,
Helmut Schröder
1   Wissenschaftliches Institut der AOK (WIdO), Berlin, Germany
› Author Affiliations
 

Zusammenfassung

Ziel der Studie Das Konzept der Krankheitslast erlaubt eine umfassende Analyse des Gesundheitszustands einer Bevölkerung. Als Kennzahlen werden verlorene Lebensjahre aufgrund von Mortalität (years of life lost, YLL) und Morbidität (years lived with disability, YLD) berechnet und im Summenindikator DALY (disability adjusted life years) zusammengefasst. Diese Indikatoren liefern eine Planungsgrundlage für Bereiche wie Prävention, Versorgung oder Bedarfsplanung. In dem vom Innovationsfonds geförderten Projekt BURDEN 2020 wird erstmals für Deutschland eine regionalisierte Krankheitslastberechnung in Anlehnung an die internationale „Global Burden of Disease“-Studie durchgeführt.

Methodik Zur Berechnung der YLD werden Informationen zur Häufigkeit von Krankheiten und deren Schweregradverteilungen benötigt. Dabei sind Krankenkassenroutinedaten eine wichtige Datengrundlage. In Expertentreffen wurden Falldefinitionen für 18 ausgewählte Krankheiten sowie Schweregrade bei 11 der Krankheiten entwickelt. Auf dieser Basis wurden Krankheitshäufigkeiten vom WIdO unter Nutzung der Routinedaten der AOK-Versicherten ermittelt. Ein spezifisches Prävalenzkonzept berücksichtigt die Dynamik der offenen Kohorte der Versicherten. Die Hochrechnung der Ergebnisse ausgehend von der AOK auf die Gesamtbevölkerung erfolgte bei den Schweregraden bundesweit nach Alter und Geschlecht und bei den Krankheitshäufigkeiten zusätzlich morbiditätsadjustiert und regionalisiert.

Ergebnisse Systematisch wurden für 18 Erkrankungen aus sieben Krankheitsgruppen (kardiovaskuläre Krankheiten, Diabetes, Krebs, psychische Störungen, Demenz, COPD und untere Atemwegsinfekte) die Krankheitshäufigkeiten (Prävalenzen oder Raten) bis auf Ebene der Bundesländer und Raumordnungsregionen ermittelt. Schweregradverteilungen liegen bundesweit nach Alter und Geschlecht vor. Die Ergebnisse und Methodendokumentation sind verfügbar unter www.krankheitslage-deutschland.de.

Schlussfolgerung Krankenkassenroutinedaten stellen eine wichtige Datengrundlage im Projekt BURDEN 2020 dar, weil auf Basis der großen Fallzahlen regionale Kennzahlen und teilweise Schweregrade ermittelt werden können. Eine umfassende Publikation der Ergebnisse schafft Transparenz und soll die Nachnutzung in Folgeprojekten ermöglichen. Perspektivisch scheint es sinnvoll, die Krankheitslastberechnung auf weitere Krankheiten auszuweiten. Zudem wird der Bedarf nach datenschutzkonformer Verknüpfung von Krankenkassenroutinedaten mit weiteren Gesundheitsdatenbeständen steigen.


#

Abstract

Objective The concept of disease burden enables a comprehensive analysis of the health status of a population. Key indicators are years of life lost due to mortality (YLL) and morbidity (years lived with disability, YLD), summarised in the DALY indicator (disability adjusted life years). These indicators are suitable for planning prevention, health care or provision of health services. With the project BURDEN 2020, funded by the German Federal Joint Committee’s Innovation Fund, a national and regionalised calculation of burden of disease for Germany is being carried out for the first time, based on the methodology of the international “Global Burden of Disease” study.

Methods Calculation of YLD requires data on the frequency and severity of diseases, with routine health insurance data constituting an important data source. Case definitions for 18 selected diseases and severity levels for 11 of these diseases were developed in expert meetings. Based on these case definitions, the AOK Research Institute (WIdO) calculated disease frequencies from health utilisation data of patients insured with the AOK. A specific concept for prevalence calculation takes into account the dynamics of an open cohort of insurees. For severity levels, the results of the AOK insurees were extrapolated to the total population in Germany according to age and gender groups. For disease frequencies, the results were additionally adjusted for morbidity and estimated on regional levels.

Results Disease frequencies measured by prevalences or rates are available for 18 diseases from seven categories (cardiovascular diseases, diabetes, cancer, mental disorders, dementia, COPD and lower respiratory tract infections) at the regional levels of the 16 federal states and 96 regional planning areas. Severity distributions are provided on the national level stratified by age groups and gender. The results and documentation of methods are available at www.krankheitslage-deutschland.de (in German language).

Conclusion Routine health insurance data are an important data source in the BURDEN 2020 project because regional figures and, in some cases, severity levels can be determined on the basis of a large number of cases. A comprehensive publication of results creates transparency and allows reutilisation of methods in further projects. Future research should extend burden of disease calculations to other diseases. In addition, there is an increasing demand for health data linkage.


#

Einleitung

Das Projekt BURDEN 2020, gefördert vom Innovationsfonds des Gemeinsamen Bundesausschusses (Förderkennzeichen 01VSF17007, Projektlaufzeit vom 1.4.2018 bis 30.6.2021), hatte eine regionalisierte Krankheitslastberechnung für Deutschland zum Ziel. Das Konzept der Krankheitslast erlaubt die umfassende Messung des Gesundheitszustands der Bevölkerung, indem der Beitrag von Morbidität und Mortalität von Krankheiten auf die Gesundheit quantifiziert wird [1]. Für die Mortalität werden verlorene Lebensjahre aufgrund frühzeitigen Versterbens als „years of life lost“ (YLL) berechnet. Für die Morbidität werden verlorene gesunde Lebensjahre aufgrund der Beeinträchtigung durch eine Krankheit als „years lived with disability“ (YLD) ermittelt. YLL und YLD ergeben zusammen den Summenindikator „disability adjusted life years“ (DALY) [2]. Mit einer anschließenden Risikoattribution kann der Beitrag einzelner Risikofaktoren zur Krankheitslast ermittelt werden. Die Ergebnisse der Krankheitslastberechnung stellen somit eine wichtige Grundlage zur Beurteilung der gesundheitlichen Lage der Bevölkerung dar und ermöglichen Planung, Steuerung und Monitoring im Gesundheitswesen [3]. Die Ergebnisse des BURDEN 2020-Projekts sowie methodische Erläuterungen zur Krankheitslastberechnung werden unter www.daly.rki.de bereitgestellt.

International werden globale Krankheitslastberechnungen seit den 1990er Jahren regelmäßig in der „Global Burden of Disease“-Studie (GBD) durchgeführt [4]. Im Projekt BURDEN 2020 wird erstmals eine Krankheitslastberechnung für Deutschland mit regionalisierten Ergebnissen realisiert [3]. Dabei wird die Methodik der internationalen Global Burden of Disease-Studie aufgegriffen, jedoch werden vorrangig nationale Datenbestände genutzt und die Ergebnisse regional nach den 16 Bundesländern und 96 Raumordnungsregionen differenziert. Im Projekt wird eine Auswahl relevanter Krankheiten betrachtet, mit denen nach den Ergebnissen der GBD-Studie 2017 mehr als 50 Prozent der Krankheitslast (DALY) in Deutschland abgebildet werden [5].

Für die Krankheitslastberechnung erfordert der Morbiditätsindikator YLD im Wesentlichen drei verschiedene Kennzahlen: (i) Angaben zur Häufigkeit einer Krankheit wie Prävalenzen oder Raten, (ii) Anteilswerte der mit der betrachteten Krankheit einhergehenden Schweregrade oder Folgezustände sowie (iii) einen Gewichtungsfaktor zum Grad der korrespondierenden gesundheitlichen Beeinträchtigung des betrachteten Zustands [3]. Beispielsweise kann der Morbiditätsindikator für Major-Amputationen bei Diabetes mellitus berechnet werden aus der Diabetes-Prävalenz, dem Anteil der Diabetiker mit Major-Amputation und dem Gewichtungsfaktor für die gesundheitliche Einschränkung aufgrund der Amputation. Für das BURDEN 2020-Projekt wurden die Gewichtungsfaktoren aus der internationalen Global Burden of Disease-Studie übernommen [3] [6]. Für die anderen Kennzahlen zu Krankheitshäufigkeiten und Schweregradanteilen werden, wo möglich, nationale Daten aus Deutschland verwendet. Dabei stellen anonymisierte Krankenkassenroutinedaten eine der zentralen Datenquellen dar. Im Folgenden wird die Vorgehensweise zur Ermittlung von Krankheitshäufigkeiten und Schweregraden auf Basis von Krankenkassenroutinedaten für das Projekt BURDEN 2020 dargestellt.


#

Methoden

Für das Projekt BURDEN 2020 wurde das Kalenderjahr 2017 als Zieljahr der Krankheitslastberechnung festgelegt. Dementsprechend wurden anonymisierte Krankenkassenroutinedaten aus dem Jahr 2017 und evtl. vorangegangener Datenjahre inklusive der jeweils zugehörigen Klassifikationsstände der entsprechenden Schlüsselkataloge (ICD, OPS, ATC, EBM) herangezogen.

Erarbeitung von Falldefinitionen

Es existieren keine Goldstandards für Falldefinitionen von Krankheiten auf Basis von Krankenkassenroutinedaten. Beispielsweise gibt es eine Vielzahl an Analysen zu Typ-2-Diabetikern auf Basis von (Krankenkassen-)Routinedaten, bei denen jeweils verschiedene Aufgreifkriterien, auch in Abhängigkeit der Datenverfügbarkeit, angewendet wurden [7] [8] [9] [10]. Zudem besteht im Projekt BURDEN 2020 die Notwendigkeit, Krankheiten eng an die internationale GBD-Studie angelehnt zu definieren, da in der YLD-Berechnung die Gewichtungsfaktoren zum Grad der gesundheitlichen Beeinträchtigung aus der GBD-Studie übernommen werden [3]. Dementsprechend muss die zugehörige Definition der Krankheiten und Schweregrade möglichst passgenau zur GBD-Definition abgebildet werden. Die Falldefinitionen wurden daher in Treffen von Expertinnen und Experten erarbeitet, an denen Forschende aller drei projektbeteiligten Institutionen (Robert Koch-Institut RKI, WIdO, Umweltbundesamt UBA) teilnahmen. Damit konnte die Expertise im Bereich der Routinedatenanalysen (WIdO), der GBD-Methodik (RKI, UBA) sowie krankheitsspezifischer Epidemiologie (Fachabteilungen des RKI) und Versorgungsforschung (WIdO) eingebracht werden. Auf Basis verschiedener explorativer Analysen wurden die finalen Falldefinitionen unter allen Beteiligten konsentiert. Unter https://www.krankheitslage-deutschland.de/dokumente/methodendokumentation.pdf sind alle routinedatenbasierten Falldefinitionen des Projekts BURDEN 2020 dokumentiert [11].


#

Prävalenzkonzept für die Versichertengrundmenge

Neben der Falldefinition ist zur Berechnung epidemiologischer Kennzahlen wie Prävalenzen oder Raten ein geeignetes Zähler-/Nennerkonzept nötig. Die Prävalenz ist definiert als der Anteil erkrankter Personen an allen in einer Studie untersuchten Personen [12]. In Krankenkassendaten ist die zugrundeliegende Versichertenpopulation aber eine offene, dynamische Kohorte, in der ständig Zu- und Abwanderungen von Personen vorkommen, sei es wegen natürlicher Bevölkerungsbewegungen (Geburt, Tod) oder wegen Änderungen im Versicherungsverlauf (Wechsel der Krankenversicherungen). Daher basieren alle Berechnungen auf beobachteten Personenzeiten, um die Dynamik der offenen Kohorte im Versichertenkollektiv abzubilden. So werden auch Versicherungszeiten von neugeborenen oder verstorbenen Versicherten anteilig berücksichtigt. Dies ist insbesondere von Vorteil bei Krankheiten, die im jungen Kindesalter häufig auftreten oder die mit hoher Sterblichkeit assoziiert sind. Bei der Ermittlung regionalisierter Kennzahlen, wie sie im BURDEN 2020-Projekt erfolgt, ist zudem zu berücksichtigen, dass unterjährig Zu- oder Wegzüge aus einer Region erfolgen können. Daher erfolgte die regionale Zuordnung der Versicherten quartalsweise. Damit werden die dynamischen, regionalen Veränderungen im Versichertenkollektiv abgebildet. Die Kennzahl für das Gesamtjahr berechnet sich schließlich aus dem gewichteten Mittelwert der vier Einzelquartale je Region. Das Vorgehen ist detailliert beschrieben in der online verfügbaren Methodendokumentation unter https://www.krankheitslage-deutschland.de/dokumente/methodendokumentation.pdf.


#

Hochrechnung auf alle EinwohnerInnen

Da die anhand der AOK-Routinedaten im WIdO ermittelten epidemiologischen Kennzahlen nicht repräsentativ für die gesamte Wohnbevölkerung sind, erfolgte für die Krankheitshäufigkeiten (Prävalenzen und Raten) eine Hochrechnung auf alle EinwohnerInnen in den Regionen Deutschlands mit einem vom WIdO entwickelten statistischen Verfahren, das für Morbiditätsunterschiede korrigiert [13].

Bei den Schweregradanteilen konnte das Verfahren aufgrund der teils sehr geringen Fallzahlen nicht angewendet werden. Hier erfolgte eine einfache Hochrechnung auf die bundesweite Gesamtbevölkerung ohne regionale Differenzierung, unterteilt nach 5-Jahres-Altersgruppen und Geschlecht. Als Hochrechnungsfaktor wurde das Verhältnis der mittleren Bevölkerung Deutschlands zu der Anzahl der beobachteten Versichertenjahre der AOK-Versicherten im Jahr 2017 zugrunde gelegt.


#
#

Ergebnisse

Alle Ergebnisse aus dem Projekt BURDEN 2020 zu routinedatenbasierten Krankheitshäufigkeiten und Schweregraden mit Abbildungen nach Altersgruppen und Geschlecht sowie Karten und die methodischen Grundlagen sind unter www.krankheitslage-deutschland.de verfügbar. Beispielhaft ist in [Abb. 1] die 1-Jahres-Prävalenz der koronaren Herzkrankheit auf Ebene der Raumordnungsregionen dargestellt. Aus Platzgründen können nicht alle Ergebnisse, Falldefinitionen und die methodische Vorgehensweise dargestellt werden. Im Folgenden wird daher auf ausgewählte methodische Aspekte fokussiert, die für Forschende im Bereich der Krankenkassenroutinedaten von besonderem Interesse sind.

Zoom Image
Abb. 1 Karte zur 1-Jahres-Prävalenz von koronarer Herzkrankheit im Jahr 2017 unter allen Einwohnerinnen und Einwohnern auf Ebene der Raumordnungsregionen. Detaillierte Ergebnisse zur Häufigkeit der Krankheiten nach Altersgruppen und Geschlecht stehen unter www.krankheitslage-deutschland.de zur Verfügung.

Versichertengrundmengen für Prävalenzen oder Raten

Als epidemiologische Kennzahlen im Projekt BURDEN 2020 wurden Prävalenzen (1- oder 10-Jahres-Prävalenzen) sowie Raten (Fälle je 100.000 Personenjahre) mittels eines spezifischen, auf Personenzeiten basierenden Zähler/Nenner-Konzepts berechnet. In [Tab. 1] sind die Versichertenzahlen der genutzten Datenbasis, deren beobachtete Versicherungsdauern und Anteile der Versicherten mit veränderter regionaler Zuordnung im Jahr 2017 angegeben. Insgesamt waren 27,1 Millionen Personen im Kalenderjahr 2017 mindestens einen Tag bei einer der elf AOKs versichert. Diese für mindestens einen Tag versicherten Personen stellten die Grundgesamtheit für die ermittelten Raten bei Herzinfarkten und unteren Atemwegsinfekten dar. Die Raten wurden als Fallzahlen je 100.000 beobachteten Personenjahren (Versicherungszeiten) ermittelt. Die mindestens einen Tag AOK-versicherten Personen umfassen insgesamt 25,8 Millionen Personenjahre im Jahr 2017. Dieser Wert ist kleiner als die gesamte Personenanzahl, da nicht alle Versicherten ganzjährige Beobachtungszeiten beitragen. Für die 1-Jahres- und 10-Jahres-Prävalenzen ist es notwendig, auf Versicherte mit entsprechend langer, lückenloser Versichertenhistorie einzuschränken. Damit verblieben jeweils eine kleinere Personenanzahl sowie Gesamtdauern der beobachteten Versichertenjahre. Die Zahl der Versichertenjahre bei den Prävalenzen liegt leicht unterhalb der Anzahl der Versicherten, weil im Falle von neugeborenen und verstorbenen Versicherten nur verkürzte Versicherungszeiten beobachtet werden (ab der Geburt bzw. bis zum Todestag). Änderungen der regionalen Zuordnung traten bei 2,1 Prozent der Versicherten in der Grundgesamtheit für die Raten auf. Bei Einschränkung auf Versicherte mit längerem Versicherungsverlauf für die 1- und 10-Jahres-Prävalenzen waren diese Anteilswerte geringer (1,7 und 1,3 Prozent).

Tab. 1 Versichertenzahlen aller AOKs und beobachtete Versichertenjahre nach den jeweiligen Nennerkonzepten sowie Versicherte mit Änderung der regionalen Zuordnung im Jahr 2017.

Nennerkonzept

Anzahl versicherte Personen [Millionen]

Anzahl Versichertenjahre [Millionen]

Anteil Versicherte mit veränderter Kreiszuordnung im Jahr 2017

Raten

27,1

25,8

2,1%

1-Jahres-Prävalenz

25,4

24,1

1,7%

10-Jahres-Prävalenz

18,1

17,5

1,3%


#

Falldefinitionen für Krankheiten

Auf Basis der Versicherten der jeweiligen Grundgesamtheit (für Raten, 1-Jahres- oder 10-Jahres-Prävalenzen) wurden die Patienten mit einer bestimmten Krankheit in den Krankenkassenleistungsdaten ermittelt. In [Tab. 2] findet sich eine Übersicht zu den Falldefinitionen der Krankheiten mit ausgewählten Aspekten der Aufgreifkriterien, die aus Perspektive der Routinedatenforschenden von besonderem Interesse sein können. Beispielsweise erfolgte bei nahezu allen Krankheiten eine interne Diagnosevalidierung der ambulanten, „gesicherten“ Diagnosen über zeitliche Zusatzkriterien wie M2Q (Diagnosedokumentation in mindestens zwei Quartalen im betrachteten Zeitraum [14]) oder spezifische Arzneimittelverordnungen. Bei den Krebserkrankungen wurden Fälle auch dann gewertet, wenn die Krebsdiagnose von zwei verschiedenen ärztlichen Betriebsstätten erfolgte. Bei Diabetes erfolgte eine Differenzierung in Typ1 oder Typ 2-Diabetes anhand eines hierarchischen Algorithmus, bei dem zunächst Arzneimittelverordnungen berücksichtigt werden, gefolgt von stationären Hauptdiagnosen, Einschreibungen in Disease-Management-Programme (DMP) und den restlichen Diagnosen. Nach Umsetzung des Algorithmus verblieb eine Restmenge der nicht nach Typ 1 oder 2 eingeteilten DiabetikerInnen im Promillebereich. Bei diesen Patienten erfolgte eine Umverteilung auf die beiden Diabetestypen nach Altersgruppen und Geschlecht, da nach der Methodik der GBD-Studie keine Restkategorie abgebildet wird. Die meisten im BURDEN 2020-Projekt berücksichtigten Krankheiten stellen lang andauernde oder chronische Zustände dar. Nur bei Herzinfarkten und unteren Atemwegsinfekten handelt es sich um akute Krankheitszustände, die wiederholt auftreten können. Hier erfolgte eine Zählung von Fällen zur Ermittlung von Raten je beobachteten Personenjahren.

Tab. 2 Krankheiten, epidemiologische Kennzahlen und besondere Aspekte der Falldefinitionen in Krankenkassenroutinedaten für das Projekt BURDEN 2020*.

Krankheit und epidemiologische Kennzahl

Besondere Aspekte der Falldefinition

Interne Validierung der ambulanten, „gesicherten“ Diagnosen

Kardiovaskuläre Krankheiten

Herzinsuffizienz

Es werden keine gesonderten 1-Jahres-Prävalenzen ermittelt, sondern die Herzinsuffizienz ist in der Krankheitslastberechnung im Projekt BURDEN 2020 verschiedenen Ursachen zugeordnet (koronare oder hypertensive Herzkrankheit).

M2Q-Kriterium UND Arzneimittel

Herzinsuffizienz aufgrund koronarer Herzkrankheit (1-Jahres-Prävalenz 1,9%)

Falldefinition „Herzinsuffizienz“ ist erfüllt und Falldefinition „koronare Herzkrankheit“ ist erfüllt; Bei „koronarer Herzkrankheit“ neben diagnosebasierten Fällen auch Berücksichtigung von Fällen mit dokumentiertem OPS (Bypass oder koronare Gefäßintervention)

Koronare Herzkrankheit: M2Q-Kriterium UND Arzneimittel

Angina pectoris (1-Jahres-Prävalenz 1,5%)

Falldefinition „koronare Herzkrankheit“ ist erfüllt, zusätzliches Vorliegen von Angina-pectoris-Diagnosen oder spezifischen Arzneimittelverordnungen (organische Nitrate oder Molsidomin)

Keine interne Diagnosevalidierung bei „Angina pectoris“, aber bei der Falldefinition „koronare Herzkrankheit“

Herzinfarkte (Rate je 100.000 Personenjahre: 225)

Fallzählung zur Ermittlung der Rate: Berücksichtigt werden stationäre Aufenthalte mit Herzinfarkt als Hauptdiagnose (ICD I21, I22) mit zeitlichem Zusatzkriterium: Fälle mit vorangegangenem Herzinfarkt innerhalb von bis zu 28 Tagen werden nicht neu gezählt, sondern der vorangegangenen Herzinfarkt-Episode zugeordnet.

nicht zutreffend – nur Fälle mit stationärer Hauptdiagnose werden berücksichtigt

Herzinsuffizienz aufgrund hypertensiver Herzkrankheit (1-Jahres-Prävalenz 1,3%)

Falldefinition „Herzinsuffizienz“ ist erfüllt und Falldefinition „hypertensive Herzkrankheit“ ist erfüllt.

hypertensive Herzkrankheit: M2Q-Kriterium ODER M1Q plus Arzneimittel

Schlaganfall (10-Jahres-Prävalenz 1,4%)

Berücksichtigt werden ausschließlich stationäre Aufenthalt mit ICD I60, I61, I63, I64 als Hauptdiagnose.

nicht zutreffend – nur Fälle mit stationärer Hauptdiagnose werden berücksichtigt

Diabetes

Diabetes Typ 1 (1-Jahres-Prävalenz 0,29%)

Hierarchischer Algorithmus zur Zuteilung der Diabetes-Patienten in Typ 1 oder Typ 2 unter Berücksichtigung von:

M2Q-Kriterium ODER M1Q plus Arzneimittel

Diabetes Typ 2 (1-Jahres-Prävalenz 8,6%)

  1. Arzneimittelverordnungen

  1. Stationären Hauptdiagnosen

  1. DMP-Einschreibung

  1. Eindeutigkeit sonstiger ICD-Diagnosen

  1. Relative Mehrheit sonstiger ICD-Diagnosen

  1. Umverteilung aller nicht zugeordneten, verbleibenden Diabetespatienten nach Altersgruppen und Geschlecht auf Typ 1/Typ 2

Krebserkrankungen

Lungenkrebs (10-Jahres-Prävalenz 0,21%)

Wiederholungsdiagnose innerhalb von 3 Quartalen ODER Diagnosedokumentation bei zwei unterschiedlichen Betriebsstätten

Brustkrebs (nur Frauen: 10-Jahres-Prävalenz 2,1%)

Darmkrebs (10-Jahres-Prävalenz 0,62%)

Prostatakrebs (nur Männer: 10-Jahres-Prävalenz 1,5%)

Psychische Störungen

Depression (major) (1-Jahres-Prävalenz 9,0%)

Ausschluss von Patienten mit Diagnosen einer Manie oder bipolaren Störung

M2Q-Kriterium

Dysthymie (1-Jahres-Prävalenz 0,79%)

Ausschluss von Patienten mit Diagnosen einer Manie oder bipolaren Störung

M2Q-Kriterium

Angst- und Belastungsstörungen (1-Jahres-Prävalenz 6,1%)

M2Q-Kriterium

Neurologische Krankheiten

Alzheimer und andere Demenzen (1-Jahres-Prävalenz 1,9%)

Diagnosen bei Personen unter 40 Jahren werden nicht berücksichtigt.

M2Q-Kriterium

Chronische Atemwegserkrankungen

COPD und andere chronische Krankheiten der unteren Atemwege exklusive Asthma (1-Jahres-Prävalenz 4,7%)

Diagnosen von Personen unter 35 Jahren werden nicht berücksichtigt.

M2Q-Kriterium ODER M1Q plus Arzneimittel

Übertragbare Krankheiten

untere Atemwegsinfekte (Rate je 100 000 Personenjahre: 11 700)

Fallzählung zur Ermittlung der Rate: Je Quartal wird pro Person ein Fall gezählt, unabhängig davon, wie oft Patienten im Krankenhaus oder ambulant behandelt wurden.

Keine interne Diagnosevalidierung

*Detaillierte Ergebnisse zur Häufigkeit der Krankheiten nach Altersgruppen und Geschlecht sowie regionaler Gliederung stehen unter www.krankheitslage-deutschland.de zur Verfügung. Beschreibungen der Falldefinitionen sind im Methodendokument unter https://www.krankheitslage-deutschland.de/dokumente/methodendokumentation.pdf verfügbar [11].


#

Falldefinitionen für Schweregrade

Bei ausgewählten Krankheiten wurden zudem Schweregradanteile auf Basis von Krankenkassenroutinedaten ermittelt. Die entsprechenden Besonderheiten der Falldefinitionen für die einzelnen Schweregrade sind in [Tab. 3] dargestellt. Für die Schweregraddefinitionen wurden teils umfangreiche Abrechnungsdaten zur Versorgung der Patienten berücksichtigt. Beispielsweise wurde bei den Krebserkrankungen die Phase der Primärtherapie anhand von Chemotherapien, Operationen oder Bestrahlungen aus Leistungsdaten der stationären und ambulanten Versorgung ermittelt. Bei Diabetes wurden Amputationen in der gesamten verfügbaren Versichertenhistorie berücksichtigt. Bei Depressionen liegen Schweregrade anhand der ICD-Diagnosen häufig nur unspezifisch vor – bei einem Viertel aller betrachteten Versichertenverläufe im Jahr 2017. In einer früheren Untersuchung basierend auf Daten aus dem Jahr 2010 lag dieser Anteil noch deutlich höher [15]. Für die Krankheitslastberechnung ist jedoch eine Einteilung nach Schweregraden notwendig. Bei den unspezifisch dokumentierten Depressions-Diagnosen schien die generelle Annahme eines leichten Schweregrads in der Runde der Expertinnen und Experten bei der Entwicklung der Falldefinitionen nicht gerechtfertigt. Daher erfolgte eine Umverteilung der Patienten mit unspezifischem Schweregrad anhand des beobachteten Verhältnisses der spezifisch dokumentierten Diagnosen, wobei zwischen Patientengruppen mit und ohne Kontakt zu spezialisierten Facharztgruppen unterschieden wird.

Tab. 3 Besondere Aspekte der Falldefinitionen für Schweregrade von Krankheiten auf Basis von Krankenkassenroutinedaten im Projekt BURDEN 2020*.

Krankheit

Besondere Aspekte der Falldefinitionen für Schweregrade

Kardiovaskuläre Krankheiten

Herzinsuffizienz

Die Schweregradeinteilung erfolgt anhand der dokumentierten ICD-Diagnosen nach NYHA-Stadien, wobei immer der höchste Schweregrad gewertet wird. Patienten mit stationärem Aufenthalt wegen Herzinsuffizienz (Hauptdiagnose) werden immer als schwer gewertet.

  • Schweregrad leicht ("mild"): NYHA Stadium I/II oder kein NYHA-Stadium dokumentiert

  • Schweregrad mittelgradig ("moderate"): NYHA Stadium III

  • Schweregrad schwer ("severe"): NYHA Stadium IV oder stationärer Fall mit Herzinsuffizienz als Hauptdiagnose

Herzinfarkte

Unterteilung der beobachteten Personentage in Intervalle von 0 bis 2 und 3 bis 28 Tage nach Infarkt; bei Personen mit Versterben im betreffenden Intervall werden entsprechend gekürzte Beobachtungszeiten zur Berechnung der insgesamt beobachteten Personentage verwendet.

Schlaganfälle

Keine Betrachtung von Schweregraden, sondern Differenzierung nach Schlaganfallformen anhand der ICD der stationären Hauptdiagnosen:

  • Ischämischer Schlaganfall I63

  • Intrazerebrale Blutung I61

  • Subarachnoidalblutung I60

Bei Patienten mit unspezifischen Diagnosen (I64) erfolgt eine Umverteilung auf die drei spezifischen Schlaganfallformen anhand des beobachteten Verhältnisses nach Altersgruppen und Geschlecht.

Diabetes

Neuropathie

Validierung der ambulanten, „gesicherten“ Diagnosen mit M2Q-Kriterium

Diabetischer Fuß

Validierung der ambulanten, „gesicherten“ Diagnosen mit M2Q-Kriterium; Berücksichtigung der Gebührenordnungsposition zur Behandlung des diabetischen Fußes aus dem einheitlichen Bewertungsmaßstab (EBM-Katalog)

Amputation (major)

Erfassung von Major-Amputationen über stationäre Aufenthalte mit OPS für entsprechende Amputationen in der gesamten Versichertenhistorie; stationäre Aufenthalte mit Hauptdiagnosen für Tumorleiden oder Traumata (Unfälle) werden nicht berücksichtigt.

Sehverlust aufgrund diabetischer Retinopathie

Es müssen ICD-Diagnosen zur Retinopathie und zusätzlich ICD-Diagnosen zur Sehbeeinträchtigung (H54) vorliegen. Das Ausmaß der Sehbeeinträchtigung wird für jedes Auge unter Berücksichtigung der Seitigkeit (links, rechts) in den Routinedaten ermittelt. Zur Einteilung in die Schweregrade wird das „bessere“ Auge verwendet:

  • moderat: Auf dem „besseren” Auge liegt eine mittelschwere Sehbeeinträchtigung vor.

  • schwer: Auf dem „besseren” Auge liegt eine schwere Sehbeeinträchtigung vor.

  • Blindheit: Auf beiden Augen liegt Blindheit oder hochgradige Sehbeeinträchtigung vor.

Krebserkrankungen

Alle Krebserkrankungen (Lunge, Brust, Darm, Prostata)

Einteilung in vier verschiedene Phasen, tagesgenau im betrachteten Zeitraum ausgewertet:

  1. Diagnose- und Primärtherapiephase: Berücksichtigung von krebsspezifischen Operationen, Chemotherapie, Bestrahlung/Strahlentherapie/nuklearmedizinischer Therapie mit zugehörigem Behandlungsdatum und krebsspezifisch angenommener Therapiedauer in Anlehnung an die GBD-Studie (3 bis 4 Monate je nach Krebsart).

  1. Kontrollierte Phase: Tage, die keiner anderen Phase zugeordnet werden.

  1. Metastasierte Phase: Dokumentation der ICD zu sekundären Neubildungen (C77, C78, C79) im betrachteten Quartal oder bis zu 3 Quartale vorher; Es werden alle Tage im betrachteten Quartal der metastasierten Phase zugeordnet.

  1. Terminale Phase: In Anlehnung an die GBD-Studie ist die terminale Phase als Zeitraum von 4 Wochen vor dem Versterben definiert.

Brustkrebs

Zusätzliche Differenzierung der kontrollierten Phase anhand spezifischer OPS-Codes: mit oder ohne Mastektomie; Berücksichtigung der Exzess-Mastektomien im Vergleich zu Versicherten ohne Brustkrebs

Darmkrebs

Zusätzliche Differenzierung der kontrollierten Phase anhand spezifischer ICD-Codes: mit oder ohne Stoma; Berücksichtigung der Exzess-Stomata im Vergleich zu Versicherten ohne Darmkrebs

Prostatakrebs

Zusätzliche Differenzierung der kontrollierten Phase anhand spezifischer ICD-Codes: mit oder ohne Impotenz bzw. Inkontinenz; Berücksichtigung der Exzess-Impotenz/-Inkontinenz im Vergleich zu Versicherten ohne Prostatakrebs

Psychische Störungen

Depression (major)

Einteilung in die Schweregrade asymptomatisch, mild, moderat, schwer anhand der ICD-Diagnosen. Umverteilung von Patienten mit ausschließlich unspezifischen ICD-Diagnosen nach Altersgruppen und Geschlecht innerhalb der Patientengruppen mit bzw. ohne Kontakt zu einem Spezialisten (Psychiater, Neurologe, Psychotherapeut).

*Detaillierte Ergebnisse zur Häufigkeit der Schweregrade nach Altersgruppen und Geschlecht stehen unter www.krankheitslage-deutschland.de zur Verfügung. Beschreibungen der Falldefinitionen für Schweregrade sind im Methodendokument unter https://www.krankheitslage-deutschland.de/dokumente/methodendokumentation.pdf verfügbar [11].

Bei einigen Krankheiten konnten allerdings keine Schweregrade anhand der Routinedaten ermittelt werden, da die dazu notwendigen Informationen in den Routinedaten nicht vorliegen. Dies traf zu auf Angina pectoris, Angststörungen, Dysthymie, Demenzen, Schlaganfälle, untere Atemwegsinfekte und COPD.


#
#

Diskussion

Im Projekt BURDEN 2020 werden zur Berechnung der Krankheitslast regionalisierte Zahlen zu Krankheitshäufigkeiten benötigt. Diese werden überwiegend aus Krankenkassenroutinedaten generiert. Die unter den Expertinnen und Experten konsentierten Definitionen sowie alle Ergebnisse stehen unter www.krankheitslage-deutschland.de zur Verfügung. Damit wird Transparenz zum methodischen Vorgehen geschaffen und die Nachnutzung für weitere Projekte auf Routinedatenbasis ermöglicht.

Große Datenbasis, Abbildung der Versorgungsrealität

Krankenkassenroutinedaten haben eine Reihe von Vorteilen. Einer der bedeutsamsten liegt darin, dass sie große Versichertenzahlen umfassen. So konnten in den anonymisierten Routinedaten der AOKs im Jahr 2017 Datensätze von insgesamt 27,1 Millionen AOK-Versicherten analysiert werden. Diese Datenbasis ermöglicht eine regionalisierte Ermittlung von Krankheitshäufigkeiten bis auf Ebene der 16 Bundesländer und 96 Raumordnungsregionen. Zudem können auch seltene Krankheiten oder Folgezustände analysiert werden wie Amputationen oder Sehbeeinträchtigungen bei Diabetes mellitus. Weitere Vorteile sind, dass die Daten aller Leistungssektoren des Gesundheitssystems miteinander verknüpft werden können. Zudem werden die Daten unter Alltagsbedingungen erhoben und bilden so direkt den abrechnungsrelevanten Teil der Versorgungsrealität ab [16]. Dies ist im Rahmen der Krankheitslastberechnung insbesondere bei der Betrachtung der Schweregrade oder Folgezustände hilfreich, wenn diese über spezifische Abrechnungsprozeduren ermittelt werden können. Beispielsweise konnten Krankheitsfolgen wie Mastektomien bei Brustkrebspatientinnen, Amputationen bei Diabetikern oder Chemotherapien bei KrebspatientInnen erfasst werden.


#

Zähler-/Nennerkonzept für Prävalenzen und Raten

Für das BURDEN 2020-Projekt wurde ein Konzept zur Ermittlung der epidemiologischen Kennzahlen (Prävalenzen, Raten) entwickelt, welches die Besonderheiten der offenen, dynamischen Kohorte in der Versichertengrundgesamtheit berücksichtigt. Dabei wurden jeweils beobachtete Personenzeiten anstelle der Personenzahl ausgewertet, damit epidemiologische Kennzahlen wie Prävalenzen und Raten mit unterjährigen regionalen Veränderungen genauer abgebildet werden können. Demgegenüber wäre ein Nennerkonzept wie „alle mindestens 1 Tag versicherten Personen“ ungenau, da dann auch Personen mit sehr kurzer Versichertenzeit gezählt werden [17]. Diese Personen wären bei einer Zählweise nach „Köpfen“ anteilig überrepräsentiert. Über die Berücksichtigung von Personenzeiten wird dieser Effekt abgemildert, da kurzzeitig versicherte Personen auch nur weniger Beobachtungszeit beitragen.


#

Limitierung: begrenzte Informationen

Als Limitierung der Krankenkassenroutinedaten ist zu beachten, dass einige Krankheiten oder deren Schweregrade mit Routinedaten nicht abgebildet werden können. Das ist dann der Fall, wenn eine Krankheit beziehungsweise eine gesundheitliche Einschränkung nicht mit einer Leistungsinanspruchnahme einhergeht oder wenn in den Routinedaten weitere benötigte Informationen wie Schweregradangaben, klinische Informationen oder Laborwerte fehlen. Beispielsweise lässt sich die gesundheitliche Beeinträchtigung aufgrund von Kopfschmerzen oder Rückenschmerzen anhand von Krankenkassenroutinedaten nicht abbilden, da vermutlich ein großer Teil der Patientinnen und Patienten ihre Beschwerden selbst behandeln – beispielsweise durch Hausmittel oder Anwendung von Schmerzmitteln, die direkt ohne ärztliches Rezept in der Apotheke eingekauft werden. In solchen Fällen kommt es nicht zu einem Arztkontakt, so dass in den Krankenkassenroutinedaten dann auch keine abrechnungsrelevanten Informationen vorliegen. Daher wurden für das BURDEN 2020-Projekt zu diesen Themen eigene Befragungsstudien durchgeführt [18] [19].


#

Hochrechnung auf die gesamte Bevölkerung

Weiterhin ist zu berücksichtigen, dass Krankenkassenroutinedaten nicht repräsentativ für die Gesamtbevölkerung sind, weil es neben demographischen Faktoren Unterschiede im sozioökonomischen Status und in gesundheitsrelevanten Faktoren gibt, die in Morbiditätsunterschieden zwischen verschiedenen Krankenkassen resultieren können [20] [21]. Dabei ist zusätzlich zu berücksichtigen, dass diese Unterschiede regional unterschiedlich ausgeprägt sind [20] und dass sich auch das kassenspezifische Versichertenkollektiv im Laufe der Zeit wandeln kann. Aus diesen Gründen ist es notwendig, auf die gesamte Bevölkerung in den Regionen Deutschlands im jeweils betrachteten Zeitraum hochzurechnen. Bei den Krankheitshäufigkeiten erfolgte die regionalisierte Hochrechnung unter Anwendung eines statistischen Verfahrens, das auch für Morbiditätsunterschiede korrigiert [13]. Im Falle der Schweregradanteile lagen jedoch teils sehr kleine Fallzahlen vor. Hier konnte das komplexe Hochrechnungsverfahren nicht angewendet werden, und auch eine Regionalisierung der Ergebnisse war nicht abbildbar. Bei den Schweregradanteilen erfolgte daher eine einfache Extrapolation auf die mittlere Bevölkerung des Jahres 2017 auf bundesweiter Ebene nach Alter und Geschlecht.


#

Interne Validierung

Als weitere Einschränkung der Krankenkassenroutinedaten ist zu nennen, dass die Kriterien der Vollständigkeit und Validität der dokumentierten Daten möglicherweise nicht erfüllt sind [14] [22] [23]. Daher kann es zu Unter-, Über- oder Fehlerfassung von (vermeintlich) erkrankten Personen kommen. Um diese Problematik abzumildern wurde bei jeder Falldefinition nach Möglichkeit eine interne Validierung der ambulanten Diagnosen berücksichtigt. Bei den stationären Diagnosen gelten seit 2004 vergütungsrelevante Kodierregeln [14]. Daher wird insbesondere für die stationären Hauptdiagnosen angenommen, dass die Diagnosen zutreffend sind [24] [25]. Die interne Validierung der ambulanten Diagnosen erfolgte entweder über zeitliche Kriterien als Wiederholungsdiagnose bei chronischen Krankheiten oder Zuständen, über spezifische Arzneimittelverordnungen oder über das Vorliegen einer Diagnosedokumentation von unterschiedlichen ärztlichen Betriebsstätten. Lediglich bei den unteren Atemwegsinfekten konnte keine interne Diagnosevalidierung erfolgen, weil diese Zustände nur von kurzer Dauer sind und in den meisten Fällen nicht zu einem wiederholten Arztkontakt führen.


#

Externe Plausibilisierung der Ergebnisse

Für alle ermittelten Krankheitshäufigkeiten im BURDEN 2020-Projekt erfolgte eine externe Plausibilisierung der Ergebnisse anhand der Literatur. Sofern entsprechend vergleichbare Untersuchungen vorlagen – wie beispielsweise beim Diabetes mellitus – zeigte sich häufig eine gute Übereinstimmung der erhaltenen Prävalenzen nach Alter, Geschlecht und regionalen Mustern [7] [8] [26].

Bei abweichenden Plausibilisierungsergebnissen können häufig methodische Unterschiede als Erklärungsansatz identifiziert werden. So ergab der Vergleich der 10-Jahres-Prävalenzen bei Brustkrebs, Darmkrebs, Lungenkrebs und Prostatakrebs aus dem BURDEN 2020-Projekt [27] höhere Werte als die Berechnungen aus den Krebsregistern in der Publikationsreihe „Krebs in Deutschland“ [28]. Dabei werden die 10-Jahres-Prävalenzen in „Krebs in Deutschland“ auf Basis der in den zurückliegenden 10 Jahren neu erkrankten Fälle definiert, während für das BURDEN 2020-Projekt – abweichend von der GBD-Methodik – alle Patienten mit Diagnosen in den zurückliegenden 10 Jahren erfasst werden, so dass auch Patienten mit länger zurückliegender initialer Krebsdiagnose enthalten sind [27].

Insgesamt war der Ergebnisvergleich häufig dadurch limitiert, dass keine geeigneten Untersuchungen für einen Vergleich herangezogen werden konnten. Entweder gibt es keine bundesweit repräsentativen, externen Vergleichsdaten zu Krankheitshäufigkeiten wie bei den unteren Atemwegsinfekten, oder die Ergebnisse liegen nicht regionalisiert vor. Zudem ist zu berücksichtigen, dass die Falldefinitionen für die Krankheitslastberechnung spezifisch sind, insbesondere bei den Schweregraden oder Folgezuständen. Zu diesen spezifischen Definitionen gibt es in der Regel keine entsprechenden vergleichbaren Untersuchungen aus Deutschland, beispielsweise bei den Krebsphasen. Dann kann nur ein Ergebnisvergleich mit internationalen Krankheitslaststudien erfolgen [29] [30].


#
#

Zusammenfassung und Fazit

Die Projektergebnisse zeigen, dass die internationale Methodik der „Global Burden of Disease“ (GBD) Studie auch für Deutschland anwendbar ist. Dabei spielen anonymisierte Krankenkassenroutinedaten zur Generierung der notwendigen epidemiologischen Kennzahlen für die Morbiditätskomponenten bei der Krankheitslastberechnung eine wichtige Rolle. Die großen Fallzahlen in den Routinedaten erlauben es, auch seltene Zustände abzubilden und regionalisierte Werte für Krankheitshäufigkeiten zu generieren. Mit dem Aufbau des Forschungsdatenzentrums ist zudem zukünftig eine stärkere Nutzung von Krankenkassenroutinedaten in der Versorgungsforschung zu erwarten. Dies setzt jedoch Expertise bei den Nutzenden voraus, da wichtige Limitierungen der Routinedaten zu beachten sind.

Mit dem Projekt BURDEN 2020 liegt erstmals eine regionalisierte Krankheitslastberechnung für Deutschland vor. Perspektivisch kann die Krankheitslastberechnung als zentraler Indikator im Rahmen der Gesundheitsberichterstattung genutzt werden, insbesondere wenn zukünftig weitere Krankheiten in die Berechnung einbezogen werden. Deutlich wurde, dass zur YLD-Berechnung die Angaben zur Häufigkeit einer Krankheit wie Prävalenzen oder Raten und die Anteilswerte der mit der betrachteten Krankheit einhergehenden Schweregrade oder Folgezustände unter Nutzung der Krankenkassenroutinedaten ermittelt werden konnten. Zur Ermittlung des Morbiditätsindikators YLL konnten die Informationen aus der Todesursachenstatistik mit einer Umverteilung nicht-informativer Codes genutzt werden [31].

Bei einer Verstetigung einer regionalisierten Krankheitslastberechnung für Deutschland sollte geprüft werden, ob der Gewichtungsfaktor zum Grad der korrespondierenden gesundheitlichen Beeinträchtigung des betrachteten Zustands weiterhin aus der GBD-Methodik genutzt wird oder eine nationale Ermittlung dieses Faktors sinnvoll erscheint. Um bestehende Limitierungen der Krankenkassenroutinedaten abzubauen, wäre darüber hinaus eine Verknüpfung mit weiteren Datenbeständen wie Daten aus elektronischen Patientenakten oder Registern hilfreich, wie im aktuellen Gutachten des Sachverständigenrats beschrieben [32]. Damit kann der Wissenschafts- und Innovationsstandort Deutschland auch im Kontext der Versorgungsforschung im internationalen Wettbewerb gestärkt werden. Dann würden aktuelle Informationsdefizite, wie sie beispielsweise derzeit im Monitoring der Effekte der Coronapandemie rund um Infizierte, Genesene und Geimpfte in Deutschland zu erkennen sind, der Vergangenheit angehören [33].


#
#

Interessenkonflikt

Die Autorinnen/Autoren geben an, dass kein Interessenkonflikt besteht.


Correspondence

Dr. Katrin Schüssel
Wissenschaftliches Institut der AOK (WIdO)
Rosenthaler Straße 31
AOK-Bundesverband
10178 Berlin
Germany   

Publication History

Article published online:
23 June 2022

© 2022. Thieme. All rights reserved.

Georg Thieme Verlag
Rüdigerstraße 14, 70469 Stuttgart, Germany


Zoom Image
Abb. 1 Karte zur 1-Jahres-Prävalenz von koronarer Herzkrankheit im Jahr 2017 unter allen Einwohnerinnen und Einwohnern auf Ebene der Raumordnungsregionen. Detaillierte Ergebnisse zur Häufigkeit der Krankheiten nach Altersgruppen und Geschlecht stehen unter www.krankheitslage-deutschland.de zur Verfügung.