Gesundheitswesen 2013; 75 - A166
DOI: 10.1055/s-0033-1354133

Qualitätssicherung der sozialmedizinischen Begutachtung der Deutschen Rentenversicherung mit dem Peer Review-Verfahren

H Vogel 1, A Strahl 1, C Gerlich 1, HD Wolf 1, A Müller-Garnn 2, J Gehrke 2
  • 1Universität Würzburg, Abteilung Medizinische Psychologie und Rehabilitationswissenschaften, Würzburg
  • 2DRV Bund, Bereich Sozialmedizin, Berlin

Hintergrund: Die sozialmedizinische Begutachtung zur Feststellung eines Anspruchs auf Erwerbsminderungsrente (EM-Rente) für Versicherte der Deutschen Rentenversicherung wird mit persönlicher Untersuchung des Versicherten oder auf Grundlage der vorhandenen Aktenlage durchgeführt. Für diesen Prozess hat die Kommission zur Weiterentwicklung der Sozialmedizin in der gesetzlichen Rentenversicherung (SOMEKO) ein Qualitätssicherungskonzept entwickelt, welches im Kern ein Peer Review-Verfahren umfasst (VDR, 2004). Die manualisierte Qualitätsbewertung der Gutachten orientiert sich an einem hierarchischen Konzept mit sechs Einzelkriterien (Formale Gestaltung, Verständlichkeit, Transparenz, Vollständigkeit, Medizinisch-wissenschaftliche Grundlagen, Wirtschaftlichkeit) sowie einem übergeordneten Kriterium (Nachvollziehbarkeit des Gutachtens) (DRV, 2013). Als wesentliches Gütekriterium ist für das Peer Review-Verfahren die (Interrater-)Reliabilität zu überprüfen (Goldman, 1994), die im Allgemeinen ab 0,70 als gut interpretiert werden kann (Wirtz & Caspar, 2002). Mehrere Studien und die Metaanalyse von Goldman (1994) zeigen jedoch, dass in der Praxis eher niedrigere Reliabilitätskennwerte um 0,30 erreicht werden. Methodik: Im Rahmen einer Pilotstudie zur Überprüfung der Reliabilität des Peer-Reviews der sozialmedizinischen Begutachtung wurden 260 Erstgutachten zur Erwerbsminderungsrente unterschiedlicher Indikationen von zwölf teilnehmenden Rentenversicherungsträgern einbezogen. Davon wurden 20 zufällig ausgewählte Gutachten von allen Peers sowie 20 Gutachten pro teilnehmendem Träger anhand eines Verteilungsschemas durch jeweils zwei Peers beurteilt. Insgesamt gingen 771 Reviews von 19 Peers als Datengrundlage in die Auswertung ein. Zur Beurteilung der Interrater-Reliabilität wurde Kendalls Konkordanzkoeffizient W für mehr als zwei Beurteiler herangezogen. Ergebnisse: Die Reliabilitätskennwerte der Einzelkriterien liegen in einem Range von 0,09 bis 0,88. Das übergeordnete Kriterium, welches die Nachvollziehbarkeit der Gutachten misst, erreicht eine Interrater-Reliabilität von 0,37. Betrachtet man die prozentuale Übereinstimmung der Bewertung des übergeordneten Kriteriums innerhalb der Gutachten, schwankt der Range auch hier von 88% bis 29% und liegt im Mittel bei 48,9%. Die Koeffizienten der indikationsspezifischen Reliabilitätsberechnung zeigen ähnliche Ausprägungen wie die indikationsübergreifenden Kennwerte. Dabei reduziert die statistische Auswahl der einzelnen Indikationen jedoch stark die Zahl der Fälle, die in die Berechnung eingehen, sodass einzelne Koeffizienten nicht berechnet werden können oder auf nur sehr wenigen Fällen beruhen. Diskussion: Die in der Literatur idealistisch geforderte Reliabilität von > 0,70 erreicht das Peer Review der sozialmedizinischen Begutachtung auf Basis des vorliegenden Manuals nicht. Jedoch liegen für die Interpretation der Reliabilitätskennwerte lediglich grobe Empfehlungen vor, gemäß denen sich die Beurteilung immer an den Bedingungen des jeweiligen Kontextes orientieren sollte. So bewegt sich im Praxisvergleich der Kennwert des übergeordneten Kriteriums in demselben Bereich wie die Kennwerte beim Peer Review der Reha-Entlassungsberichte in der letzten veröffentlichen Fassung (Erhebungsrunde 2000/2001/Somatik Farin et al. 2003). Zudem beeinflusst die Anzahl der Skalenkategorien und die Definition des zu messenden Merkmals die Höhe der Konkordanz. Während wenige Skalenkategorien die Höhe der Reliabilitätskoeffizienten verringern können, ist ein breit definiertes, komplexes Merkmal wie das übergeordnete Kriterium schwer zu operationalisieren und einheitlich zu erfassen. Schlussfolgerung: Die gefundene Reliabilität des Manuals erweist sich, im Kontext vorhandener Forschungsdaten und Studien, als ausreichend. Die Konstruktion als indikationsübergreifendes Bewertungsinstrument kann durch die Daten bestätigt werden. Eine Erhöhung der Reliabilität des Manuals erfolgt durch Überarbeitung bzw. Kürzung einzelner Prüffragen. Um künftig einheitlichere Bewertungsmaßstäbe der Peers herzustellen bzw. zu sichern, bedarf es vor Anwendung des Manuals einer Peer-Schulung sowie eines praxisbegleitenden kontinuierlichen Auffrischungstrainings.