Klinische Neurophysiologie 2011; 42(03): 200-203
DOI: 10.1055/s-0031-1286265
Biostatistik leicht gemacht
Georg Thieme Verlag KG Stuttgart · New York

Interpretation von Schlaganfallakutstudien

Verwendete Endpunkte und Analyseverfahren
H. Wersching
1   Institut für Epidemiologie und Sozialmedizin, Universität Münster
,
J. Minnerup
2   Klinik und Poliklinik für Neurologie, Universitätsklinikum Münster
› Author Affiliations
Further Information

Publication History

Publication Date:
14 September 2011 (online)

Editorial: „Skalen und Endpunkte – wie nervig“

Wenn sich die internationale Wissenschaftsgemeinschaft („Scientific Community“) auf gemeinsame Standards einigt, dann ist das mindestens so bedeutsam, wie ein EU-Rettungsschirm, geschieht aber meistens in aller Bescheidenheit und unspektakulär. Skalen (scales) sind Messinstrumente, wie eine Waage oder ein Zollstock, die eigene Schwächen und Grenzen haben. Die Maßeinheiten sind dann nicht Kilogramm oder Zentimeter, sondern bestimmte Skalenwerte (scores), deren Anwendung notwendig ist, um die therapeutische Wirkung einer Therapie messen und beurteilen zu können. Wenn der Handwerker bei Ihnen mit einem gekrümmten Zollstock das Aufmaß nimmt, geht hinterher im wahrsten Sinne alles schief. Die Autoren Wersching und Minnerup des anliegenden Beitrages erläutern die Schwächen und Stärken der weltweit am meisten genutzten Maße für die Schwere des Schlaganfalls und die Effektivität der Schlaganfalltherapie, die National Institutes of Health Stroke Scale (NIHSS), die Modified Ranking Scale (mRS) und den Barthel-Index (BI) für die Beurteilung der Selbstständigkeit im Alltag. Diese Skalen unterliegen sogenannten Boden- und Deckeneffekten, d. h. am oberen oder unteren Ende der Skala wird die Messung ungenau. Die Reliabilität ist ein anderes bedeutsames Qualitätsmaß für das benutzte Messinstrument. Besonders eindrucksvoll arbeiten die Autoren heraus, wie Oberflächlichkeiten oder Unschärfen in der Festlegung des Studiendesigns oder der Analysetechnik vor Studienbeginn die statistische Power einer Studie so verderben können, dass letztlich die Studie ihre Aussagekraft verliert – eine enorme Geldverschwendung und zudem ein unethisches Verhalten gegenüber den Studienteilnehmern. Damit das nicht passiert, sollte man den Beitrag von Wersching und Minnerup aufmerksam lesen.

E. B. Ringelstein, Münster

 
  • Literatur

  • 1 Goldstein LB, Samsa GP. Reliability of the National Institutes of Health Stroke Scale. Extension to non-neurologists in the context of a clinical trial. Stroke 1997; 28: 307-310
  • 2 Berger K, Weltermann B, Kolominsky-Rabas P et al. The reliability of stroke scales. The german version of NIHSS, ESS and Rankin scales. Fortschr Neurol Psychiatr 1999; 67: 81-93
  • 3 Shinar D, Gross CR, Bronstein KS et al. Reliability of the activities of daily living scale and its use in telephone interview. Arch Phys Med Rehabil 1987; 68: 723-728
  • 4 Wilson JT, Hareendran A, Hendry A et al. Reliability of the modified Rankin Scale across multiple raters: benefits of a structured interview. Stroke 2005; 36: 777-781
  • 5 Hacke W, Kaste M, Bluhmki E et al. Thrombolysis with alteplase 3 to 4.5 hours after acute ischemic stroke. N Engl J Med 2008; 359: 1317-1329
  • 6 Lefkopoulou M, Ryan L. Global tests for multiple binary outcomes. Biometrics 1993; 49: 975-988
  • 7 Saver JL. Optimal end points for acute stroke therapy trials: best ways to measure treatment effects of drugs and devices. Stroke 2011; 42: 2356-2362
  • 8 Saver JL, Gornbein J. Treatment effects for which shift or binary analyses are advantageous in acute stroke trials. Neurology 2009; 72: 1310-1315
  • 9 Saver JL. Novel end point analytic techniques and interpreting shifts across the entire range of outcome scales in acute stroke trials. Stroke 2007; 38: 3055-62
  • 10 van Swieten JC, Koudstaal PJ, Visser MC et al. Interobserver agreement for the assessment of handicap in stroke patients. Stroke 1988; 19: 604-607