Statistische Power (Trennschärfe)

Die statistische Power (Trennschärfe) ist die Wahrscheinlichkeit, mit der ein statistischer Test einen tatsächlich vorhandenen Effekt korrekt erkennt – also die Nullhypothese (H₀) ablehnt, wenn sie tatsächlich falsch ist. Power = 1 − β, wobei β die Wahrscheinlichkeit eines Typ-II-Fehlers (falsch negativer Befund, fehlende Erkennung eines wahren Effekts) bezeichnet.

In der klinischen Forschung wird üblicherweise eine Power von mindestens 80 % (β ≤ 0,20) angestrebt, für pivotale Zulassungsstudien häufig 90 % (β ≤ 0,10). Die Power hängt von vier Faktoren ab: Signifikanzniveau (α), erwarteter Effektgröße (z. B. Unterschied in Mittelwerten), Variabilität der Messgröße (Standardabweichung) und Stichprobengröße (n). Höhere Power erfordert – bei gleichem α und gleicher Variabilität – eine größere Fallzahl.

Die Fallzahlberechnung (Sample Size Calculation) ist eine zentrale Aufgabe im Studiendesign und muss im Studienprotokoll dokumentiert werden. Zu niedrige Power führt zu sogenannten unterpowerten Studien, die trotz eines wahren Effekts keine Signifikanz erreichen. Für CROs ist die korrekte Fallzahlkalkulation – unter Einbeziehung von Dropout-Raten und Adjustierungen für Multiple Testing – eine kritische biostatistische Aufgabe. Regulatorische Referenz: ICH E9.

Zurück zur Übersicht