Non-Inferiority (Nicht-Unterlegenheit) beschreibt eine klinische Studienstrategie, bei der das Ziel nicht der Nachweis einer Überlegenheit gegenüber einer Vergleichsbehandlung ist, sondern der Beleg, dass eine neue Behandlung in ihrer Wirksamkeit nicht wesentlich schlechter abschneidet. Der entscheidende Unterschied zur Überlegenheitsstudie liegt in der Fragestellung: Anstatt zu fragen, ob die neue Therapie besser wirkt, wird gefragt, ob sie innerhalb einer vorab definierten akzeptablen Toleranzgrenze liegt. Diese Grenze wird als Non-Inferiority-Marge bezeichnet und ist der methodisch kritischste Bestandteil einer Non-Inferiority-Studie. Die Marge muss vor Studienbeginn festgelegt werden und basiert auf klinischen Überlegungen sowie historischen Daten zur Wirksamkeit der Vergleichstherapie. Ohne eine klar definierte und gut begründete Marge ist die Aussagekraft einer Non-Inferiority-Studie wissenschaftlich nicht haltbar.
Wann wird Non-Inferiority eingesetzt?
Non-Inferiority-Studien werden eingesetzt, wenn eine neue Behandlung zwar keine höhere Wirksamkeit als die etablierte Standardtherapie verspricht, aber in anderen Eigenschaften Vorteile bieten kann. Dazu zählen ein günstigeres Nebenwirkungsprofil, eine einfachere Verabreichungsform (zum Beispiel oral statt intravenös), niedrigere Kosten oder eine höhere Patientencompliance. In diesen Situationen wäre eine klassische Überlegenheitsstudie weder ethisch noch wissenschaftlich sinnvoll, da die neue Therapie nie den Anspruch hat, wirkungsvoller zu sein.
Typische Anwendungsgebiete sind Antibiotika-Studien, Antikoagulanzien, Immuntherapien in der Onkologie sowie Impfstoffstudien. Bei Impfstoffen etwa wird die Immunogenität des neuen Impfstoffs mit der eines zugelassenen Referenzimpfstoffs verglichen, und ein Non-Inferiority-Nachweis gilt als ausreichender Beleg für die Zulassung. Auch in der Dermatologie, der Kardiologie und der Behandlung von Infektionskrankheiten sind Non-Inferiority-Studien etabliert. Entscheidend ist in jedem Fall, dass das neue Produkt einen klaren Mehrwert bietet, der den Verzicht auf den Nachweis einer höheren Wirksamkeit rechtfertigt.
Die Non-Inferiority-Marge
Die Non-Inferiority-Marge (auch: Delta, Δ) ist der maximal tolerierbare Unterschied zwischen der neuen Behandlung und der Standardtherapie, der noch als klinisch akzeptabel gilt. Die Festlegung dieser Marge ist regulatorisch und methodisch anspruchsvoll: Sie muss einerseits auf dem historisch belegten Effekt des Komparators gegenüber Placebo basieren (sogenannter M1-Schritt) und andererseits so gewählt werden, dass ein klinisch bedeutsamer Anteil dieses Effekts erhalten bleibt (M2-Schritt).
Sowohl die EMA als auch die FDA haben Leitlinien zur Festlegung der Non-Inferiority-Marge veröffentlicht. Die EMA-Leitlinie CPMP/EWP/2158/99 sowie die FDA-Guidance „Non-Inferiority Clinical Trials to Establish Effectiveness“ (2016) betonen, dass die Wahl der Marge im Studienprotokoll wissenschaftlich begründet und dokumentiert sein muss. Eine zu groß gewählte Marge kann dazu führen, dass eine wirkungslose Therapie als nicht-unterlegen eingestuft wird – ein als „Bio-Creep“ bezeichnetes Problem.
Statistische Auswertung
Die statistische Auswertung einer Non-Inferiority-Studie erfolgt in der Regel über Konfidenzintervalle. Ein einseitiger Test oder ein zweiseitiges 95-%-Konfidenzintervall wird berechnet, und Non-Inferiority gilt als belegt, wenn die untere Grenze des Konfidenzintervalls oberhalb der negativen Non-Inferiority-Marge liegt. Im Gegensatz zur Überlegenheitsstudie ist die ITT-Analyse (Intent-to-Treat) bei Non-Inferiority-Studien nicht zwingend die konservativste Analyse: Protokollgemäße Auswertungen (Per-Protocol) sind ebenfalls von zentraler Bedeutung und müssen beide Ergebnisse übereinstimmen.
Ein häufiger Fehler in der Interpretation ist die Verwechslung von statistischer Non-Inferiority mit klinischer Äquivalenz. Non-Inferiority bedeutet lediglich, dass die Untergrenze des Konfidenzintervalls die Marge nicht überschreitet – nicht, dass beide Behandlungen identisch wirksam sind. Regulatoren und Gutachter prüfen deshalb die biologische Plausibilität der Ergebnisse sorgfältig. Darüber hinaus ist die Sensitivität der Studie zu demonstrieren, das heißt, es muss belegt werden, dass die Studie in der Lage gewesen wäre, einen relevanten Unterschied zu entdecken, wenn er vorgelegen hätte. Diese Anforderung wird als Assay Sensitivity bezeichnet und ist ein zentrales Kriterium bei der regulatorischen Prüfung.
Regulatorische Anforderungen
Zulassungsbehörden wie EMA und FDA verlangen, dass Non-Inferiority-Studien prospektiv geplant werden. Die Marge, die statistische Methode und die primären Endpunkte müssen vor Studienbeginn im Protokoll und im statistischen Analyseplan festgelegt sein. Nachträgliche Anpassungen der Marge gelten als schwerwiegender Protokollverstoß und können zur Ablehnung des Zulassungsantrags führen.
Im Rahmen eines Marketing-Authorisation-Application-Verfahrens (MAA) wird die methodische Qualität der Non-Inferiority-Studie von Scientific Advisors der Behörde eingehend geprüft. Die Behörde bewertet unter anderem, ob die Marge konservativ genug gewählt wurde, ob die Studienpopulation repräsentativ ist und ob die Ergebnisse intern konsistent sind. Full-Service-CROs wie mediconomics unterstützen Sponsoren bei der Konzeption der Studie, der Festlegung der Marge im Rahmen des Scientific-Advice-Prozesses sowie der statistischen Planung und Auswertung von Non-Inferiority-Studien in allen Therapiebereichen.
Ein praxisrelevanter Aspekt ist auch die Wahl des Komparators in Non-Inferiority-Studien. Idealerweise sollte die aktive Vergleichstherapie in der untersuchten Population und unter den Studienbedingungen eine nachgewiesene und reproduzierbare Wirksamkeit gegenüber Placebo aufweisen. Wenn dies nicht der Fall ist – etwa weil die Wirksamkeit des Komparators nur in historischen Studien mit anderen Designs belegt wurde – wird es schwierig, eine valide Marge abzuleiten. Dieser Aspekt wird von Regulatoren besonders kritisch geprüft und sollte frühzeitig im Scientific-Advice-Prozess geklärt werden.
Häufig gestellte Fragen (FAQ)
Kann aus einer Non-Inferiority-Studie nachträglich Überlegenheit abgeleitet werden?
Ja, wenn im Protokoll von vornherein ein hierarchisches Testvorgehen vorgesehen ist: Zunächst wird Non-Inferiority getestet, und wenn diese belegt ist, kann im zweiten Schritt auf Überlegenheit geprüft werden. Dieses Vorgehen muss jedoch prospektiv geplant und im statistischen Analyseplan dokumentiert sein.
Was ist der Unterschied zwischen Non-Inferiority und Äquivalenz?
Eine Äquivalenzstudie prüft, ob zwei Behandlungen in beide Richtungen innerhalb einer Toleranzgrenze liegen (weder überlegen noch unterlegen). Eine Non-Inferiority-Studie prüft nur, ob die neue Therapie nicht wesentlich schlechter ist. Äquivalenzstudien werden vor allem in der Biosimilar-Entwicklung eingesetzt, Non-Inferiority-Studien in der Wirksamkeitszulassung.