Missing Data (fehlende Daten) bezeichnet in der klinischen Forschung alle Datenpunkte, die im Studienprotokoll vorgesehen, aber im finalen Datensatz nicht vorhanden sind. Das Problem betrifft nahezu jede klinische Studie und hat weitreichende Konsequenzen für die statistische Aussagekraft, die interne Validität und die regulatorische Bewertung der Studienergebnisse. Ein systematischer Umgang mit fehlenden Daten ist daher eine zentrale Anforderung der Good Clinical Practice (GCP) und der einschlägigen ICH-Leitlinien. Trotz aller Präventionsmaßnahmen kann das vollständige Fehlen von Daten in keiner Studie ausgeschlossen werden – entscheidend ist der geplante, transparente Umgang damit.
Ursachen und Klassifikation fehlender Daten
Fehlende Daten entstehen aus einer Vielzahl von Gründen, die sich in ihrer statistischen Bedeutung erheblich unterscheiden. Die Literatur unterscheidet drei grundlegende Mechanismen:
- MCAR (Missing Completely At Random): Das Fehlen eines Werts ist vollständig zufällig und unabhängig von allen beobachteten und unbeobachteten Variablen. Beispiel: Ein Messgerät fällt technisch aus, ohne dass dies mit dem Gesundheitszustand des Patienten zusammenhängt. MCAR-Daten erlauben theoretisch eine unverzerrte Analyse vollständiger Fälle, sind aber in der klinischen Praxis selten, empirisch kaum zu belegen und dürfen daher nicht als Standardannahme verwendet werden.
- MAR (Missing At Random): Das Fehlen hängt von beobachteten, aber nicht von unbeobachteten Variablen ab. Beispiel: Ältere Patienten brechen häufiger ab, aber das Alter ist im Datensatz dokumentiert. Unter MAR-Annahme liefern Methoden wie Multiple Imputation oder MMRM unverzerrte Schätzungen.
- MNAR (Missing Not At Random): Das Fehlen hängt vom fehlenden Wert selbst ab – also von unbeobachteten Größen. Beispiel: Patienten mit stärksten Schmerzen brechen die Studie ab, melden dies aber nicht. Dieser Mechanismus ist am schwierigsten zu behandeln und erfordert Sensitivitätsanalysen sowie Worst-Case-Szenarien.
Die Unterscheidung dieser Mechanismen ist nicht nur akademischer Natur: Sie bestimmt unmittelbar, welche statistische Methode regulatorisch akzeptabel ist und welche Sensitivitätsanalysen erwartet werden.
Auswirkungen auf klinische Studien
Fehlende Daten können die Ergebnisse einer klinischen Studie auf mehreren Ebenen verzerren. Erstens reduzieren sie die effektive Stichprobengröße und damit die statistische Power der Studie, was zu falsch negativen Ergebnissen führen kann. Zweitens können sie, je nach Missing-Data-Mechanismus, systematische Verzerrungen (Bias) in die Wirksamkeits- oder Sicherheitsanalyse einführen. Drittens beeinflussen sie die Interpretierbarkeit der Ergebnisse: Regulatoren wie die EMA und das BfArM bewerten die Vollständigkeit des primären Endpunkts als zentrales Qualitätsmerkmal eines Zulassungsantrags.
Besonders kritisch sind fehlende Daten beim primären Wirksamkeitsendpunkt. Ein hoher Anteil fehlender Werte (typisch über 10–20 %) kann selbst bei formal positivem Studienergebnis zur Anforderung zusätzlicher Sensitivitätsanalysen oder sogar zur Ablehnung des Antrags führen. Die EMA-Guideline on Missing Data aus dem Jahr 2010 setzt hierfür den regulatorischen Rahmen und fordert explizit, dass Sponsoren a priori darlegen, wie sie fehlende Daten behandeln werden – einschließlich begründeter Annahmen über den zugrunde liegenden Mechanismus und der Darstellung geplanter Sensitivitätsszenarien.
Präventionsstrategien und Studiendesign
Der wirksamste Umgang mit fehlenden Daten ist ihre Prävention. Bereits im Studiendesign können verschiedene Maßnahmen ergriffen werden, um den Anteil fehlender Daten zu minimieren:
- Wahl eines realistischen, patientenfreundlichen Besuchsplans mit möglichst wenigen Pflichtvisiten
- Einsatz von Remote- oder dezentralen Studienformaten (Decentralised Clinical Trials) zur Reduktion von Abbrüchen durch Reiseaufwand
- Proaktives Patienten-Retention-Management durch regelmäßige Kontaktpunkte und motivierende Kommunikation
- Verwendung elektronischer Patientenberichte (ePRO) für tägliche Messungen, die verpasste Visiten teilweise kompensieren können
- Frühzeitige Identifikation von Abbruchrisiken im Risk-Based-Monitoring und gezielte Gegenmaßnahmen auf Prüfzentrumsebene
Bedeutung für klinische Studien
Missing Data ist eines der häufigsten Kritikpunkte regulatorischer Behörden bei der Begutachtung klinischer Studiendaten. Ein gut durchdachter Missing-Data-Plan, der Mechanismus-Annahmen, Imputationsmethoden und Sensitivitätsanalysen vorab dokumentiert, ist heute Standard für jede Phase-III-Studie und ein kritisches Qualitätsmerkmal des Statistical Analysis Plans. Full-Service-CROs wie mediconomics unterstützen Sponsoren bei der Entwicklung einer robusten Missing-Data-Strategie, die regulatorischen Anforderungen standhält und die Integrität der Studienergebnisse sichert.
Häufig gestellte Fragen (FAQ)
Wie viele fehlende Daten sind in einer klinischen Studie akzeptabel?
Es gibt keine feste regulatorische Grenze. Als Faustformel gilt: Über 10 % fehlende Daten beim primären Endpunkt sind erklärungsbedürftig, über 20 % gelten als kritisch und erfordern robuste Sensitivitätsanalysen. Die EMA bewertet dies einzelfallbezogen und berücksichtigt dabei den Indikationsbereich, die Studienlaufzeit und die Art des Endpunkts.
Muss der Missing-Data-Plan vorab festgelegt werden?
Ja. Die Strategie für den Umgang mit fehlenden Daten – einschließlich Annahmen über den Mechanismus, Imputationsmethode und Sensitivitätsanalysen – muss im Statistical Analysis Plan vor dem Database Lock dokumentiert sein. Nachträgliche Entscheidungen werden von Regulatoren als potenziell ergebnisgetrieben eingestuft und kritisch bewertet.
Was ist der Unterschied zwischen Missing Data und Protokollabweichungen?
Fehlende Daten beziehen sich auf nicht erhobene Messwerte, während Protokollabweichungen Verstöße gegen den Prüfplan darstellen (z. B. falsche Dosierung, nicht eingehaltene Zeitfenster). Beide können zur Exklusion aus der Per-Protocol-Population führen, werden aber statistisch und regulatorisch getrennt behandelt. Fehlende primäre Endpunktdaten betreffen typischerweise die Intent-to-Treat-Analyse, nicht nur die Per-Protocol-Auswertung.
Regulatorische Referenzen
- EMA Guideline on Missing Data in Confirmatory Clinical Trials (EMA/CPMP/EWP/1776/99 Rev. 1, 2010)
- ICH E9(R1) – Addendum on Estimands and Sensitivity Analysis in Clinical Trials (2019)
- ICH E6(R3) – Good Clinical Practice (2023): Datenvollständigkeit und Datenqualität
- EU-Verordnung Nr. 536/2014 (CTR): Dokumentation von Protokollabweichungen und Datenlücken
- FDA Guidance: Missing Data in Clinical Trials – A Framework for Drug Development (2010)