26.02.2017 Stellungnahme zum Methodenpapier des IQTIG
“Methodische Grundlagen” Version V1.0s
(Fortsetzung 3)
3.3. „Qualitätsmessung“ und Indikatorenkonzept
Das Methodenpapier des IQTIG geht davon aus, dass sich Qualität in der
Gesundheitsversorgung linear messen lässt, und verwendet Qualitätsindikatoren
als Messinstrumente, ähnlich wie sie im technischen Bereich oder in der
Labormedizin eingesetzt werden. Dieser Ansicht ist aus der Perspektive der Qualitäts- und Versorgungsforschung deutlich zu
widersprechen. In der vorliegenden Stellungnahme sind drei Punkte genauer auszuführen:
- Grundlage des Indikatorenverständnisses: Monitoring-Funktion
- Definition von Indikatoren (normativer Zugang)
- Unterscheidung von Reliabilität und Validität von Indikatoren
3.3.1. Bestimmung und Erfassung von Qualität
Im Methodenpapier wird zugrunde gelegt, dass sich die Qualität der
Gesundheitsversorgung ähnlich wie biomedizinische Marker durch lineare
Messinstrumente quantifizieren lässt:
„Die Messung der Qualität medizinischer Versorgung erfolgt grundsätzlich
mittels Qualitätsindikatoren“ (S. 21).
„Kern der Aufgaben des Instituts ist die Qualitätsmessung in der
Gesundheitsversorgung mittels Qualitätsindikatoren (S. 87).
Die Indikatoren können nach dem Konzept des IQTIG verschiedene Ausprägungen einnehmen, die verwendeten Begriffe zur
Abstufung von Qualität reichen von „ungenügend“, „nicht ausreichend“, „durchschnittlich gut“ über „gut“ bis zu „außerordentlich
gut“ und sogar „Exzellenz“:
„Die Qualitätsförderung (…) unterscheidet bislang lediglich qualitativ unauffällige und qualitativ auffällige Ergebnisse, also
gute und nicht ausreichende Qualität. Das KHSG identifiziert dagegen beispielsweise im Rahmen von qualitätsbezogenen
Zu- und Abschlägen außerordentlich gute und am anderen Ende der Skala unzureichende Qualität und damit
indirekt auch die dazwischen liegende, durchschnittlich gute Qualität. Damit wird deutlich, dass zukünftig weitere,
über die Differenzierung von guter und nicht ausreichender Qualität hinausgehende Differenzierungen notwendig werden.
(…) Auch im Rahmen planungsrelevanter Qualitätsindikatoren findet sich eine feinere Differenzierung der
Versorgungsqualität: Minimal-anforderungen bei Planungsentscheidungen, Ausschlusskriterien bei
Interventionsentscheidungen und Exzellenzaspekte bei Vergabeentscheidungen.“ (S. 19, Hervorh. der Verf.)
Aus Sicht der Versorgungsforschung kann man dem Konzept einer linearen Qualitäts“messung“ nicht folgen. Wie bereits
einleitend ausgeführt (s. Abb. 1), sind grundsätzlich bei der Quantifizierung des Grades, in dem inhärente Merkmale die
Anforderungen erfüllen (so die DIN-Definition von Qualität),
- wissenschaftsgetriebene Verfahren,
- der Einsatz klinisch-epidemiologischer Falldefinitionen,
- der Einsatz von Indikatoren zu Zwecken des Monitoring und
- die generierenden Verfahren (z.B. CIRS)
zu unterscheiden (s. Abb. 1). Nur die beiden erstgenannten Verfahren kommen einer Messung nahe. Der wissenschaftliche
Zugang ist auf der Basis einer Modellbildung bemüht, ein Messinstrument mit gleichermaßén hoher Sensitivität und Spezifität
einzusetzen, den Messvorgang selbst als (komplexe) Intervention zu verstehen und die Komplexität des Kontextes der
Messung zu berücksichtigen (z.B. Messung der Händedesinfektionscompliance durch direkte Beobachtung). Der Aufwand
einer solchen Messung ist sehr hoch, so dass solche Verfahren nur zur Etablierung einer Methode oder in besonders
dringenden Situationen eingesetzt werden. Auch beim Einsatz klinisch-epidemiologischer Falldefinitionen, so wie sie in der
Hygiene (z.B. Erfassung von postoperativen Wundinfektionen) oder im Bereich der Patientensicherheit bei der Erfassung
unerwünschter Ereignisse verwendet werden, ist der Erhebungsaufwand so hoch, dass man den Einsatz dieser Instrumente
auf definierte Ereignisgruppen (z.B. nonokomiale Infektionen) beschränkt2. Allerdings sind diese klinisch-epidemiologischen
Instrumente einfacher einzusetzen als die primär Wissenschafts-getriebenen Ansätze, man ist nicht bei jedem Einsatz darauf
angewiesen, eine individuelle Modellbildung vorzunehmen und die doppelte Komplexität von Kontext und (Mess-)Intervention
zu bewerten3.
Für den Routinebetrieb verbleibt daher als einzig denkbare Lösung der Einsatz von Monitoring-Instrumenten, so wie sie
durch Indikatoren gegeben sind. Indikatoren müssen in erster Linie sensitiv eingestellt werden, denn bei einem Monitoring-
Ansatz ist es notwendig, möglichst alle problematischen Fälle zu erfassen (Vermeidung von falsch-negativen Ergebnissen),
auch auf die Gefahr hin, falsch-positive Ergebnisse zu erhalten (Kompromisse bei der Spezifität). Im Gesundheitswesen ist die
Erfassung von problematischen (negativen) Fällen bzw. Leistungserbringern von vorrangiger Wichtigkeit, denn sonst können
die resultierenden Ergebnisse keine Steuerungswirkung entfalten: Patienten und Zuweiser müssen vor allem darauf vertrauen
könne, dass bei fehlendem Ansprechen des Indikators keine Qualitätsprobleme vorliegen. Aus dieser Sicht weisen Indikatoren
eine ganz andere Konfiguration als Messinstrumente und auch als diagnostische Verfahren in der Medizin auf.
Messinstrumente werden im Allgemeinen auf einen möglichst optimalen Kompromiss von Sensitivität und Spezifität eingestellt
(z.B. je 85%), und diagnostische Verfahren weisen in erster Linie eine hohe Spezifität auf (weswegen im medizinischen Bereich
Indikatoren oft nicht verstanden werden).
An diesem Punkt liegt einer der entscheidenden Schwächen im Indikatorenverständnis, so wie es im Methodenpapier des
IQTIG und auch darüber hinaus oft im deutschen Gesundheitswesen vertreten wird. Wenn man Qualitätsindikatoren, so wie
oben ausgeführt, in einem Kontinuum von schlechter bis außerordentlich guter Qualität einsetzt, kommt man nicht umhin, ihnen
ähnliche Eigenschaften wie klassische Messinstrumente zuzuweisen. Da es aus grundlegenden statistischen Überlegungen
nicht möglich ist, ein Messinstrument gleichzeitig auf eine Sensitivität und Spezifität von 100% einzustellen, muss man bei der
Sensitivität Kompromisse machen, und in der Folge verlieren Indikatoren ihre Monitoring-Funktion.
An dieser Stelle kommt das Konzept der sog. Exzellenz-Indikatoren ins Spiel. Welche statistischen Eigenschaften müss(t)en
Exzellenz-Indikatoren aufweisen? Wenn Qualitätsindikatoren, die Qualitätsprobleme identifizieren sollen (Monitoring), eine
hohe Sensitivität für diese Ereignisse besitzen müssen (man will möglichst keine Probleme übersehen), dann sollten
Qualitätsindikatoren, die besonders hohe Qualität identifizieren sollen, auf eine besonders hohe Spezifität eingestellt sein, denn
man will ja vermeiden, dass Exzellenz dort festgestellt wird, wo sie nicht vorliegt (man will falsch-positive Befunde vermeiden).
In der Konsequenz heißt dies nichts anderes, als dass die gleichen Qualitätsindikatoren, die für die Identifikation von
Qualitätsproblemen verwendet werden, nicht gleichzeitig als Indikatoren für besonders gute Qualität fungieren können. Es liegt
auf der Hand, dass diese Ableitung nicht nur den Grundannahmen im Methodenpapier des IQTIG widerspricht, sondern auch
die gesetzlichen Regelungen in Frage stellt, die an dieser Stelle hinterfragt werden sollten.
Das Methodenpapier des IQTIG vertritt das Konzept der linearen Messung von Qualität durch Qualitätsindikatoren. Eine
differenzierte Betrachtung unterschiedlicher Erhebungsmethoden wird nicht vorgenommen. Entgegen der international
und im deutschen Schrifttum üblichen Auffassung werden Indikatoren nicht als hoch-sensitive Monitoring-Instrumente,
sondern als klassische Messinstrumente eingesetzt, die gleichzeitig für die Erfassung von Qualitätsproblemen und für die
Identifikation von „exzellenter“ Qualität zuständig sind.
-------
2 Allerdings lässt der Methodentransfer zwischen der Klinischen Infektiologie mit ihrem Infection Control-Ansatz und dem Qualitäts- und
Patientensicherheitsbereich viele Wünsche offen, denn es wäre ein Leichtes, klinisch-epidemiologische Falldefinitionen z.B für postoperative
Thrombosen zu entwickeln, denen nicht die mangelnde Sensitivität von Abrechnungsdaten anhaftet, und die – ähnlich wie bei nosokomialen
Infektionen – so genau sein könnten, dass sie sogar internationale Vergleiche erlauben würden. Wichtig ist auch hier die Feststellung, dass es
sich dabei nicht um klinische, d.h. für therapeutische Verfahren verwertbare Diagnosen handelt, sondern um primär epidemiologische
Instrumente.
3 Die vierte Methode, die generierenden Verfahren, sind lediglich zur Behebung des „blindes Fleckes“ in Form der „Unknown Unknowns“
geeignet, weisen keine sinnvolle Sensitvität und Spezifität auf und stehen in dem hier diskutierten Zusammenhang nicht im Mittelpunkt.
Printversion hier zum Download
21
Seite
Im Weißbuch
21
Seite