IQTIG-Methodenpapier

26.02.2017 Stellungnahme zum Methodenpapier des IQTIG “Methodische Grundlagen” Version V1.0s (Fortsetzung 3) 3.3. „Qualitätsmessung“ und Indikatorenkonzept Das Methodenpapier des IQTIG geht davon aus, dass sich Qualität in der Gesundheitsversorgung linear messen lässt, und verwendet Qualitätsindikatoren als Messinstrumente, ähnlich wie sie im technischen Bereich oder in der Labormedizin eingesetzt werden. Dieser Ansicht ist aus der Perspektive der Qualitäts- und Versorgungsforschung deutlich zu widersprechen. In der vorliegenden Stellungnahme sind drei Punkte genauer auszuführen: - Grundlage des Indikatorenverständnisses: Monitoring-Funktion - Definition von Indikatoren (normativer Zugang) - Unterscheidung von Reliabilität und Validität von Indikatoren 3.3.1. Bestimmung und Erfassung von Qualität Im Methodenpapier wird zugrunde gelegt, dass sich die Qualität der Gesundheitsversorgung ähnlich wie biomedizinische Marker durch lineare Messinstrumente quantifizieren lässt: „Die Messung der Qualität medizinischer Versorgung erfolgt grundsätzlich mittels Qualitätsindikatoren“ (S. 21). „Kern der Aufgaben des Instituts ist die Qualitätsmessung in der Gesundheitsversorgung mittels Qualitätsindikatoren (S. 87). Die Indikatoren können nach dem Konzept des IQTIG verschiedene Ausprägungen einnehmen, die verwendeten Begriffe zur Abstufung von Qualität reichen von „ungenügend“, „nicht ausreichend“, „durchschnittlich gut“ über „gut“ bis zu „außerordentlich gut“ und sogar „Exzellenz“: „Die Qualitätsförderung (…) unterscheidet bislang lediglich qualitativ unauffällige und qualitativ auffällige Ergebnisse, also gute und nicht ausreichende Qualität. Das KHSG identifiziert dagegen beispielsweise im Rahmen von qualitätsbezogenen Zu- und Abschlägen außerordentlich gute und am anderen Ende der Skala unzureichende Qualität und damit indirekt auch die dazwischen liegende, durchschnittlich gute Qualität. Damit wird deutlich, dass zukünftig weitere, über die Differenzierung von guter und nicht ausreichender Qualität hinausgehende Differenzierungen notwendig werden. (…) Auch im Rahmen planungsrelevanter Qualitätsindikatoren findet sich eine feinere Differenzierung der Versorgungsqualität: Minimal-anforderungen bei Planungsentscheidungen, Ausschlusskriterien bei Interventionsentscheidungen und Exzellenzaspekte bei Vergabeentscheidungen.“ (S. 19, Hervorh. der Verf.) Aus Sicht der Versorgungsforschung kann man dem Konzept einer linearen Qualitäts“messung“ nicht folgen. Wie bereits einleitend ausgeführt (s. Abb. 1), sind grundsätzlich bei der Quantifizierung des Grades, in dem inhärente Merkmale die Anforderungen erfüllen (so die DIN-Definition von Qualität), - wissenschaftsgetriebene Verfahren, - der Einsatz klinisch-epidemiologischer Falldefinitionen, - der Einsatz von Indikatoren zu Zwecken des Monitoring und - die generierenden Verfahren (z.B. CIRS) zu unterscheiden (s. Abb. 1). Nur die beiden erstgenannten Verfahren kommen einer Messung nahe. Der wissenschaftliche Zugang ist auf der Basis einer Modellbildung bemüht, ein Messinstrument mit gleichermaßén hoher Sensitivität und Spezifität einzusetzen, den Messvorgang selbst als (komplexe) Intervention zu verstehen und die Komplexität des Kontextes der Messung zu berücksichtigen (z.B. Messung der Händedesinfektionscompliance durch direkte Beobachtung). Der Aufwand einer solchen Messung ist sehr hoch, so dass solche Verfahren nur zur Etablierung einer Methode oder in besonders dringenden Situationen eingesetzt werden. Auch beim Einsatz klinisch-epidemiologischer Falldefinitionen, so wie sie in der Hygiene (z.B. Erfassung von postoperativen Wundinfektionen) oder im Bereich der Patientensicherheit bei der Erfassung unerwünschter Ereignisse verwendet werden, ist der Erhebungsaufwand so hoch, dass man den Einsatz dieser Instrumente auf definierte Ereignisgruppen (z.B. nonokomiale Infektionen) beschränkt². Allerdings sind diese klinisch-epidemiologischen Instrumente einfacher einzusetzen als die primär Wissenschafts-getriebenen Ansätze, man ist nicht bei jedem Einsatz darauf angewiesen, eine individuelle Modellbildung vorzunehmen und die doppelte Komplexität von Kontext und (Mess-)Intervention zu bewerten³. Für den Routinebetrieb verbleibt daher als einzig denkbare Lösung der Einsatz von Monitoring-Instrumenten, so wie sie durch Indikatoren gegeben sind. Indikatoren müssen in erster Linie sensitiv eingestellt werden, denn bei einem Monitoring- Ansatz ist es notwendig, möglichst alle problematischen Fälle zu erfassen (Vermeidung von falsch-negativen Ergebnissen), auch auf die Gefahr hin, falsch-positive Ergebnisse zu erhalten (Kompromisse bei der Spezifität). Im Gesundheitswesen ist die Erfassung von problematischen (negativen) Fällen bzw. Leistungserbringern von vorrangiger Wichtigkeit, denn sonst können die resultierenden Ergebnisse keine Steuerungswirkung entfalten: Patienten und Zuweiser müssen vor allem darauf vertrauen könne, dass bei fehlendem Ansprechen des Indikators keine Qualitätsprobleme vorliegen. Aus dieser Sicht weisen Indikatoren eine ganz andere Konfiguration als Messinstrumente und auch als diagnostische Verfahren in der Medizin auf. Messinstrumente werden im Allgemeinen auf einen möglichst optimalen Kompromiss von Sensitivität und Spezifität eingestellt (z.B. je 85%), und diagnostische Verfahren weisen in erster Linie eine hohe Spezifität auf (weswegen im medizinischen Bereich Indikatoren oft nicht verstanden werden). An diesem Punkt liegt einer der entscheidenden Schwächen im Indikatorenverständnis, so wie es im Methodenpapier des IQTIG und auch darüber hinaus oft im deutschen Gesundheitswesen vertreten wird. Wenn man Qualitätsindikatoren, so wie oben ausgeführt, in einem Kontinuum von schlechter bis außerordentlich guter Qualität einsetzt, kommt man nicht umhin, ihnen ähnliche Eigenschaften wie klassische Messinstrumente zuzuweisen. Da es aus grundlegenden statistischen Überlegungen nicht möglich ist, ein Messinstrument gleichzeitig auf eine Sensitivität und Spezifität von 100% einzustellen, muss man bei der Sensitivität Kompromisse machen, und in der Folge verlieren Indikatoren ihre Monitoring-Funktion. An dieser Stelle kommt das Konzept der sog. Exzellenz-Indikatoren ins Spiel. Welche statistischen Eigenschaften müss(t)en Exzellenz-Indikatoren aufweisen? Wenn Qualitätsindikatoren, die Qualitätsprobleme identifizieren sollen (Monitoring), eine hohe Sensitivität für diese Ereignisse besitzen müssen (man will möglichst keine Probleme übersehen), dann sollten Qualitätsindikatoren, die besonders hohe Qualität identifizieren sollen, auf eine besonders hohe Spezifität eingestellt sein, denn man will ja vermeiden, dass Exzellenz dort festgestellt wird, wo sie nicht vorliegt (man will falsch-positive Befunde vermeiden). In der Konsequenz heißt dies nichts anderes, als dass die gleichen Qualitätsindikatoren, die für die Identifikation von Qualitätsproblemen verwendet werden, nicht gleichzeitig als Indikatoren für besonders gute Qualität fungieren können. Es liegt auf der Hand, dass diese Ableitung nicht nur den Grundannahmen im Methodenpapier des IQTIG widerspricht, sondern auch die gesetzlichen Regelungen in Frage stellt, die an dieser Stelle hinterfragt werden sollten. Das Methodenpapier des IQTIG vertritt das Konzept der linearen Messung von Qualität durch Qualitätsindikatoren. Eine differenzierte Betrachtung unterschiedlicher Erhebungsmethoden wird nicht vorgenommen. Entgegen der international und im deutschen Schrifttum üblichen Auffassung werden Indikatoren nicht als hoch-sensitive Monitoring-Instrumente, sondern als klassische Messinstrumente eingesetzt, die gleichzeitig für die Erfassung von Qualitätsproblemen und für die Identifikation von „exzellenter“ Qualität zuständig sind. ------- ² Allerdings lässt der Methodentransfer zwischen der Klinischen Infektiologie mit ihrem Infection Control-Ansatz und dem Qualitäts- und Patientensicherheitsbereich viele Wünsche offen, denn es wäre ein Leichtes, klinisch-epidemiologische Falldefinitionen z.B für postoperative Thrombosen zu entwickeln, denen nicht die mangelnde Sensitivität von Abrechnungsdaten anhaftet, und die – ähnlich wie bei nosokomialen Infektionen – so genau sein könnten, dass sie sogar internationale Vergleiche erlauben würden. Wichtig ist auch hier die Feststellung, dass es sich dabei nicht um klinische, d.h. für therapeutische Verfahren verwertbare Diagnosen handelt, sondern um primär epidemiologische Instrumente. ³ Die vierte Methode, die generierenden Verfahren, sind lediglich zur Behebung des „blindes Fleckes“ in Form der „Unknown Unknowns“ geeignet, weisen keine sinnvolle Sensitvität und Spezifität auf und stehen in dem hier diskutierten Zusammenhang nicht im Mittelpunkt.