Die notwendige Auseinandersetzung mit P4P, die Wertung der bisherigen Ergebnisse und die Integration des Instrumentes
P4P in eine Strategie der Weiterentwicklung des Gesundheitssystems bezieht naturgemäß die technischen, methodischen,
konzeptionellen und Gesundheitsystem-seitigen Faktoren ein, die die Anwendung und den Nutzen von P4P beeinflussen. Wie
wichtig dieserlei Faktoren sind, führt ein einfaches Gedankenexperiment vor Augen: wenn es im deutschen Gesundheitswesen
zusätzliche finanzielle Mittel in der Größenordnung von 100 Mrd. € pro Jahr gäbe (also weit mehr als die Hälfte der gesamten
GKV-Ausgaben), die ausschließlich Qualitäts-orientiert verwendet werden würden - wären wir wirklich sicher, dass sich eine
deutliche Qualitätsverbesserung einstellt? Natürlich wären die Erwartungen hoch, aber wahrscheinlich wäre eine deutliche
Verbesserung gar nicht zu beobachten. Warum ist dies so? Unwillkürlich wird man an den Satz von Janet Corrigan, der Chefin
des National Quality Forums der USA aus dem Jahr 2009 erinnert: “The current care system cannot do the job. Trying harder
will not work. Changing systems of care will.” (Corrigan und McNeill 2009).
Man muss sich also mit der Frage auseinandersetzen, inwieweit man von einem einzelnen Instrument wie P4P eine
Änderungswirkung erwarten kann, die den Beharrungskräften des Systems gewachsen ist, die diese sogar übertrifft. Und wenn
man hier (mit gutem Recht) skeptisch ist: welche Rahmenbedingungen beeinflussen am stärksten die Wirkung von P4P, bzw.
unter welchen Rahmenbedingungen wäre eine Wirkung besonders gut zu beobachten? Es geht also nicht nur um die
Faktoren, die für einen sinnvollen und erfolgreichen Einsatz des Instrumentes P4P Voraussetzung und Umfeld bilden, sondern
auch um die Erwartungen, die man realistischer Weise an ein solches Instrument stellen kann, wenn es in einem derart
komplexen System wie einem nationalen Gesundheitswesen eingesetzt wird. Die betreffenden Faktoren sind ausserordentlich
zahlreich und in ihren Wechselwirkungen vielfältig, so sehr dass ihre Wirkung - selbst bei scheinbar optimaler Kenntnis der
Einzelfaktoren - nicht direkt als Summe bzw. logisches Konstrukt dieser Vielzahl dargestellt werden kann (s.u.
Komplexitätstheorie). Die Komplexität des Systems dupliziert sich noch zusätzlich auf der Ebene der Organisationen des
Gesundheitswesens (s.u. Expertenorganisation), ganz zu schweigen von den Annahmen, die man zur Frage der
Verhaltensänderung im Gesundheitswesen trifft (s. Kapitel 3.5.), den ökonomischen Grundannahmen (Kapitel 4), zur
Einbettung in andere bzw. übergeordnete Vergütungssysteme (Kapitel 5) und zur Aufgabe der Gesundheitspolitik als Instanz
der Gewährleistung und Sicherstellung (Kapitel 6).
In Kapitel 7 werden auf dieser Basis die bisherigen Ergebnisse der Evaluationsstudien (Kap. 2) und die zahlreichen
technischen sowie methodischen Fragen diskutiert und daraus Empfehlungen abgeleitet. Um sich dem Thema jedoch
zunächst anzunähern, werden hier die wichtigsten Einflussfaktoren in vier Gruppen eingeteilt und dargestellt, sowohl auf der
Ebene der gegenwärtigen Diskussion (technische Umsetzung und Methodik der Qualitätsmessung), als auch mit einem
weitergefassten Fokus (Konzeption der Umsetzung und Systemfaktoren):
● Technische Umsetzung
● Methodik der Qualitätsmessung
● Konzeption der Umsetzung
● Faktoren des Gesundheitssystems.
Die ersten beiden Gruppen werden auch in der aktuellen Diskussion häufig genannt, kurz soll hier auf folgende Sachverhalte
eingegangen werden:
► Technische Umsetzung: Freiwilligkeit, Art der monetären
Bewertung, Grenzwerte bei der Auslösung der Zahlung, wer ist
der Adressat der qualitäts-orientierten Vergütung, der einzelne
Arzt oder die Organisation (das Krankenhaus, das Praxisnetz)
(zusammenfassende Darstellung s. Tableau 5)? Diese
technischen Fragen sind jedoch nur auf den ersten Blick rein
technischer Natur, sondern sie werden stark von unserem
Grundverständnis des Zustandekommens von Gesundheits-
bzw. Versorgungsleistungen beeinflusst. Um ein Beispiel zu
nennen: Kommt der alte Spruch “Ich, Ihr Arzt, bin Ihre Prognose”
der Wahrheit näher als die Annahme, dass die medizinische
Behandlung das Ergebnis einer Team- bzw.
Organisationsleistung ist? Muss man also den einzelnen Arzt
oder das Team für Qualität vergüten? Hinter den vordergründig
“nur” technischen Fragen verbergen sich also weitergehende
organisations-theoretische Überlegungen, so dass sie nicht ohne
die Klärung solcher grundlegenden Annahmen beantwortet
werden können (s. auch “konzeptionelle Faktoren”, im weiteren
dann insbes. Kap. 3 und Kap 4).
► Methodik der Qualitätsmessung: In erster Linie geht es hier um die Auswahl der Indikatoren für die Qualitätsmessung.
Indikatoren (s. Tableau 6) sagen Qualität bzw. Qualitätsprobleme voraus, die Rückverlegungsrate auf Intensivstation steht z.B.
für die Qualität der intensivmedizinischen Versorgung (s. Abb. 2). Im Kapitel “7.3. Feedback - Voraussetzungen” wird darauf
eingegangen, an dieser Stelle sei lediglich darauf hingewiesen, dass immer noch zwei Fragen die Diskussion dominieren:
- Prozess- versus Ergebnis-Indikatoren und
- administrative (Routine- oder Sozial-) Daten versus klinische Daten.
Kurz zusammengefasst: Prozessindikatoren sind weniger relevant, während Ergebnisindikatoren (wie der Name schon
sagt) mehr über das Outcome aussagen. Allerdings müssen Letztere risikoadjustiert werden, was zu kleinen Gruppen führt,
kleine Krankenhäuser benachteiligt, die ein einziges negatives Ereignis schlecht ausgleichen können (Davidson et al. 2007,
Scott und Ward 2006) und bei mangelhafter Risikoadjustierung die Anbieter zur Risikoselektion veranlasst (s. Nicholson et al.
2008). Die statistische Aussagekraft ist daher bei
Prozessindikatoren, die nicht oder in geringerem Maße
risikoadjustiert werden müssen (s. allerdings Mehta et al.
2008), deutlich besser; hinzu kommt, dass diese dem
grundsätzlichen Präventionsgedanken des
Qualitätsmanagements sehr viel näher kommen, weil
“das Kind noch nicht in den Brunnen gefallen ist” (sog.
bad apple-Problematik, s. z.B. Cannon 2006). Es ist
daher wenig verwunderlich, dass Prozessindikatoren
nicht nur in der Vergangenheit z.B. im HQIP-Programm
von Premier und CMS eingesetzt wurden (Lindenauer et
al. 2007, s.u.), sondern auch im aktuellen Value-Based
Purchasing-Programm (VBP) von Medicare (Tompkins et
al. 2009, CMS 2012) und im ambulanten Quality and
Outcome Framework (QOL) des NHS in Großbritannien
(NHS 2013A) eine große Rolle spielen.
Über die Nutzung administrativer Daten versus
klinischer Daten wird ähnlich erbittert gestritten. Erstere
haben den Vorteil einer leichteren Erhebbarkeit, sie
haben aber gegenüber klinischen und
Beobachtungsdaten (Kontrolle der Reliabilität der Erhebung
durch Stichproben vorausgesetzt) klare Defizite in der Sensitivität, der alles entscheidenden Eigenschaft von Indikatoren (s.
z.B. Azaouagh und Stausberg 2008, Calderwood et al. 2014, Miller et al. 2001, Pawlson et al. 2007, Powell et al. 2001, s. auch
SVR 2008 Nr.654ff; zur Bedeutung der Sensitivität s.u., zusammenfassende Darstellung SVR 2008, Nr. 645ff). Der Grund liegt
darin, dass sie primär für Vergütungszwecke und nicht für Qualitätsmessungen entwickelt und erhoben werden. Allerdings
muss bei klinischen Daten sehr differenziert mit der Messmethodik umgegangen werden, da z.B. durch direkte Beobachtung
erhobene klinische Daten deutlich höhere Ergebnisse erbringen als Daten aus Krankenakten (sog. chart review) (s.u.). Es gibt
jedoch langjährige Erfahrungen mit epidemiologischen Falldefinitionen auf dem Gebiet der Erhebung nosokomialer Infektionen,
die sich klinische Daten stützen (National Nosocomial Infection Surveillance, NNIS, der Centers of Disease Control, CDC).
Anders als oft angenommen, handelt es sich dabei nicht um klinische Diagnosen, sondern zu rein epidemiologischen Zwecken
entwickelte Instrumente (vgl. Talbot et al. 2013). Fasst man nun alle Erfahrung und alle Studien zusammen: erstens sollte man
Indikatoren im Set verwenden, also mehrere Indikatoren miteinander kombinieren, zweitens ist es sicher richtig,
Prozessindikatoren mit einigen Ergebnisindikatoren zu kombinieren bzw. Prozessindikatoren zu verwenden, die besonders
Ergebnis-relevant sind (z.B. Rückverlegungsrate auf Intensivstation) und drittens: natürlich administrative Daten verwenden,
die bereits vorliegen, wenn es möglich ist, denn der Messaufwand ist eine kritische Größe: “Indicators of performance do not
measure quality, people do!” (Kazandijan et al. 1995).
weiter : 1. Einleitung, 1.4. Zum Begriff des Indikators
Seite
Kapitel
Seite
Kapitel
1. Einleitung
1.3. Technische Umsetzung und Methodik der Qualitätsmessung
© Prof. Dr. med. Matthias Schrappe, Venloer Str. 30, D-50672 Köln
Impressum und Datenschutz
Schrappe, M.: P4P: Aktuelle Einschätzung, konzeptioneller
Rahmen und Handlungsempfehlungen, Version 1.2.1.
Tableau 5: Technische und methodische Fragen bei P4P
(SVR 2008, Nr. 733):
- Teilnahme freiwillig oder verpflichtend?
- wie werden Qualitätsindikatoren monetär bewertet,
- Zuschläge, Abschläge oder beides? Wie sieht die
Refinanzierung der Zuschläge aus?
- wie werden die Zu- bzw. Abschläge ausgelöst (ab einem
gewissen Grenzwert, ab einer relativen Position im Vergleich zu
den Wettbewerbern, oder durch die relative Verbessserung zur
vorangegangenen Erhebung),
- wer ist Adressat der Zu-/Abschläge (einzelner Arzt, Team,
Institution: Einzel- oder Gruppenmotivation),
- gibt es Ausnahmeregelungen für bestimmte Patienten (z.B.
wegen fehlender Compliance),
- Struktur-, Prozess- oder Ergebnisindikatoren?
- klinische Surveillance- oder administrative Daten oder beides?
- Risikoadjustierung der Indikatoren,
- welche Ziele werden verfolgt: Akuterkrankungen oder
Populations-bezogene Qualitätsziele oder beides,
- Kombination mit anderen Instrumenten wie z.B. public
reporting?
- wer übernimmt die Kosten für die Datenerhebung,
- wie sieht die technische Umgebung aus, insbesondere wie sind
die IT-Voraussetzungen gestaltet.
Tableau 6: Was ist ein Indikator? Diese zentrale Frage gehört zu den
größten Problemen in der gegenwärtigen Qualitätsdiskussion, weil der
ungenaue Gebrauch dieses Konzeptes die Diskussion erschwert.
Indikatoren stellen nicht zwingend selbst Qualitätsprobleme dar, sondern
sagen solche voraus (Ampelfunktion). Wie die JCAHO es schon vor
mehr als 20 Jahren sagte: “Ein Indikator ist ein Maß, welches zum
Monitoring und zur Bewertung der Qualität wichtiger Leitungs-,
Management-, klinischer und unterstützender Funktionen genutzt
werden kann, die sich auf das Behandlungsergebnis des Patienten
auswirken. Ein Indikator ist kein direktes Maß der Qualität. Es ist mehr
ein Werkzeug, das zur Leistungsbewertung benutzt werden kann, das
Aufmerksamkeit auf potentielle Problembereich lenken kann, die einer
intensiven Überpfügung innnerhalb einer Organisation bedürfen
können.” (JCAHO 1991, in der Übers. v. Sens et al. 2003). Wenn wir
also die readmission-rate ansehen, dann geht es nicht darum, ob diese
“zu hoch” oder “o.k.” ist (kein direktes Qualitätsmaß), sondern darum, ob
diese valide die Qualität der intensivmedizinischen Behandlung in
Zusammenarbeit mit den Normalpflegestationen vorhersagen
(Reliabilität der Erfassung vorausgesetzt). Natürlich gibt es (gute)
Indikatoren, die selbst Qualitäts-relevant sind (aber das ist die
Ausnahme!), z.B. nosokomiale intravenöse Katheterinfektionen, die
selbst ein Qualitätsproblem darstellen, gleichzeitig und in erster Linie
aber die Qualität der Versorgung einer ganzen Station abbilden.
M. Schrappe
P4P: Aktuelle Einschätzung,
konzeptioneller Rahmen und
Handlungsempfehlungen