De kwaliteitsslag – deel 3

In de vorige delen hebben we de aanloop naar ROM bekeken, en de rollen die het zou moeten innemen in de zorg en het zorgstelsel zoals beschreven in het AR-rapport dat de directe aanleiding vormde tot de petitie ‘Stop ROM als benchmark’. Voor de daaropvolgende discussie is het onderscheid in de 3 doelen van ROM nogal belangrijk: ROM als klinisch middel ter verbetering van de individuele behandeling (ROM-k), ROM voor intern institutioneel gebruik ter verbetering van behandelprogramma’s, -processen of -strategieën door vergelijk met andere delen van hetzelfde instituut of met ander instituten (ROM-i) en tenslotte ROM als benchmark, om kwaliteit van zorg tussen aanbieders te kunnen vergelijken, ten behoeve van zorginkoop (ROM-b).

Wat staat er nu in het AR-rapport over ROM?

Over ROM-k en ROM-i zegt men vrij weinig, behalve dat de uitkomsten per definitie subjectief zijn.

Over ROM-b wordt een aantal zaken benoemd die de bruikbaarheid van ROM als benchmark beperken:
– de onvolledigheid van de gegevensverzameling. Dit heeft te maken met de vraag, of de data die je hebt wel representatief zijn voor wat een zorgaanbieder doet en wie men behandelt. Is dat niet het geval dan kan er sprake zijn van selectiebias, waardoor de data een vertekend beeld geven van de realiteit. Men kijkt dus van hoeveel procent van alle behandeltrajecten die verricht worden, voor- en nametingen worden gedaan. In 2015 zat men landelijk op 47%. De zorgverzekeraar heeft een financiële prikkel gesteld juist om dit punt te bevorderen.
– zorgaanbieders zijn niet zomaar vergelijkbaar. Een redelijke analogie is met wiskunde: de teller en de noemer. Het verschil in score tussen einde en begin behandeling is de teller, en uit de scores blijkt dat er aanzienlijke verschillen tussen zorgaanbieders bestaan. Wat niet meteen duidelijk is, is de noemer: alle factoren behalve de geboden behandeling, die de uitslag hebben kunnen beïnvloeden. Weet u nog, die rugzak met aardappels die een van de lopers mee torste in deel 1? Voor de ggz zou dit bijvoorbeeld kunnen zijn, dat de ene aanbieder patiënten heeft uit een socio-economisch gunstigere demografische groep dan de ander, en omdat dit (niet voor alle maar wel voor sommige) aandoeningen invloed heeft op de behandelbaarheid, betekent dat, dat een betere uitkomst bij die behandelaar niet noodzakelijk met de behandeling te maken heeft, maar -wellicht- met de gunstige omstandigheden. Voor dit soort confounders moet gecorrigeerd worden, wil je op goede gronden gaan benchmarken. Dat is de laatste tijd gedaan door de zogenaamde ‘zorgvraagzwaarteindicator’ (dat is inderdaad een flinke woordscore). Wat die indicator dus probeert, is om na te gaan welke veranderingen in een behandeling puur op het conto van de patiënt (en diens omstandigheden dus) te schrijven zijn ipv op de behandeling. De AR geeft aan dat de ‘zeggingskracht’ van deze indicator nog zeer beperkt is, en dat er geen zicht is op versterking van die zeggingskracht. Een tweede manier om voor de noemer te corrigeren, is door zgn. ‘casemixcorrectie’ toe te passen. Daarbij ga je binnen de patiëntpopulatie een subgroep maken van mensen met dezelfde hoofddiagnose, bijvoorbeeld een angststoornis of een depressie, en ga je binnen die geselecteerde groep zoeken naar confounders. Dat is makkelijker vanwege de kleinere groep die bij voorbaat al meer met elkaar gemeen heeft. Dit gaat al beter, maar nog steeds onvoldoende, volgens de AR, om alleen op deze basis conclusies te kunnen trekken. En daarnaast ontstaat een praktisch probleem: om zo’n selectie te kunnen maken, heb je veel patiënten nodig. Bij kleinere aanbieders lukt dat niet en kan deze methode dus niet toegepast worden.
– de vertaling van kwaliteit als ‘gemiddelde behandeluitkomst’ geeft een smalle invulling van het begrip kwaliteit. Behandeldoelen hoeven echter niet alleen hierop gericht te zijn, en daarnaast meet dit relatief korte-termijn herstel, terwijl juist in de ggz lange-termijn herstel van belang is. In volgende afleveringen zullen we uitgebreider op dit punt ingaan.
– als de informatie gevolgen heeft voor de zorginkoop, moet voldaan worden aan hoge eisen van betrouwbaarheid, volledigheid, en vergelijkbaarheid van kwaliteit tussen zorgaanbieders. Dat is logisch: bij een vertekend beeld zouden we, in dit model, misschien een kwalitatief slechtere aanbieder belonen. Bovendien, schrijft men, is er het risico dat als zorgverzekeraars op basis van informatie van slechte kwaliteit handelen, dit strategisch gedrag bij aanbieders uitlokt, waardoor de data juist slechter worden. Vertekening op vertekening dus.

Uit deze opsomming blijkt dat het rapport, voor dit deel, zich vooral op de zorginkoop aan het richten is. Ergens wel logisch, omdat dat het eerste aangrijpingspunt is van overheidsbeleid op de praktijk, maar een verdere uitwerking van hoe het ROM-k en ROM-i is vergaan was aardig geweest. Maar dat valt ook elders te lezen.

In het rapport wordt hierna de toekomst geschetst over de komende jaren: de ontwikkeling naar een ander model voor bekostiging naar Engels voorbeeld, de rol die zorgstandaarden en kwaliteitsstatuten daarin zullen hebben, en vervolgens wat dit betekent als we de bovengenoemde punten daarbij betrekken. Zie overigens hiervoor ook mijn eerdere blogserie ‘De Week van de Kwaliteit’. De AR concludeert dat het belang van ROM zal toenemen in het komende model, maar dat er tot op dat moment geen aandacht was voor de door hun gesignaleerde beperkingen t.a.v. de kwaliteitsinformatie in de ontwikkeling van dat model. Kortom: er komt nog meer druk te staan op deze problematiek.

Het rapport concludeert, dat er (1) nu meer aandacht is voor verbeteren van kwaliteit van zorg, door het focus op prestatiebekostiging en (2) dat er veel meer informatie is over hoeveel mensen er zijn behandeld, met welke stoornis, tegen welke kosten. Ze benoemen (3) dat er op de zorginkoopmarkt vooral gekeken is naar beheersing van de uitgaven en niet naar kwaliteitsvergelijking tussen zorgaanbieders, waardoor er de facto sprake is van budgetbekostiging. Ze geven aan dat de partijen betrokken bij het bestuurlijk akkoord hoge verwachtingen hebben van het nieuwe model en zetten kanttekeningen bij het tijdspad, gezien bovenstaande problemen.

Hier de centrale conclusie mbt ROM-b:

“De minister van VWS heeft aangegeven dat de ROM-metingen een belangrijke rol moeten gaan spelen in het nieuwe model van prestatiebekostiging. Het gebruik van ROM kent echter beperkingen. De ROM-metingen zijn subjectief en onvolledig, en zorgaanbieders zijn aan de hand van de uitkomsten niet te vergelijken. Het is alleen zinvol om in de bekostiging gebruik te maken van op ROM gebaseerde informatie, wanneer deze informatie sterk verbetert. Pas als er goede en vergelijkbare informatie beschikbaar is, kan kwaliteit een rol gaan spelen bij de zorginkoop. Of deze kwaliteit van de informatie op korte termijn aanzienlijk zal verbeteren, moet echter nog blijken. Er is de afgelopen jaren al veel energie gestoken in het kunnen voorspellen van uitkomsten van behandelingen en in het corrigeren voor verklaarbare verschillen in behandeluitkomsten. De geboekte vooruitgang is vooralsnog beperkt.”

En bij de aanbevelingen:

“Het is echter niet vanzelfsprekend dat de zorgstandaarden en productstructuur ook gaan
bijdragen aan een beter functionerende zorginkoopmarkt. Met de voorgenomen  aanpassingen zal er meer informatie beschikbaar komen. De uitdaging is echter vooral om informatie te verzamelen die door zowel zorgverzekeraars als zorgaanbieders als zinvol wordt ervaren. Anders bestaat het risico dat er een arbeidsintensief systeem van informatievoorziening wordt opgezet dat in de praktijk weinig gaat bijdragen aan de kwaliteit en doelmatigheid van de zorg.”

Eén van de aanbevelingen is om de bekostiging op méér te baseren dan prestatiemetingen, en om tijd te nemen ‘om te komen tot de benodigde verandering van gedrag, te leren en te verbeteren op basis van ervaring’.

De aanbevelingen, letterlijk:
1: Neem voldoende tijd om te komen tot realisatie van een samenhangend en effectief bekostigingsmodel
2: Bepaal tijdig welke verantwoordingsinformatie past bij het nieuwe bekostigingsmodel
3: Houd rekening met beperkingen van de meetbaarheid en vergelijkbaarheid van de behandeluitkomsten
4: Wij bevelen de minister van VWS aan om het Zorginstituut Nederland een expliciet oordeel te laten geven over de kwaliteit van de nieuwe set kwaliteitsindicatoren.
5: Neem de tijd voor eventuele doorontwikkeling naar outcomebekostiging en geef veldpartijen eerst voldoende tijd en ruimte om ervaring op te doen met het bekostigingsmodel van 2019, en spreek op basis van deze ervaringen een realistisch tijdpad af voor de mogelijke invoering van outcomebekostiging.
6: Wij bevelen de minister van VWS aan om veldpartijen aan te moedigen te experimenteren met nieuwe contractvormen en de lessen die hieruit volgen te gebruiken bij de verdere ontwikkeling van de bekostiging.

Tot zover het AR-rapport. Uit de aanbevelingen spreekt naar mijn idee vooral een waarschuwing om niet teveel haast te maken, zodat de methodologische problemen in voldoende mate het hoofd geboden kan worden voordat binnen het nieuwe model gebenchmarkt zou gaan worden tbv zorginkoop. De risico’s daarvan mogen nu duidelijk zijn. Van belang dus nogmaals om te onthouden dat het hier gaat om één van de drie zorgmarkten (zorginkoop) en de rol van ROM-b daarin. Maar omdat in de praktijk de uitvoering van ROM-b gekoppeld is (of hoort te zijn) aan ROM-k en ROM-i, ging het in de discussie daarna, tot verwarrens toe, over ROM als geheel. In de volgende aflevering de petitie en de reacties.

~AR

Advertenties

Geef een reactie

Vul je gegevens in of klik op een icoon om in te loggen.

WordPress.com logo

Je reageert onder je WordPress.com account. Log uit / Bijwerken )

Twitter-afbeelding

Je reageert onder je Twitter account. Log uit / Bijwerken )

Facebook foto

Je reageert onder je Facebook account. Log uit / Bijwerken )

Google+ photo

Je reageert onder je Google+ account. Log uit / Bijwerken )

Verbinden met %s