De Kwaliteitsslag – Deel 7

Op deze prachtige laatlentedag gaan we het hebben over kwaliteit en zonnige vergezichten, oftewel: hoe zit het eigenlijk met het ‘doorontwikkelen’ van ROM? Voor wie nu pas ingeschakeld heeft een korte recap: in de eerdere afleveringen hebben we de achtergrond van de recente ROM-discussie behandeld, de redenen om überhaupt dit middel in te schakelen, het rapport van de Algemene Rekenkamer dat de opmaat vormde voor de actie Stop Benchmark met ROM, de voornaamste punten van de discussie die volgde, en de privacykwestie die de aanlevering van ROM gegevens aan SBG juridisch problematisch maakt. Belangrijke feiten waren het onderscheid tussen het gebruik van ROM op het niveau van behandelaar en cliënt(en), ter ondersteuning van de behandeling (klinische ROM of ROM-k), ROM data gebruiken binnen een instelling om op beleidsniveau verbeteringen door te voeren (ROM-i) en ROM data gebruiken om de kwaliteit van zorg tussen instellingen te vergelijken en daarmee zorg in te kopen (benchmarking of ROM-b). We concludeerden dat er, ondanks de nodige pittige retoriek, redelijk wat overeenstemming blijkt te zijn over de status van deze verschillende vormen van ROM: ROM-k wordt breed als waardevol en toepasbaar gezien, ROM binnen de context van instellingen is al meer aan kritiek en twijfel onderhevig (o.a. m.b.t. de juiste keuze van ROM instrumenten), terwijl benchmarken met ROM op dit moment niet als haalbaar en verstandig wordt gezien. De meningen verschillen vervolgens over twee dingen: de perspectieven voor het alsnog mogelijk maken van benchmarken, en de implicaties van de huidige situatie voor wat er de komende tijd zou moeten gebeuren met ROM. Een kernbegrip in de stellingnames hieromtrent is “doorontwikkelen” van ROM, wat in zou houden dat de huidige praktijk van aanlevering van ROM data, misschien (afhankelijk van de uitkomst van de privacykwestie) met aangescherpte informed consent procedures en databeveiliging, zo door zou moeten gaan, terwijl de wetenschap vooral zijn werk moet doen om de problemen rond de validiteit van de uitkomsten op te lossen. Als je ‘doorontwikkelen ROM’ googlet, dan kun je een tijdje aan het lezen blijven. Wat ik vandaag dus wil doen, is kijken wat er nu bekend is over de vooruitzichten op deze punten.
Wat waren ‘validiteit’ en ‘betrouwbaarheid’ ook alweer? Validiteit gaat over de vraag of de uitslag die een meetinstrument geeft, ook echt de werkelijkheid van de wereld vertegenwoordigt. Stel ik ga kamperen en ik wil precies weten hoe warm het is op het stekkie waar ik zit, dus ik neem een thermometer mee. Als die structureel 5 graden te laag aangeeft, dan heb je meer kans dat ik verbrand, als ik tenminste alleen op die thermometer af ga. Als je zo’n structurele meetfout kent, dan kun je daarvoor corrigeren, iets wat ook bij vertekenende invloeden in de statistiek gedaan wordt. Wat ook kan, is dat de thermometer gevoelig blijkt voor mijn lichaamstemperatuur als ik hem vasthoud, en daarom wisselende uitslagen geeft afhankelijk van wie hem wanneer vastgehouden heeft. Mijn lichaamswarmte is dan een zogenaamde confounder. Als de thermometer intern niet goed werkt waardoor hij bij een gelijke buitentemperatuur telkens verschillende uitslagen geeft, of zo slecht te lezen is dat mijn kampeerburen en ik allemaal een verschillende temperatuur aflezen van de meter, dan is hij onbetrouwbaar. Met deze termen in de hand zijn populair-wetenschappelijke discussies over ROM iets makkelijker te volgen. We kunnen nu over naar de vraag: wat zijn de perspectieven voor ‘doorontwikkelen’ van ROM-b? Wat zou er dan moeten veranderen?

Een van de grootste problemen is dus de invloed van confounders. In een eerdere aflevering hebben we het hier al over gehad: stel je wil twee looptrainers met elkaar vergelijken, kijken wie de beste is, en je doet dat door ze elk 10 mensen te laten trainen, en dan een voor- en nameting te doen van hun loopprestaties, dan krijg je een vertekend beeld als de ene trainer een groep jonge atleten krijgt, en de ander een groep mid-life kantooraardappels. Wat je in feite wilt, is dat je een gelijk speelveld hebt voor en tijdens de wedstrijd. Om dat op te lossen ga je dus groepen op leeftijd indelen en vergelijk je dus tussen dezelfde leeftijdsklassen. Hetzelfde kun je dan vervolgens ook doen voor andere verstorende factoren, zoals bijvoorbeeld of iemand werkt, of iemand in de stad woont of op het platteland, wat het inkomen is, enzovoort. Maar je kunt je voorstellen, dat als je tien man traint, en je gaat zulke groepen maken, je al heel snel tot hele kleine groepen komt, en ook met een paar man over die nergens in passen. Dat betekent weer, dat je geen valide vergelijking kunt maken, want een groep van een paar man is niet representatief voor de totale groep mensen die je wel vertegenwoordigd wil zien in je onderzoek. Dit is dus één van de redenen waarom men afgesproken heeft om een ondergrens te stellen aan hoeveel ROM-gegevens verzameld worden; net als met verkiezingen geldt: hoe hoger de opkomst, hoe beter de uitslag de mening van de groep vertegenwoordigt.
Demografische factoren zoals leeftijd, inkomen, burgerlijke status, lichamelijke problemen, andere psychische problemen, of sociale problemen zoals huisvesting of werkloosheid, zijn bekende confounders: ze kunnen allemaal de uitkomst van de behandeling beïnvloeden. Dat betekent, dat als je als zorginstelling toevallig in een streek woont waarin veel van deze factoren de uitkomsten van de behandeling ‘omlaag drukken’, je met een even goede behandeling lager zult scoren dan een instelling zonder deze factoren. Een verwant probleem is de variatie die onder een diagnose schuil kan gaan. Wie een vaste lezer is van deze blog weet dat we eerder al de nodige aandacht besteed hebben aan de beperkingen en problemen rond de classificatie die we in de ggz in Nederland gebruiken, de DSM. Een daarvan is de verscheidenheid aan problemen die schuil kunnen gaan onder één DSM-diagnose. Omdat die classificaties tot stand komen op basis van het voldoen aan een x aantal verschijnselen uit een lijst van x + y aantal mogelijkheden (dus bijvoorbeeld 5 van de 9 mogelijke symptomen van depressie), krijg je onvermijdelijk dat problemen die zich op verschillende manieren manifesteren, met verschillende verschijnselen, toch voldoen aan dezelfde DSM-diagnose. En dan kun je ook weer dezelfde vraag stellen: stel je bent twee groepen van mensen met een depressie aan het vergelijken (dat je die subgroep eruit pikt is al één manier om confounding tegen te gaan), dan is het best mogelijk dat de ene groep veel meer symptomen x heeft, en de andere veel meer symptomen y. Dan is de vervolgvraag, of dat uitmaakt voor de behandelbaarheid en de kans op herstel van ‘de depressie’ tussen de beide groepen, want zo ja, dan heb je weer een ongelijk speelveld bij de vergelijking. En verder weten we dat de DSM de werkelijkheid van psychisch lijden in heel veel aandoeningen en aandoeninkjes opdeelt, waardoor het veel voorkomt dat mensen meer dan één aandoening geclassificeerd krijgen. En wat betekent het dan, als je naast je depressie nog kampt met verslaving, trauma, of psychose? Dat maakt waarschijnlijk wel iets uit voor de kansen op herstel. Dus daar moet dan ook rekening mee gehouden worden. Dit is nog maar een tipje van de sluier van de methodologische uitdagingen voor vergelijken op een goede, valide manier.

Nu zou je denken dat na de StopROM petitie, er een offensief zou komen waarin uitgelegd zou worden hoe men de methodologische bezwaren gaat aanpakken. Maar dat valt wat tegen. Bekijk deze blog maar eens van Gert Westert, nota bene lid van de Wetenschappelijke Raad van SBG. Je zou verwachten: die gaat met een klinkend verweer komen met specifieke antwoorden op bovenstaande problemen. Helaas staat daar niks over in zijn stuk, merkwaardig gezien zijn functie. Interessant om te lezen is ook de reactie van hoogleraar ROM Edwin de Beurs. Ik heb goed gezocht meen ik, maar in dit stuk niks gelezen over hoe de validiteitsproblemen zullen worden aangepakt. Des te opvallender is dit, omdat deze bezwaren ook al vijf jaar eerder opgetekend waren in het bekende multi-hoogleraren artikel. Als daar een respons op was, zou je toch verwachten dat prof. de Beurs de eerste zou zijn die te kennen en te vermelden. Maar nee. De vraag is dan waarop het vertrouwen in ‘doorontwikkelen’ van de ROM (in wetenschappelijk opzicht) gebaseerd is. Maar laten we vooral verder zoeken dan de blogosphere.

Het onvolprezen Tijdschrift voor Psychiatrie, dat gratis te lezen is online, heeft recent in haar aprilnummer aandacht besteed aan deze punten. In het artikel ‘Red ROM als kwaliteitsinstrument‘ wordt een aantal voorstellen gedaan voor het aanpakken van de problemen. Daar staat onder het hoofdje ‘ROM en benchmarking’ iets over ‘corrigeren voor de casemix door subgroepselectie’. ‘Casemix’, letterlijk het mengsel aan gevallen, verwijst dus naar de samenstelling van de patiëntengroep van de aanbieder en dus de mogelijke variatie die daar in zit. Subgroepselectie is dan, net als boven, het selecteren van groepen die tussen twee aanbieders goed of beter vergelijkbaar zijn. Dus alleen mensen vergelijken met angststoornissen, of depressies. Uit het artikel blijkt dat deze methode toepassen inderdaad leidt tot andere rangordes op vergelijkingslijsten, maar wat er niet bij staat, is of hiermee ook voor alle confounders gecorrigeerd is. Want een verandering in volgorde wil nog niet zeggen dat de veranderde versie de werkelijkheid goed vertegenwoordigt. Verderop in het artikel wordt een lans gebroken voor ‘het vergelijken van homogenere groepen patiënten’. Afijn, het geeft wel een idee over in welke richting de oplossing wordt gezocht.

Offline valt er gelukkig ook nog genoeg te lezen, en onlangs kreeg ik (full disclosure) van Edwin de Beurs tijdens een interessante discussiebijeenkomst over ROM het boek ‘Behandeluitkomsten‘ cadeau. Deze geeft een aardig beeld van de huidige stand van zaken weer in Nederland vanuit het perspectief van de ‘doorontwikkelaars’. Deel IV van het boek is gewijd aan de ‘Methodologische Uitdagingen’. Els Blijd-Hoogewys schreef een mooie introductie van de knelpunten, en Lisanne Warmerdam een hoofdstuk over de aanpak van confounding en selectiebias (ik laat de problemen over het betrouwbaar gebruiken van vragenlijsten en hoe te vergelijken met verschillende vragenlijsten even achterwege, omdat die iets eenvoudiger aan te pakken zijn. Toch leveren die ook weer fundamentele vragen op, daar komen we misschien in een vervolgaflevering op terug). Warmerdam geeft een paar heldere illustraties over hoe casemixcorrectie werkt, en voegt als waarschuwing toe: dat direct vergelijken van gecorrigeerde gegevens van aanbieder alleen werkt als de casemix van die aanbieders niet heel erg veel van elkaar afwijkt. Daarnaast bestaat de mogelijkheid dat niet alle relevante confounders bekend zijn, of voldoende geregistreerd of aangeleverd zijn. Dat is dus een beetje Rumsfeld in de ROM:

Goed, dit alles is beschreven vanuit het perspectief van auteurs die dicht bij SBG en ROM staan. Het beeld dat ontstaat, is dat er véél data nodig zullen zijn, zodat subgroepselecties kunnen worden gemaakt, en dat het project om voor confounders te corrigeren nog veel vraagtekens kent. Een aantal andere problemen is hiermee nog niet benoemd, bijvoorbeeld strategische verzameling van data door zorgaanbieders (vooral de tevreden klanten meten), eenduidigheid in het verzamelen, timing, enzovoorts. Eigenlijk is het zo, dat als je dit goed wil doen, het in feite de opzet zou moeten volgen van wetenschappelijk onderzoek. Doe je dat niet, dan zal er altijd kritiek mogelijk zijn. Ziehier het stuk van Delespaul en van Os waarin bondig deze kritiek wordt verwoord, en alternatieven geschetst worden.

Eén ding bedacht ik zelf al over deze doorontwikkeling: hoe zal dat gaan lukken voor kleine aanbieders? Kunnen die wel genoeg data leveren om subgroepen op een valide manier te selecteren? Dit punt werd inderdaad in ‘Behandeluitkomsten’ herkend, maar een oplossing was er (nog) niet. Dus deze aanpak zal wel werken voor de grote aanbieders, maar lastig zijn voor de kleintjes. Dat geeft dan weer een volgend probleem, want sommige grote instellingen zijn zo groot dat ze in hun regio, in elk geval voor sommige doelgroepen, monopolisten zijn. Dan is al helemaal de vraag hoe die selectieve zorginkoop zou moeten werken. Het systeem vraagt dan eigenlijk tegengestelde dingen aan de instelling: kleiner worden om de monopolie te doorbreken, en groter worden ten behoeve van de ROM. Ingewikkeld! Concluderend is mijn indruk dat er nog veel onduidelijk is over het perspectief van doorontwikkelen, dat het opvallend is hoe weinig daarover in de tamelijk publieke discussie geschreven wordt, maar dat er nog steeds overeenstemming is over twee dingen: ROM-k ja, ROM-b nee, althans, voorlopig.

Dat brengt mij bij een tweede, voorlopige, conclusie: als hierover zoveel overeenstemming is, dan zou het logisch zijn, als de sturende prikkel van de zorgverzekeraar verplaatst wordt van het aanleveren van benchmarkdata naar het integreren van ROM-k in de behandelpraktijk. Op dit moment, zo betoogt SBMR, wordt ROM-k verdrongen door ROM-b. Het zou representatief zijn voor de huidige discussie als nu ROM-k wordt geprioriteerd, door behandelaars, instellingen, en verzekeraars, terwijl ondertussen tijd en ruimte gelaten wordt voor het verder bestuderen en ontwikkelen van benchmarking. Daarbij is echter ROM niet the only game in town. Volgende keer dus meer over hoe de toekomst er ook uit zou kunnen zien. In deze week waarin de eens verguisde Corbyn Groot-Brittannië op zijn kop zette is het wijs dat we ons realiseren dat de werkelijkheid ons telkens weer kan verbazen. So keep your mind open, but don’t let your brain fall out.

~AR

De Kwaliteitsslag – Deel 6

En toen was het spel op de wagen! Eind maart schreef minister Schippers over de aanlevering van ROM-data aan SBG: “Met de uitspraak van de Autoriteit Persoonsgegevens is duidelijk geworden dat pseudonimiseren geen anonimiseringmethode is […] Voor de verwerking van (dubbel) gepseudonimiseerde gegevens is dus een wettelijke grondslag nodig op basis van de Wet bescherming persoonsgegevens (Wbp). Het verkrijgen van expliciete toestemming van de patiënt is een van de grondslagen. Omdat het toestemmingsvereiste sinds de genoemde uitspraak van de AP de enige wettelijke grondslag is voor ROM, ben ik in overleg met partijen en de AP. Ik wil daarbij bezien of nadere wetgeving nodig is.” Wie de discussie een beetje gevolgd heeft, weet dat dit een verreikende uitspraak was: het betekende, dat een wettelijke basis voor de aanlevering naar en opslag van ROM gegevens bij SBG, ontbrak. Dit had een aantal gevolgen. Na enig overleg kwamen er berichten vanuit diverse ggz-werkgevers- en beroepsorganisaties, met het advies de aanlevering aan SBG op te schorten, tot het juridisch vraagstuk opgehelderd was. Vrijwel tegelijk verschenen stukken rond de (juridische en praktische) implicaties van deze stand van zaken. Nu het protest tegen ROM-benchmarking ook real-world gevolgen kreeg, verscherpte de toon van de ROM-publicaties, met her en der onaangename pogingen de druk op te voeren of deelnemers weg te zetten. ‘Sound and fury, signifying nothing,’ zoals de bard al zei. Interessanter is het om eens wat nauwkeuriger te kijken naar privacy, wetgeving, en ROM.

Nou weet ik, dat na de vorige zin al één derde van de lezers weggezapt heeft. Dus fijn dat u tenminste gebleven bent! Lezen over de juridische aspecten van privacy is voor velen ongeveer even spannend en urgent als je pensioenwijzer doorspitten, en we zijn inmiddels helemaal geconditioneerd om de lappen tekst over privacy op onze apps en op internet snel door te klikken. Eigenlijk maken we er ons alleen maar druk om als Zembla een schandaal door onze strot ramt, en dan zeggen we: ‘poeh poeh’. Het is tekenend dat de namen die in onze geheugen gegrift zijn betreffende de grootste privacy-schandalen van de laatste tijd (Bradley Manning, Edward Snowden, Julian Assange) die van de klokkenluiders zijn (en ook allemaal gecriminaliseerd) en niet van officials die data onwettig verzameld en opgeslagen hebben. Dit wijst ons er ook op, dat overheden niet als hoeders van uw privacy gezien kunnen worden, en daarbij afhankelijk van het belang de grenzen van de wet kunnen opzoeken en soms overtreden. Uit een recente Canadese studie bleek zelfs dat de overheid daar een grotere bedreiging van de privacy van burgers vormt dan bedrijven. Hoe dan ook, in ons semi-private zorgstelsel gaat het om beide, waarbij we niet moeten vergeten dat het niet alleen overheid en zorgverzekeraars zijn die de data in bezit hebben, maar ook de zorginstellingen, en de zogenaamde ‘Trusted Third Parties’. Aan de andere kant van de lijn gaat het om patiënten, maar ook om zorgverleners. Immers, benchmarking is vooral ook bedoeld om hún praktijken aan het licht te brengen (speciaal voor de ggz wordt de huidige situatie nogal eens dramatisch als ‘black box’ aangeduid, een woord dat inmiddels zijn weg gevonden heeft naar de StopROM bingo. Meer daarover een andere keer). Net als bij andere privacykwesties is het dan verleidelijk om te suggereren dat mensen die zich om privacy druk maken iets te verbergen hebben. Hier een mooie TED talk waarin dit argument behandeld wordt:

Glenn Greenwald benadrukt hierin onder andere het belang van een vrije, vertrouwde plek waarin je je onbespied weet, om vrijuit te kunnen spreken. Die vrijheid is van groot belang voor de zorgprofessional om allerlei redenen, onder andere omdat soms de belangrijkste diagnostische informatie het meest schaamte- of angstbeladen is, maar wetende hoe groot de rol van maatschappelijk stigma en zelfstigma is bij mensen die lijden aan psychische aandoeningen, is het belang van een veilige, vertrouwde ruimte cruciaal. En zoals Greenwald opmerkt, als je de camera op je gericht weet en weet wanneer die aan en uit staat, dan heb je nog controle, maar juist als je niet weet wanneer je in de gaten gehouden wordt, raak je je onbevangenheid kwijt, met angstig, conformistisch gedrag tot gevolg. Lees hier het relaas van Judica Berkelaar over de wijze waarop met haar en haar gegevens werd (en wordt) omgegaan.

Maar hoe zit het nou met die ‘dubbele pseudonimisering’? (Ik dacht eerst dat dan je schuilnaam iets met Baden-Baden zou zijn, of van Gelderen Jansens-Koeiezoon o.i.d.) Hiervoor kunnen we terecht bij de blogsite van Wim Jongejan, huisarts en ICT/EPD/LPD/privacy-bolleboos. Hier legt hij uit, met link naar de Europese wetgeving, waarom dubbelgepseudonimiseerde gegevens als persoonsgegevens beschouwd kunnen worden, en wat dan de rol van de Autoriteit Persoonsgegevens zou moeten zijn. In deze blog legt hij uit hoe het zit met de ROM-data. En hier leest u hoe wat pseudonimisering behelst (en hoe die teruggedraaid kan worden). Conclusies o.a.: de data in het SBG-databank kunnen tot de persoon herleid worden, het is niet te achterhalen welke koppelingen met welke databases hebben plaatsgevonden, en met de unieke identificerende codes zouden cliënten die dat willen hun data kunnen laten verwijderen. Maar ja, dan moeten ze wel ook wéten dat hun gegevens daar liggen, en dat ze dat mogen doen. In aansluiting op het antwoord van de minister en de adviezen van diverse ggz-instituten om niet aan te leveren, kwamen er in een latere fase berichten uit waarin gesteld werd dat aanlevering door kon gaan mits met expliciete toestemming van de patiënt. Nou is dat laatste een wat beknopte opvatting van informed consent en de privacywetgeving mbt persoonsgegevens. Want als dus de wet op persoonsgegevens van toepassing is, wat betekent dat dan? Lees hier meer over de Wet Bescherming Persoonsgegevens.

Maar nou komt er nog wat leuks, want Europa heeft ook niet stilgezeten. En zoals u weet is Europa sinds de deconfiture van Wilders, le Pen en Trump weer helemaal hip, dus we doen er goed aan te lezen wat daar, eh ik bedoel, hier (wir sind alle Europäer!) bedacht wordt. Kijk hier maar eens even, en dan leest u -ik verzin dit niet- letterlijk de slogan van de Brexiteers: ‘take back control‘ – of your personal data!!

Image result for take back control

Hier een overzichtelijke site met wat bedrijven moeten doen. Ik ben geen expert, maar ik denk dat deze regels in elk geval voor zorgbedrijven zullen gelden als het om persoonsgegevens gaat. Wilt u echt het naadje van de kous weten, lees dit dan even door, of liever laat uw zoon die rechten wil studeren dat doen en overhoor hem dan.

Er staan een aantal dingen in die voor de hand liggen, zoals duidelijke informatie (informed consent) en toestemming, maar ook nieuwe interessante zoals het recht van de ‘klant’ om toegang te hebben tot zijn of haar data, dat de data voor heldere doelen verzameld mogen worden en niet langer opgeslagen mogen worden dan voor die doelen nodig is. Allemaal beste gewone dingen, wat ligt immers meer voor de hand dan toestemming vragen voor uitvragen, opslaan en doorgeven van gegevens? Nou, daar zitten wat addertjes onder het gras, want zorgbedrijven hebben dit natuurlijk zo efficiënt mogelijk aangepakt, en zijn (nog) niet bedacht op deze Europese regels, althans, ze zijn er (al hadden ze dat wel kunnen weten) niet vanuit gegaan dat het persoonsgegevens betrof. Dus -en de minister schreef dit al- werden zorgen over een nieuwe golf bureaucratie geuit, en het risico dat het percentage geROMden te laag zou worden, waardoor de juist zo gewenste ‘doorontwikkeling’ van de validiteit gevaar zou lopen. Daar spelen nog twee dingen, namelijk het gegeven dat als er echte informed consent wordt toegepast op de ROM, veel minder mensen bereid zijn hun data te delen (zie o.a. onderzoek Maastricht University) en dat het nogal de vraag is, of er sprake kan zijn van vrij gegeven informed consent, als er druk op patiënten wordt gelegd om toestemming te geven. Dat is bijvoorbeeld het geval als in de toelichting op de ROM vragenlijsten aan de patiënt wordt gesteld dat de vragenlijst ingevuld moet worden omdat anders de zorg niet vergoed wordt, of dergelijke teksten (verband houdend met de verplichting een quotum aan ROM’s aan de verzekeraar aan te leveren). De patiënt kan zich dan verplicht voelen toestemming te geven, en wordt in elk geval in een minder vrije positie gebracht. Met de Europese wetgeving in de hand zou hierover veel meer duidelijkheid en eenduidigheid moeten komen voor patiënten en behandelaars.

Inmiddels is het zo, dat er vooral onduidelijkheid heerst. Minister van Rijn suggereerde in de beantwoording van Kamervragen dat deze regelgeving omzeild zou kunnen worden met een beroep op het algemeen belang. Een noodgreep, zo lijkt het, om uit de klauwen van de Europese wetgeving te blijven en de trein zonder al te veel tussenstops te laten doordenderen. Ondertussen weten veel behandelaren, patiënten, en familieleden, en misschien ook de spelers in dit debat zelf niet, wat nu de juiste juridische stand van zaken is. Wel of niet informed consent? Hoe dan? Met een handtekening in het EPD? Hoe zit het met al die ICT systemen die opgetuigd zijn rond ROM? Tegen het licht van de nieuwe wetgeving en alle betrokken partijen is het misschien niet eens zo raar dat het de laatste tijd wat stil blijft. Maar inmiddels heeft de SBMR-groep besloten om e.e.a. aan de rechter voor te leggen, zodat er in elk geval op een aantal punten wat meer duidelijkheid komt.

Ik vermoed dat dit nog wel even een tijdje een wat mistig gebied zal blijven, maar dat is niet zonder risico voor patiënten, voor behandelaren, en voor zorginstellingen. In eerste instantie is dit een juridische discussie, en daarmee niet mijn forte. Dus: we houden u op de hoogte, maar volgende keer keren we terug naar waar het allemaal om begonnen was: KWALITEIT!!

Hier nog een aantal handige sites over privacy en de zorg:

https://www.privacybarometer.nl/
https://platformburgerrechten.nl/
http://www.kdvp.nl/

Happy Pentecost!

~AR

De Kwaliteitsslag – Deel 5

In de voorgaande aflevering hebben we de petitie StopBenchmarkMetROM en de eerste reacties behandeld. Opvallend was dat er best wat overeenstemming leek te zijn: zowel over de waarde van klinische ROM als over de problemen rond benchmarking met ROM. Twee twistpunten kwamen naar voren: de perspectieven op verbetering van de methodologische problemen rond benchmarking, en de ‘koppelverkoop’ van ROM: er lijkt een -impliciete-  veronderstelling bij de ‘pro-ROM’ debaters dat je alleen pro of tegen ROM tout court kunt zijn, en niet, zoals SBMR, contra ROM-benchmarking (in de huidige toestand). We hebben de beroepsverenigingen en GGZ NL nog niet gehad, dus die volgen nu, waarna we in zullen gaan op de Kamervragen en de reactie van de minister, met de opmaat voor de privacy problematiek. Eerst dus: de verenigingen.

We beginnen bij een omvangrijke groep: de psychologen. Die hebben (historische redenen) nogal wat verenigingen, ziehier een lijst die nog niet eens compleet is. Als graadmeter voor politieke invloed is één optie om te kijken naar wie de Bestuurlijke Akkoorden heeft mede-ondertekend, hier de meest recente. Ik link gelijk naar de officiële standpunten van de LVVP en P3NL over de ROM-kwestie. Over P3NL moet u trouwens wel even weten dat dit een federatie is van 9 psychologen-beroepsverenigingen en daarmee 20.000 leden vertegenwoordigend. Ziehier. Om met hun te beginnen: ook zij zijn het op de inhoud eens met de petitie: in de huidige staat kan niet met de gegevens gebenchmarkt worden. De crux zit in de volgende paragraaf:

“Het is op dit moment namelijk nog onvoldoende mogelijk om behandelresultaten te corrigeren voor verschillen in casemix. Dit ‘casemix’-probleem is waarschijnlijk nooit helemaal oplosbaar, maar op termijn wel goed genoeg om op basis van ROM-gegevens vergelijkbare behandelaars of instellingen die onvoldoende presteren te identificeren. Wel kunnen benchmarks nu al gebruikt worden als uitgangspunt voor discussie tussen behandelaars, afdelingen en instellingen over de aanpak en kwaliteit van hun behandeling. Benchmarking als kwaliteitsinstrument past in een meet-bespreek-en-verbetercyclus.”

Hier wijken de opvattingen. P3NL stelt dat het casemix-probleem (zie afl. 1 & 2) goed genoeg op te lossen is op termijn om matig presterende instellingen te identificeren. Dit argument wordt dus herhaald gebezigd, maar zelden onderbouwd. Want we zagen eerder dat het AR-rapport juist aangaf weinig perspectief op verbetering te zien. Dit punt wordt dus genegeerd, lijkt het.

Een ander argument is eveneens opvallend: “Zonder ROM is gepast gebruik van zorg en transparantie over de effectiviteit niet mogelijk.” Dit is aantoonbaar onjuist, er zijn immers wereldwijd vele andere methoden voor het bereiken van transparantie (afhankelijk van hoe je dat definieert) en het ‘passend’ houden van zorg voorhanden. Hier wordt een valse dichotomie en ook iets van een angstbeeld geschapen: zonder ROM geen transparantie. Het is een ‘TINA’ argument dat ook over de DSM is ingezet: There Is No Alternative. Tot die er wel is.

Dezelfde soort argumentatie wordt door Jeroen Muller, bestuurslid P3NL, vicevoorzitter NIP, en voorzitter Raad van Bestuur van Arkin in een blog voor Skipr gebruikt.

“Er is sterke kritiek op het gebruik van de ROM. De kritische vragen gaan over validiteit, privacy, mogelijkheid tot benchmarken, administratieve druk, de match tussen instrument en stoornis, het afrekenen door zorgverzekeraars en mogelijk nog wat kleinere issues.

Het alternatief is niets doen en gewoon verder gaan met zoals we het nu doen.”

Het is niet helemaal een juiste weergave van de SBMR bezwaren, maar het punt is dat als alternatief voor ROM…. niets doen wordt voorgesteld. Wederom een valse dichotomie, en ook wat men noemt een falen op het criterium van de ‘principle of charity‘, waarbij je in een debat het argument van je tegenstander zo accuraat mogelijk moet weergeven (vandaar dus ook dat ik hier de moeite neem om de stukken van voor- en tegenstanders ongefilterd aan te halen). Dhr. Muller brengt dus niet de alternatieven naar voren, en schurkt tegen een stroman argument aan, want hij impliceert hiermee dat SBMR liever niks zou doen aan transparantie etc. Verderop nog een valse dichotomie: “In plaats van klagen over de ROM, praten we weer over onze professie.”

Dhr. Muller stelt voor om de knelpunten diepgaand, met elkaar, te onderzoeken, en onderwijl de afspraken in de Agenda te honoreren. Dat laatste is een extra argument: afspraak is afspraak. Dat klinkt sterk. Ware het niet dat men natuurlijk ook wel eens van akkoorden afwijkt, beredeneerd, net als van richtlijnen. Je kunt wel zeggen: daar moet je dan goede redenen voor hebben. Maar dan ben je weer terug aan het begin van de discussie. Afijn. Wat vond de minister er eigenlijk van? Die kreeg een aantal vragen van SP-kamerlid Lilian Marijnissen over de kwestie, ziehier haar antwoorden. Interessant om te lezen! Ook de minister onderschrijft allereerst het belang van de klinische ROM. Wat zegt ze over benchmarking?

“Zoals ik al aangaf in mijn reactie op het rapport van de Algemene Rekenkamer zullen partijen steeds moeten (blijven) nagaan en benoemen waar de grenzen van het zinvolle gebruik van ROM-gegevens liggen, wat de zeggingskracht is en wat de tekortkomingen zijn van de ROM-informatie.”

Zo kennen we onze liberale minister! Maar toen kwam er een addertje onder het gras. Terwijl de wetenschappers allemaal over validiteit, casemixes en delta-t’s aan het bakkeleien waren, was er nog een vraagje over privacy en toestemming. De ROM gegevens worden namelijk ‘dubbel gepseudonimiseerd’ aan het SBG aangeleverd, en dat klinkt best pittig, maar het is dus niet anoniem.

“Met de uitspraak van de Autoriteit Persoonsgegevens (AP) is duidelijk geworden dat pseudonimiseren geen anonimiseringmethode is, maar een beveiligingsmaatregel om privacyrisico’s te verkleinen. Voor de verwerking van (dubbel) gepseudonimiseerde gegevens is dus een wettelijke grondslag nodig op basis van de Wet bescherming persoonsgegevens (Wbp). Het verkrijgen van expliciete toestemming van de patiënt is een van de grondslagen.”

Hiermee werd de discussie in één klap verengd tot de privacykwestie, wat zelfs uitliep op het advies om de aanlevering van ROM aan SBG op te schorten. Meer hierover in de volgende aflevering, waarin cliënten het adagium gingen volgen: ‘Don’t get mad, get angry!’

~AR

De Kwaliteitsslag – deel 4

In de vorige afleveringen zijn we ingegaan op de ontwikkeling en het belang van ROM in de ggz, en zijn we dieper ingegaan op het rapport van de Algemene Rekenkamer over hoe ROM in de afgelopen jaren functioneert.

Een belangrijk onderscheid, dat in het rapport gemaakt wordt, halen we nog eens aan, namelijk de doelen die ROM recent gediend heeft:

Vlnr gaat het hier om ROM-k (klinisch), Rom-i (institutioneel benchmarken) en ROM-z (benchmarking tbv zorginkoop)

Kort na het verschijnen van het rapport startte een gemêleerde groep betrokkenen in de ggz (psychiaters, psychologen, ervaringsdeskundigen, verpleegkundigen) een petitie
“Stop Benchmark met ROM” (SBMR), met de volgende tekst:

Routine Outcome Monitoring (ROM) is het regelmatig invullen van vragenlijsten, bedoeld ter ondersteuning van de behandeling.
Al in 2012 werd door onder meer alle acht kernhoogleraren psychiatrie gewaarschuwd voor grootschalige invoering van deze ROM om de kwaliteit van behandelingen te vergelijken. Daarvoor is het totaal ongeschikt. Dit is nog weer eens bevestigd door een onafhankelijk rapport van de rekenkamer van 26 januari 2017.
Helaas is hier niet naar geluisterd. Het is nu zelfs een wettelijke verplichting en zorgverzekeraars geven boetes als er onvoldoende ROM-gegevens worden aangeleverd. Het verkrijgen en verwerken van al die gegevens kost naar schatting 30 miljoen per jaar.
ROM was oorspronkelijk bedoeld voor het verbeteren van de individuele behandeling. Dit gebruik is verdrongen door het moeten leveren van ROM-gegevens aan de stichting benchmark GGZ. Privacygevoelige informatie wordt op grote schaal verstrekt zonder toestemming van de patiënt voor iets waar hij niets aan heeft.
Natuurlijk zijn we voor het meten van de kwaliteit. We zijn alleen tegen een verkeerde manier om de kwaliteit te meten. ROM is dáárvoor niet geschikt.
Door de petitie te ondertekenen geef je aan een eind te willen aan deze geldverslindende, zinloze en bureaucratische praktijk.”

Hier de site.

Disclaimer: Ik ondertekende deze petitie, omdat ik overtuigd was door de combinatie van de reeds genoemde kritiek van de hoogleraren, de inhoud van het rapport zelf, en het m.i. ontbreken van een perspectief ter verbetering.

Uit bovenstaande tekst blijkt dat de petitie zich vooral richt op ROM-z, waarbij ook kritiek op ROM-i geleverd wordt, terwijl ROM-k onderschreven wordt. Men stelt dat omdat de nadruk zo ligt op ROM-i en ROM-z, ROM-k bedreigd wordt. Daarnaast zijn er zorgen mbt informed consent en privacy, een punt dat niet een aandachtspunt was van het AR-rapport. Het bovengenoemde onderscheid is voor de discussie cruciaal, wat ook zal blijken uit de reacties, waarbij de petitie nogal eens als een afwijzing van alledrie de vormen van ROM geportretteerd is. Dat de site van de petitie oorspronkelijk stoprom.com heette, schiep wat dat betreft onduidelijkheid. Inmiddels is de site omgedoopt tot stopbenchmark.com.
Binnen anderhalve week werd deze petitie meer dan 4000 keer ondertekend: ziehier. De petitie werd tevens door een reeks hoogleraren gesteund, patiëntenorganisaties, beroepsverenigingen, en privacy-waakhonden. Zie hier.

Een eerste reactie vanuit de SBG (Stichting Benchmark GGz) is te lezen bij zorgvisie. Hier de tekst:

‘De SBG laat weten het iets genuanceerder te zien. “De gedachte was: de zorgkosten rijzen de pan uit, we moeten iets doen om dat tegen te gaan en daarvoor is er meer transparantie nodig wat betreft de kosten. Hoeveel kost een behandeling? Hoeveel levert hij op? Dat speelt natuurlijk niet alleen in de ggz, maar ook bij andere branches in de zorg. De Algemene Rekenkamer richtte zich in het rapport vooral op de inzet van Rom-gegevens bij de uitkomstenbekostiging. Dus dat instellingen die betere kwaliteit leveren of hun kwaliteit hebben verbeterd meer geld krijgen. Maar zover zijn we nog niet; dit stond altijd al gepland voor na 2020’, zegt algemeen directeur Maarten Erenstein. Volgens hem kan Rom, mits het goed wordt toegepast, juist helpen om de kwaliteit te verbeteren. Hij denkt dat er vooral meer transparantie in de ggz kan komen door de Rom-gegevens, een punt dat ook terugkomt in de Agenda Gepast Gebruik en Transparantie die de ggz zelf opstelt. ‘Er zijn genoeg voorbeelden van instellingen die dankzij Rom aan hun kwaliteit zijn gaan werken. Zo is er een grote instelling die uit de Rom-gegevens opmaakte dat ze niet goed scoorden op de depressiebehandeling. De bestuurder is toen met een instelling gaan praten die op dit gebied juist wel goed scoorde en heeft aan de hand daarvan dingen veranderd.”‘

Korte analyse: allereerst wordt in de inleiding gesuggereerd dat er een (relatief) gebrek aan nuance te vinden is in de argumentatie van de petitie. Dit wordt echter niet gespecificeerd. Vervolgens wordt het schrikbeeld van onbeheersbare zorgkosten opgeworpen, en gekoppeld aan transparantie over kosten, en gekoppeld aan een prijs-kwaliteit beeld. Dit argument treft geen doel, immers, op dit punt bestaat geen verschil met wat in de petitie geschreven werd. Het tweede argument is het bezwaar tegen ROM-z. Het tegenargument is: zover zijn we nog niet. M.a.w. waartegen maakt de petitie eigenlijk bezwaar? SBMR reageerde hierop dat er praktijkvoorbeelden zijn waarin dit wél al gebeurt. Daarnaast is dit niet een antwoord op de inhoudelijk-methodologische kritiek dat ook in het rapport staat, en vraagt om een perspectief, terwijl er nu al wel een flinke investering in tijd en geld is gedaan met dit doel (men zou kunnen zeggen: wat is de prijs-kwaliteit verhouding van de investering in ROM?). Transparantie wordt als inherente waarde gepresenteerd, en dus ook aan ROM gekoppeld. Opnieuw een argument zonder doel, want SBMR betwist dus juist dat ROM transparantie oplevert. Dit simpelweg stellen is geen argument. Tenslotte wordt verwezen naar voorbeelden van ROM-i. Hier wordt gesteld dat instellingen dankzij ROM aan hun kwaliteit zijn gaan werken. Dit zal vast zo zijn, de vraag is of dit zonder ROM niet ook had gekund, met een ander instrument of set instrumenten. Een tweede vraag is of de vergelijking die gemaakt is wel valide is geweest. Hoe weten we eigenlijk of de veranderingen die kennelijk zijn doorgevoerd, ten goede zijn geweest, als de validiteit van de maten betwist wordt?

Ook Zorgverzekeraars Nederland reageerde snel (31-1-2017): hier

Nieuwe argumenten: het rapport doet geen recht aan inspanningen van betrokken partijen. Dit is meer een teken van adhesie dan een argument, maar wel relevant, zeker waar Kwaliteitsstatuut en (komende) zorgstandaarden genoemd worden. Hoe verhouden die zich eigenlijk tot ROM-i en ROM-z? We weten het nog niet.
Daarna spreekt ZN SBG kennelijk tegen: benchmarken kan wel, zij het niet op individueel maar op populatieniveau. Helaas geen onderbouwing of referentie hiervoor. In een volgende aflevering zullen we daarop ingaan. De eerste experimenten gaan binnenkort kennelijk van start. ZN maakt een onderscheid tussen individu en populatie dat in het rapport niet wordt gemaakt, en de meeste methodologische bezwaren (zie afl. 3) zijn onafhankelijk hiervan. Dit roept dus vragen op, tegelijk wordt het argument van SBG mbt de actualiteit van het bezwaar onderuit gehaald. Tenslotte is de opmerking mbt het huidige bekostigingssysteem opvallend, namelijk dat deze ‘onvoldoende werkt’; voor ondergetekende een klein ‘I told you so’-momentje, maar net als alle mensen die nu gelijk krijgen met alle waarschuwingen over de overheveling van de jeugdzorg en jeugd-ggz naar de gemeenten, levert dit gelijk krijgen mij nul tevredenheid op. Een herhaling in de argumentatie is overigens dat ROM functioneert als ‘begin van een gesprek’.

Na SNG en de verzekeraars, eerst het woord aan patiëntvertegenwoordigers, als eerste de LPGGZ (inmiddels MIND-LPGGZ), de koepel van, voor en door cliënten- en familieorganisaties in de ggz: ziehier

Allereerst wordt kritiek geleverd op de titel ‘stoprom’ als populistisch. Wanneer dit label inderdaad voor de inhoud wordt gehouden, is dit een steekhoudend argument. SBMR heeft zich dit aangetrokken en mede daarom ook de site aangepast. Maar wie even verder leest, weet dat SBMR niet ROM als geheel overboord wil gooien, zoals ‘het kind met de badwater weggooien’ suggereert. Ook dit is een terugkerend argument: als je bezwaar hebt tegen ROM-z (en tegen bepaalde vormen van ROM-i), dan betekent dat, dat ROM-k óók in gevaar komt. Dit argument is ook afhankelijk van de context, want gezien de drie doelen van ROM, is het de vraag of er nu sprake is van een soort koppelverkoop: je doet of alledrie wel, of alledrie niet. Wat was nou de situatie in jan 2017? Als het gaat om afspraken en verplichtingen, lag de nadruk op aanleveren aan SBG (en in tweede instantie, ook aanleveren tbv de voorgenomen keuzewebsite voor patiënten en familie). Zie ook de Agenda voor gepast gebruik, het actuele zorgbrede akkoord voor de ggz. Tegelijk is er in de agenda wel degelijk oog voor de prioriteit van ROM-k: “ROM moet worden doorontwikkeld met toevoeging van alle aspecten van positieve gezondheid en herstel en primair tot doel hebben de behandeling te ondersteunen.” Ik denk dat helder is dat de financiële prikkels en de beleidsafspraken tot nu toe gericht zijn op aanlevering, en dus op ROM-b/z.

MIND herhaalt de behoefte aan transparantie, en wie de geschiedenis kent van de cliëntenbeweging in Nederland weet dat zij het grootste recht van spreken hebben wat dat betreft. Ze onderstrepen het belang en het nut van ROM-k. Tenslotte betreuren ze de ervaring van in elk geval een deel van professionals om ROM te zien als een extern opgelegd verplicht nummer (zie ook dit rapport van het Trimbos), en moedigen ze ons aan mee en verder te denken. Een uitnodiging waar SBMR op is ingegaan tijdens een recente bijeenkomst bij MIND.

In april organiseerde het LOC Zeggenschap in Zorg (Landelijk Overleg Cliëntenraden) een bijeenkomst over ROM. Ziehier het verslag

De argumentatie die er te vinden is, is grosso modo een herhaling van wat op de SBMR site staat. Het LOC heeft dan ook de petitie ondersteund. Nieuw is de verbinding tussen het prioriteren van ROM-k (net als MIND) en de bescherming van de vertrouwelijkheid van het behandelcontact in de conclusies.

Zo, genoeg voor vandaag. Ik kan me voorstellen dat u zegt: nou, was dat alles? U had misschien gehoopt op een pittige woordenstrijd waarin men elkaar voor rotte ROMvis uitmaakte. Het was toch weer eens zo’n klassieke ggz-ruzie, als het Gallisch dorp?

Image result for asterix fight

Hier wreekt zich volgens mij de echokamer van sociale media. Het lijkt dan al snel heel wat. Niets van dit alles, in deze keurige documenten is opvallend veel overeenstemming. We zullen de komende afleveringen zien er inderdaad verrassend genoeg meer is wat de deelnemers bindt… Maar ook een paar vinnige struikelblokjes, en een of twee verrassende wendingen die de zaak op zijn kop zetten. Wordt vervolgd!

~AR

De kwaliteitsslag – deel 3

In de vorige delen hebben we de aanloop naar ROM bekeken, en de rollen die het zou moeten innemen in de zorg en het zorgstelsel zoals beschreven in het AR-rapport dat de directe aanleiding vormde tot de petitie ‘Stop ROM als benchmark’. Voor de daaropvolgende discussie is het onderscheid in de 3 doelen van ROM nogal belangrijk: ROM als klinisch middel ter verbetering van de individuele behandeling (ROM-k), ROM voor intern institutioneel gebruik ter verbetering van behandelprogramma’s, -processen of -strategieën door vergelijk met andere delen van hetzelfde instituut of met ander instituten (ROM-i) en tenslotte ROM als benchmark, om kwaliteit van zorg tussen aanbieders te kunnen vergelijken, ten behoeve van zorginkoop (ROM-b).

Wat staat er nu in het AR-rapport over ROM?

Over ROM-k en ROM-i zegt men vrij weinig, behalve dat de uitkomsten per definitie subjectief zijn.

Over ROM-b wordt een aantal zaken benoemd die de bruikbaarheid van ROM als benchmark beperken:
– de onvolledigheid van de gegevensverzameling. Dit heeft te maken met de vraag, of de data die je hebt wel representatief zijn voor wat een zorgaanbieder doet en wie men behandelt. Is dat niet het geval dan kan er sprake zijn van selectiebias, waardoor de data een vertekend beeld geven van de realiteit. Men kijkt dus van hoeveel procent van alle behandeltrajecten die verricht worden, voor- en nametingen worden gedaan. In 2015 zat men landelijk op 47%. De zorgverzekeraar heeft een financiële prikkel gesteld juist om dit punt te bevorderen.
– zorgaanbieders zijn niet zomaar vergelijkbaar. Een redelijke analogie is met wiskunde: de teller en de noemer. Het verschil in score tussen einde en begin behandeling is de teller, en uit de scores blijkt dat er aanzienlijke verschillen tussen zorgaanbieders bestaan. Wat niet meteen duidelijk is, is de noemer: alle factoren behalve de geboden behandeling, die de uitslag hebben kunnen beïnvloeden. Weet u nog, die rugzak met aardappels die een van de lopers mee torste in deel 1? Voor de ggz zou dit bijvoorbeeld kunnen zijn, dat de ene aanbieder patiënten heeft uit een socio-economisch gunstigere demografische groep dan de ander, en omdat dit (niet voor alle maar wel voor sommige) aandoeningen invloed heeft op de behandelbaarheid, betekent dat, dat een betere uitkomst bij die behandelaar niet noodzakelijk met de behandeling te maken heeft, maar -wellicht- met de gunstige omstandigheden. Voor dit soort confounders moet gecorrigeerd worden, wil je op goede gronden gaan benchmarken. Dat is de laatste tijd gedaan door de zogenaamde ‘zorgvraagzwaarteindicator’ (dat is inderdaad een flinke woordscore). Wat die indicator dus probeert, is om na te gaan welke veranderingen in een behandeling puur op het conto van de patiënt (en diens omstandigheden dus) te schrijven zijn ipv op de behandeling. De AR geeft aan dat de ‘zeggingskracht’ van deze indicator nog zeer beperkt is, en dat er geen zicht is op versterking van die zeggingskracht. Een tweede manier om voor de noemer te corrigeren, is door zgn. ‘casemixcorrectie’ toe te passen. Daarbij ga je binnen de patiëntpopulatie een subgroep maken van mensen met dezelfde hoofddiagnose, bijvoorbeeld een angststoornis of een depressie, en ga je binnen die geselecteerde groep zoeken naar confounders. Dat is makkelijker vanwege de kleinere groep die bij voorbaat al meer met elkaar gemeen heeft. Dit gaat al beter, maar nog steeds onvoldoende, volgens de AR, om alleen op deze basis conclusies te kunnen trekken. En daarnaast ontstaat een praktisch probleem: om zo’n selectie te kunnen maken, heb je veel patiënten nodig. Bij kleinere aanbieders lukt dat niet en kan deze methode dus niet toegepast worden.
– de vertaling van kwaliteit als ‘gemiddelde behandeluitkomst’ geeft een smalle invulling van het begrip kwaliteit. Behandeldoelen hoeven echter niet alleen hierop gericht te zijn, en daarnaast meet dit relatief korte-termijn herstel, terwijl juist in de ggz lange-termijn herstel van belang is. In volgende afleveringen zullen we uitgebreider op dit punt ingaan.
– als de informatie gevolgen heeft voor de zorginkoop, moet voldaan worden aan hoge eisen van betrouwbaarheid, volledigheid, en vergelijkbaarheid van kwaliteit tussen zorgaanbieders. Dat is logisch: bij een vertekend beeld zouden we, in dit model, misschien een kwalitatief slechtere aanbieder belonen. Bovendien, schrijft men, is er het risico dat als zorgverzekeraars op basis van informatie van slechte kwaliteit handelen, dit strategisch gedrag bij aanbieders uitlokt, waardoor de data juist slechter worden. Vertekening op vertekening dus.

Uit deze opsomming blijkt dat het rapport, voor dit deel, zich vooral op de zorginkoop aan het richten is. Ergens wel logisch, omdat dat het eerste aangrijpingspunt is van overheidsbeleid op de praktijk, maar een verdere uitwerking van hoe het ROM-k en ROM-i is vergaan was aardig geweest. Maar dat valt ook elders te lezen.

In het rapport wordt hierna de toekomst geschetst over de komende jaren: de ontwikkeling naar een ander model voor bekostiging naar Engels voorbeeld, de rol die zorgstandaarden en kwaliteitsstatuten daarin zullen hebben, en vervolgens wat dit betekent als we de bovengenoemde punten daarbij betrekken. Zie overigens hiervoor ook mijn eerdere blogserie ‘De Week van de Kwaliteit’. De AR concludeert dat het belang van ROM zal toenemen in het komende model, maar dat er tot op dat moment geen aandacht was voor de door hun gesignaleerde beperkingen t.a.v. de kwaliteitsinformatie in de ontwikkeling van dat model. Kortom: er komt nog meer druk te staan op deze problematiek.

Het rapport concludeert, dat er (1) nu meer aandacht is voor verbeteren van kwaliteit van zorg, door het focus op prestatiebekostiging en (2) dat er veel meer informatie is over hoeveel mensen er zijn behandeld, met welke stoornis, tegen welke kosten. Ze benoemen (3) dat er op de zorginkoopmarkt vooral gekeken is naar beheersing van de uitgaven en niet naar kwaliteitsvergelijking tussen zorgaanbieders, waardoor er de facto sprake is van budgetbekostiging. Ze geven aan dat de partijen betrokken bij het bestuurlijk akkoord hoge verwachtingen hebben van het nieuwe model en zetten kanttekeningen bij het tijdspad, gezien bovenstaande problemen.

Hier de centrale conclusie mbt ROM-b:

“De minister van VWS heeft aangegeven dat de ROM-metingen een belangrijke rol moeten gaan spelen in het nieuwe model van prestatiebekostiging. Het gebruik van ROM kent echter beperkingen. De ROM-metingen zijn subjectief en onvolledig, en zorgaanbieders zijn aan de hand van de uitkomsten niet te vergelijken. Het is alleen zinvol om in de bekostiging gebruik te maken van op ROM gebaseerde informatie, wanneer deze informatie sterk verbetert. Pas als er goede en vergelijkbare informatie beschikbaar is, kan kwaliteit een rol gaan spelen bij de zorginkoop. Of deze kwaliteit van de informatie op korte termijn aanzienlijk zal verbeteren, moet echter nog blijken. Er is de afgelopen jaren al veel energie gestoken in het kunnen voorspellen van uitkomsten van behandelingen en in het corrigeren voor verklaarbare verschillen in behandeluitkomsten. De geboekte vooruitgang is vooralsnog beperkt.”

En bij de aanbevelingen:

“Het is echter niet vanzelfsprekend dat de zorgstandaarden en productstructuur ook gaan
bijdragen aan een beter functionerende zorginkoopmarkt. Met de voorgenomen  aanpassingen zal er meer informatie beschikbaar komen. De uitdaging is echter vooral om informatie te verzamelen die door zowel zorgverzekeraars als zorgaanbieders als zinvol wordt ervaren. Anders bestaat het risico dat er een arbeidsintensief systeem van informatievoorziening wordt opgezet dat in de praktijk weinig gaat bijdragen aan de kwaliteit en doelmatigheid van de zorg.”

Eén van de aanbevelingen is om de bekostiging op méér te baseren dan prestatiemetingen, en om tijd te nemen ‘om te komen tot de benodigde verandering van gedrag, te leren en te verbeteren op basis van ervaring’.

De aanbevelingen, letterlijk:
1: Neem voldoende tijd om te komen tot realisatie van een samenhangend en effectief bekostigingsmodel
2: Bepaal tijdig welke verantwoordingsinformatie past bij het nieuwe bekostigingsmodel
3: Houd rekening met beperkingen van de meetbaarheid en vergelijkbaarheid van de behandeluitkomsten
4: Wij bevelen de minister van VWS aan om het Zorginstituut Nederland een expliciet oordeel te laten geven over de kwaliteit van de nieuwe set kwaliteitsindicatoren.
5: Neem de tijd voor eventuele doorontwikkeling naar outcomebekostiging en geef veldpartijen eerst voldoende tijd en ruimte om ervaring op te doen met het bekostigingsmodel van 2019, en spreek op basis van deze ervaringen een realistisch tijdpad af voor de mogelijke invoering van outcomebekostiging.
6: Wij bevelen de minister van VWS aan om veldpartijen aan te moedigen te experimenteren met nieuwe contractvormen en de lessen die hieruit volgen te gebruiken bij de verdere ontwikkeling van de bekostiging.

Tot zover het AR-rapport. Uit de aanbevelingen spreekt naar mijn idee vooral een waarschuwing om niet teveel haast te maken, zodat de methodologische problemen in voldoende mate het hoofd geboden kan worden voordat binnen het nieuwe model gebenchmarkt zou gaan worden tbv zorginkoop. De risico’s daarvan mogen nu duidelijk zijn. Van belang dus nogmaals om te onthouden dat het hier gaat om één van de drie zorgmarkten (zorginkoop) en de rol van ROM-b daarin. Maar omdat in de praktijk de uitvoering van ROM-b gekoppeld is (of hoort te zijn) aan ROM-k en ROM-i, ging het in de discussie daarna, tot verwarrens toe, over ROM als geheel. In de volgende aflevering de petitie en de reacties.

~AR

De kwaliteitsslag – deel 2

Eind januari 2017 werd het rapport “Bekostiging van de curatieve geestelijke gezondheidszorg” van de Algemene Rekenkamer (AR) aan de Tweede Kamer aangeboden.

Rapport-Bekosting-van-de-curatieve-geestelijke-gezondheidszorg

De Algemene Rekenkamer is een overheidsorgaan, een zogenaamde ‘Hoog College van Staat’ (ziehier) en dus onafhankelijk van de regering. De Algemene Rekenkamer controleert of het Rijk geld uitgeeft en beleid uitvoert zoals het de bedoeling was. De AR doet geen politieke uitspraken, maar controleert of een wet functioneert zoals deze is bedoeld. Het is dus heel logisch dat de AR ook het functioneren van het zorgstelsel onderzoekt, zeker als je weet dat een groot deel van de zorg sinds ca. 2006 gestoeld is op het principe van de ‘gereguleerde markt’. Daar heb ik héél wat blogjes aan gewijd (deze is goed te pruimen vind ik zelf), maar het wordt in het rapport in de inleiding ook kort uitgelegd. Het komt er in elk geval op neer, dat aan een aantal randvoorwaarden moet worden voldaan, wil een markt goed functioneren. Daarbij moet je natuurlijk wel bedenken, dat je eerst moet nadenken over wat ‘goed functioneren’ is. Beste kwaliteit van zorg? Beste kwaliteit/prijs verhouding? Meeste keuzevrijheid? Een heel ingewikkelde zaak, en een aardig rapport hierover is ‘De zorgstelselcompetitie’ van de RVS. Er zijn veel (semi-)overheidsinstituten die over het functioneren van het zorgstelsel publiceren, dus wat is nou de insteek van de AR? Welnu, de aanleiding voor het onderzoek zijn de problemen met de ‘jaarverantwoording’ in de ggz. Waar het op neerkomt is de oer-Hollandse vraag: worden onze centjes wel goed besteed? Dat komt jaarlijks allemaal samen op de derde woensdag in mei (dus over twee weekjes weer beste kijkbuiskinderen!), de Verantwoordingsdag, ook wel Woensdag Gehaktdag geheten. Op deze pagina vindt u een overzicht van de problemen in de ggz, die o.a. samenhangen met beleidswijzigingen en de daaruit voortvloeiende complexiteit van de verantwoording. En om een indruk te krijgen van hoe zorgverzekeraars naar deze zaken kijken, lees hier een commentaar van de directeur Zorg van Zorgverzekeraars Nederland. Daar wordt onder andere over ‘praktijkvariatie’ gesproken. Komen we nog op. Maar het punt is dat de AR in dit rapport naar aanleiding van de telkens terugkerende problemen met de jaarverantwoording het functioneren van het zorgstelsel, althans het deel dat vanuit de Zorgverzekeringswet wordt bekostigd, in breder perspectief te beoordelen. Best interessant dus voor wie in die sector werkt of er zorg ontvangt.

Hier het bekende schemaatje van de Zorgverzekeringswet. Het rapport focust dus op de Zorginkoopmarkt. Dat betekent dus dat hoe gedegen ook, dit rapport in feite maar één derde van dit schema onder de loep neemt.

Zorgstelsel

Op pagina 10 van het rapport is te lezen wat de bedoeling is met de zorg: het moet naar een systeem toe van ‘prestatiebekostiging’, oftewel betaling aan zorgaanbieders naargelang ze inhoudelijk beter presteren. Dan moet je dus goed zicht hebben op kwaliteit natuurlijk. En dat betekent weer dat je het met elkaar eens moet zijn over wat kwaliteit is. Makkelijker gezegd dan gedaan, maar dat komt dan weer terug in die polderakkoorden waar we het de vorige keer over hebben gehad, de bestuurlijke akkoorden. Daarin is dus afgesproken dat de hoekstenen voor die prestatiebekostiging zullen bestaan uit de ontwikkeling van zorgstandaarden (en dan zal er dus ook een bepaalde controle moeten zijn op het werken volgens de standaard) en de koppeling aan effectiviteitsmetingen. En bij dat laatste zit dus het bruggetje naar ROM, want ROM, zagen we de vorige keer, is dus de aanpak die uitgekozen is om de effectiviteit van behandelingen in de ggz te meten.

 

Op pag. 13 van het rapport gaat de AR in op randvoorwaarden voor de Zorginkoopmarkt:

  1. Zorgverzekeraars moeten voldoende financieel risico dragen bij de zorginkoop.
  2. Zorgverzekeraars en zorgaanbieders moeten ruimte hebben om te kunnen onderhandelen.
  3. Zorgverzekeraars hebben informatie nodig om prestaties van zorgaanbieders te kunnen vergelijken.

De conclusies in het AR rapport:
1. De zorgverzekeraars zijn sinds 2012 steeds meer financieel risico gaan dragen bij de inkoop van zorg in de curatieve ggz.
2. De ruimte om te onderhandelen is toegenomen, maar wordt nog beperkt gebruikt. In de praktijk wordt bijna 95% van de zorguitgaven gedaan volgens een contract met een financieel plafond. Dit betekent dat er vooraf geen prijs per afgeronde behandeling is afgesproken, maar een maximumbedrag tot waar de declaraties van de zorgaanbieders worden vergoed.
3. Er is door de invoering van de dbc-productstructuur in de specialistische ggz veel meer informatie beschikbaar gekomen over de curatieve ggz: zorgverzekeraars en zorgaanbieders hebben afspraken gemaakt over kwaliteitsindicatoren en hierbij vastgelegd dat deze indicatoren worden vastgesteld met de Routine Outcome Monitoring. ROM is de methodiek waarmee in de ggz regelmatig metingen gedaan worden van de toestand van de patiënt. Echter, de informatie die met ROM wordt verkregen, heeft beperkingen en is van onvoldoende kwaliteit om te dienen als sturingsinformatie bij de zorginkoop.

In de toelichting hierop schrijft de AR wat velen in de ggz wel weten, namelijk dat het stelsel op dit moment niet functioneert zoals beoogd, maar als een verkapt budgetteringsstelsel:

“In de praktijk blijkt dat zorgverzekeraars niet kunnen inkopen op prijs en kwaliteit, omdat zij onvoldoende informatie hebben, bijvoorbeeld over de kwaliteit van de zorg. In plaats daarvan onderhandelen zorgverzekeraars met zorgaanbieders over de hoogte van financiële plafonds tot waar de declaraties van de zorgaanbieders worden vergoed. Op deze manier zorgen de zorgverzekeraars ervoor dat op macroniveau de uitgaven aan curatieve ggz worden beheerst.”

Het is een situatie dat veel financiële onzekerheid geeft bij zorgaanbieders, en de patiënt niet de beoogde ‘marktmacht’ geeft om te kunnen kiezen voor kwaliteit (ik sla hier dus mijn eigen kritiek op diverse onderliggende aannames over). Dus dan wordt punt 3. heel belangrijk.

Daar komt de crux waar het hier om gaat, de ROM. De keuze om die te gebruiken als maat voor kwaliteit is gemaakt in 2010 in een akkoord tussen GGZ Nederland, de brancheorganisatie van de grote ggz-instellingen, en Zorgverzekeraars Nederland. Opvallend dus in dit verhaal is het detail dat dit niet een breed polderakkoord was. Hier het akkoord, waarin we een aantal politieke coryfeeën tegenkomen. Hiermee, zo schrijft het AR, is er één taal voor het meten van kwaliteit gekomen. Nu zullen we in een volgende blog gaan zien, dat dit aspect voor- en nadelen heeft. Maar hier is het belangrijk om te laten zien, dat ROM vanuit dit akkoord drie doelen moest dienen: het verloop van de individuele behandeling nagaan, benchmarking (zie deel 1) op gemiddelde behandeluitkomst, en benchmarkinformatie beschikbaar stellen ten behoeve van de zorginkoop.

 

ROM 3 doelen

Je zou bij het eerste kunnen zeggen: daar is de ROM er vooral voor de behandelaar en de patiënt, bij de tweede: dat is iets voor vergelijking tussen behandelaars en tussen instellingen bijvoorbeeld, om te kijken wat je zou kunnen verbeteren, en het laatste is informatie voor de partijen (zorgaanbieders en zorgverzekeraars) aan de onderhandelingstafel, waar men dus al tijden staat te trappelen om op kwaliteit te kunnen gaan onderhandelen. Maar de AR heeft bedenkingen bij de kwaliteit van de informatie voor deze doelen (pag. 20 e.v.).

Meer hierover de volgende keer, als we naar de kritiek gaan kijken op de ROM-praktijk, de start van de petitie en de eerste reacties. Tot dan!

~AR

De kwaliteitsslag – deel 1

Voor wie geen tijd en zin heeft om alle blogjes, opinieartikelen en vileine tweets te lezen over de ROM-discussie heb ik bedacht om een overzicht geven. Ik heb net als veel anderen mijn handtekening gezet onder de petitie stop ROM als benchmark. Inmiddels is dit een paar maanden geleden en is er het nodige gebeurd, waarbij er ook her en der wat retoriek wordt ingezet. Hoort er allemaal bij, maar hieronder zal ik proberen een zo neutraal mogelijke opsomming te geven. Omdat ik nogal eens te horen heb gekregen dat ik lang en ingewikkeld schrijf, ga ik het nu eens anders proberen. Benieuwd of het lukt! Het wordt wel een verhaal met meerdere afleveringen. Het is vooral ook bedoeld voor mensen die nog niet heel diep in de materie gedoken zijn. Feedback zoals gebruikelijk welkom.

Wie een wat uitvoerigere inleiding in de materie wil verkrijgen, verwijs ik naar mijn blogserie ‘De Week van de Kwaliteit’, dat hier begint. Daar vindt u de prehistorie van ROM in de ggz.

Eerst in het kort de aanloop, de situatie rond januari 2017: binnen de ggz was al in eerdere bestuurlijke akkoorden (afspraken die om de zoveel jaar tussen instellingen, beroepsverenigingen, patiëntenverenigingen, zorgverzekeraars en overheid allemaal met de ggz verbonden worden gemaakt, een soort polder-regeerakkoord voor de ggz) ingezet op het verbeteren van de ‘kwaliteitstransparantie’, oftewel, het als zorgaanbieder de kwaliteit van je behandeling tonen. Daarvóór was er al een politieke keuze gemaakt, in polderoverleg, om voor dat doel in de ggz Routine Outcome Monitoring (ROM) te gebruiken. ROM betekent letterlijk het routineus in de gaten houden van de uitkomst, en dat kan dus in principe voor elke handeling dat een uitkomst heeft. Als ik bijvoorbeeld drie keer per week 5 km ren, en ik hou mijn tijd bij, dan kan ik zien hoe ik presteer. Als ik vervolgens mijn tijd over de 5 km ga vergelijken met de buurman, dan kunnen we zien wie beter presteert, althans: wie het snelst is. We hebben dan snelheid als indicator gesteld, dat zien we dan als ‘kwaliteit’, en die vergelijking heet dan nu in de zorg benchmarking. Een benchmark is Engels voor een ijkpunt, daarmee wordt benadrukt dat je dus een goed vergelijking wil maken. Het is dus belangrijk om ook goed te vergelijken. Als ik 5 min. langzamer loop dan mijn buurman, maar dat doe met een rugzak met 2 kilo aardappelen op mijn rug, dan zeggen we: hee, dat is geen eerlijke vergelijking. Er is dan geen sprake van valide benchmarking.

Kwaliteit inzichtelijk maken en kwaliteit vergelijken werden om verschillende redenen belangrijk gevonden. Ten eerste was er een toenemende wens, over de hele zorg, om op basis van bewijs, in plaats van op basis van ‘professionele autoriteit’ of iets dergelijks, de zorg te organiseren. Dat heeft met diverse historische, politieke en economische redenen te maken, en is een ontwikkeling dat je niet alleen in de zorg ziet, maar op allerlei andere terreinen. Daar kun je hele discussies over voeren, maar doen we nu even niet. Ten tweede, is kwaliteitstransparantie een noodzakelijk hoeksteen van het marktgedreven zorgstelsel, waarbij zowel patiënten als zorgverzekeraars als kritische consumenten naar hun zorg moeten kijken, en het concurrentiebeginsel zou moeten leiden tot betere kwaliteit voor lagere prijs. Ook daar is van alles op af te dingen, en dat heb ik elders uitvoerig gedaan, maar gaan we hier ook niet doen. Een derde, meer sociologische reden, waarom juist in de ggz openheid over kwaliteit werd gewenst, was dat de ggz fundamenteel als minder grijpbaar werd gezien, zowel in zijn aard (wat ís een psychiatrische aandoening nou eigenlijk?), als in zijn oorzaken (zijn psychiatrische aandoeningen geestelijk, lichamelijk, beide? Hoe kunnen we ze nou aantonen?), als in de wijze van behandelen (wat doen psychiaters en therapeuten eigenlijk?), als in de resultaten (hoe sterk is eigenlijk het bewijs dat de behandelingen in de ggz effectief zijn? En wordt er wel ‘evidence-based’ gewerkt?). Een vierde reden, meer specifiek voor ‘de cliëntenbeweging’ in de ggz (waar ik ook belangenverenigingen van familie en netwerk onder schaar), is dat de ggz veel meer dan andere geneeskundige vakken te maken heeft met problematiek rond de machtsrelaties tussen behandelaars/instellingen en cliënten/familie. Veel meer vindt u hierover in de prachtige Canon van de Cliëntenbeweging ggz nl . Meer duidelijkheid over beloop en kwaliteit geeft ook meer grip op die relatie, die altijd een machtsrelatie is. Dat is elke relatie natuurlijk, maar de psychiatrische relatie is historisch en actueel meer beladen. Meer weten? Bezoek het Dolhuys. Er zullen vast nog meer redenen te bedenken zijn rond kwaliteit, maar ik hou het even hierbij.

 

Toen het project begon om zorgresultaten te verzamelen, ging dat nogal moeizaam. Er kwamen onvoldoende gegevens boven tafel, en daarbij bleek ook, dat verschillende instellingen verschillende vragenlijsten gebruikten om hun resultaten te meten. Dan kun je dus niet benchmarken. Vanuit die optiek was het logisch om het hele benchmark-gebeuren bij één instelling te beleggen, dat werd de Stichting Benchmark GGZ (SBG). Ziehier. In de bestuurlijke akkoorden werd vervolgens afgesproken dat iedereen zou gaan ROM’men en de data naar SBG zou aanleveren zodat het benchmarken op gang zou kunnen komen. Een middel daartoe was een financiële prikkel van de zorgverzekeraars: die stelden een eis van 70% aanlevering van ROM data als voorwaarde voor betaling van hun vergoeding. Oftewel: de instelling/behandelaar moest ervoor zorgen dat van minimaal 70% van de patiënten de ROM-gegevens (dus op zijn minst een voormeting en een nameting) werden aangeleverd bij SBG. Overal in het land gingen mensen hier dus mee aan de slag, en daarvoor moest natuurlijk het nodige aan ontwikkeling van vragenlijsten, meetinstrumenten maar ook software en ondersteuning gedaan worden. Hoeveel dat allemaal gekost heeft? Geen idee. Niemand die dat precies bijgehouden heeft. Je kunt die gegevens over de behandeling namelijk op verschillende manieren verzamelen. Je kunt het als behandelaar zelf natuurlijk aan je patiënt vragen, maar je kunt bijvoorbeeld ook de patiënt bij aanmelding naar een website sturen waar die zelf een vragenlijst moet invullen. In grotere instellingen wordt een aantal medewerkers specifiek aangesteld om ROM te verzamelen, de data te versturen naar SBG, en ook de resultaten overzichtelijk te maken voor behandelaren en het instituut. Volgens mij heeft niemand bijgehouden hoeveel dit allemaal kost. Waarom dat belangrijk is? Daar komen we nog op, maar een tipje van de sluier licht ik alvast op met een artikel uit 2012, dat wat roet in het eten gooide van het SBG project, namelijk het artikel “ROM: gedragsnorm of dwangmaatregel?”, hier te lezen. In dit artikel maakten een aantal hoogleraren psychiatrie (en dat is tamelijk uitzonderlijk) gezamenlijk bezwaar tegen de gang van zaken waarbij ROM als benchmark gebruikt zou gaan worden. Wat ze, kort gezegd, zeiden, was dat er meerdere redenen waren om te bedenken dat die vergelijking volgens de stand van zaken toen, geen eerlijke vergelijking zou zijn, omdat, om in de beeldspraak te blijven van die lopers, er niet alleen sprake was van rugzakken en aardappels, maar ook van verschillende horloges die niet goed geijkt waren om de tijd op te nemen, en ook, dat het de vraag was of snelheid nou de belangrijkste uitkomstmaat was: sommige mensen waren meer geïnteresseerd in hoe soepel de loper liep, of dat hij met minste blessures binnenkwam, of dat hij de mooiste foto’s onderweg nam. In termen van benchmarking: werd wel de juiste indicator voor kwaliteit gebruikt?

Daar zit trouwens een weerbarstig probleem, namelijk dat als je op landelijk niveau wil gaan vergelijken, dan moet je een maat zoeken die overal in het land geldig is. Zou je voor een loper zeggen: afstand gedeeld door tijd, dan zullen mensen zeggen: hee, maar dat is niet eerlijk, want de lopers in Limburg moeten heuvel op, heuvel af! Dan moet je dus gaan corrigeren voor de helling, of je moet gaan zeggen: we vergelijken alleen over de vlakke stukken. Dat kan. Alleen mis je dan dus wel de vergelijking van lopers die alleen over heuvels lopen. En als je een al te algemene maat neemt, zoals bijvoorbeeld de gemiddelde snelheid over een vlak traject van 1 km (want die lopen bijna alle lopers), dan zegt dat weer te weinig over de individuele lopers, waarvan sommige sprinters zijn, andere marathonlopers, en alles ertussenin. Dit is dus een spanningsveld: hoe meer mensen je hebt om mee te vergelijken, hoe makkelijker het is om geldige (wetenschappelijke) uitspraken te doen, maar het nadeel is weer dat die uitspraken over zaken zullen gaan die dan minder te maken hebben met jouw specifieke situatie. Met dit soort problemen is men dus al een tijdje bezig bij SBG. Het artikel van de hoogleraren had overigens geen effect op de voortgang van het project, voor zover ik heb kunnen nagaan (ik hou me aanbevolen). Het werd in diverse geledingen besproken, de problemen werden erkend, en men nam zich voor vooral goed verder te gaan ontwikkelen om de problemen zoveel mogelijk op te lossen.

En ondertussen peilt de overheid met enige regelmaat hoe de voortgang hierin is. Het meest recent gebeurde dat via een rapport van de Algemene Rekenkamer, getiteld: “Bekostiging van de curatieve geestelijke gezondheidszorg.”

Toen begon het gedonder.

Wordt vervolgd!

~AR