Gaten vullen

Wie wel eens aan een vragenlijstonderzoek meedoet, herkent het: ‘wat een gekke vraag, ik sla hem wel over.’ Maar dan blijkt dat niet te kunnen, omdat het een verplichte vraag is. Of: ‘wat had ik daarnet bij een vergelijkbare vraag ook alweer ingevuld?’ Ik ben zeker niet de enige die daar tegenaan loopt, merkte ik tijdens mijn eigen vragenlijstonderzoek.

We stuurden een uitgebreide vragenlijst naar alle mannen en jongens met hemofilie in Nederland, waarin we hen werkelijk het hemd van het lijf vroegen over hun medische geschiedenis, hun dagelijks functioneren en hun ervaringen met de zorg.

De meeste vragen waren meerkeuze, en vaak kon een deelnemer ervoor kiezen een vraag over te slaan. Dat leverde dan een ‘gat’ op in de database; een leeg vakje in een gigantische tabel met duizenden rijen en kolommen.

Dat gebeurde ook voor verplichte vragen, zoals leeftijd. Deelnemers konden daar zelf een waarde invullen. Toen we de digitale vragenlijst maakten, dachten we dat het een goed idee was in te bouwen dat volwassen deelnemers alleen een waarde tussen de 18 en 100 jaar konden invullen, en tieners alleen een leeftijd tussen de 12 en de 17 jaar. Maar wat als een tiener per ongeluk een volwassenenvragenlijst krijgt? En hoe kom je daar eigenlijk achter?

Als onderzoekers wisten wij namelijk niet wie welke vragenlijst kreeg, omdat we vanwege privacyregelgeving geen persoonsgegevens mochten hebben. De deelnemende ziekenhuizen verstuurden daarom de vragenlijsten digitaal of op papier. Van papieren vragenlijsten konden we gemakkelijk tellen hoeveel er terugkwamen. Als we dan bij invoer in de database een vreemde waarde tegenkwamen, zoals een tienerleeftijd in een volwassenenvragenlijst, wisten we dat iemand per ongeluk de verkeerde vragenlijst had gekregen.

Bij digitaal verstuurde vragenlijsten was het lastiger te bepalen of alle ingevulde waarden klopten. Aan analyseprogramma SPSS vroegen we dan welke vragen waren ingevuld. Als een leeftijd was ingevuld, werkten de beperkingen blijkbaar. Was er geen leeftijd, dan kon de deelnemer daar misschien niet verder en is ie maar helemaal opgehouden met invullen. Door het studienummer wisten we bij welk ziekenhuis die persoon hoorde, maar het ziekenhuis mocht ons dan niet vertellen wat de leeftijd van die persoon was. Ook dat leverde dus een gat op. Echt erg is zo’n gat niet, zolang het er maar niet te veel zijn.

En toen zagen we af en toe gaten ontstaan. We stelden in dat geen enkele vraag meer verplicht was, zodat deelnemers ze eventueel over konden slaan. Liever een gat voor zoiets als leeftijd dan gaten voor alle vragen daarna. En als iemand toch na drie vragen ophield met invullen, noemden we dat dan eigenlijk een ingevulde vragenlijst? Ja, besloten we. Alleen als geen enkele vraag was ingevuld, vroegen we aan SPSS die persoon uit het bestand te verwijderen.

Gelukkig hadden we nog een troef achter de hand. Van de meeste deelnemers met vragenlijstgegevens zaten ook gegevens uit het patiëntendossier in de database. Zelfs als de leeftijd in de vragenlijst ontbrak, konden we die toch invullen door SPSS te vragen: ‘als leeftijd vragenlijst ontbreekt, gebruik dan de leeftijd uit het CRF’.

Dat trucje gebruikten we ook om na te gaan of de gegevens in het dossier verschilden van die in de vragenlijst; als iemand bijvoorbeeld had aangekruist dat hij* ernstige hemofilie had, maar het volgens het patiëntendossier om iemand met matige hemofilie ging, zochten we uit waar dat verschil vandaan kwam. Het leverde een SPSS-code op met 295 regels om de bekende gaten in te vullen.

Niet alle gaten konden we op die manier vullen, want hoeveel last iemand in zijn dagelijks leven heeft van zijn hemofilie, staat helaas niet met een getalletje in het patiëntendossier.

 

*normaal zou ik schrijven ‘hij of zij’, maar in onze database zitten alleen mannen, omdat hemofilie bij hen veel vaker voorkomt dan bij vrouwen. Ons onderzoek gaat over hemofilie bij mannen.