Utilisation des bases de données médico-administratives du Québec pour des études en santé mentale : opportunités, défis méthodologiques et limites – cas de la dépression chez les personnes diabétiques

Lunghi, Carlotta; Zongo, Arsène; Guénette, Line

doi:https://doi.org/10.7202/1058612ar

Introduction

Les bases de données médico-administratives sont beaucoup utilisées en recherche. Elles sont dérivées des systèmes de facturation des assureurs et contiennent plusieurs informations sur les caractéristiques démographiques des personnes assurées, les profils des cliniciens leur ayant fourni des services, les services et soins facturés comme les actes médicaux et les médicaments réclamés, ainsi que les coûts et diagnostics associés¹. Que ce soit pour les maladies mentales ou pour tout autre type de maladies, ces bases de données offrent la possibilité d’étudier de grandes populations ayant des données colligées sur plusieurs années. Elles permettent donc de répondre à des questions qui, en temps normal, mettraient des années à être étudiées. Elles permettent aussi, pour le cas des maladies mentales, de surpasser certaines difficultés, notamment celle liée à la collecte des données directement auprès de ces personnes (données autorapportées). L’utilisation des bases de données médico-administratives pour des études chez des personnes atteintes de maladies mentales n’est cependant pas exempte de difficultés. Leur utilisation comporte plusieurs défis méthodologiques qu’il faut connaître et surmonter afin de produire des résultats acceptables et assurer une interprétation moins biaisée des résultats des études.

Dans cet article, nous proposons de réaliser un survol de l’utilisation des bases de données pour des études épidémiologiques. Nous illustrerons nos propos à partir d’exemples provenant d’une thèse de doctorat conduite pour évaluer l’incidence de la dépression chez les personnes atteintes de diabète de type 2 au Québec et son impact sur l’usage des médicaments antidiabétiques. De façon spécifique, une synthèse des écrits sur la validation des algorithmes utilisés pour identifier des personnes ayant une dépression sera effectuée. Nous présenterons ensuite un exemple de l’usage d’un de ces algorithmes dans les bases de données de la Régie de l’assurance maladie du Québec (RAMQ) pour estimer l’incidence de la dépression chez des personnes diabétiques et l’impact de la dépression sur l’adhésion au traitement médicamenteux antidiabétique.

Les bases de données médico-administratives du Québec

Au Québec, les données médico-administratives ont une grande notoriété dans la recherche sur les services de santé, les maladies, l’usage des médicaments et plusieurs autres questionnements importants^2-4. Ces données comprennent les services pharmaceutiques et les services médicaux de la RAMQ, le registre des hospitalisations Med-Écho et le registre des décès de l’Institut de la statistique du Québec (ISQ).

La précision et la justesse des informations recueillies dans le fichier des services pharmaceutiques de la RAMQ ont été évaluées par Tamblyn et coll.⁵. Ces auteurs ont comparé l’information sur les ordonnances fournies à des personnes consultant dans une clinique de médecine interne avec les informations des réclamations correspondantes dans le fichier des services pharmaceutiques. Ils ont trouvé une concordance de 83 %⁵. Également, la validité des diagnostics dans le fichier des services médicaux de la RAMQ a été évaluée par rapport aux dossiers médicaux dans une autre étude⁶. Les auteurs ont validé les codes diagnostiques de 14 maladies de près de 15 000 sujets qui participaient à un essai clinique. Ils rapportent qu’en général la spécificité était très élevée (supérieure à 90 %) et la sensibilité variait selon la maladie, celle-ci étant plus élevée pour les maladies les plus communes comme le diabète (52 %) ou l’hypertension (61 %)⁶. En plus, la sensibilité montait sensiblement (à 64 % et 69 %, respectivement) lorsque, dans l’analyse, étaient incluses les données sur les réclamations de tous les médecins et pas seulement ceux de l’essai clinique⁶. La validité du registre des hospitalisations Med-Écho n’a pas été évaluée de façon systématique. Toutefois, une étude a évalué la fiabilité des données Med-Écho par rapport aux cholécystectomies survenues dans un hôpital montréalais. On rapporte que les données étaient valides et fiables⁷.

Identifier les cas de dépression dans les bases de données médico-administratives

Il faut se rappeler que les bases de données médico-administratives ne sont pas conçues pour la recherche, mais surtout pour permettre le remboursement des services médicaux et pharmaceutiques offerts par les professionnels de la santé à la population dans le cadre des régimes d’assurance. Pour cette raison, des études permettant d’évaluer la validité de l’utilisation de ces bases de données médico-administratives pour l’identification des personnes ayant la maladie que l’on veut étudier sont nécessaires.

L’identification des personnes malades se fait souvent à l’aide d’algorithmes conçus pour chercher la présence de codes diagnostiques et thérapeutiques (principalement ceux de la Classification internationale des maladies 9^e ou 10^e édition – CIM-9 ou CIM-10, respectivement), ou de réclamations de médicaments liés à la maladie d’intérêt. Ces codes sont des indications que l’évènement clinique à l’étude s’est réellement produit^8-11. Dans les dernières années, plusieurs études ont été menées afin de valider des algorithmes et de tester leur fiabilité pour l’identification des personnes ayant la maladie d’intérêt^12-14. Ces études testent la capacité des algorithmes à distinguer entre les malades et les non-malades en rapportant leur sensibilité, c’est-à-dire la capacité d’identifier correctement les personnes ayant la maladie (selon une mesure de référence ou étalon-or) et leur spécificité, soit la capacité d’identifier correctement ceux qui ne sont pas malades. En général, il y a un compromis à faire entre la sensibilité et la spécificité d’un algorithme. Lorsqu’on essaie d’augmenter la sensibilité, en utilisant par exemple des algorithmes qui identifient des cas en se basant sur une seule consultation ayant le code diagnostique recherché, la spécificité diminue.

Dans le cas de la dépression, plusieurs algorithmes permettant l’identification de sujets ayant la dépression ont été validés dans différentes bases de données administratives provinciales ou nationales en Amérique du Nord (Tableau 1). Une revue de la littérature¹⁵ a mis en évidence une grande hétérogénéité des algorithmes utilisés en termes de sélection et de nombre de codes diagnostiques utilisés, de type d’acte médical (consultations ou hospitalisations) et de fenêtre temporelle choisie pour aller chercher ces codes diagnostiques. Aussi, la mesure de référence utilisée pour la validation n’était pas toujours la même, allant des entrevues diagnostiques structurées^16,¹⁷, aux questionnaires validés^18-20, aux mesures autorapportées^20-22 et aux dossiers médicaux^15,^23-25. La sensibilité des algorithmes passait de 16 % à 50 % dans les études utilisant des questionnaires comme référence^16-19 et à 95 % dans l’étude qui, elle, utilisait les dossiers médicaux²⁵. Les auteurs de la revue concluent que l’algorithme qui performait le mieux était celui de Spettell et coll.²⁵. Cet algorithme utilisait au moins deux consultations médicales ayant un code de dépression dans une fenêtre de 12 mois et la réclamation d’un antidépresseur (sensibilité : 95 %).

En plus de cette revue systématique, Noyes et coll.²⁶ ont mené une étude dans laquelle ils comparaient les diagnostics des bases de données médico-administratives aux résultats de dépistage obtenus à l’aide de deux échelles (outils) de mesure de dépression. Selon les auteurs, les algorithmes testés n’étaient pas suffisamment valides pour identifier les cas de dépression. En effet, même si la spécificité était en général bonne (entre 75 % et 96 %), la sensibilité était pour sa part plutôt faible (entre 10 % et 45 %). West et coll.²⁷ ont validé des algorithmes de dépression dans les bases de données médico-administratives de la Saskatchewan en utilisant les dossiers médicaux comme mesure de référence. L’algorithme utilisant une seule consultation médicale ayant un des codes de dépression (codes CIM-9 : 296, 300, 311) performait bien : sensibilité de 71 % ; spécificité de 85 %. Toutefois, comme la cohorte était composée de nouveaux utilisateurs d’antidépresseurs, cet algorithme était valide seulement pour identifier des personnes déjà traitées pharmacologiquement pour leur dépression²⁷. Alaghehbandan et coll.²⁸ ont mené une étude dans laquelle ils ont testé 120 algorithmes différents dans les bases de données médico-administratives de Terre Neuve-Labrador, en utilisant les dossiers médicaux électroniques comme référence. Le meilleur algorithme (sensibilité de 78 % et spécificité de 93 %) identifiait les cas de dépression avec une hospitalisation ou une consultation psychiatrique ou deux consultations médicales sur une période de deux ans²⁸.

En somme, aucune étude n’a évalué la validité d’un algorithme pour identifier les cas de dépression dans les bases de données médico-administratives québécoises, et cela appelle à des études pour répondre à la question. Le nombre d’études portant sur la validation des algorithmes publiées dans les dernières années démontre la difficulté d’identifier avec certitude les personnes atteintes d’une maladie mentale comme la dépression dans les bases de données médico-administratives. Cela reflète également le fait que la dépression n’est pas facilement reconnue en première ligne ; elle est plutôt sous-diagnostiquée et sous-traitée, particulièrement chez les personnes âgées^29-31. En plus de cela, il faut tenir compte que certains diagnostics ne se retrouvent peut-être pas dans les banques de données administratives pour éviter aux patients les stigmas associés, par exemple d’éventuels problèmes avec leurs assurances. Cependant, un avantage de l’usage des bases de données médico-administratives pour identifier les cas de dépression est celui d’éviter les biais de rappel ou de désirabilité sociale qui sont typiques des enquêtes utilisant des données autorapportées^32,³³.

Tableau 1

**Articles portant sur la validation des algorithmes de dépression dans les bases de données administratives du Canada et des États-Unis entre 2000 et 2014**

Exemple de l’utilisation des bases de données médico-administratives de la RAMQ pour estimer l’incidence de la dépression et l’effet de la dépression sur l’adhésion au traitement médicamenteux antidiabétique au Québec

En utilisant les données médico-administratives de la RAMQ, notre équipe de recherche a mesuré l’incidence des diagnostics de dépression chez des personnes ayant commencé un traitement avec des médicaments pour traiter un diabète de type 2 au Québec entre le 1^er janvier 2000 et le 31 décembre 2006³⁴. Nous nous sommes intéressés en particulier aux personnes ayant le diabète puisque la dépression affecte fréquemment les personnes ayant ce type de maladie chronique^35,³⁶. De plus, elle peut entraîner chez ces personnes une mauvaise adhésion aux recommandations des cliniciens – diète, activité physique et prise des médicaments –³⁷, une mauvaise maîtrise de la glycémie³⁸, un risque accru de complications³⁵ et, par conséquent, de décès³⁹. Nous voulions analyser l’incidence de la dépression chez des personnes diabétiques et identifier les facteurs liés à la survenue de la dépression afin de pouvoir cibler les personnes les plus à risque qui pourraient bénéficier d’un dépistage précoce visant à améliorer le pronostic du diabète.

L’objectif de notre étude était donc de mesurer l’incidence de la dépression et les facteurs associés à l’apparition de la dépression chez des personnes atteintes de diabète de type 2, assurées par le régime public d’assurance médicaments (RPAM) de la RAMQ et nouvellement traitées avec des antidiabétiques oraux³⁴.

Comme nous avons utilisé les bases de données de la RAMQ (les fichiers des services médicaux et pharmaceutiques) et Med-Écho, nous nous sommes penchés sur le choix d’un algorithme qui nous permettrait de bien identifier les cas de dépression. Nous avons choisi d’identifier les cas de dépression à partir de l’algorithme proposé par Alaghehbandan⁴⁰. Plus précisément, nous avons utilisé une version modifiée de cet algorithme en suivant les recommandations des auteurs (c’est-à-dire l’ajout des antidépresseurs conjointement à une visite médicale ayant un code de dépression) afin d’augmenter la sensibilité de l’algorithme⁴⁰. Dans notre cas, une personne ayant la dépression avait eu 1) au moins une hospitalisation ou une consultation psychiatrique avec un code diagnostique de dépression de la CIM-9 ou de la CIM-10 ; ou 2) au moins deux consultations médicales, dans une période de 24 mois, avec un code diagnostique CIM-9 de dépression ; ou 3) au moins une consultation médicale avec un code diagnostique CIM-9 de dépression et une réclamation d’un antidépresseur dans une fenêtre de 24 mois. L’ajout de réclamations d’antidépresseurs à cet algorithme, malgré qu’il soit recommandé par plusieurs auteurs pour améliorer sa performance^21,^25,⁴⁰, a entrainé une méconnaissance de la sensibilité et spécificité de l’algorithme utilisé dans notre étude³⁴.

En utilisant cette version de l’algorithme d’Alaghehbandan⁴⁰, nous avons identifié les cas de dépression diagnostiqués entre le 1^er janvier 2000 et le 31 décembre 2008 présents dans les bases de données de la RAMQ. Parmi 181 801 personnes ayant commencé un traitement antidiabétique, 7 441 (4,1 %) ont reçu un diagnostic de dépression dans la période étudiée⁴¹. Nous avons trouvé que la prévalence annuelle de dépression dans cette période était autour de 4 %, allant de 4,2 % en 2000, à 4,4 % en 2004 à 3,9 % en 2008⁴¹. L’incidence de la dépression était de 12,6/1000 (intervalle de confiance [IC] à 95 % : 11,94-13,27) personnes-années (PA) dans l’année suivant le début du traitement antidiabétique et de 9,47 (IC à 95 % : 9,20-9,74) pour toute la période à l’étude³⁴. Par rapport à la littérature, nous avons remarqué que l’incidence estimée dans les bases de données médico-administratives avec cet algorithme était faible comparativement à l’incidence cumulée rapportée dans l’étude de Messier et coll. (14 %) pour la population diabétique du Québec⁴². Cependant, nos résultats étaient comparables à ceux obtenus pour la Saskatchewan⁴³ utilisant aussi des bases de données médico-administratives, mais un algorithme différent. Les auteurs de cette étude rapportent une incidence de 6,5/1000 PA pendant un suivi de 8 ans (comparativement à 9,47/1000 PA pour la même durée dans notre étude). L’écart observé avec l’étude de Messier et coll. pourrait être expliqué par les différences dans les méthodes utilisées pour identifier les cas de dépression. En effet, Messier et coll. ont utilisé le Patient Health Questionnaire-9 (PHQ-9) pour mesurer des symptômes de dépression alors que nous avons utilisé un algorithme basé principalement sur les diagnostics colligés dans les banques médico-administratives. L’écart pourrait donc refléter la différence entre l’incidence des symptômes de dépression et l’incidence de diagnostic de dépression. Il faut en fait tenir compte que certaines personnes ne consultent pas et ne reçoivent pas de soins pour leur dépression ou reçoivent des soins bien après l’apparition des symptômes, ou encore sont suivies par des psychologues dont les services ne sont pas répertoriés dans les bases de données médico-administratives. Tout cela a comme conséquence que le nombre de cas identifiés par ces algorithmes est plus faible que le nombre de personnes présentant des symptômes dépressifs dans la population²⁶. En effet, parmi les algorithmes validés dans les dernières années, les plus performants étaient ceux qui utilisaient les dossiers médicaux comme mesure de référence²⁵,⁴⁰. Cela est possiblement dû au fait que les autres outils de validation, notamment les questionnaires, n’identifient pas seulement les personnes ayant reçu un diagnostic de dépression, mais aussi celles ayant des symptômes dépressifs non diagnostiqués. En plus, dans notre cas spécifique, la population à l’étude était composée de personnes atteintes de diabète. Chez les patients diabétiques, l’usage des questionnaires autoadministrés, même s’ils sont une méthode largement utilisée, pourrait avoir tendance à surestimer la présence de la dépression. Cela vient du fait que la plupart des patients diabétiques montrant des niveaux élevés de symptômes dépressifs pourraient être en détresse émotionnelle en raison de leur diabète, plutôt qu’être cliniquement déprimés⁴⁴.

Comme déjà mentionné, la dépression chez les personnes ayant le diabète peut avoir des effets néfastes. Elle a d’ailleurs déjà été associée à une mauvaise adhésion aux traitements médicamenteux dans plusieurs maladies chroniques⁴⁵, y compris le diabète⁴⁶. En ayant déjà identifié des personnes ayant reçu un diagnostic de dépression dans l’année suivant le début de leur traitement antidiabétique, nous avons poursuivi nos recherches en menant des études qui avaient comme objectifs 1) de mesurer l’association entre la dépression et la non-adhésion au traitement médicamenteux antidiabétique et à la non-persistance ; et 2) d’identifier les facteurs associés à la non-adhésion et à la non-persistance chez les diabétiques ayant eu un diagnostic de dépression. En effet, même si d’autres études avaient porté sur cette association, seulement une³⁷ avait pris en compte l’effet du niveau d’adhésion des personnes diabétiques avant la survenue de la dépression dans les analyses. Cela est un point important puisque le niveau d’adhésion dans le passé prédit fortement l’adhésion future⁴⁷. De plus, seulement deux études^48,⁴⁹ avaient examiné l’association entre la dépression et une composante spécifique de l’adhésion, la persistance, définie comme la poursuite du traitement pendant toute la durée prescrite^50-52. Enfin, aucune étude n’avait porté sur les caractéristiques des personnes diabétiques ayant un diagnostic de dépression et n’adhérant ou ne persistant pas à prendre leur traitement.

Pour nos études, nous avons mesuré l’adhésion au traitement médicamenteux antidiabétique (issue d’intérêt) à l’aide de la proportion de jours couverts (PJC) par un antidiabétique^53,⁵⁴. La PJC était calculée à l’aide des dates de réclamations d’ordonnances d’antidiabétique et des durées de ces ordonnances. Elle correspondait à la proportion de jours pour lesquels la personne avait en sa possession un antidiabétique dans la période entre le diagnostic de dépression et le 365^e jour après cette date. Pour les personnes qui n’avaient pas de diagnostic de dépression, nous avons attribué une date fictive de dépression en utilisant la méthode du time-matching cohort⁵⁵ afin d’éviter de créer un biais de temps immortel⁵⁶. Les personnes ont ensuite été classées comme étant non adhérentes (PJC < 90 %) ou adhérentes (PJC ≥ 90 %). Nous avons mesuré la non-persistance au traitement antidiabétique avec la méthode de la séquence des renouvellements⁵². Une personne a été considérée non persistante lorsqu’il y avait une interruption non acceptable dans sa séquence de renouvellements d’antidiabétiques⁵⁷. Cette interruption non acceptable a été fixée à une période correspondant à trois fois la durée de la dernière réclamation⁵⁷. La dépression, qui était la variable d’exposition, a été mesurée avec l’algorithme mentionné ci-haut.

Dans ces études, nous avons observé que la dépression représentait un facteur de risque indépendant de non-adhésion aux traitements, même lorsqu’on tenait compte du niveau d’adhésion dans la période précédant le diagnostic de dépression (Rapport de cote ajusté : 1,24 ; IC à 95 % : 1,13-1,37). De plus, les personnes ayant un diagnostic de dépression étaient plus susceptibles d’arrêter précocement leur traitement antidiabétique (rapport des fonctions de risque instantané ajusté : 1,52 ; IC à 95 % : 1,41 à 1,63)^58,⁵⁹. Le fait d’avoir utilisé un algorithme pour identifier les cas de dépression, au lieu d’utiliser un questionnaire de symptômes de dépression, nous a possiblement amenés à sous-estimer les cas de dépression et par conséquent à une possible classification erronée des exposés (certaines personnes classifiées comme non dépressives selon l’algorithme étant possiblement atteintes de dépression en réalité). Cela a pu avoir des conséquences sur les mesures d’association trouvées. Par contre, comme ce biais dans la classification était non différentiel (c’est-à-dire que la probabilité d’être mal classé est la même, peu importe l’issue d’intérêt) cela a eu comme conséquence une possible sous-estimation de l’effet réel de la dépression sur la non-adhésion et la non-persistance.

Nous avons ensuite observé que les facteurs associés à la non-adhésion et à la non-persistance chez ces patients atteints de diabète de type 2 et de dépression étaient similaires à ceux trouvés pour la population diabétique de type 2 générale du Québec^60,⁶¹ et que le facteur le plus fortement associé à la non-adhésion était effectivement le niveau d’adhésion avant la dépression.

Une des principales limites de ces analyses est l’absence, dans les bases de données de la RAMQ, de certains facteurs qui pourraient influencer l’issue d’intérêt (la dépression, l’adhésion médicamenteuse ou la persistance) et qui autrement pourraient être pris en compte dans les analyses. En effet, il n’y a pas des données cliniques (par exemple le niveau de contrôle glycémique pour les diabétiques) qui pourraient donner des indications sur la gravité d’une maladie ; il n’y a pas non plus d’information sur les facteurs liés au patient lui-même (motivation, peur des effets indésirables des traitements, présence et gravité des effets indésirables des médicaments, perception du besoin d’un traitement médicamenteux ou de l’efficacité du traitement, etc.), au système de santé, à la relation entre les patients et leurs médecins. En plus, lorsqu’on utilise les bases de données administratives, on doit faire des postulats, comme de considérer qu’un médicament acheté correspond à un médicament réellement utilisé, ou de considérer qu’un médicament pris avant une hospitalisation sera toujours pris pendant l’hospitalisation – les informations sur l’utilisation des médicaments lors d’une hospitalisation ne sont pas colligées dans les bases de données de la RAMQ. Enfin, les résultats de recherche obtenus en étudiant uniquement les assurés au RPAM ne sont pas nécessairement généralisables à l’ensemble de la population québécoise étant donné que les personnes bénéficiant d’un régime privé d’assurance médicaments avec leur employeur ne sont pas prises en compte.

Conclusions

L’usage des bases de données médico-administratives dans les études épidémiologiques en santé mentale offre plusieurs avantages, mais comporte aussi des limites et des défis à surmonter. En effet, les bases de données médico-administratives de la RAMQ permettent l’accès à une large cohorte de personnes provenant de partout au Québec, étant donné que plus de 40 % de la population du Québec est assurée par le RPAM dont la presque totalité des personnes âgées de 65 ans et plus⁶². Cet avantage peut servir non seulement à la recherche épidémiologique, mais également dans la surveillance des maladies mentales, et ainsi contribuer à la planification d’interventions cliniques ou de santé publique et à l’établissement de politiques de santé.

Cependant, il faut bien connaître le processus d’accès aux données de la RAMQ et être conscient des délais lorsqu’on planifie des recherches (surtout dans le cas d’une utilisation pour un projet de maîtrise ou de doctorat) qui doivent se conclure en un temps raisonnable. Une fois les données obtenues, il convient aussi de bien cerner les limites de ces bases de données et d’en tenir compte dans la planification et la conduite de la recherche en santé mentale ainsi que dans l’interprétation des résultats et leur utilisation. En effet, nous avons constaté que de définir la dépression à partir de ces bases de données demandait des compromis puisque toute l’information concernant le diagnostic et les traitements de la dépression n’y est pas captée. Par exemple, décider de la fin d’un premier épisode dépressif et du début d’un nouvel épisode demande d’émettre certaines hypothèses, ce qui engendre d’autres incertitudes sur les résultats.

Afin de mieux répondre aux questions que rencontre le système de santé du Québec, une réflexion devra être menée pour corriger les insuffisances structurelles des bases de données de la RAMQ. À cet effet, il faudra travailler à rendre possible, dans le futur, le jumelage des bases de données de la RAMQ avec les données cliniques des patients ainsi que les données des examens de laboratoire. Il faudra aussi travailler à rendre disponibles les données sur l’usage des médicaments pour l’ensemble de la population québécoise. Cela permettra de répondre plus efficacement à des questions liées aux traitements et aux maladies mentales en considérant toute la population. Dans cette optique, on peut s’inspirer du modèle de la province de l’Alberta qui, depuis 2000, collige les ordonnances de presque toute la population (95 %) à travers un réseau informatisé dénommé Pharmaceutical Information Network⁶³. Cette province met également à la disposition des chercheurs les données de laboratoire des patients.

Résumé

Abstract

Introduction

Les bases de données médico-administratives du Québec

Identifier les cas de dépression dans les bases de données médico-administratives

Exemple de l’utilisation des bases de données médico-administratives de la RAMQ pour estimer l’incidence de la dépression et l’effet de la dépression sur l’adhésion au traitement médicamenteux antidiabétique au Québec

Conclusions

Remerciements

Bibliographie

Liste des tableaux

Résumés

Résumé

Abstract

Corps de l’article

Introduction

Les bases de données médico-administratives du Québec

Identifier les cas de dépression dans les bases de données médico-administratives

Exemple de l’utilisation des bases de données médico-administratives de la RAMQ pour estimer l’incidence de la dépression et l’effet de la dépression sur l’adhésion au traitement médicamenteux antidiabétique au Québec

Conclusions

Parties annexes

Remerciements

Bibliographie

Liste des tableaux

Outils de citation

Citer cet article

Exporter la notice de cet article