Évaluer la résilience des étudiants en santé en France : adaptation et mesure de l’invariance de l’échelle CD-RISC 10

  • Gilles Guihard,
  • Audrey Morice-Ramat,
  • Laurent Deumier,
  • Lionel Goronflot,
  • Brigitte Alliot-Licht et
  • Ludivine Bouton-Kelly

…plus d’informations

  • Gilles Guihard
    Université de Nantes

  • Audrey Morice-Ramat
    Université de Nantes

  • Laurent Deumier
    Université de Nantes

  • Lionel Goronflot
    Université de Nantes

  • Brigitte Alliot-Licht
    Université de Nantes

  • Ludivine Bouton-Kelly
    Université de Nantes

Note des auteurs

La correspondance liée à cet article peut être adressée à [gilles.guihard@univ-nantes.fr].

Les auteurs ne déclarent aucun conflit d’intérêt.

Gilles Guihard est du Centre de recherche en éducation de Nantes (CREN) et de la Faculté de médecine de l’Université de Nantes. Ludivine Bouton-Kelly est de la Faculté de médecine de l’Université de Nantes. Audrey Morice-Ramat et Lionel Goronflot sont du Département de médecine générale, à la Faculté de médecine de l’Université de Nantes. Laurent Deumier et Brigitte Alliot-Licht sont de la Faculté d’odontologie de l’Université de Nantes.

Couverture de Volume 41, numéro 2, 2018, p. 1-162, Mesure et évaluation en éducation

Corps de l’article

Introduction

L’épuisement professionnel ou burnout représente une réponse inadéquate à des conditions de vie stressantes qui conduit à une diminution du bien-être, de la qualité de vie et des performances (Salvagioni et al., 2017). Ce syndrome se manifeste par des dysfonctionnements physiologiques (Dimsdale, 2008 ; Huerta-Franco et al., 2013) et par des signes psychologiques tels que l’anxiété, la dépression, la perte de motivation, la réduction des contacts interpersonnels et des tendances suicidaires (Gunnar et Quevedo, 2007). Plusieurs travaux rapportent que les étudiants en santé peuvent être affectés par le burnout au cours de leur scolarité (Ishak et al., 2013 ; de Cavalcante Almeida, de Souza, de Almeida, de Cavalcante Almeida et Almeida, 2016 ; Bullock et al., 2017). Selon le curriculum, la prévalence chez les étudiants en médecine varie de 15 % à 45 % (Dyrbye et al., 2006 ; Galam, Komly, Le Tourneur et Jund, 2013 ; de Cavalcante Almeida et al., 2016).

Les formations en santé sont activement impliquées dans la mise en place de stratégies visant à réduire l’impact du burnout chez les étudiants. Parmi celles-ci, le développement de la résilience tient une place particulière (Kreitzer et Klatt, 2017). La résilience représente la capacité d’un individu ou d’un groupe à préserver sa qualité de vie ainsi qu’à continuer à se projeter dans l’avenir en dépit d’événements déstabilisants, de conditions de vie difficiles ou de traumatismes importants (Herrman et al., 2011 ; Rutter, 2013). Bien que répartie de façon inégale entre les individus en fonction du genre, de l’origine culturelle et du contexte de vie, cette faculté peut se développer tout au long de la vie (Rutter, 2012 ; Daskalakis, Bagot, Parker, Vinkers et de Kloet, 2013).

L’évaluation de la résilience a fait l’objet de la conception et de l’adaptation de plusieurs outils psychométriques (Windle, Bennett et Noyes, 2011). Parmi ceux-ci, l’échelle d’évaluation de Connor et Davidson (CD-RISC pour Connor-Davidson Resilience Scale) représente un outil valide et performant (Connor et Davidson, 2003). Ce questionnaire de 25 items propose une évaluation basée sur une échelle de Likert à cinq points. L’addition des scores obtenus pour chaque item produit un score total plus ou moins élevé qui indique un potentiel de résilience plus ou moins fort. L’échelle CD-RISC présente de bonnes qualités psychométriques dans la population générale aux États-Unis (Connor et Davidson, 2003). Sur la base d’une analyse factorielle, Connor et Davidson (2003) ont proposé une structure à cinq facteurs incluant : 1) les compétences personnelles et la ténacité, 2) une confiance en ses propres instincts, 3) une attitude positive devant le changement, 4) le contrôle de son environnement, et 5) la spiritualité.

Différentes versions de l’échelle CD-RISC ont été adaptées, permettant une exploration de la résilience dans les populations sud-africaine (Jǿrgensen et Seedat, 2008), autrichienne (Tran, Glück et Lueger-Schuster, 2013), brésilienne (Solano et al., 2012), chinoise (Yu et Zhang, 2007 ; Yu et al., 2011), coréenne (Baek, Lee, Joo, Lee et Choi, 2010 ; Jung et al., 2012), espagnole (Manzano-García et Ayala-Calvo, 2013), française (Guihard et al., 2018), indienne (Singh et Yu, 2010), iranienne (Khoshouei, 2009), néerlandaise (Giesbrecht et al., 2009), russe (Vetter et al., 2010) et turque (Karaırmak, 2010).

Les propriétés psychométriques de ces traductions ont été analysées dans des contextes variés (Campbell-Sills et Stein, 2007 ; Gillespie, Chaboyer et Wallis, 2007 ; Jǿrgensen et Seedat, 2008 ; Lamond et al., 2008 ; Burns et Anstey, 2010 ; Sexton, Byrd et von Kluge, 2010 ; Fu, Leoutsakos et Underwood, 2014 ; Green et al., 2014 ; Xie, Peng, Zuo et Li, 2016). Pour certaines versions (Gillespie et al., 2007 ; Baek et al., 2010 ; Yu et al., 2011 ; Jung et al., 2012), la structure factorielle et la composition des facteurs de résilience restent identiques à celles déterminées par Connor et Davidson (2003). Toutefois, ces similitudes ont été remises en question dans de nombreux autres travaux (Campbell-Sills et Stein, 2007 ; Yu et Zhang, 2007 ; Jǿrgensen et Seedat, 2008 ; Lamond et al., 2008 ; Karaırmak, 2010 ; Khoshouei, 2009 ; Burns et Anstey, 2010 ; Sexton et al., 2010 ; Singh et Yu, 2010 ; Fu et al., 2014 ; Green et al., 2014 ; Xie et al., 2016 ; Guihard et al., 2018). L’absence de consensus concernant les propriétés de l’échelle CD-RISC rend donc complexe et difficile l’interprétation comparative de la résilience dans des contextes démographiques, culturels, psychologiques ou psychopathologiques donnés.

Une version abrégée constituée de 10 items (CD-RISC 10) a été conçue par Campbell-Sills et Stein (2007). Il existe aujourd’hui un consensus autour de cette échelle puisque sa composition et sa structure unidimensionnelle sont largement acceptées dans la plupart des versions publiées (Burns et Anstey, 2010 ; Wang, Shi, Zhang et Zhang, 2010 ; Gucciardi, Jackson, Coulter et Mallett, 2011 ; Notario-Pacheco et al., 2011 ; Rodrigues Lopes et do Carmo Fernandes Martins, 2011 ; Coates, Phares et Dedrick, 2013 ; Serrano-Parra et al., 2013 ; Notario-Pacheco et al., 2014 ; Duong et Hurst, 2016 ; Gonzales, Moore, Newton et Galli, 2016 ; Ye et al., 2017).

La résilience d’étudiants en santé en France peut-elle être évaluée de manière comparative ? Actuellement, une version validée pour ce type de répondant de l’échelle CD-RISC 10 fait toujours défaut, bien qu’un score CD-RISC 10 ait été calculé pour un échantillon de femmes françaises (Scali et al., 2012) et qu’un échantillon de femmes franco-canadiennes ait été utilisé pour une validation de l’échelle (Hébert, Parent, Simard et Laverdière, 2018). Par ailleurs, une analyse statistique comparative de scores suppose que l’invariance du modèle structural ait été vérifiée. À notre connaissance, il n’existe qu’une seule étude ayant réalisé une mesure d’invariance pour une version anglophone de l’échelle CD-RISC 10 (Gonzales et al., 2016). Nos objectifs ont donc consisté à élaborer la première version française de l’échelle CD-RISC 10, à tester cette version auprès d’un échantillon constitué de jeunes étudiants français en santé et à vérifier que les propriétés psychométriques en garantissent une utilisation en tant qu’outil fiable pour des évaluations comparatives de la résilience.

Méthodes

Recrutement des participants et passation du questionnaire

Cette étude fait partie d’un travail global visant à analyser les caractéristiques psychologiques des étudiants en santé à l’Université de Nantes. Il a fait l’objet d’une accréditation de la part du comité local d’éthique de l’Université de Nantes (no de référence ST/BB 14-772). Pour constituer le questionnaire, nous avons utilisé les items 1, 4, 6, 7, 8, 11, 14, 16, 17 et 19 de l’échelle CD-RISC (renumérotés de 1 à 10 dans l’échelle CD-RISC 10), après que ceux-ci eurent été adaptés en français par une équipe regroupant deux scientifiques, deux dentistes et une traductrice anglais-français agréée (Guihard et al., 2018).

Les étudiants inscrits à l’Université de Nantes en première année commune aux études de santé (PACES, n = 1387), en formation médicale (2e à 6e année, n = 1176), en formation d’odontologie (2e à 6e année, n = 387) et en 3e cycle de médecine générale (n = 380) ont été inclus dans l’enquête. Un accès au questionnaire a été proposé (entre mars et mai 2014) à chaque étudiant après la validation électronique d’un formulaire de consentement expliquant les buts et les moyens mis en oeuvre dans l’étude. Une anonymisation des réponses et l’exploitation exclusive des données par les seuls chercheurs ont été assurées. Les individus contactés ont été invités à répondre à la question suivante pour chaque item : « Jusqu’à quel degré êtes-vous en accord ou en désaccord avec les propositions suivantes ? » Une notation de chaque item a été effectuée en utilisant une échelle de Likert à cinq points dans laquelle 0 et 4 correspondent respectivement à « totalement en désaccord » et « totalement d’accord ».

Caractéristiques des répondants

À l’issue de la consultation et après le retrait des réponses incomplètes et/ou aberrantes (test de Dixon ; Rorabacher, 1991), le nombre de questionnaires pris en considération correspondait à 1347. La composition de l’échantillon total est donnée dans le tableau 1. Le rapport F/H valait 1,89 (881 femmes, 466 hommes) dans notre étude. Il était représentatif de celui retrouvé dans les formations de santé en France (Ministère de l’Enseignement supérieur et de la Recherche, 2011).

Analyse des données

Les données collectées ont été analysées grâce aux logiciels SPSS 21.0, Amos 20, SigmaPlot 12 et R (librairies userfriendlyscience et psych) (Revelle, 2016 ; Peters, 2018). Le caractère adéquat du questionnaire a été déduit à partir du coefficient de Kaiser-Meyer-Olkin (KMO, seuil d’acceptabilité > 0,7), du test de Bartlett (seuil d’acceptabilité défini par p < 0,001) et de la valeur du coefficient de corrélation partielle calculé pour chaque item dans la matrice de corrélation anti-image (coefficient AIC, seuil d’acceptabilité > 0,6).

Tableau 1

Composition de l’échantillon total

Composition de l’échantillon total

-> Voir la liste des tableaux

La structure factorielle a été étudiée par des analyses factorielles confirmatoires (AFC) menées sur l’échantillon total, sur les sous-échantillons constitués par les étudiants en PACES, en odontologie, en médecine et en médecine générale, ainsi que sur deux sous-échantillons correspondant aux étudiantes (n = 881) et aux étudiants (n = 466). Tel qu’il a été suggéré antérieurement (Hooper, Coughlan et Mullen, 2008), nous avons déterminé la justesse du modèle à partir des valeurs des indices d’ajustement suivants :

  • le khi carré normalisé par le nombre de degrés de liberté (χ2/ddl, seuil d’acceptabilité ~ 2,0) ;

  • la valeur standardisée de la racine carrée de l’erreur quadratique moyenne des résidus (SRMR ou standardized root mean square residual, valeur optimale < 0,05) ;

  • l’indice de qualité de l’ajustement (GFI ou goodness of fit index, seuil d’acceptabilité > 0,9) ;

  • l’indice pondéré de qualité de l’ajustement (AGFI ou adjustedgoodness of fit index, seuil d’acceptabilité > 0,9) ;

  • la racine carrée de l’erreur quadratique moyenne d’approximation (RMSEA ou root mean square error of approximation, seuil d’acceptabilité < 0,08) ;

  • l’indice comparatif d’ajustement (CFI ou comparative fit index, seuil d’acceptabilité > 0,9) ; et

  • le critère d’information d’Akaike corrigé (cAKIC ou correctedAkaike information criterion, dont la valeur est idéalement la plus faible possible).

La validité a été analysée en tenant compte de différents critères. La consistance interne a été estimée en calculant les coefficients alpha (α) de Cronbach, oméga (Ω) de McDonald (Revelle et Zinbarg, 2009) et greatest lower bound (GLB ; Sijtsma, 2009). Les corrélations entre les items et les corrélations entre le score de chaque item et le score total (corrélation item-score ou CIS) ont été calculées. La validité convergente de l’échelle a été estimée à partir de la variance moyenne extraite (VME = Σλ2/ Σλ2 + Σ1 - λ2 ; où représente la valeur de saturation factorielle de chaque item) et à partir de l’indice de fiabilité (IF = (Σλ)2 / (Σλ)2 + Σ (1 - λ2)) (Fornell et Larcker, 1981). La validité convergente a été considérée comme acceptable lorsque VME > 0,5 et IF > 0,7. La stabilité dans le temps a été analysée à partir du coefficient de concordance (Lin, 1989) et du coefficient de corrélation intra-classe (mode de calcul « cohérence absolue » dans SPSS). Ces indicateurs ont été calculés à partir de 203 réponses obtenues auprès d’étudiants en médecine (F/H = 1,93) ayant participé à l’enquête entre mars et mai 2014, puis réinterrogés en septembre 2014.

L’invariance de l’échelle en fonction du genre ou du curriculum a été estimée par une analyse confirmatoire multi-groupes (méthode d’ajustement par maximum de vraisemblance) en intégrant progressivement les contraintes suivantes (Dimitrov, 2010) :

  • aucune contrainte (invariance de configuration) ;

  • invariance des valeurs de saturation factorielle (invariance métrique assimilée à un faible niveau) ;

  • invariance des valeurs de seuil pour chaque item (invariance scalaire assimilée à un niveau fort).

Le niveau d’invariance scalaire entre groupes devait obligatoirement être atteint avant de pouvoir effectuer une comparaison statistique des scores moyens obtenus par les différents groupes (Dimitrov, 2010). Pour chaque niveau d’invariance, il a été possible d’évaluer la qualité de l’ajustement avec les données expérimentales à travers les indices CFI et RMSEA et le degré de changement ∆CFI et ∆RMSEA entre deux niveaux consécutifs. Nous avons retenu les seuils d’acceptabilité proposés par Hu et Bentler (1999) pour les indicateurs RMSEA (< 0,08) et CFI (> 0,9) et les critères proposés par Cheung et Reinsvold (2002) pour accepter un modèle d’ajustement de plus en plus contraint (∆CFI < 0,01 et ∆RMSEA < 0,02 en valeur absolue).

Résultats

Analyses statistiques et psychométriques

L’examen des réponses de l’échantillon total a montré le caractère adéquat des items constituant le questionnaire puisque le test de Bartlett a été passé avec succès (χ2 = 2482,0 ; degré de liberté = 45 ; p < 0,001) et puisque l’indice KMO valait 0,879. Les valeurs de coefficient de corrélation partielle (AIC) des différents items étaient supérieures à 0,8 (voir Tableau 2). Les scores de chaque item ont été déterminés dans l’échantillon total et chez les étudiantes et les étudiants (voir Tableau 2). Le score total moyen (±écart-type) obtenu par l’ensemble des répondants correspondait à 25,9 (±5,4).

Les corrélations entre le score obtenu pour chaque item et le score total étaient significatives et variaient entre 0,28 (item 3) et 0,59 (item 9) (voir Tableau 3). Par ailleurs, nos résultats ont montré que les corrélations entre items étaient significatives et s’inscrivaient entre 0,10 (pour les items 3 et 6) et 0,44 (pour les items 8 et 9) (voir Tableau 3). Dans nos conditions de test-retest, les valeurs calculées pour le coefficient de corrélation intra-classe et le coefficient de concordance équivalaient respectivement à 0,87 (p < 0,001) et à 0,72 (CI95 = [0,66 ; 0,78]).

Tableau 2

Questionnaire CD-RISC 10

Questionnaire CD-RISC 10

-> Voir la liste des tableaux

Tableau 3

Analyse des corrélations

Analyse des corrélations

-> Voir la liste des tableaux

L’analyse factorielle confirmatoire réalisée sur l’échantillon total a permis d’extraire les valeurs de saturation factorielle (λ) pour chaque item dans un modèle unidimensionnel de base (voir Tableau 2). Ce modèle de base expliquait ~ 35 % de la variance observée. Quatre items (2, 3, 4 et 10) présentaient une valeur de saturation factorielle inférieure à 0,5, suggérant une validité convergente assez faible. La valeur calculée de l’indice VME (0,278) indique effectivement une faible validité convergente. Toutefois, la valeur de l’indice de fiabilité (IF = 0,789) calculée à partir de nos données argumente en faveur d’une validité convergente acceptable. En segmentant notre échantillon selon le genre, nous avons calculé des valeurs de VME et d’IF égales à 0,287 et 0,797 pour les étudiantes et entre 0,240 et 0,745 pour les étudiants. Les mêmes indices calculés en fonction du curriculum avaient des valeurs égales à 0,213 et 0,720 pour les étudiants en PACES, entre 0,216 et 0,708 pour les étudiants en médecine, entre 0,262 et 0,773 pour les étudiants en odontologie et entre 0,501 et 0,908 pour les internes de médecine générale. Ces résultats ont montré que l’échelle CD-RISC 10 en français satisfaisait aux critères de validité convergente pour le sous-échantillon d’internes de médecine générale, exclusivement.

Les indices calculés ont montré un meilleur ajustement aux données expérimentales du modèle unidimensionnel (voir Tableau 4) que du modèle à deux facteurs défendu par Aloba et ses collaborateurs (2016) (n = 1347 ; χ2/ddl = 4,96 ; sRMR = 0,035 ; GFI = 0,97 ; AGFI = 0,96 ; RMSEA = 0,054 ; CFI = 0,94 ; cAKIC = 340,8). Nos analyses ont aussi montré que ce modèle unidimensionnel s’ajustait particulièrement bien lorsqu’il était testé sur les échantillons en PACES, en odontologie, en médecine et en médecine générale (voir Tableau 4). Enfin, les indices d’ajustement calculés pour un modèle unidimensionnel présentaient des valeurs très supérieures aux seuils d’acceptabilité lorsque les échantillons constitués par les étudiantes et par les étudiants étaient considérés séparément (voir Tableau 4). Nous avons calculé les indicateurs de consistance interne du modèle unidimensionnel pour la totalité des répondants et pour chaque échantillon (voir Tableau 4). Dans ces conditions, toutes les valeurs calculées étaient supérieures à 0,7, satisfaisant ainsi la condition d’acceptabilité pour la consistance interne du questionnaire.

Mesure de l’invariance du modèle unidimensionnel

Dans un premier temps, nous avons évalué l’invariance de l’échelle en fonction du genre pour l’échantillon total et pour les différents sous-échantillons (voir Tableau 5). Les valeurs des critères RMSEA et ∆RMSEA étaient satisfaisantes pour les niveaux configurationnel, métrique et scalaire pour les différents groupes. Toutefois, les critères CFI et ∆CFI atteignaient leur seuil pour une invariance scalaire uniquement dans les sous-échantillons étudiants en PACES et internes de médecine générale (voir Tableau 5). En revanche, le niveau d’invariance scalaire de l’échelle entière n’était pas atteint dans les sous-échantillons médecine et odontologie et dans l’échantillon total (voir Tableau 5). Afin d’évaluer l’occurrence d’une invariance scalaire partielle, nous avons levé la contrainte d’égalité des seuils d’items dans ces groupes. Nos résultats montrent que tous les items étaient invariants entre étudiantes et étudiants, à l’exception des items 3 et 10 dans l’échantillon total et dans le sous-groupe odontologie (voir Tableau 5). Pour le sous-groupe médecine, il a été nécessaire de lever la contrainte pour un item supplémentaire (item 4).

Tableau 4

Analyse factorielle confirmatoire du modèle unidimensionnel

Analyse factorielle confirmatoire du modèle unidimensionnel

-> Voir la liste des tableaux

Tableau 5

Analyse de l’invariance de l’échelle CD-RISC 10 en fonction du genre

Analyse de l’invariance de l’échelle CD-RISC 10 en fonction du genre

-> Voir la liste des tableaux

Dans un second temps, nous avons analysé l’invariance du modèle dans les différents curriculums (PACES, odontologie, médecine et médecine générale) (voir Tableau 6). Les valeurs des critères RMSEA et RMSEA restaient en deçà des seuils de rejet jusqu’au niveau d’invariance scalaire. Toutefois, les critères CFI et CFI n’étaient satisfaits que pour les niveaux configurationnel et métrique. Afin d’évaluer une invariance scalaire partielle, nous avons considéré le modèle d’invariance métrique (M02) et introduit pour chaque item pris individuellement une contrainte d’égalité de seuil (modèle M03*item). Nos résultats ont montré que le niveau scalaire était observable pour l’échantillon total ou le sous-échantillon « étudiantes » lorsque la contrainte d’invariance s’appliquait aux items 3, 8 ou 9, individuellement. Pour le sous-échantillon « étudiants », le niveau scalaire était observable en contraignant l’invariance des items 3, 7, 8 ou 9, individuellement. Finalement, nous avons envisagé la possibilité d’une invariance scalaire partielle en testant différentes combinaisons d’items. Notre analyse a montré que 7 des 10 items composant l’échelle CD-RISC 10 n’étaient pas invariants entre les sous-groupes testés dans l’échantillon total et dans les deux sous-échantillons « étudiantes » et « étudiants » (voir Tableau 6). Ainsi, le niveau scalaire n’était respecté que si la contrainte d’égalité des seuils s’imposait simultanément aux items 3, 8 et 9 (voir Tableau 6).

Analyse des différences de résilience

Les scores totaux (moyenne ±écart-type) des sous-échantillons PACES, odontologie, médecine et médecine générale correspondaient respectivement à 26,8 ±4,9 ; à 25,6 ±5,0 ; à 26,0 ±4,5 ; et à 31,0 ±7,3. L’invariance scalaire entre ces quatre échantillons n’étant pas validée pour l’ensemble des items, la comparaison statistique des scores moyens aurait eu peu de sens. Pour la même raison, l’analyse des différences liées au genre a été restreinte aux sous-échantillons PACES et médecine générale, pour lesquels l’invariance scalaire était avérée. La comparaison statistique a montré que le score moyen (±écart-type) des étudiants (28,1 ±7,4) est significativement plus important (t(1, 684) = 4,57 ; p < 0,001 ; coefficient d de Cohen = 0,29) que celui des étudiantes (26,3 ±4,9) en PACES. De même, les internes de médecine générale avaient un score (33,4 ±6,3) significativement plus important (t(1, 135) = 2,58 ; p = 0,011 ; coefficient d de Cohen = 0,49) que leurs homologues féminins (30,0 ±7,5).

Tableau 6

Analyse de l’invariance de l’échelle CD-RISC 10 en fonction du curriculum

Analyse de l’invariance de l’échelle CD-RISC 10 en fonction du curriculumAnalyse de l’invariance de l’échelle CD-RISC 10 en fonction du curriculum

-> Voir la liste des tableaux

Discussion

Le travail rapporté ici avait pour objectif principal de produire la première adaptation en français du questionnaire CD-RISC 10 et de caractériser ses propriétés psychométriques. L’échantillon mobilisé pour l’enquête était constitué d’étudiants en formation de santé depuis la 1re année jusqu’au 3e cycle.

Propriétés psychométriques du questionnaire CD-RISC 10

L’analyse factorielle confirmatoire suggère que le questionnaire présente une structure unidimensionnelle similaire à celle décrite pour toutes les autres versions (Campbell-Sills et Stein, 2007 ; Burns et Anstey, 2010 ; Wang et al., 2010 ; Gucciardi et al., 2011 ; Notario-Pacheco et al., 2011 ; Rodrigues Lopes et do Carmo Fernandes Martin, 2011 ; Coates et al., 2013 ; Goins, Gregg et Fiske, 2013 ; Serrano-Parra et al., 2013 ; Duong et Hurst, 2016 ; Gonzales et al., 2016). Cette structure est vérifiée pour l’échantillon total, pour les sous-échantillons d’étudiantes et d’étudiants et pour les quatre sous-échantillons définis par le curriculum des répondants. Nos résultats montrent que la consistance interne du questionnaire est acceptable quel que soit l’échantillon considéré. Bien que cette règle soit contestée dans le cas d’outils psychométriques multidimensionnels (Crutzen et Peters, 2015), la consistance interne d’un questionnaire unidimensionnel peut être approchée par le calcul du coefficient a de Cronbach. Dans notre étude, le coefficient a excède systématiquement la valeur d’acceptabilité et atteint une excellente valeur pour les internes de médecine générale. De bonnes à excellentes valeurs sont observées pour les deux autres indicateurs de consistance interne (V et GLB). Nos valeurs de corrélation entre le score de chaque item et le score total du questionnaire CD-RISC 10 sont plus faibles que dans la version cambodgienne (Duong et Hurst, 2016), mais elles sont du même ordre de grandeur que celles rapportées pour d’autres versions (Gucciardi et al., 2011 ; Notario-Pacheco et al., 2011 ; Gonzales et al., 2016).

Un critère de validation d’un modèle psychométrique porte sur la valeur de saturation factorielle imputable à chaque item (Osborn et Fitzpatrick, 2012). Ces valeurs calculées pour l’échantillon total satisfont partiellement au critère d’acceptabilité. Nous observons des valeurs élevées, dont une valeur particulièrement élevée pour l’item 9. Toutefois, la valeur déterminée pour l’item 3 (« J’essaie de voir le côté humoristique des choses lorsque je suis confronté(e) à des problèmes ») reste faible, même si elle est comparable aux valeurs décrites par Burns et Anstey (2010) chez de jeunes adultes australiens et par Gucciardi et ses collègues (2011) chez des sportifs australiens. De faibles valeurs de saturation pour cet item ont aussi été rapportées dans plusieurs travaux reposant sur des échantillons d’étudiants nord-américains inscrits en 1er cycle universitaire (âge moyen : 18 ans ; rapport des sexes : 2,9) (Campbell-Sills et Stein, 2007) et de lycéens cambodgiens (âge moyen : 17 ans ; rapport des sexes : 1,2) (Duong et Hurst, 2016). En revanche, les travaux menés chez des enseignants chinois victimes du séisme de 2008 au Sichuan (âge moyen : 39 ans ; rapport des sexes : 1,2) (Wang et al., 2010), chez des étudiants espagnols (âge moyen : 20 ans ; rapport des sexes : 2,9) (Notario-Pacheco et al., 2011), chez des hommes afro-américains à faible revenu (âge moyen : 32 ans) (Coates et al., 2013) ou chez des coureurs de fond nord-américains de haut niveau (âge moyen : 35 ans ; rapport des sexes : 0,8) (Gonzales et al., 2016) montrent de profondes divergences par rapport à nos valeurs de saturation factorielle. Ces divergences pourraient refléter des différences sociales et/ou culturelles ainsi que des différences liées au parcours de vie quant à la compréhension/l’interprétation de chaque item, tel que le suggère Clauss-Ehlers (2008). Ainsi, notre travail indique que l’utilisation de l’humour pourrait être moins contributive qu’ailleurs dans la résilience chez les étudiants en santé. Il est plausible que les étudiants en santé contextualisent au domaine du soin l’évocation de « stress », de « situation », de « problème » et de « pression », termes présents dans les items du questionnaire. Dans ces conditions, l’apport humoristique pourrait entrer en conflit avec l’approche thérapeutique traditionnelle.

Nos résultats suggèrent que l’échelle CD-RISC 10 présente une validité convergente qui reste proche de celle déterminée précédemment (Wang et al., 2010 ; Notario-Pacheco et al., 2011). Dans nos conditions, l’indice VME calculé pour la totalité de l’échantillon est inférieur à 0,5, ce qui indique que plus de 50 % de la variance des données est imputable à une erreur de mesure. Nous n’avons pas d’explication claire concernant cette observation. Toutefois, la segmentation de l’échantillon selon le curriculum a montré que la validité convergente était satisfaite pour un seul sous-échantillon (internes de médecine générale), ce qui indique une hétérogénéité entre les sous-échantillons quant à la proportion de variance imputable à une erreur de mesure. De plus, nous n’avons pas pu évaluer la validité discriminante de l’échelle en raison du caractère unidimensionnel établi par notre étude et en raison de l’absence de réponses concomitantes à des items constitutifs d’autres échelles dans notre échantillon. En dépit de ce dernier point, nos résultats pris dans leur ensemble indiquent que le questionnaire CD-RISC 10 possède des qualités psychométriques acceptables. Selon notre analyse, la version française de l’échelle CD-RISC 10 représente un outil fiable pour la mesure de la résilience dans une population d’étudiants en santé en France.

Invariance du questionnaire en fonction de l’appartenance du répondant

À notre connaissance, une analyse d’invariance du questionnaire CD-RISC 10 en fonction de l’année d’études ou du curriculum n’a jamais été réalisée. Il ressort de nos travaux que les niveaux configurationnel et métrique sont vérifiés pour les différents échantillons analysés. Cela suggère que les items définissant le questionnaire et leur relation avec la résilience sont perçus de manière similaire par l’ensemble des répondants. Toutefois, le niveau scalaire n’a pas été atteint pour l’échelle entière. Il n’est donc pas possible de comparer statistiquement les scores de résilience obtenus par les différents sous-échantillons.

Invariance du questionnaire en fonction du genre

Une précédente analyse avait montré l’existence d’une invariance stricte en fonction du genre pour la version longue du questionnaire CD-RISC (Liu, Fairweather-Schmidt, Burns et Roberts, 2015). Selon le travail réalisé sur le questionnaire CD-RISC 10 dans un échantillon de sportifs de haut niveau (Gonzales et al., 2016), l’invariance de configuration et l’invariance métrique étaient vérifiées, ce qui suggère que les items constituant le questionnaire sont reliés à la résilience de façon identique chez les sportives et les sportifs. Gonzales et ses collègues (2016) ont argumenté que l’invariance scalaire était aussi vérifiée sur la base du calcul du CFI. Toutefois, cette conclusion ne nous semble pas valide puisque la valeur du CFI reste < 0,9 dans leurs conditions. Dans notre travail, l’invariance de configuration et l’invariance métrique sont confirmées entre les genres dans l’échantillon total et dans les quatre échantillons établis selon l’appartenance des répondants. Il apparaît ainsi que les 10 items constituant la version française du questionnaire sont perçus et reliés de manière identique à la résilience par les étudiantes et les étudiants en santé. Nous rapportons que l’invariance scalaire de l’échelle entière n’est vérifiée que chez les étudiants en PACES et chez les internes de médecine générale, ce qui autorise ainsi une comparaison statistique au sein de ces sous-échantillons.

Dans les échantillons médecine et odontologie, la non-vérification de l’invariance selon le genre au-delà du niveau métrique indique que la résilience pourrait être influencée par des facteurs inconnus affectant différemment les étudiantes et les étudiants de ces formations. Il a été montré que la motivation de l’étudiant en santé subit une érosion importante avec l’avancée dans le curriculum durant les études d’odontologie (Deumier et al., 2016). Par ailleurs, un accroissement de l’anhédonisme est favorisé par la formation en médecine ou en odontologie (Guihard, 2018). Une expression différentielle de ces facteurs chez les étudiantes et les étudiants de notre échantillon pourrait affecter différemment leur représentation et le développement de leur résilience.

Toutefois, la levée de la contrainte d’égalité des seuils pour les items 3, 4 et 10 permet de valider une invariance scalaire dans les deux sous-groupes précités. Comme nous l’avons mentionné plus haut, le contenu de l’item 3 fait référence à l’humour comme élément permettant de surmonter un problème. Notre travail suggère que cet item n’est pas appréhendé de manière similaire par les étudiantes et les étudiants. Cela pourrait s’expliquer par des différences de perception de l’humour (Aillaud et Piolat, 2012), de manifestation de l’humour (les hommes préférant des formes d’humour agressives dans les relations interpersonnelles ; Cann et Matson, 2014) ou encore d’utilisation de l’humour dans la résolution de problème (Hay, 2000). L’item 4 fait intervenir la notion de force, notion ambigüe (physique, psychologique) pouvant être comprise différemment selon le genre (Linley et al., 2007). Enfin, l’item 10 mobilise la compréhension d’un contexte émotionnel pour lequel des différences liées au genre des étudiants de santé ont été rapportées (Zhu, Luo, Liu et Qu, 2018).

Variation de la résilience en fonction du genre

Le critère d’invariance étant satisfait pour les étudiants en PACES et les internes de médecine générale, les scores ont été analysés en fonction du genre. Notre analyse montre que les étudiants possèdent une résilience supérieure à celle de leurs homologues féminins. Toutefois, le descriptif de plusieurs items du questionnaire CD-RISC 10 fait référence aux notions de force, de confrontation, d’opiniâtreté et de performance. Il est possible que les hommes interrogés dans notre enquête aient surestimé leur appréciation par rapport aux étudiantes, induisant un biais par désirabilité sociale. En effet, la désirabilité sociale correspond à une tendance à répondre d’une manière socialement – ou supposée socialement – acceptable (Paulhus, 1991). Elle peut inciter les hommes ou les femmes à surestimer ou à sous-estimer leurs réponses. Cela a déjà été rapporté dans d’autres études (Hebert et al., 1997 ; Freitas, Oliveira, Correia, Pinhão et Poínhos, 2017 ; Latkin, Edwards, Davey-Rothwell et Tobin, 2017).

Limites de l’étude

Ce travail de validation psychométrique du questionnaire CD-RISC 10 présente plusieurs limites. En premier lieu, notre travail repose sur une approche monocentrique et a été réalisé en France. De ce fait, il sera nécessaire d’étendre la caractérisation sur l’ensemble du territoire français et vers les pays de la francophonie. En second lieu, nos résultats sont basés sur les réponses obtenues auprès d’étudiants en formation de santé. De ce point de vue, nos conclusions sont restreintes à la population étudiée et nous ne pouvons pas les étendre à une population plus générale. Un travail futur devra être organisé en vue d’établir une caractérisation des propriétés du questionnaire CD-RISC 10 français dans des échantillons de répondants plus représentatifs de la population générale. La question de la stabilité dans le temps du score CD-RISC 10 est abordée dans notre travail. L’information apportée par le coefficient de corrélation intra-classe suggère une bonne stabilité temporelle quant aux réponses fournies par les étudiants réinterrogés après un délai de trois mois. Toutefois, la valeur du coefficient de concordance de Lin apparaît comme modérée, selon les critères de McBride (2005). Bien qu’ayant un ratio F/H similaire à celui de notre population étudiée, l’échantillon de répondants pour ce test-retest nous semble limité quant à son effectif et à son caractère représentatif puisqu’il est uniquement constitué d’étudiants en santé. De futurs travaux devront explorer plus complètement cette propriété avant la mise en place d’études longitudinales.

Conclusion

Notre travail propose pour la première fois une version française de la forme abrégée CD-RISC 10 de l’échelle CD-RISC de Connor et Davidson. Cette version satisfait plusieurs critères indiquant des qualités psychométriques acceptables. La structure unidimensionnelle réplicable et le nombre réduit d’items en font un outil fiable, ce qui permet son utilisation pour une mesure de la résilience au sein de populations d’étudiants français en santé. Nous rapportons que l’analyse de l’invariance de la mesure doit être systématiquement réalisée afin d’utiliser le questionnaire pour des analyses comparatives. Des études ultérieures devront étendre l’utilisation de ce questionnaire dans une plus large population francophone.

Parties annexes