Évaluation de la validité prédictive de neuf instruments chez les agresseurs sexuels adultes

Parent, Geneviève; Guay, Jean-Pierre; Knight, Raymond

doi:https://doi.org/10.7202/038606ar

Introduction

L’évaluation du risque que posent les délinquants est une tâche cruciale. Elle permet, entre autres, de déterminer les besoins criminogènes des clients et d’établir ainsi des cibles de traitement susceptibles de faire diminuer la probabilité de récidive (Andrews et Bonta, 2003), de favoriser les décisions relatives à l’élargissement des peines et de choisir le niveau de supervision requis dans la collectivité. L’évaluation du risque est donc une étape incontournable à laquelle est rattaché un nombre important de décisions, lesquelles sont lourdes de conséquences tant pour les délinquants que pour la population en général. Il est important de disposer d’instruments permettant d’éclairer le plus efficacement possible les intervenants de première ligne (agent de libération conditionnelle, agent de probation, praticien, etc.) et de minimiser les risques d’erreurs.

Les méthodes d’évaluation du risque que représentent les délinquants ont beaucoup évolué au fil des années. On décrit généralement ces méthodes comme ayant traversé trois phases (Bonta, 1996). La première phase a été celle de l’évaluation clinique traditionnelle, aussi appelée jugement clinique non structuré. Ce type d’évaluation repose sur les entrevues avec le délinquant, les informations contenues dans le dossier et l’intuition du clinicien afin de prédire la récidive d’un agresseur sexuel. La deuxième phase est généralement décrite comme celle où l’on préconise une combinaison statistique de prédicteurs liés empiriquement à la récidive. Finalement, la dernière phase correspond à l’intégration des prédicteurs cliniques (cibles de changement) aux prédicteurs statiques (historiques). À cette étape, il n’est plus question de prédire la récidive (état statique), mais plutôt d’évaluer le risque que représente un individu (état dynamique).

Aujourd’hui, les évaluations cliniques traditionnelles ont laissé place aux évaluations plus structurées, dans lesquelles les items sont clairement établis et leur poids relatif est déterminé. Les évaluations de nature actuarielle ont par ailleurs maintes fois démontré leur supériorité par rapport au jugement clinique non structuré (Meehl, 1954 ; Mossman, 1994 ; Grove et al., 2001 ; Aegisdóttir et al., 2006 ; Hanson et Morton-Bourgon, 2007). En effet, les outils actuariels apportent des règles de codification objective et ne sont pas influencés par diverses stratégies cognitives erronées qui peuvent être associées au jugement clinique, comme les corrélations illusoires (association de deux éléments sans pour autant que cette association soit réelle) ou l’ancrage (l’interprétation des informations obtenues par le clinicien est fortement teintée par son point de vue initial envers le délinquant) (Guay, 2006).

Nos connaissances concernant l’évaluation du risque de récidive chez les délinquants en général se sont grandement accrues depuis les 20 dernières années (Barbaree et al., 2001). Plusieurs instruments qui permettent de déterminer le risque que posent les délinquants ont vu le jour, comme le LSI-R et sa plus récente version, le LS/CMI (Andrews et al., 2004) ou l’ISR (Bonta et al., 1996). Bien qu’ils soient utiles pour prédire la récidive chez les délinquants traditionnels, ils ne prennent pas en compte les différentes particularités des délinquants sexuels et ne comportent donc pas de prédicteurs spécifiques (Hanson et Bussière, 1998). Les travaux en délinquance sexuelle ont permis de cerner différents facteurs de risque liés à la dynamique de l’abus sexuel et, par la suite, de concevoir des instruments d’évaluation du risque propres à ce type de délinquance (Hanson et Bussière, 1998 ; Hanson et Harris, 2000 ; Hanson et Morton-Bourgon, 2004).

Le nombre d’outils s’est multiplié depuis. Parmi eux, les plus utilisés sont le Rapid Risk Assessment for Sex Offender Recidivism (RRASOR : Hanson, 1997), la Statique-99 (Hanson et Thornton, 2000), le Violence Risk Appraisal Guide (VRAG : Harris et al., 1993) et le Sex Offender Risk Appraisal Guide (SORAG : Quinsey et al., 1998). Ces derniers ont fait l’objet de nombreuses études de validation. Dans leur méta-analyse, Hanson et al. (2003) ont combiné les résultats de 17 études pour le RRASOR (échantillon total = 5004), de 15 études pour la Statique-99 (échantillon total = 4202), de 5 études pour le VRAG (échantillon total = 1000) et de cinq études pour le SORAG (échantillon total = 1104). Hanson et al. (2003) ont utilisé le d de Cohen afin de résumer les résultats de ces nombreuses études ; une valeur d de 0,80 est considérée comme « grande » et une valeur d de 0,50 est jugée « moyenne » selon Cohen (1988 : 40). Il est à noter qu’un d de Cohen de 0,68 correspond à une aire sous la courbe ROC de 0,68 et qu’un d de 0,28 correspond à une aire sous la courbe de 0,58 (Hanson et al., 2003). Pour la récidive sexuelle, Hanson et al. (2003) rapportent un d moyen de 0,66 pour le RRASOR (intervalle de confiance [IC] de 0,58 à 0,75), de 0,76 pour la Statique-99 (IC de 0,65 à 0,87), de 0,64 pour le VRAG (IC de 0,50 à 0,79) et de 0,68 pour le SORAG (IC de 0,51 à 0,86). Ces résultats suggèrent que ces quatre outils arrivent à une validité prédictive située entre marginale et modeste[1] avec des échantillons indépendants de ceux de leur conception.

Dans une moindre mesure, trois autres outils ont également fait partie d’études de validation. À notre connaissance, seulement deux études de validation ont été produites pour le Minnesota Sex Offender Screening Tool–Revised (MnSOST–R : Epperson et al., 1998) et leurs résultats ne répliquaient pas ceux obtenus avec l’échantillon initial. En effet, les résultats de Bartosh et al. (2003) et Barbaree et al. (2001) indiquent que le MnSOST–R prédit significativement la récidive générale (aires sous la courbe respectives de 0,66 et 0,65), alors qu’Epperson et al. (2000) rapportent des aires sous la courbe de 0,77 et de 0,76 avec un échantillon de contre-validation pour la récidive sexuelle. Seulement une étude (Langton, Barbaree, Seto et al., 2007) a eu recours à la Statique-2002 (Hanson et Thornton, 2003), et ses résultats concordent avec ceux obtenus grâce à l’échantillon initial (aires sous la courbe variant de 0,71 à 0,72). Finalement, le Risk Matrix 2000 (RM2000 : Thornton et al., 2003) a fait l’objet d’une unique étude de contre-validation. Craig et al. (2006) rapportent des aires sous la courbe inférieures à celles des auteurs pour la récidive sexuelle avec le Risk Matrix Sexual (respectivement de 0,59 à 0,68 et de 0,75 à 0,77), mais des résultats semblables avec le Risk Matrix Violent (respectivement de 0,86 à 0,87 et de 0,78 à 0,85).

Finalement, les deux derniers outils utilisés dans le cadre de cette étude n’étaient pas conçus initialement comme outils actuariels. Le Sexual Violence Risk-20 (SVR-20 : Boer et al., 1997) a été imaginé essentiellement pour guider le clinicien dans la collecte d’informations à propos du risque de violence sexuelle d’un agresseur sexuel adulte. Néanmoins, il a quand même été utilisé aux fins de prédiction dans deux études. Sjöstedt et Långström (2002) parviennent à des aires sous la courbe de 0,49 et de 0,64 pour la récidive sexuelle et violente respectivement (n = 51), tandis que Craig et al. (2006) rapportent des aires sous la courbe de 0,46 à 0,51 pour la récidive sexuelle et de 0,54 à 0,72 pour la récidive violente (n = 131). Finalement, l’échelle de psychopathie (PCL–R : Hare, 2003) a été initialement conçue afin d’évaluer les traits de personnalité psychopathique, et non pour prédire la récidive. Spécifions que l’échelle de psychopathie constitue un aspect du VRAG et du SORAG. De plus, Barbaree et al. (2001) soutiennent que l’échelle de psychopathie semble prédire la récidive en général, tant la récidive violente que sexuelle, dans une population d’agresseurs sexuels (aire sous la courbe de 0,68 et 0,63 respectivement). C’est pourquoi il est nécessaire d’inclure cet instrument dans les analyses de cette étude, et il sera utilisé comme instrument de comparaison.

Bien que les travaux précédents sur la prédiction aient permis de construire des outils plus valides et fidèles, ils contiennent néanmoins certaines limites. Premièrement, peu d’entre eux ont étudié la nature et la gravité de la récidive (Sjöstedt et Grann, 2002). Il est cependant essentiel de distinguer les crimes moins graves (mais plus communs comme l’exhibitionnisme) des crimes plus graves (comme l’agression sexuelle). De plus, même si les différents instruments ont été conçus pour prédire la récidive sexuelle, les agresseurs sexuels peuvent récidiver par des crimes non sexuels. Il importe donc d’évaluer la validité prédictive des différents instruments pour les délits non sexuels violents ou non violents. Deuxièmement, peu d’études ont été en mesure de comparer l’efficacité de plusieurs instruments sur la base d’un seul et même échantillon. Seulement 3 des 21 études examinées par Langton et al. (2007b) ont confronté plus de quatre outils.

Troisièmement, peu de travaux ont tenu compte de l’hétérogénéité que l’on trouve chez les délinquants sexuels en ce qui concerne la prédiction de la récidive. Cette hétérogénéité se retrouve au sein de leurs motivations (Knight et Guay, 2006) et de leur modus operandi (Proulx et al., 1999a ; 1999b). De plus, les agresseurs de femmes partagent beaucoup de caractéristiques avec les délinquants non sexuels, notamment en ce qui concerne leur versatilité criminelle, alors que les agresseurs sexuels d’enfants ont une carrière criminelle moins diversifiée (Lussier et al., 2005 ; Harris et al., 2007). Ainsi, différents prédicteurs pourraient permettre de prédire la récidive selon le type d’agresseurs. Seuls Bartosh et al. (2003) ont pris en considération le type d’agresseurs dans leurs travaux sur la récidive. Leurs résultats confirment l’idée selon laquelle les différents instruments montrent des performances variées en fonction des types d’agresseurs. En effet, leur étude suggère l’utilisation du RRASOR, de la Statique-99 et du SORAG auprès des agresseurs d’enfants pour la récidive sexuelle, violente et générale. Pour les agresseurs de femmes, aucun instrument ne parvient à prédire significativement la récidive. Toutefois, la Statique-99 et le SORAG approchaient du seuil de signification pour la récidive sexuelle. Finalement, aucun instrument ne parvient à prédire la récidive chez les agresseurs sexuels sans contacts (ex. : voyeur, exhibitionniste).

L’objectif de la présente étude est de comparer la validité prédictive de huit outils actuariels utilisés en délinquance sexuelle et d’un outil de référence pour quatre types de récidive (récidive sexuelle avec contact, récidive sexuelle sans contact ou nuisance sexuelle, récidive violente non sexuelle et récidive non violente et non sexuelle) en fonction du type d’agresseurs (agresseurs de femmes, agresseurs d’enfants et agresseurs mixtes). De façon générale, les instruments actuariels devraient mieux performer lorsqu’il est question de prédire la récidive pour laquelle ils ont été conçus. De plus, la performance des différents instruments devrait varier en fonction du type d’agresseurs sexuels. Vu la versatilité de la carrière criminelle (Lussier et al., 2005 ; Harris et al., 2007) et l’importance du rôle de la psychopathie chez les agresseurs de femmes (Rice et Harris, 1997 ; Seto et Barbaree, 1999 ; Harris et al., 2003 ; Knight et Guay, 2006), la récidive non sexuelle devrait être mieux prédite pour ce type d’agresseurs. Pour les agresseurs d’enfants, vu leur spécialisation en délinquance sexuelle et la surreprésentation des prédicteurs relatifs à la déviance sexuelle (victime masculine, victime mineure, etc.), la récidive sexuelle devrait être mieux prédite pour ce type d’agresseurs. La présente démarche offre aussi l’avantage d’utiliser un échantillon indépendant de ceux ayant servi à la construction des différents instruments et, par conséquent, n’est pas exposée à une accumulation de variance d’erreur qui résulte parfois de la construction de tels instruments. De plus, l’étude se distingue des études de Barbaree et al. (2001), de Harris et al. (2003) et de Langton et al. (2007) par la taille de l’échantillon (n = 537 comparativement à n = 215, n = 396 et n = 468 respectivement), par la distinction entre la récidive sexuelle avec et sans contact et par la distinction de sous-groupe d’agresseurs sexuels.

Méthodologie

Participants

Les 599 participants à la présente étude sont des agresseurs sexuels qui ont été évalués au Massachusetts Treatment Center for Sexually Dangerous Persons (MTC) à Brigewater, Massachusetts, entre 1959 et 1984. Le MTC fut établi en 1959 grâce à une législation spéciale en vue d’évaluer et de traiter les délinquants condamnés pour des crimes sexuels à répétition/violents. Sous la loi du Civil Commitment, l’agresseur est libéré lorsqu’il n’est plus considéré comme sexuellement dangereux. Les participants ont été répartis en trois groupes : les agresseurs de femmes, les agresseurs d’enfants et les agresseurs mixtes. Ceux qui n’avaient fait que des victimes de 16 ans ou plus étaient considérés comme des agresseurs de femmes pour cette étude (n = 222). Les sujets qui avaient seulement fait des victimes de moins de 16 ans étaient considérés comme des agresseurs d’enfants (n = 277). Le point de coupure entre les agresseurs de femmes et les agresseurs d’enfants a été fixé à 16 ans afin qu’il corresponde aux critères de classement des typologies de Knight (Knight et al., 1989 ; Knight et Prentky, 1990). Finalement, les participants dont les victimes se trouvaient dans les deux catégories étaient classés parmi les agresseurs mixtes. Une seule exception toutefois : les sujets qui avaient fait plusieurs victimes dans une catégorie mais une seule dans l’autre étaient classés dans la première (Bartosh et al., 2003). Dès qu’un participant avait fait plus d’une victime dans chaque catégorie ou seulement une victime dans chaque catégorie, il était considéré comme un agresseur mixte (n = 49). Cinquante et un agresseurs ont été exclus des analyses, soit parce que les données les concernant étaient insuffisantes, soit parce qu’ils n’avaient fait que des victimes intrafamiliales. Le nombre total de participants est ainsi de 548. L’âge moyen des participants est de 32,2 ans (é.-t. = 11,5). L’échantillon est constitué à 90,7 % de personnes de race blanche (n = 497) et les participants ont complété en moyenne 8,7 années de scolarité (é.-t. = 2,3). Le nombre total moyen de délits sexuels antérieurs est de 2,6 (é.-t. = 2,2), de délits de nuisance sexuelle est de 1,5 (é.-t. = 1,7), de délits violents est de 1,7 (é.-t. = 1,6) et celui de délits non violents est de 5,8 (é.-t. = 7,5).

Instruments[2]

VRAG. Le VRAG (Harris et al., 1993) a été mis au point grâce à un échantillon initial de délinquants masculins ayant des troubles mentaux et ce, afin d’évaluer le risque de récidive violente. Cet instrument peut également être administré à des populations délinquantes (incluant les agresseurs sexuels) n’ayant pas de troubles mentaux. Même si cet outil ne s’utilise pas qu’avec des agresseurs sexuels, il est employé dans plusieurs études en comparaison avec d’autres outils actuariels conçus pour cette population (Hanson et al. [2003] en recensent cinq dans leur méta-analyse). Il contient 12 items, dont le score total à l’échelle de psychopathie (PCL–R : Hare, 2003), et son total varie de -26 à +38.

SORAG. Le SORAG (Quinsey et al., 1998) est une modification du VRAG, avec 10 items en commun et a été conçu selon une méthode similaire pour évaluer le risque de récidive violente (cela inclut les récidives sexuelles où il y a des contacts physiques avec la victime) chez les agresseurs sexuels. Le SORAG contient 14 items, mais les dossiers ne contenaient pas l’information concernant l’évaluation phallométrique des sujets et celle-ci n’a donc pas pu être codée. Le total varie de -27 à +51.

RRASOR. Le RRASOR (Hanson, 1997) a été construit en utilisant un échantillon d’hommes qui avaient été condamnés pour avoir commis au moins un délit sexuel. Il a été conçu pour évaluer le risque de récidive sexuelle. Le RRASOR contient 4 items et son total varie de 0 à 6.

Statique-99. Comme le RRASOR, la Statique-99 (Hanson et Thornton, 2000) a été créée pour évaluer le risque de récidive sexuelle d’hommes adultes qui avaient été condamnés pour avoir commis au moins un délit sexuel. La Statique-99 contient 10 items (incluant les 4 du RRASOR) dont le total varie de 0 à 12.

Statique-02. La Statique-02 (Hanson et Thornton, 2003) a été conçue afin d’améliorer les définitions et la facilité d’utilisation de la Statique-99. Certains items ont été ajoutés pour combler les lacunes de la Statique-99. Comme cette dernière, elle s’applique à des hommes adultes qui avaient été condamnés pour avoir commis au moins un délit sexuel et sert à évaluer le risque de récidive sexuelle. La Statique-02 contient 14 items dont le total varie de 0 à 14.

RM2000. Le RM2000 (Thornton et al., 2003) a été construit pour des hommes âgés de 18 ans et plus qui ont été condamnés pour au moins un délit sexuel. Il utilise des informations sur le passé de l’agresseur qui se trouvent généralement dans son dossier. Le RM2000 est constitué de trois échelles distinctes : le Risk Matrix 2000 Sexual (RMS), le Risk Matrix 2000 Violent (RMV) et le Risk Matrix 2000 Combined (RMC). Le RMS est un outil de prédiction de la récidive sexuelle (sous forme de questionnaire) qui est rempli en deux temps. On doit d’abord coter trois items dont le total varie de 0 à 6. Ce total est réparti en quatre catégories de risque (allant de 1 à 4, où 4 est le niveau de risque le plus élevé). Ensuite, il faut coter quatre facteurs aggravants. Chaque fois que deux facteurs aggravants sont présents, on augmente d’un niveau le risque déterminé dans un premier temps. Pour sa part, le RMV est un outil de prédiction des délits violents non sexuels commis par des agresseurs sexuels. Il se remplit en une seule étape. Il contient trois items et le total varie de 0 à 8. Ce total est également réparti en quatre catégories de risque (allant de 1 à 4, où 4 est le niveau de risque le plus élevé). Finalement, le RMC est un outil de prédiction qui combine les totaux du RMS et du RMV afin d’évaluer le risque de récidive des délits sexuels et violents. Les niveaux établis par le RMS et le RMV sont transférés en scores 0, 1, 2 ou 3. Ces scores sont additionnés pour donner le score total du RMC, qui varie de 0 à 6.

MnSOST–R. Le MnSOST–R (Epperson et al., 1998) a d’abord été conçu comme un outil d’évaluation clinique, pour ensuite être utilisé pour évaluer le risque de récidive sexuelle chez les agresseurs de femmes et les agresseurs d’enfants extrafamiliaux. Il contient 16 items. Le total varie de -14 à +30.

SVR-20. Le SVR-20 (Boer et al., 1997) est un outil basé sur le jugement clinique structuré qui évalue le risque de récidive sexuelle. Les 20 items sont regroupés dans trois domaines : adaptation psychosociale, infractions sexuelles et projets. Dans la présente étude, le SVR-20 a été codé en donnant un score à chaque item (0 = absent ; 1 = possibilité ou partiellement présent = 1 ; 2 = présent). Cette procédure a déjà été employée dans les travaux de Craig et al. (2006) et dans ceux de Sjöstedt et Långström (2002). Le total varie de 0 à 40.

PCL–R. L’échelle de psychopathie de Hare (2003) est une échelle qui permet d’évaluer les traits de la personnalité psychopathique. Elle contient 20 items qui sont codés sur une échelle de 3 points (0 = absent ; 1 = possibilité ou partiellement présent = 1 ; 2 = présent). Les items de l’échelle de psychopathie sont divisés en deux facteurs : égocentrisme/manque de remords et personnalité antisociale/impulsivité. Le total varie de 0 à 40. Un score de 30 et plus désigne généralement un psychopathe.

Procédure

Les neuf instruments ont été codés en 2003-2004 d’après les dossiers cliniques et criminologiques de chaque agresseur qui figurent au MTC. Ces documents comprennent toutes les informations recueillies durant les 60 jours d’évaluation au MTC (les rapports scolaires et professionnels, les dossiers de probation et de libération conditionnelle, les rapports psychiatriques et médicaux, les résultats de tests psychologiques et les notes cliniques consignées durant la période d’évaluation au MTC). Environ le tiers des dossiers des agresseurs ont été codés par deux évaluateurs pour les différents instruments. Ces dossiers ont été sélectionnés aléatoirement et les évaluateurs ignoraient lesquels avaient été codés deux fois. La fidélité interjuge fut évaluée sur la base du score total des instruments (à l’exception du RM2000 où le niveau de risque fut utilisé) à l’aide du coefficient de corrélation intraclasse. Les coefficients variaient de 0,89 (MnSOST–R) à 0,94 (RMV). Dans les cas où le participant avait été codé par les deux évaluateurs, le score moyen fut utilisé pour les analyses de courbe ROC.

Afin d’obtenir des taux de récidive officielle aussi fiables que possible, quatre différentes sources officielles ont été consultées : le bureau central du Massachusetts Board of Probation, le Massachusetts Parole Board, le Massachusetts Treatment Center Authorized Absence Program et le Federal Bureau of Investigation. Une période fixe de récidive de cinq ans fut établie pour les analyses au lieu de prendre l’ensemble de la période de suivi qui varie de quelques jours à 27 ans (moyenne = 10,03 ; é.-t. = 8,2). Une telle stratégie a pour objectif d’optimiser la performance des différents outils (Harris et al., 2003). Il y avait récidive lorsque de nouvelles accusations étaient portées au dossier de l’agresseur. Cela permet de contrer certaines limites associées à la condamnation comme mesure de récidive, notamment en ce qui concerne le recours au plea bargaining (modification d’un délit sexuel en délit non sexuel afin d’obtenir un plaidoyer de culpabilité). Quatre types de récidive ont été sélectionnés : la récidive sexuelle (crimes sexuels où il y a un contact physique avec la victime), la nuisance sexuelle (crimes sexuels où il n’y a pas de contact physique avec la victime), la récidive violente (crimes non sexuels où il y a un contact direct avec la victime) et la récidive non violente (crimes non sexuels où il n’y a pas de contact direct avec la victime). Les récidives sexuelles et violentes furent examinées distinctement car la majorité des instruments ont été conçus afin d’évaluer un type de récidive en particulier (sexuelle ou violente) et non la combinaison des deux (à l’exception du VRAG et du SORAG).

Stratégie analytique

Des coefficients r de Pearson sont rapportés afin d’évaluer la validité concourante des différents instruments. Des analyses de courbes ROC (Receiver Operating Characteristic) serviront à la comparaison de la validité prédictive des différents outils actuariels. Ce type d’analyse permet d’évaluer si l’instrument est capable de distinguer correctement les récidivistes et les non-récidivistes. En effet, les analyses de courbes ROC nous renseignent sur la sensibilité (la proportion de récidivistes correctement identifiés) et la spécificité (la proportion de non-récidivistes correctement identifiés). La courbe ROC correspond au tracé du nombre de récidivistes correctement identifiés, c’est-à-dire la sensibilité ou les vrais positifs (les individus à risque élevé qui récidivent) par rapport à 1 – la spécificité ou les faux positifs (individus à risque élevé qui ne récidivent pas) pour chaque valeur de l’outil actuariel. Le coefficient d’aire sous la courbe ROC varie entre 0 et 1, où 0,5 correspond au hasard et 1 à une prévision parfaite (absence de tout chevauchement des récidivistes et des non-récidivistes). On peut en général considérer le coefficient d’aire sous la courbe comme la probabilité qu’un récidiviste choisi au hasard ait un score plus élevé qu’un non-récidiviste également choisi au hasard (Hanson et Thornton, 2000). En bref, le coefficient d’aire sous la courbe nous renseigne sur la proportion de participants correctement assignés à une catégorie (récidiviste vs non-récidiviste). Plus le coefficient se rapproche de 1, plus l’instrument a une bonne validité prédictive. Tandis qu’un coefficient d’aire sous la courbe inférieur à 0,5 correspond à une validité prédictive plus faible que le hasard. Les analyses de courbes ROC ont pour avantage d’être à peu près insensibles aux faibles taux de base et de permettre de comparer la validité prédictive de différents instruments ou méthodes pour différents types de récidive (Harris et al., 2003 ; Barbaree et al., 2006).

Résultats

Le détail des taux de récidive pour l’échantillon et pour les sous-groupes est présenté au tableau 1. Le nombre de récidivistes (n) est présenté pour chaque type de récidive selon le type d’agresseurs sexuels.

Les résultats suggèrent que les taux de récidive sexuelle sont différents selon le type d’agresseurs sexuels (V de Cramer = 0,19, p < 0,001). Après une correction Bonferroni (seuil alpha diminué à p < 0,01), on peut remarquer une différence significative entre les agresseurs mixtes et les agresseurs de femmes (phi = 0,22, p < 0,01) ainsi qu’entre les agresseurs mixtes et les agresseurs d’enfants (phi = 0,23, p < 0,001). Les agresseurs mixtes (40,5 %) récidivent davantage sous forme de récidive sexuelle que les agresseurs de femmes (17,3 %) et les agresseurs d’enfants (15,0 %). Il existe également des différences entre les groupes pour les taux de récidive de nuisance sexuelle (V de Cramer = 0,17, p < 0,01). Après une correction Bonferroni (seuil alpha diminué à p < 0,01), on peut remarquer une différence significative entre les agresseurs mixtes et les agresseurs de femmes (phi = 0,25, p < 0,01). En effet, les agresseurs mixtes (19,4 %) récidivent davantage sous forme de nuisance sexuelle que les agresseurs de femmes (3,7 %). Finalement, les taux de récidive violente sont également différents selon le type d’agresseurs (V de Cramer = 0,15, p < 0,05). Après une correction Bonferroni (seuil alpha diminué à p < 0,01), on peut remarquer une différence significative entre les agresseurs de femmes et les agresseurs d’enfants (phi = -0,16, p < 0,01). Les agresseurs de femmes (22,0 %) récidivent davantage de manière violente que les agresseurs d’enfants (14,1 %).

Les statistiques descriptives pour l’ensemble des instruments utilisés sont présentées au tableau 2 pour l’échantillon total et pour les sous-groupes.

Tableau 2

**Statistiques descriptives des instruments**

Validité concourante

Les corrélations de Pearson entre tous les instruments sont présentées au tableau 3. Vu qu’ils sont constitués des mêmes prédicteurs, le VRAG et le SORAG sont fortement corrélés l’un avec l’autre (r = 0,92, p < 0,01), ainsi que le RRASOR et la Statique-99 (r = 0,77, p < 0,01). La Statique-2002 étant conçue à partir du RRASOR et de la Statique-99, elle est également fortement corrélée avec ses deux prédécesseurs (respectivement r = 0,76, p < 0,01, et r = 0,82, p < 0,01). Le résultat du RMC étant obtenu grâce à l’addition du RMS et du RMV, cela explique la forte corrélation avec ces outils (respectivement r = 0,82, p < 0,01, et r = 0,81, p < 0,01), le RMS et le RMV n’étant pas conçus pour prédire le même type de récidive, ne sont que moyennement corrélés entre eux (r = 0,33, p < 0,01). L’échelle de psychopathie étant l’une des composantes du VRAG et du SORAG, il n’est pas étonnant qu’elle y soit fortement associée (respectivement r = 0,76, p < 0,01, et r = 0,77, p < 0,01). Dans l’ensemble, les instruments sont presque tous associés les uns aux autres, avec des coefficients r variant de 0,21 (p < 0,01) à 0,92 (p < 0,01), à l’exception du RRASOR et du RMV (r = -0,03, p> 0,05).

Tableau 3

**Corrélations entre les instruments d’évaluation du risque et l’échelle de psychopathie**

Validité prédictive

Les résultats des différentes analyses de courbes ROC sont présentés au tableau 4 pour l’ensemble de l’échantillon. Le total des instruments a été utilisé pour les analyses, sauf dans le cas du RM2000, pour lequel on a considéré les catégories de risque. Les résultats indiquent que tous les instruments, à l’exception du RMV, sont en mesure de prédire la récidive sexuelle. L’ensemble des aires sous la courbe se situe entre 0,61 et 0,70. L’instrument avec l’aire sous la courbe la plus élevée est la Statique-99, suivie du RRASOR. Il est par ailleurs à noter qu’aucun instrument n’a été en mesure de prédire la récidive de nuisance sexuelle.

Tableau 4

**Aires sous la courbe ROC pour les instruments d’évaluation du risque et l’échelle de psychopathie pour l’ensemble de l’échantillon**

La récidive violente et la récidive non violente sont prédites significativement par l’ensemble des instruments à l’exception du RRASOR. L’ensemble des aires sous la courbe pour la récidive violente se situe entre 0,59 et 0,71 et entre 0,61 et 0,71 pour la récidive non violente. Le RMV obtient l’aire sous la courbe la plus élevée pour la récidive violente et le RMC, pour la récidive non violente.

Les résultats des analyses plus approfondies en fonction des sous-groupes d’agresseurs sexuels (agresseurs de femmes, d’enfants et mixtes) sont présentés aux tableaux 5, 6 et 7 respectivement. Lorsque l’on n’étudie que les agresseurs de femmes, on constate que la récidive sexuelle est prédite significativement par l’ensemble des instruments à l’exception du VRAG, du RRASOR et du RMV. L’ensemble des aires sous la courbe varie entre 0,63 et 0,72. L’échelle de psychopathie obtient l’aire sous la courbe la plus élevée pour ce type de récidive.

La récidive violente est quant à elle prédite significativement par l’ensemble des instruments à l’exception du RRASOR et du RMS. Les aires sous la courbe varient de 0,61 à 0,71. Le RMV et l’échelle de psychopathie obtiennent les aires sous la courbe les plus élevées. Seul le RRASOR ne parvient pas à prédire significativement la récidive non violente chez les agresseurs de femmes. L’ensemble des aires sous la courbe varie de 0,59 à 0,75 et le RMV obtient l’aire sous la courbe la plus élevée.

Tableau 5

**Aires sous la courbe pour les instruments d’évaluation du risque et l’échelle de psychopathie pour les agresseurs de femmes**

Le portrait est sensiblement différent lorsque l’on ne considère que les agresseurs d’enfants. La récidive sexuelle est également prédite par l’ensemble des instruments à la seule exception du RMV. L’ensemble des aires sous la courbe varie de 0,63 à 0,73. Même si l’étendue est semblable à celle des agresseurs de femmes, cinq outils ont une aire sous la courbe égale ou supérieure à 0,70, alors que chez les agresseurs de femmes, il n’y avait que l’échelle de psychopathie. La Statique-99 obtient l’aire sous la courbe la plus élevée. La récidive violente est prédite seulement par le RMV, le RMC et le MnSOST–R. Les aires sous la courbe varient quant à elles de 0,62 à 0,67.

Tableau 6

**Aires sous la courbe pour les instruments d’évaluation du risque et l’échelle de psychopathie pour les agresseurs d’enfants**

Comme dans le cas des agresseurs de femmes, seul le RRASOR ne parvient pas à prédire la récidive non violente. Toutefois, les aires sous la courbe chez les agresseurs d’enfants sont légèrement moins élevées (de 0,61 à 0,68) que chez les agresseurs de femmes. Finalement, les résultats présentés au tableau 7 indiquent qu’aucun des instruments ne parvient à prédire la récidive chez les agresseurs sexuels mixtes. Bien que certaines aires sous la courbe semblent élevées, elles n’atteignent toutefois pas la signification alpha de p < 0,05. Plus de travaux sont donc nécessaires pour ce sous-groupe.

Tableau 7

**Aires sous la courbe pour les instruments d’évaluation du risque et l’échelle de psychopathie pour les agresseurs mixtes**

Interprétation des résultats

L’objectif principal de cette étude était de comparer la validité prédictive de huit outils actuariels en délinquance sexuelle et d’un outil de référence en fonction du type d’agresseurs (agresseurs de femmes, agresseurs d’enfants et agresseurs mixtes), et ce, pour quatre types de récidive (nuisance sexuelle, récidive sexuelle, récidive violente non sexuelle et récidive non violente et non sexuelle) grâce à un échantillon différent de ceux ayant servi à la construction des divers instruments. De façon générale, l’ensemble des instruments permet de prédire trois des quatre types de récidive. Comme nous nous y attendions, la validité prédictive des instruments est légèrement supérieure lorsque la récidive prédite est du même type que celle pour laquelle l’instrument a été conçu. Nos résultats correspondent à ceux rapportés par Hanson et al. (2003) dans leur méta-analyse pour le VRAG, le SORAG, le RRASOR et la Statique-99, ainsi qu’à ceux de Langton et al. (2007b) pour la Statique-2002. Toutefois, les résultats de l’étude ne démontrent pas de différences marquantes entre la Statique-99 et la Statique-02 même si cette dernière a été conçue pour être une amélioration de la première.

Pour ce qui est du RM2000, les aires sous la courbe obtenues concordent avec celles de Craig et al. (2006) pour la récidive sexuelle, mais elles sont légèrement inférieures pour ce qui est de la récidive violente. Contrairement à ceux de Bartosh et al. (2003) et de Barbaree et al. (2001), nos résultats suggèrent que le MnSOST–R permet de prédire la récidive sexuelle, violente et non violente. Cependant, les résultats observés sont légèrement plus faibles que ceux auxquels parviennent Epperson et al. (2000). Pour ce qui est du SVR-20, nos résultats suggèrent une validité prédictive supérieure pour la récidive sexuelle que les conclusions déjà rapportées, mais la validité prédictive est équivalente pour la récidive violente (Sjöstedt et Långström, 2002 ; Craig et al., 2006). Notre instrument de référence, l’échelle de psychopathie, permet de prédire la récidive sexuelle, violente et non violente de façon équivalente et parfois même supérieure aux instruments de prédiction de la récidive. En d’autres termes, la psychopathie permet de prédire la récidive chez les délinquants sexuels et renforce l’idée selon laquelle elle contribue au passage à l’acte chez les délinquants sexuels.

Nuisance sexuelle

Les résultats de la présente étude indiquent toutefois qu’aucun instrument ne parvient à prédire significativement la récidive de nuisance sexuelle. Trois explications pourraient rendre compte de ce résultat. Premièrement, la nature des prédicteurs utilisés dans les différents instruments n’est possiblement pas la même que pour les crimes sexuels sans contact. Deuxièmement, il se peut que les échantillons à la base des différents instruments contiennent peu d’exhibitionnistes comparativement aux agresseurs sexuels avec contacts. Par conséquent, les prédicteurs utiles pour prédire la récidive sexuelle sans contact peuvent donc être passés inaperçus. Troisièmement, nos résultats pourraient s’expliquer par un plus faible taux de base. Même si les analyses de courbe ROC subissent moins l’impact de faibles taux de base que les techniques de prédiction traditionnelles comme la régression logistique, il n’en demeure pas moins que de telles conditions ont pu entraîner à la baisse la valeur des coefficients d’aire sous la courbe.

Distinction de sous-groupes d’agresseurs sexuels

L’analyse des instruments en fonction des différents types de délinquants indique que la validité prédictive varie grandement selon le sous-groupe auquel elle est appliquée. Les coefficients d’aire sous la courbe ROC sont légèrement plus élevés pour la prédiction de la récidive sexuelle chez les agresseurs d’enfants et pour la prédiction de la récidive violente et non violente chez les agresseurs de femmes adultes. De telles différences peuvent s’expliquer, du moins en partie, par la nature des items qui composent ces instruments. En effet, ces derniers comportent deux dimensions : la composante de déviance sexuelle/répétition et la composante de criminalité/violence générale. Ces deux dimensions ont été mises en évidence à la fois dans les travaux sur l’identification des facteurs liés à la récidive (Prentky, Knight et Lee, 1997 ; Hanson et Bussière, 1998 ; Hanson et al., 2003 ; Hanson et Morton-Bourgon, 2005) et dans quelques études qui ont eu recours à l’analyse factorielle (Roberts et al., 2002 ; Doren, 2004 ; Barbaree et al., 2006).

D’une part, le RRASOR, la Statique-99, la Statique-2002 et le RMS sont tous fortement corrélés entre eux et ciblent principalement la dimension de la déviance sexuelle/répétition (Barbaree et al., 2006). Ce sont ces mêmes instruments dont la validité prédictive est la plus élevée dans le sous-groupe des agresseurs d’enfants. Les facteurs relatifs à la déviance sexuelle caractérisent donc davantage la dynamique des agresseurs d’enfants. Ces derniers sont également plus fixés dans leur type de récidive et ils ont une plus grande spécialisation dans la carrière criminelle en délinquance sexuelle (Lussier et al., 2005 ; Harris et al., 2007). D’autre part, le VRAG, le SORAG, le RMV et l’échelle de psychopathie sont également fortement corrélés entre eux et se rattacheraient davantage à la dimension de criminalité/violence générale (Barbaree et al., 2006). Chez les délinquants en général, cette dimension a été maintes fois liée à la récidive. Comme les agresseurs sexuels de femmes se rapprochent des délinquants en général quant à leur versatilité criminelle, les facteurs relatifs à la criminalité et à la violence générale se rattacheraient donc davantage à ce type d’agresseurs. À cet effet, la place de choix qu’occupe la psychopathie n’est pas étrangère à ces résultats (Knight et Guay, 2006). D’ailleurs, la validité prédictive de l’échelle de psychopathie et la performance différente des instruments selon le type d’agresseurs sexuels rappellent la pertinence de tenir compte des différents modèles théoriques et étiologiques en délinquance sexuelle afin de bonifier la prédiction (Côté, 2001).

Finalement, les résultats de la présente étude ont permis de mettre en lumière les difficultés associées à la prédiction de la récidive chez les agresseurs mixtes. Les victimes des agresseurs mixtes se retrouvant à la fois parmi celles des agresseurs de femmes et celles des agresseurs d’enfants, on pourrait s’attendre à ce qu’une combinaison des aspects influençant les agresseurs de femmes et d’enfants parvienne à prédire leur récidive, mais ce n’est pas le cas. Ni la composante de la déviance sexuelle/répétition, ni celle de la criminalité/violence générale, ni une combinaison des deux ne semble être un bon prédicteur pour ce type d’agresseurs sexuels. Il se pourrait que d’autres prédicteurs, possiblement de nature plus situationnelle, soient liés à la récidive pour ce type d’agresseurs. Jusqu’à maintenant, la plupart des travaux sur la prédiction de la récidive ont considéré les agresseurs sexuels comme un groupe homogène (Hanson et Bussière, 1998 ; Hanson et Harris, 2000 ; Hanson et Morton-Bourgon, 2004). Par conséquent, le faible nombre d’agresseurs mixtes influe sur notre capacité à détecter des relations significatives et peut en partie expliquer de tels résultats.

Limites

Bien que la présente étude ait permis de combler certaines lacunes associées à la prédiction de la récidive chez les délinquants sexuels, elle n’est cependant pas exempte de limites. Premièrement, les participants à la présente recherche formaient un sous-groupe assez particulier d’agresseurs. Les délinquants sexuels dirigés vers le MTC avaient tous été condamnés pour des crimes sexuels à répétition et/ou pour des crimes sexuels particulièrement violents. Par conséquent, ils sont bien loin de représenter le délinquant judiciarisé typique. Toutefois, les travaux québécois vont dans le même sens que les résultats de la présente étude (Bigras, 2007). De plus, les travaux de M. Karl Hanson, principal chercheur dans le domaine de la prédiction de la récidive chez les délinquants sexuels, contiennent à la fois les données québécoises (dont celles de M. Jean Proulx affilié à l’Institut Philippe-Pinel de Montréal et l’Université de Montréal), ainsi que les données utilisées dans cet article (Hanson et Thornton, 2003 ; Hanson et Morton-Bourgon, 2007). Les résultats dans cette étude sont donc représentatifs et peuvent être utiles aux intervenants de première ligne du Québec.

Deuxièmement, une limite importante de la présente étude réside dans le recours exclusif aux dossiers pour codifier les différents instruments. Bien que plusieurs auteurs aient procédé de la même façon (Barbaree et al., 2001 ; Sjöstedt et Långström, 2001 ; 2002 ; Bartosh et al., 2003 ; Bengtson et Långström, 2007 ; Langton et al., 2007a ; 2007b), la codification d’après le dossier a pour effet de gonfler artificiellement l’impact des variables plus factuelles et ainsi de limiter la place des variables de nature psychologique (Walters, 2006). De plus, la codification sur la base du dossier amplifie la place de l’inférence dans la cotation des variables psychologiques. Finalement, les aspects relatifs à l’enfance et les facteurs développementaux sont généralement mesurés de manière moins fidèle. Cependant, plusieurs instruments, comme le RRASOR, la Statique-99, la Statique-02 ainsi que le RM2000, sont moins soumis à de telles contraintes, puisqu’ils sont facilement codifiables avec les informations que l’on trouve généralement dans les dossiers.

Conclusion

En somme, l’ensemble des instruments actuariels parvient à prédire la récidive sexuelle, violente et non violente. De plus, la validité prédictive de l’instrument de référence (PCL–R) ne se distingue pas de celle des instruments actuariels conçus à cet effet. Deux grandes dimensions sembleraient ressortir des instruments : déviance sexuelle/répétition et criminalité/violence générale. La dimension de la déviance sexuelle/répétition serait plus fortement liée au RRASOR, à la Statique-99 et à la Statique-2002 et permettrait de prédire la récidive chez les agresseurs d’enfants. La dimension de la criminalité/violence générale serait quant à elle liée au VRAG, au SORAG, au RMV et à l’échelle de psychopathie, et permettrait de prédire la récidive chez les agresseurs de femmes adultes. Finalement, les outils actuariels utilisés dans le cadre de la présente étude n’ont pas permis de prédire la récidive chez les agresseurs mixtes.

Évaluation de la validité prédictive de neuf instruments chez les agresseurs sexuels adultes

Résumé

Abstract

Resumen

Introduction