Article body

Introduction

La récidive des auteurs de délits à caractère sexuel ne peut être comprise ou déterminée par un facteur unique. Malgré tout, les méta-analyses tendent à montrer que la déviance sexuelle est l’un des plus importants facteurs associés à la récidive criminelle sexuelle (Hanson et Bussière, 1998 ; Hanson et Morton-Bourgon, 2005). Ainsi, pour guider certaines décisions sentencielles ou pour gérer et orienter les personnes contrevenantes durant leur suivi (p. ex. : besoins en matière de programmes, niveau d’encadrement en communauté), les intérêts sexuels déviants sont pris en compte à différentes étapes du système de justice. Toutefois, l’évaluation des déviances sexuelles, notamment en contexte judiciaire, représente un défi, puisque les personnes évaluées peuvent être réticentes à ce que leurs préférences soient identifiées, d’où l’importance de disposer d’outils d’évaluation valides et fidèles. En plus des mesures autorévélées (les questionnaires, les entrevues) et des mesures physiologiques (la pléthysmographie pénienne), des mesures basées sur l’attention du participant ont été développées, dont le temps de visionnement (VT ; viewing time). L’objectif du présent article est de faire une revue systématique des études qui ont fait l’évaluation de l’emploi du VT chez les auteurs de délits à caractère sexuel afin de situer son efficacité selon l’état actuel des connaissances et de présenter cette mesure d’évaluation à un lectorat francophone.

Mesures des préférences et de l’intérêt sexuels

L’excitation sexuelle, telle que conceptualisée dans la trichotomie de Singer (1984), se divise en trois composantes, soit la réponse esthétique, la réponse d’approche et la réponse génitale. La réponse esthétique correspond à une sensation agréable en réaction à un stimulus sexuel, par exemple, le fait d’apercevoir une personne attirante. La personne intéressée pourrait faire un effort pour garder le stimulus en vue, ce qui peut la conduire à la réponse d’approche, qui correspond à l’action d’aller vers l’objet du désir, dans l’espoir d’obtenir des contacts physiques. Enfin, l’excitation sexuelle peut se manifester de manière somatique. Cette manifestation constitue ce que Singer appelle la réponse génitale, mais qui inclut également plusieurs réponses physiologiques automatiques (p. ex. : changement du rythme cardiaque et de la respiration, tension musculaire) en plus des changements au niveau des organes génitaux.

Selon Singer (1984), ces trois composantes de l’excitation sexuelle sont indépendantes les unes des autres. Elles ne peuvent donc pas être mesurées de la même manière. À notre connaissance, il existe trois grandes catégories de mesures utilisées pour évaluer les préférences sexuelles déviantes, soit les mesures autorévélées, l’évaluation phallométrique et les mesures indirectes basées sur le traitement de l’information. Les premières mesurent la réponse esthétique de l’excitation sexuelle. Elles reposent sur des données rapportées directement par les individus au moyen de questionnaires et d’entrevues pour cerner leurs préférences sexuelles.

Comme le soulignent Snowden, Craig et Gray (2011), les mesures de l’intérêt sexuel autorévélées posent un certain nombre de problèmes. Premièrement, elles supposent que l’information est disponible à la conscience du répondant afin qu’il puisse la rapporter, ce qui n’est pas toujours le cas. Les mesures autorévélées de l’intérêt sexuel ne peuvent donc mesurer que les cognitions qui sont explicites sans pouvoir accéder aux cognitions implicites. De plus, il peut être difficile pour certaines personnes d’analyser leurs propres comportements et problèmes, comme les préférences sexuelles déviantes, afin de les communiquer (Snowden et al., 2011). Finalement, les mesures autorévélées ne fonctionnent que si l’évalué fournit des réponses honnêtes, ce qui peut s’avérer problématique, étant donné les conséquences possibles pour l’individu en contexte judiciaire et la honte qu’il peut éprouver à l’égard de ses préférences sexuelles déviantes (Snowden et al., 2011). Certains mécanismes existent pour diminuer l’influence de la désirabilité sociale sur les résultats des mesures autorévélées (comme le Balanced Iventory for Desirable Responding [BIDR] ; Paulus, 1984), mais ceux-ci ne permettent pas toujours d’améliorer leur validité (Snowden et al., 2011).

Devant ces constats quant aux limites des mesures autorévélées des préférences sexuelles, les chercheurs ont développé des méthodes alternatives pour mesurer ces concepts. Par exemple, la pléthysmographie pénienne (PPG), ou évaluation phallométrique, consiste à mesurer la réponse génitale lors de la présentation de stimuli sexuels qui sont présumés correspondre aux préférences sexuelles déviantes de l’individu (p. ex. : enfants, violence, exhibitionnisme). Des stimuli auditifs ou visuels sont présentés, alors que les changements de volume sanguin (circonférence) du pénis sont mesurés à l’aide d’un pléthysmographe pénien, constitué d’un anneau de caoutchouc contenant un liquide conductible (mercure) relié à un appareil qui enregistre les données. La PPG a fait l’objet d’abondantes recherches et est l’un des outils d’évaluation des préférences sexuelles les plus fréquemment utilisés (Banse, Schmidt et Clarbour, 2010). Elle fait néanmoins l’objet de plusieurs critiques.

On reproche à la PPG d’être sujette à la manipulation des résultats par le participant (inhibition volontaire de la réponse érectile), d’être coûteuse en termes de temps et d’argent et d’être hautement intrusive pour la personne évaluée (Laws, 2009). De plus, le manque de standardisation est un problème persistant avec la PPG qui, bien que connue depuis plusieurs années (O’Donohue et Letourneau, 1992), s’est peu améliorée avec le temps, malgré certains efforts en ce sens (Laws, 2009). À cet effet, O’Donohue et Letourneau (1992) relèvent 17 éléments susceptibles de faire varier les résultats de la PPG d’une procédure à l’autre (type d’anneau utilisé, d’échantillon, de stimulus). Enfin, la validité de construit de la PPG pour l’évaluation des préférences sexuelles déviantes, ainsi que sa fiabilité, sont remises en doute (Kalmus et Beech, 2005 ; Marshall et Fernandez, 2000 ; O’Donohue et Letourneau, 1992). Selon O’Donohue et Letourneau (1992), la PPG mesure une réponse pénienne à un stimulus érotique plutôt que le comportement qu’aurait réellement l’individu dans son contexte régulier. Elle mesurerait donc une réaction à un stimulus donné, mais pas nécessairement une préférence[2].

Mesures indirectes et non physiques de l’intérêt sexuel

Depuis une vingtaine d’années, des chercheurs tentent de développer une solution de rechange à la PPG (Gress, 2005 ; Laws, 2009). Les mesures indirectes et non physiques d’évaluation des préférences sexuelles permettraient d’évaluer la dimension esthétique de l’excitation sexuelle (Mokros et al., 2013) en sondant les cognitions implicites de l’individu, sans l’interroger explicitement. Certaines de ces mesures reposent sur l’attention de l’individu par rapport à un stimulus donné[3] et d’autres reposent sur des associations de concepts[4]. Si la plupart de ces mesures demeurent au stade expérimental, certaines pourraient s’avérer des solutions de rechange prometteuses comme outil d’évaluation des préférences sexuelles. Dans le cadre de cette recension, nous nous concentrerons sur un type spécifique, le VT.

Mesure du temps de visionnement

Rosenzweig (1942) a été le premier à observer une différence quant au temps de latence d’observation entre des stimuli érotiques et non érotiques chez un groupe de participants pour mesurer l’orientation sexuelle, et plusieurs autres chercheurs ont subséquemment suivi ses traces (Ebsworth et Lalumière, 2012 ; Imhoff et al., 2010 ; Quinsey, Ketsetzis, Earls et Karamanoukian, 1996 ; Wright et Adams ; 1994, 1999 ; Zamansky, 1956). Dans un test VT typique utilisé dans l’évaluation des préférences sexuelles, le participant visionne une à une des images sexuellement explicites (personnes nues ou partiellement nues) et des images neutres (personnes habillées ou des objets, selon le cas). Pour passer à l’image suivante, l’évalué doit généralement noter sur une échelle le niveau d’attractivité sexuelle qu’il attribue au stimulus et le temps de visionnement de chaque image est enregistré.

Le test VT se base sur le temps de réponse au stimulus présenté pour mesurer l’intérêt sexuel. Un temps d’observation plus long serait induit par des stimuli qui correspondent aux intérêts sexuels du participant : le délai induit par du contenu sexuel (sexual content induced delay). Selon Schmidt, Babchishin et Lehmann (2017), deux hypothèses pourraient expliquer ce délai. Il pourrait être causé de façon volontaire par le participant, qui accorde davantage d’attention aux stimuli jugés comme attrayants. L’autre hypothèse serait que le biais attentionnel est causé par un ralentissement involontaire du processus décisionnel induit par le contenu sexuel. Ces postulats ont toutefois été mis en doute par les résultats d’Imhoff et al. (2010), qui ont trouvé que le biais était toujours présent même si on retirait les images au moment de demander aux participants d’attribuer une note aux stimuli. En l’absence de l’image, le délai était peu susceptible d’être causé volontairement par le participant qui aurait voulu la regarder plus longtemps.

Deux autres hypothèses ont alors été avancées pour expliquer ce délai (Imhoff, Schmidt, Weiß, Young et Banse, 2012) : (1) il pourrait être causé par la demande cognitive en lien avec la tâche évaluative ; ou encore (2) les stimuli sexuellement excitants pourraient causer une distraction (p. ex. : fantasmes) ralentissant le temps de réaction. À ce propos, les résultats d’Imhoff et al. (2012) suggèrent que l’effet du VT serait lié à la tâche consistant à noter le niveau d’attractivité des images lors du test. En effet, dans une tâche où les participants devaient adopter la perspective d’individus de l’autre orientation sexuelle pour noter l’attractivité des images, le délai était toujours observé. Les images correspondant à l’orientation ciblée (hommes adultes pour la perspective d’homme homosexuel ou de femme hétérosexuelle) engendraient ainsi de plus longs temps de réponse, sans correspondre aux véritables préférences. Le fait de juger un stimulus comme étant attrayant sexuellement requerrait ainsi davantage de travail cognitif que de le juger non attrayant. Pour accepter une cible comme sexuellement attrayante, il serait nécessaire de répondre à plusieurs critères (âge, sexe, traits physiques), tandis qu’un seul critère serait nécessaire pour la rejeter. Le délai induit sexuellement serait donc, au moins en partie, induit par le processus évaluatif.

Depuis son introduction par Rosenzweig (1942), le VT est devenu l’une des mesures indirectes les plus documentées pour l’évaluation des préférences sexuelles déviantes chez les auteurs de délit à caractère sexuel. Deux instruments basés sur cette méthode sont offerts commercialement, soit l’Affinity 2.5 (Glasgow, Osborne et Croxen, 2003) et le Visual Reaction Time (VRT ; Abel, Lawry, Karlstrom, Osborn et Gillespie, 1994), qui est une mesure VT faisant partie du Abel Assessment for Sexual Interest, un assemblage de différents tests visant à évaluer les préférences sexuelles. Dans le présent article, l’objectif sera de présenter les propriétés du VT à un lectorat francophone en faisant une recension systématique de la littérature disponible sur le sujet, notamment de faire état de son efficacité selon les connaissances disponibles à l’heure actuelle lorsqu’appliqué spécifiquement à une population d’hommes d’âge adulte ayant commis un délit à caractère sexuel.

Méthodologie

La méthodologie de cette étude a été inspirée de la méthode PRISMA proposée par Moher, Liberati, Tetzlaff, Altman et The PRISMA Group (2009) comme guide pour la réalisation de recensions des écrits systématiques. Après une revue exploratoire des études disponibles sur le VT, les critères d’inclusion des articles ont été définis. Pour répondre à l’objectif de recherche, seuls les articles visant au moins un échantillon ayant les critères suivants ont été retenus : a) des hommes, b) d’âge adulte et c) ayant commis un délit à caractère sexuel. De plus, seules les études publiées révisées par les pairs ont été incluses (articles, mémoires et thèses), excluant tout autre type de document comme les articles non publiés ou les conférences. Pour trouver les études permettant de répondre à la question de recherche, le moteur de recherche OVID a été interrogé en sondant les bases de données ERIC, Healthstar, MEDLINE et PsycInfo et utilisant l’énoncé de recherche suivant : (« viewing time » OR « indirect measure » OR « implicit measure » OR « reaction time » OR « latenc* » OR « Abel » OR « Affinity ») AND (« sexual devian* » OR « sexual interest » OR « paraphil* » OR « pedophil* » OR « paedophil* » OR « sex* preference* » OR « sadis* ») AND (« sex* offen* » OR « sex* abuse* » OR « child* molest* »)[5]. La Figure 1 présente le processus de sélection des études de cette recension. Des 1880 articles relevés par l’algorithme, 94 furent identifiés comme doublons, et exclus de l’analyse. Par une lecture préliminaire des titres et des résumés, les articles traitant de l’utilisation du VT pour évaluer les préférences sexuelles ont été sélectionnés pour être examinés dans leur entièreté (n = 82). De ces articles, ceux répondant aux critères d’inclusion ont été retenus (n = 18). Les articles non sélectionnés n’utilisaient pas le VT (n = 26), ne présentaient pas de données empiriques originales (p. ex. : recension ; n = 15), ne comportaient pas d’auteurs de délits à caractère sexuel dans leur échantillon à l’étude (n = 9), étudiaient des sous-populations spécifiques (p. ex. : des délinquants juvéniles ou des personnes présentant une déficience intellectuelle, n = 5), utilisaient des groupes qui n’étaient pas discriminants (p. ex. : des auteurs de délits à caractère sexuel sans discernement quant à l’âge de la victime, n = 5), ne présentaient pas suffisamment d’information sur les analyses du VT (n = 2) ou opérationnalisaient le VT agrégé à une autre mesure, rendant impossible l’évaluation de son effet spécifique (n = 2). Enfin, les références des articles sélectionnés ont été examinées afin de repérer d’autres articles susceptibles de correspondre au sujet de recherche et 1 article a ainsi été retenu. Finalement, 19 articles font l’objet de cette recension des écrits. Le contenu des articles sera présenté sous forme de revue systématique narrative appuyé de tableaux synthèse. Les articles recensés ont été classés selon trois thèmes distincts, soit la capacité discriminante du VT, la comparaison entre le VT et les autres mesures de déviances sexuelles (c.-à-d. les mesures physiques, les mesures autorévélées, les autres mesures indirectes), ainsi que le lien entre le VT et la prédiction de la récidive.

Les tailles d’effet ont été standardisées (r) en fonction de l’information disponible dans les articles[6] et seront présentées à titre indicatif et comparatif (voir Schmidt et al., 2017, pour une méta-analyse complète sur le sujet). Pour comparer différentes tailles d’effet pour une même étude (p. ex. : les capacités discriminantes pour deux types de victimes), un test Z a été calculé (Steiger, 1980).

Résultats

La capacité discriminante du VT

Des travaux recensés, 16 se sont intéressés à la capacité discriminante du VT. Le Tableau 1 présente ces études, leurs échantillons, leurs principaux résultats ainsi que leurs tailles d’effet respectives. Abel et al. (1994) ont appliqué pour la première fois le VT à l’évaluation des préférences sexuelles déviantes. Les auteurs voulaient mettre en place une façon alternative d’évaluer l’intérêt sexuel envers les enfants, notamment dans le but d’identifier des pédophiles qui chercheraient à se placer en situation propice aux abus sexuels (p. ex. : scouts, prêtres). Ils ont ainsi créé l’Abel Screen (une batterie de tests incluant le test VT et plusieurs questionnaires) et ont testé sa validité discriminante sur des groupes d’individus connus pour avoir commis des délits sexuels envers des jeunes, séparés en quatre groupes, selon le type de victime (garçon pubère = 30, garçon prépubère n = 25, fille pubère = 57, fille prépubère, n = 73) et un groupe contrôle n’ayant commis aucun délit issu de la communauté (n = 101). Le VT a permis d’identifier correctement le sexe et l’âge de la victime avec une taille d’effet élevée (= 0,61 à 0,89).

Figure 1

Diagramme de flux PRISMA du processus de sélection des études

Diagramme de flux PRISMA du processus de sélection des études

-> See the list of figures

Tableau 1

Caractéristiques des études s’intéressant à la capacité discriminante du VT

Caractéristiques des études s’intéressant à la capacité discriminante du VT

Tableau 1 (continuation)

Caractéristiques des études s’intéressant à la capacité discriminante du VT

Tableau 1 (continuation)

Caractéristiques des études s’intéressant à la capacité discriminante du VT

Tableau 1 (continuation)

Caractéristiques des études s’intéressant à la capacité discriminante du VT

VT : Mesure de la déviance sexuelle basée sur le temps de visionnement ; DSE : Individu ayant commis un délit sexuel envers un enfant ; DNS : Individu ayant commis un délit non sexuel ; AD : Individu n’ayant commis aucun délit ; DS : Individu ayant commis un délit sexuel (autre qu’enfant) ;

† : Coefficient phi basé sur les mesures de spécificité et de sensibilité ; †† : Coefficient basé sur le d de Cohen ; ††† : Coefficient basé sur les tableaux de contingence ; ‡ : Coefficient basé sur l’aire sous la courbe ROC ;

* p < 0,05 ; ns : Relation non significative.

-> See the list of tables

Ultérieurement, la majorité des études (n = 10) a confirmé la capacité discriminante du VT en fonction du sexe de la victime avec des tailles d’effet similaires (Abel, Huffman, Warberg et Holland,1998 ; Babchishin, Nunes et Kessous, 2014 ; Banse et al., 2010 ; Casey, 2007 ; Harris, Rice, Quinsey et Chaplin 1996 ; Mokros et al., 2013 ; Pierce, 2005 ; Schmidt, Gykiere, Vanhoeck, Mann et Banse, 2014 ; Welsch, Schmidt, Turner et Rettenberger, 2020).

Certaines études ont observé une capacité discriminante du VRT pour les auteurs de délits à caractère sexuel dont la victime était spécifiquement un garçon (Croxen, 2000 ; Gress, 2005 ; Lanham, 2011 ; Letourneau, 2002). Quant à eux, Stinson et Becker (2008) n’ont pu détecter aucun effet discriminant du VT en fonction du type de victime. Dans leur méta-analyse, Schmidt et al. (2017) ont observé une taille d’effet moyenne pondérée de la capacité discriminante de r = 0,39 entre les auteurs de délit à caractère sexuel et ceux n’ayant commis aucun délit.

Seulement une étude de ce type s’est intéressée à un autre intérêt sexuel que celui envers les enfants (sadisme ; Stinson et Becker, 2008), dans laquelle les auteurs n’ont pas observé de capacité discriminante significative du VRT. À noter que Welsh et al. (2020), en faisant une analyse de validité test-retest, ont observé que la capacité discriminante du VT diminuait légèrement, mais non significativement, lorsque passé pour une deuxième fois.

Finalement, après une réanalyse sommaire des tableaux présentés par Pierce (2005), qui s’est intéressé au diagnostic clinique en plus des caractéristiques des victimes, on peut déduire que les individus ayant commis un délit sexuel auprès d’une victime mineure ont 11,2 fois plus de chances d’avoir un diagnostic de pédophilie par rapport aux individus ayant commis un délit sexuel auprès d’une victime majeure (51 % des individus ayant commis un délit sexuel envers un enfant n’ont pas obtenu ce diagnostic). D’autre part, les individus ayant un intérêt déviant selon le VT ont 37,9 fois plus de chances d’avoir un diagnostic de pédophilie, soit une capacité de discrimination beaucoup plus importante que les caractéristiques de la victime. Ce résultat remet en question l’idée d’utiliser les caractéristiques des victimes d’un délit pour déterminer les préférences sexuelles de l’auteur et, dans le cas qui nous intéresse ici, si on considère les diagnostics psychiatriques comme étant des mesures valides, discute la pertinence d’utiliser ces caractéristiques pour déterminer la validité des outils comme le VT.

Comparaison du VT avec d’autres mesures de l’intérêt sexuel

Les mesures physiques

Des chercheurs ont aussi comparé les résultats du VT à une autre mesure de l’intérêt sexuel, la PPG. Le Tableau 2 présente la synthèse de ces résultats. En 1996, Harris et ses collègues ont comparé la capacité du VT et de la PPG de classifier correctement des individus issus d’un groupe de 26 auteurs de délit à caractère sexuel envers un enfant et les membres d’un groupe de 25 volontaires issus de la communauté n’ayant commis aucun délit et ne rapportant aucun intérêt sexuel envers les enfants. Les indices de déviance calculés à partir du VT ont montré de grandes différences entre les deux groupes, avec de grandes tailles d’effet (r = 0,45), mais pas autant que les résultats de la PPG (r = 0,72), quoique cette différence ne soit pas significative considérant la taille faible de l’échantillon (Z = 1,04 ; p = 0,298).

Abel et al. (1998) ont évalué la capacité des deux mesures à classifier 157 hommes recrutés dans une clinique de traitement des déviances sexuelles. Ceux qui rapportaient un comportement sexuel déviant envers les enfants étaient comparés à un groupe contrôle rapportant un comportement sexuel déviant autre (viol, exhibitionnisme, voyeurisme). Selon Abel et al. (1998), les deux méthodes avaient une validité discriminante similaire, mais ils soulignent quelques éléments méthodologiques rendant la comparaison difficile. Les stimuli utilisés (niveau d’explicité, temps d’exposition et nombre d’images par catégorie) n’étaient pas les mêmes dans les deux tests, l’étude ne comportait pas de groupe contrôle et une partie des participants n’avaient pas terminé la PPG. Abel et al. (1998) concluent que la PPG et le VRT sont deux méthodes utiles pour évaluer les préférences sexuelles déviantes et que, par conséquent, le VT peut être une solution de rechange appropriée.

Tableau 2

Caractéristiques des études s’intéressant à la comparaison entre le VT et la PPG

Caractéristiques des études s’intéressant à la comparaison entre le VT et la PPG

Tableau 2 (continuation)

Caractéristiques des études s’intéressant à la comparaison entre le VT et la PPG

Tableau 2 (continuation)

Caractéristiques des études s’intéressant à la comparaison entre le VT et la PPG

VT : Mesure de la déviance sexuelle basée sur le temps de visionnement ; PPG : Mesure de la déviance sexuelle basée sur la pléthysmographie pénienne ; DSE : Individu ayant commis un délit sexuel envers un enfant ; AD : Individu n’ayant commis aucun délit ; DS : Individu ayant commis un délit sexuel (autre qu’enfant) ;

† : Coefficient phi basé sur les mesures de spécificité et de sensibilité ; †† : Coefficient basé sur le d de Cohen ; ††† : Coefficient basé sur les tableaux de contingence ; Z : Test de comparaison de deux tailles d’effet ;

* p < 0,05 ; ns : Relation non significative.

-> See the list of tables

Letourneau (2002), une chercheuse indépendante à l’équipe d’Abel, a évalué la validité et la fiabilité du VRT (Abel et al., 1994) et de la PPG sur un échantillon de 57 auteurs de délits à caractère sexuel (envers des enfants ou non) incarcérés. Pour ceux-ci, le VT et la PPG ont permis d’identifier correctement, à niveau égal, les individus dont la victime était un jeune garçon (moins de 14 ans) pour la PPG (φ = 0,61 ; p < 0,001) et pour le VT (φ = 0,65 ; p < 0,001). Aucune des deux mesures n’a permis d’identifier correctement les autres types de victimes. Les résultats de la PPG étaient même négativement associés au groupe dont les victimes étaient des jeunes filles (φ = -0,41 ; p < 0,01). Une explication possible donnée par Letourneau (2002) est que les individus qui ont agressé sexuellement une jeune fille étaient majoritairement des auteurs de délits sexuels intrafamiliaux, dont le passage à l’acte pourrait être moins motivé par un intérêt sexuel préférentiel envers les enfants, comparativement à ceux commentant leurs délits dans un contexte extrafamilial. Malgré des limites liées au contexte carcéral militaire où a eu lieu l’expérimentation (les données recueillies n’étaient pas confidentielles), l’étude offre du soutien pour l’identification des individus ayant un intérêt sexuel envers les jeunes garçons par le VT, mais souligne que des améliorations sont nécessaires pour les individus dont les passages à l’acte criminel concernent d’autres types de victimes. Pour leur part, Stinson et Becker (2008) ont analysé les résultats de la PPG et la portion VRT de l’Abel Assessment for Sexual Interest (AASI) chez un échantillon de 60 hommes désignés comme des personnes « sexuellement violentes » résidant dans un centre de traitement. Ils observent que la PPG avait une meilleure capacité d’identification des comportements pédophiles lors du délit (r = 0,47), comparativement au VT (r = 0,06 ; Z = 2,40 ; p = 0,016).

De manière globale, considérant que, selon la méta-analyse de McPhail et al. (2019), la capacité discriminante de la PPG est de r = 0,41 pour la pédophilie et l’hébéphilie et que, selon la méta-analyse de Schmidt et al. (2017) mentionnée plus tôt, cette capacité discriminante est de r = 0,39 pour le VT, ces deux mesures semblent présenter une capacité discriminante similaire de l’intérêt sexuel déviant.

Concernant la validité convergente de ces mesures, Letourneau (2002) a trouvé des corrélations significatives entre le VT et la PPG pour ceux dont la victime était un garçon prépubère (r = 0,61 ; p < 0,01), une fille prépubère (r = 0,28 ; p < 0,05) ou une femme adulte (r = 0,38 ; p < 0,01), mais pas dans les cas où la victime était une fille pubère (r = 0,18 ; p > 0,05). Pour sa part, Cloyd (2007) a observé une validité convergente entre les intérêts sexuels mesurés pour le VT et la PPG dans les cas où le stimulus était un garçon pubère (r = 0,25 ; p < 0,05), un homme adulte (r = 0,52, p < 0,05), une fille pubère (r = 0,33, p < 0,05) et une femme adulte (r = 0,32, p < 0,05), mais pas dans les cas où le stimulus était un garçon prépubère, un garçon adolescent, une fille prépubère ou une fille adolescente (p > 0,05). Lanham (2011) a observé une relation entre ces deux outils pour les mesures d’intérêt pour les garçons pubères (r = 0,40, p < 0,05) et les filles pubères (r = 0,34, p < 0,05), mais pas pour les autres stimuli de garçon prépubère, homme adulte, fille prépubère ou femme adulte (p > 0,05). Stinson et Becker (2008) ont aussi observé une validité convergente avec les échelles agrégées de déviance des deux outils (r = 0,31 ; p > 0,05), alors que, pour leur part, Babchishin et al. (2014) ont trouvé des résultats contraires, avec des corrélations non significatives entre la PPG et le VT (n = 18 ; r = -0,47). Dans leur méta-analyse, Schmidt et al. (2017) ont observé une validité convergente moyenne pondérée de r = 0,25 entre le VT et la PPG.

Tableau 3

Caractéristiques des études s’intéressant à la comparaison entre le VT et les mesures autorévélées de l’intérêt sexuel

Caractéristiques des études s’intéressant à la comparaison entre le VT et les mesures autorévélées de l’intérêt sexuel

Tableau 3 (continuation)

Caractéristiques des études s’intéressant à la comparaison entre le VT et les mesures autorévélées de l’intérêt sexuel

VT : Mesure de la déviance sexuelle basée sur le temps de visionnement ; AR : Mesure de la déviance sexuelle auto révélée ; DSE : Individu ayant commis un délit sexuel envers un enfant ; DNS : Individu ayant commis un délit non sexuel ; AD : Individu n’ayant commis aucun délit ; DS : Individu ayant commis un délit sexuel (autre qu’enfant) ;

†† : Coefficient basé sur le d de Cohen ; ‡ : Coefficient basé sur l’aire sous la courbe ROC ; Z : Test de comparaison de deux tailles d’effet ;

* p < 0,05 ; ns : Relation non significative.

-> See the list of tables

Les mesures autorévélées

La capacité discriminante des outils utilisant le VT a aussi été comparée à celle de mesures basées sur des informations autorévélées. Le Tableau 3 présente un sommaire de ces résultats. Harris et al. (1996) observent que le VT présente une meilleure valeur discriminante (r = 0,45) qu’une mesure autorévélée (r = 0,04), entre un échantillon d’individus ayant commis une agression sexuelle sur un enfant et un échantillon de sujets dans la communauté ; quoique cette différence ne soit pas significative considérant la taille de l’échantillon (Z = 1,64 ; p = 0,101, n = 27).

Banse et al. (2010), Mokros et al. (2013), ainsi que Babchishin et al. (2014) ont aussi observé une capacité prédictive similaire des caractéristiques de la victime pour le VT et les mesures autorévélées. Pour leur part, Stinson et Becker (2008) ont plutôt observé une faible capacité discriminante du VT en comparaison des mesures autorévélées de déviance sexuelle par rapport à la victime du délit.

Certains résultats suggèrent que les mesures des préférences sexuelles déviantes autorévélées sont d’ailleurs corrélées aux mesures basées sur le VT (Babchishin et al. 2014 ; Croxen, 2000), et ce, pour différents types de déviance (p. ex. : pédophilie et sadisme : Stinson et Becker, 2008) et de victimes (Banse et al., 2010 ; Mokros et al., 2013). Dans leur méta-analyse, Schmidt et al. (2017) ont observé une validité convergente moyenne pondérée de r = 0,38 entre le VT et les mesures autorévélées.

Les autres mesures indirectes

Avec le développement d’autres mesures indirectes d’évaluation des préférences sexuelles, des chercheurs ont comparé les propriétés du VT avec certaines d’entre elles. Le Tableau 4 présente un sommaire de ces études. Gress (2005) a comparé l’habileté du VT et de la procédure de tri de cartes[7] (TC) (Sexual Deviance Card Sort, Laws, 1986 ; cité dans Laws et al., 2000), à identifier l’âge et le sexe des victimes d’un groupe de 26 individus condamnés pour des agressions sexuelles (victime enfant, n = 19 ; victime adulte, n = 7), provenant d’une clinique de traitement. Ses résultats ont montré que seul le VT arrive à prédire le sexe de la victime.

Banse et al. (2010) ont élaboré une batterie d’évaluation de la déviance composée de quatre mesures VT et de quatre tests d’associations implicites[8] (Implicit association test [TAI] ; Greenwald et al., 1998). Ils ont comparé la validité des tests VT et des TAI sur un groupe d’auteurs de délit à caractère sexuel envers un enfant (n = 38) et deux groupes contrôles, l’un composé d’individus ayant commis un délit non sexuel (n = 37) et l’autre de personnes n’ayant commis aucun délit (n = 38). De façon générale, leurs résultats ont montré que le VT avait une meilleure capacité discriminante, une meilleure validité convergente et davantage de fiabilité que le TAI. Lorsqu’elles étaient prises ensemble, les différentes mesures implicites et explicites utilisées avaient une habilité discriminante élevée (r = 0,76), alors que le VT utilisé seul avait une valeur discriminante moindre (r = 0,60 ; Z = 2,25 ; p = 0,024). Ces résultats appuient la pertinence d’une démarche multimodale pour l’évaluation des préférences sexuelles (voir aussi Babchishin et al., 2014 ; Mokros et al., 2013).

Tableau 4

Caractéristiques des études s’intéressant à la comparaison entre le VT et les autres mesures indirectes de l’intérêt sexuel

Caractéristiques des études s’intéressant à la comparaison entre le VT et les autres mesures indirectes de l’intérêt sexuel

VT : Mesure de la déviance sexuelle basée sur le temps de visionnement ; DSE : Individu ayant commis un délit sexuel envers un enfant ; DNS : Individu ayant commis un délit non sexuel

AD : Individu n’ayant commis aucun délit ; DS : Individu ayant commis un délit sexuel (autre qu’enfant) ;

† : Coefficient phi basé sur les mesures de spécificité et de sensibilité ; †† : Coefficient basé sur le d de Cohen ; ‡ : Coefficient basé sur l’aire sous la courbe ROC ; Z : Test de comparaison de deux tailles d’effet ;

* p < 0,05 ; ns : Relation non significative

-> See the list of tables

De manière similaire, Babchishin et al. (2014) ont observé des différences significatives parmi un groupe d’auteurs de délits sexuels envers des enfants (n = 35) et un groupe d’auteurs de délits non sexuels (n = 21) avec le VT (r = 0,50), alors que le TAI ne permettait pas de distinguer ces deux groupes (p > 0,05). Dans leur méta-analyse, Schmidt et al. (2017) ont observé une faible validité convergente moyenne pondérée de r = 0,18 entre le VT et les TAI.

Le VT et la prédiction de la récidive

Certains chercheurs ont examiné la concordance entre les résultats du VT et la prédiction de la récidive criminelle sexuelle. Le Tableau 5 présente un sommaire de ces études. Mueller (2007) a examiné les associations entre les résultats d’outils d’évaluation du risque (Static-99 ; Hanson et Thornton, 2000) et les différentes échelles d’intérêt sexuel du VT et n’a observé aucune relation positive statistiquement significative entre les intérêts sexuels (incluant des déviances autres que la pédophilie) et le score de risque. Pour leur part, Schmidt et al. (2014) ont examiné les associations entre les résultats d’outils d’évaluation du risque de récidive sexuelle et de l’Explicit and Implicit Sexual Interest Profile (EISIP) chez un groupe de 74 auteurs de délits sexuels envers des enfants traités en consultation externe. La mesure agrégée des résultats du VT était corrélée aux résultats du Static-99R (α = 0,33 ; p < 0,01), mais pas à ceux du SRV-20 (α = -0,04, non significatif). Aucune mesure individuelle du VT ne corrélait positivement avec les résultats des outils d’évaluation du risque (Helmus, Thornton, Hanson et Babchishin, 2012). Pour leur part, Babchishin et al. (2014) ont observé une corrélation significative entre l’indice agrégé de déviance du VT et les résultats au Static-99, mais pas le STABLE-2000 (Hanson, Harris, Scott et Helmus, 2007) ou le STABLE-2007 (Hanson et al., 2007).

Gray et al. (2015) ont publié une étude prospective où ils ont vérifié la capacité du VRT à prédire la récidive sexuelle chez des hommes ayant commis des abus sexuels envers des enfants ou adoptant d’autres comportements sexuels déviants (p. ex. : viol, bestialité, exhibitionnisme, etc.). À notre connaissance, il s’agit de la seule étude sur le VT reposant sur des résultats prospectifs plutôt que rétrospectifs à jour. Leur échantillon comptait 621 individus en probation ou en libération conditionnelle, dont 284 avaient été suivis sur une période de 15 ans et 337 sur une période de 7 ans. Selon leurs résultats, les scores du VRT étaient significativement associés au risque de récidive sexuelle (r = 0,31). Les auteurs comparent ce résultat à ceux de la méta-analyse de Hanson et Morton-Bourgon (2004) qui observe que la taille d’effet de la PPG pour prédire la récidive sexuelle est de seulement r = 0,16.

Tableau 5

Caractéristiques des études s’intéressant au lien entre le VT et la prédiction de la récidive

Caractéristiques des études s’intéressant au lien entre le VT et la prédiction de la récidive

VT : Mesure de la déviance sexuelle basée sur le temps de visionnement ; DSE : Individu ayant commis un délit sexuel envers un enfant ;

TX : Individus en traitement pour déviance sexuelle ;

‡ : Coefficient basé sur l’aire sous la courbe ;

* p < 0,05 ; ns : Relation non significative.

-> See the list of tables

Conclusion

Un certain nombre d’études appuient le VT comme mesure valide de l’intérêt sexuel chez les auteurs d’agression sexuelle (Abel et al., 1994, 1998 ; Banse et al., 2010 ; Gray et al., 2015 ; Harris et al., 1996 ; Letourneau, 2002 ; Mokros et al., 2013). Toutefois, certaines viennent nuancer ces résultats, soulevant des problèmes méthodologiques (Fischer et Smith, 1999 ; Schmidt et al., 2017) ou rapportant des résultats mitigés (Schmidt et al., 2014). Notamment, à l’instar des mesures physiologiques comme la PPG, on déplore un manque de standardisation de l’outil entre les études, ce qui rend difficile la comparaison et la généralisation des résultats. Ainsi, selon Schmidt et al. (2017), on ne peut parler d’une mesure VT, mais d’une famille de mesures n’ayant essentiellement en commun que leur variable dépendante. En effet, ces derniers soulèvent que les paramètres des stimuli (p. ex. : âge des protagonistes, degré d’explicité, présence ou non d’adolescents), les types de groupe contrôle (personne ayant commis un délit non sexuel ou n’ayant commis aucun délit) et la méthode de cotation utilisée (différences de scores ou valeurs absolues, prise en compte ou non du sexe des stimuli) sont susceptibles de faire varier les résultats.

Comme le soulignent Snowden et al. (2011), plusieurs critiques ont été formulées concernant le fait que les données sur l’Abel Screen, qui a ensuite été remodelé et renommé l’Abel Assessment for Sexual Interest (AASI) en 1996 (Abel, 2000), proviennent majoritairement de l’auteur de l’outil lui-même ou de ses collaborateurs. Fischer et Smith (1999) ont procédé à une revue critique des travaux d’Abel et de ses collègues disponibles à l’époque sur les plans méthodologique et statistique. Ils ont notamment soulevé un manque de transparence, lié au fait qu’Abel ne rendait pas disponibles les données justifiant la validité de l’outil. Les auteurs (Fisher et Smith, 1999) ont également observé des difficultés d’interprétation du test liées à l’ipsatisation des données, et concluent que l’instrument nécessite davantage de validation. Abel (2000) a adressé une réponse à Fischer et Smith (1999), dans laquelle il argue que ces derniers ont confondu deux instruments différents (Abel Screen et AASI) dans leurs analyses. Il mentionne également que les auteurs n’avaient pas compris l’objectif clinique de la portion VT de l’outil, lequel n’était pas de classifier des pédophiles et des non-pédophiles, mais de mesurer un intérêt sexuel chez l’individu. Toutefois, comme le mentionne Cloyd (2007), les données brutes des travaux d’Abel et de ses collaborateurs demeurent difficilement accessibles pour la poursuite de la recherche en dehors de son propre laboratoire, entravant la réplication et la vérification des résultats.

Également, bien que certains éléments de compréhension aient été soulevés pour le VT, les mécanismes sous-jacents des mesures indirectes demeurent largement inconnus (Imhoff et al., 2010, 2012). Toutefois, si le délai induit par du contenu sexuel est bien causé par la tâche évaluative, comme les résultats d’Imhoff et al. (2012) donnent à penser, les résultats du VT seraient alors susceptibles d’être facilement manipulés par la personne évaluée (Imhoff et al., 2012). À cet effet, Schmidt et al. (2017) soulèvent des préoccupations éthiques concernant un manque de transparence envers les participants quant à la finalité de la procédure du VT pour éviter toute manipulation de leur part. Schmidt et al. (2014) soulignent également une préoccupation quant au fait de procéder à l’évaluation des intérêts/préférences sexuelles déviantes à l’aide d’un seul type de mesure. En ce sens, des résultats convergent pour soutenir la supériorité d’une approche multiméthode pour l’évaluation des préférences sexuelles déviantes (Banse et al., 2010 ; Harris, 1996 ; Letourneau, 2002 ; Schmidt et al., 2014 ; Stinson et Becker, 2008).

Quant à ses applications, le VT, comme mesure de l’intérêt sexuel, a été utilisé en grande majorité pour évaluer un seul type de préférence sexuelle déviante, soit la préférence envers les enfants. Dans la présente recension, seules deux études mettaient en relation les résultats du VT avec des préférences sexuelles déviantes autres que la pédophilie. Larue et al. (2014) ont obtenu des résultats prometteurs quant à l’emploi de mesures indirectes, dont le VT, à l’intérêt envers la sexualisation de la violence (sadisme et masochisme) sur un échantillon d’hommes et de femmes sur internet. Il pourrait donc s’avérer intéressant d’investiguer davantage cette avenue auprès d’individus ayant commis un délit sexuel dont la victime n’est pas un enfant, de même que de tester le VT pour mesurer l’intérêt envers d’autres paraphilies et à en distinguer les différents types. Par exemple, des études subséquentes pourraient inclure des échantillons composés d’auteurs de délits à caractère sexuel envers des enfants sans contact (pornographie juvénile) ou d’individus présentant de multiples paraphilies. De plus, bien qu’elles ne satisfaisaient pas aux critères d’inclusion de la présente recension, certaines études ont également testé l’utilisation du VT avec des auteurs de délits à caractère sexuel faisant partie de groupes vulnérables (p. ex. : adolescents, personnes présentant une déficience intellectuelle). L’emploi de mesures indirectes nous semble particulièrement opportun auprès de ces populations afin d’éviter de recourir à des méthodes intrusives telles que la PPG.

Enfin, bien que les préférences sexuelles déviantes représentent l’un des facteurs de risque les plus associés à la récidive chez les auteurs d’agression sexuelle (Hanson et Bussière, 1998 ; Hanson et Morton-Bourgon, 2005), elles ne sauraient à elles seules expliquer le risque de passage à l’acte, qui est largement accepté dans la littérature comme étant multidéterminé (Mann, Hanson et Thornton, 2010). La relation entre l’intérêt sexuel déviant et l’agression sexuelle sur un enfant demeure ambiguë. En effet, il est estimé que de 40 % à 50 % des individus qui commettent de tels délits présentent une préférence sexuelle pour les enfants (Seto, 2009). Donc, même si la validité du VT pouvait être démontrée en matière d’identification des préférences sexuelles déviantes, l’information obtenue ne représenterait qu’une partie du tableau clinique quant à l’évaluation et au traitement d’individus ayant commis des délits à caractère sexuel.