Corps de l’article

La question de la méthodologie de la recherche biomédicale est généralement abordée sous un angle technique ; cet article propose au contraire quelques points de réflexion générale, utilisant parfois un argumentaire relevant moins de l’expertise méthodologique académique que de la philosophie. Il faut pourtant être très clair : l’auteur ne revendique aucune expertise dans ce domaine, mais simplement le droit et le devoir de s’interroger le plus honnêtement possible sur sa pratique de méthodologiste.

Selon le Dictionnaire de l’Académie (9e édition), la méthodologie est « l’étude des méthodes de recherche et d’analyse propres à une science, à une discipline ». La méthode est, quant à elle, la « manière de conduire sa pensée, d’établir ou de démontrer une vérité suivant certains principes et avec un certain ordre ». En complément de ce point de vue assez abstrait, il est intéressant de reprendre l’approche plus concrète d’Henri Poincaré, pour lequel la méthode est, en substance, l’art de choisir ce qu’il faut observer ou expérimenter [1].

La question de la méthodologie de la recherche médicale comporte en réalité deux facettes. La première s’organise autour de la notion de démonstration : l’objet d’étude en médecine étant le malade et sa maladie, et les connaissances étant donc de nature très diverse, comment entendre le sens du mot « démonstration » ? L’autre facette se situe sur un plan plus pratique : comment le chercheur doit-il « choisir ce qu’il va observer ou expérimenter » s’il veut que son expérience soit concluante ?

Démonstration et connaissance médicale

Le statut de connaissance médicale

Les connaissances médicales peuvent être de nature très différentes. On mentionnera en premier lieu des connaissances se limitant à de simples constatations : on affirme ainsi que « l’hyperthyroïdie s’accompagne (souvent) d’une exophtalmie », que « les bains chauds calment (un peu) les crises de colique néphrétique »… Ces connaissances, avant tout opératoires, permettent au médecin d’étayer sa démarche diagnostique et thérapeutique ; elles n’en sont pas moins frustrantes. Le besoin se fait vite sentir, en effet, de les intégrer au sein d’une construction cohérente. Ce type de construction a plusieurs avantages : faciliter la mémorisation, expliquer (donner l’illusion d’expliquer ?), faciliter la production de nouvelles connaissances : on peut alors parler de théorie et de connaissance « théorique ».

Les connaissances « théoriques » sont très appréciées des médecins scientifiques. L’impression est d’ailleurs souvent donnée qu’une connaissance médicale non intégrée dans une théorie est une connaissance de moindre valeur, anecdotique. Prenons un exemple : dans un essai médicamenteux réalisé chez des patients déprimés, la fluoxétine entraîne une réponse thérapeutique chez 65 % des sujets, alors que le placebo conduit à un taux de réponse de seulement 50 %. Cette efficacité de la fluoxétine, un inhibiteur de la recapture de la sérotonine, est très intéressante sur un plan théorique : les corps cellulaires des neurones sérotoninergiques se situent essentiellement dans le tronc cérébral (noyau du raphé), avec des projections axonales au niveau du cortex frontal (régulation de l’humeur), des ganglions de la base (agitation), des aires limbiques (anxiété), de l’hypothalamus (modification de l’appétit) et des centres du sommeil du tronc cérébral (insomnie). Quel superbe modèle explicatif du syndrome dépressif ! On en viendrait presque à oublier le taux de réponse de 50 % du placebo : à quoi est-il dû ? Ne pourrait-on pas imaginer des techniques de prise en charge permettant de renforcer cet effet et de le stabiliser dans le temps ? Ne disposant pas d’un système théorique digne de ce nom permettant d’« expliquer » l’effet du placebo, n’existe-t-il pas un risque que celui-ci soit considéré comme une source de nuisance expérimentale ? On voit là comment le statut de la connaissance médicale est susceptible de peser sur le choix des variables étudiées dans une expérience, et donc d’influencer la méthodologie.

L’ultime quête de nombreux chercheurs est la découverte de la « cause » d’une maladie, mutation génétique ou agent infectieux, par exemple. Mais qu’entend-on par « cause » d’une maladie ? N’a-t-on pas là un autre type de connaissance ?

La notion de causalité

Les philosophes ont abondamment étudié la notion de causalité. Abordée chez les Grecs sous l’angle d’un principe (« tout ce qui naît naît nécessairement par l’action d’une cause » [2]), elle est profondément remise en question dès le xviiie siècle, où elle apparaît plus volontiers comme une caractéristique de la pensée humaine que comme une notion inhérente aux phénomènes naturels. Auguste Comte est d’ailleurs catégorique à ce propos : pour lui, la recherche des causes relève de la seule métaphysique, « […] en considérant comme absolument inaccessible et vide de sens pour nous la recherche de ce que l’on appelle les causes, soit premières, soit finales [3] ».

La pratique clinique conforte cette position. Lors de l’annonce, chez un enfant, d’un diagnostic du syndrome de l’X fragile, le père se retourne vers son épouse et lui dit : « J’en était sûr, c’est à cause de ta famille ! ». Une patiente décède des suites d’une leucémie aiguë, ses parents intentent un procès à l’hôpital parce qu’un manipulateur radio est venu faire un cliché pulmonaire au lit de la patiente sans mettre de gants : c’est, selon eux, à cause de cela qu’une infection pulmonaire s’est aggravée et qu’elle est décédée. De même, derrière le questionnement d’un proche ou d’un patient à propos des causes de la maladie, le médecin trouve souvent, en réalité, une interrogation de nature métaphysique sur le destin de l’homme, sur sa liberté : « Je suis malade parce que j’ai agi comme cela (ou d’autres ont agi comme cela). J’avais donc, quelque part, la possibilité de ne pas devenir malade. Au total, c’est bien moi qui suis maître de mon destin ». La connaissance « causale » est donc avant tout une connaissance de nature métaphysique (voir le commentaire en Encadré).

Dans ce cas, est-il vraiment nécessaire de connaître les causes des maladies ? Le plus important n’est-il pas de pouvoir déterminer des variables, en amont de la maladie, sur lesquelles on est susceptible d’agir dans un but de prévention ou de guérison ? Si le dépistage des sujets génétiquement à risque de diabète et le suivi de leurs habitudes alimentaires permet de réduire la prévalence de cette maladie, est-il nécessaire que l’on ait là ou pas la cause de cette pathologie ?

On retrouve d’ailleurs un tel point de vue lors de l’examen des critères de causalité proposés par les épidémiologistes anglo-saxons [4] ? Ces points ne sont pas sans intérêt, il s’en faut de loin. Ils constituent en fait un ensemble de règles pratiques permettant de présumer qu’en agissant sur la supposée cause (le facteur de risque), il y aura bien une action sur la conséquence (la survenue de la maladie). Si un tel résultat est, certes, d’une grande valeur pratique, il ne peut cependant prétendre capturer, à lui seul, les aspects métaphysiques inhérents à la notion de causalité.

Démonstration et niveau de preuve

Le chercheur vient de caractériser la connaissance médicale qu’il veut mettre en évidence. Il lui faut maintenant construire une expérience pour en apporter la preuve. Mais, au fait, qu’est ce qu’une preuve ?

Le concept de preuve est un des plus féconds de la philosophie. Démonstration, raisonnement, syllogisme, déduction, induction, abduction, analogie… Autant de termes ayant fait l’objet de multiples développements. Il faudra être simplificateur, en choisissant par exemple la définition de Fernando Gil : « Une proposition est dite prouvée si, ayant été établie par une méthode reconnue, elle fait l’objet d’une croyance » [5]. Mais quelle peut être cette « méthode reconnue » ? On retiendra ici l’approche poppérienne, pour laquelle la méthode scientifique repose sur la formulation d’hypothèses réfutables par des expériences reproductibles.

Conformément à la définition ci-dessus, pour qu’il y ait preuve, il faut non seulement une méthode expérimentale de qualité, mais aussi une adhésion aux conclusions des investigateurs. Cette adhésion est par essence subjective, et l’on retrouve effectivement, en pratique, un désaccord fréquent à propos du niveau de preuve à attribuer à certaines connaissances médicales.

On a ainsi parfois l’impression que les jeunes médecins sont plus enclins que leurs aînés à accepter de nouvelles connaissances médicales. De même, des résultats obtenus dans des maladies graves et médiatiques pourraient être acceptés plus facilement que des résultats obtenus dans d’autres maladies. Enfin, des résultats reposant sur des mesures sophistiquées, issues notamment de technologies de pointe, semblent plus persuasifs que des résultats issus de mesures plus banales. Le niveau de preuve des résultats issus des expériences médicales peut également être minoré ou, au contraire, magnifié pour des enjeux évidents de pouvoir ou pour des raisons économiques. Enfin, le temps est un élément capital pour qu’une connaissance médicale accède au statut de croyance.

Une difficulté supplémentaire vient du fait que les résultats des expériences réalisées dans le domaine médical sont en général aléatoires. En simplifiant à l’extrême, la méthode expérimentale consiste à faire le bilan des variables ayant une action sur le système étudié, à trouver une situation dans laquelle toutes ces variables, sauf deux, sont fixées, puis à faire varier l’une de ces deux variables et à observer l’évolution conjointe de l’autre. Or, en médecine, il est parfois tout simplement impossible de faire ne serait-ce que le bilan des variables ayant une action sur un patient. Il suffit de penser à la question des variables, notamment des facteurs psychologiques, expliquant le possible succès d’une prise en charge thérapeutique. Si la méthode strictement expérimentale peut donc être envisagée dans certains domaines comme la physiopathologie, ce ne sera généralement pas le cas en recherche clinique ou épidémiologique : dans ces deux derniers domaines, les relations entre deux variables d’intérêt seront entachées d’un aléa, aléa résultant de l’effet de l’ensemble des variables non maîtrisées dans l’expérience. Cet aléa est parfois très important et peut rendre les résultats difficilement interprétables.

Prise en compte de l’aléa thérapeutique

Pour contourner cette difficulté, une solution consiste à recourir à un tirage au sort : l’aléa revêt alors un caractère probabiliste. En d’autres termes, il peut être modélisé mathématiquement, au moyen de tests statistiques ou d’intervalles de confiance : l’interprétation des résultats en est ainsi grandement facilitée.

Prenons l’exemple de la comparaison de deux traitements : l’impossibilité de faire l’inventaire des variables déterminant la réponse thérapeutique rend délicate son analyse. De fait, une différence de performance entre deux médicaments testés sur deux groupes de patients ne permet pas d’affirmer avec certitude qu’elle provient des médicaments, et non, par exemple, de l’aléa thérapeutique qui serait globalement avantageux dans un groupe et non dans l’autre. Pour résoudre ce problème, on a alors recours à un tirage au sort des patients dans les deux groupes de traitements et à un test statistique qui permet d’estimer, compte tenu de l’aléa thérapeutique observé dans chaque groupe de traitement, la probabilité que le tirage au sort puisse expliquer à lui seul le différentiel d’efficacité constaté dans l’essai (cette probabilité correspond au « p » des statisticiens). Les résultats de cette expérience sont donc bien probabilistes.

Le problème se complique quand les investigateurs, ayant toujours recours à la statistique, n’effectuent pas de tirage au sort, le caractère probabiliste des résultats de l’expérience n’étant alors pas clairement caractérisé : ce sera notamment le cas dans beaucoup d’enquêtes épidémiologiques ou d’études de physiopathologie. La justification (implicite) du recours à des tests statistiques se fait alors en considérant que la constitution « naturelle » des groupes s’est effectuée « comme si » il y avait eu un tirage au sort. Cela n’est pourtant pas exact, et entraîne un inévitable affaiblissement de la validité des conclusions, affaiblissement qui peut être géré par une modélisation plus fine du phénomène étudié (prise en compte de variables d’ajustement dans un modèle multivarié), ainsi que par une discussion encore plus approfondie des limites de l’étude.

Choisir ce qu’il faut observer

Partant de réflexions très théoriques, nous sommes progressivement arrivés à des considérations beaucoup plus pratiques, aux choix que l’expérimentateur est amené à faire au quotidien. On retrouve bien ici la méthodologie comme « l’art de choisir ce qu’il faut observer ». Bien sûr, les problèmes à résoudre sont d’une telle variété qu’il est impossible de proposer une méthodologie exhaustive de la recherche médicale ; deux questions restent cependant centrales : quelles variables mesurer, chez qui, comment et dans quelles circonstances ?

Quelles variables mesurer, et chez qui ?

Ces deux questions n’en forment en réalité qu’une seule. En effet, caractériser la population à étudier implique de définir des critères d’inclusion et d’exclusion ; or ces critères correspondent bien, en pratique, à des variables à mesurer chez les sujets. Le distinguo porte plutôt sur l’opposition entre variable qualitative (ou catégorielle) et variable quantitative (ou dimensionnelle).

En recherche médicale, les variables catégorielles sont essentielles. Le phénotype clinique de base, la maladie, est en effet presque toujours une qualité et non une quantité. On remarquera à ce propos que ce n’est nullement parce que les processus physiopathologiques sous-jacents aux maladies sont, eux aussi, catégoriels, bien au contraire ; la plupart des troubles obéissent à une logique dimensionnelle : l’asthme, la dépression ou encore l’arthrose de hanche peuvent être considérés avec une gradation d’intensité. Cela se conçoit même pour des pathologies cancéreuses où les formes in situ, voire les simples dysplasies, peuvent être considérées comme d’intensité intermédiaire. En fait, c’est la thérapeutique, et non la physiopathologie, qui a dicté le caractère catégoriel des maladies : si, dans l’arthrose de hanche, on peut envisager un continuum d’intensité de la pathologie (correspondant à un continuum de destruction articulaire), la décision de poser une prothèse totale de hanche ne pourra être, elle, que binaire, donc catégorielle. Ainsi, c’est dans le but de faciliter l’opérationnalisation de la décision thérapeutique que la nosographie médicale est construite sur la base de catégories. La caractérisation des maladies par la définition de critères diagnostiques, une tâche passionnant les cliniciens, bénéficie aujourd’hui de systèmes critériologiques opérationnels, sinon consensuels. Si ces systématisations manquent souvent de finesse dans l’explicitation des tableaux cliniques, elles ont la vertu d’homogénéiser les diagnostics et sont, de ce fait, très utiles pour la recherche.

À propos des variables dimensionnelles, on remarquera qu’elles sont souvent fortement liées à un système théorique, ce qui n’est pas sans poser un problème. Par exemple, le VEMS (volume expiratoire maximum seconde) est fréquemment utilisé pour quantifier l’amélioration d’un patient souffrant de BPCO (bronchopneumopathie chronique obstructive) sous traitement ; mais en affirmant que l’amélioration d’un patient atteint de BPCO est caractérisée par ce paramètre, il faut constater la réduction théorique du patient à sa seule physiologie respiratoire. Pour contourner cette difficulté, plusieurs variables quantitatives peuvent être proposées en substitution (ou en supplément) du VEMS : une distance maximum de marche sur tapis roulant, un score de dyspnée ou un score de qualité de vie. Ces variables s’inscrivent, elles aussi, dans leur propre champ théorique. La distance de marche sera un bon critère d’évaluation si l’on adhère à une théorie fonctionnelle du sujet humain, le score de dyspnée relèvera, lui, d’une théorie symptomatique, et le score de qualité de vie d’une théorie normative du bien-être, postulant en outre qu’un sujet humain malade est capable d’apprécier de façon absolue et semi-quantitative son niveau de souffrance et d’incapacité.

En pratique, l’expérimentateur est bien sûr libre de choisir le cadre théorique de son choix (il peut même avoir intérêt à les diversifier), encore doit-il en avoir conscience et en tenir compte lors de l’interprétation des résultats.

Dans quelles circonstances ?

Dans une expérience, l’un des objectifs est de maîtriser la variabilité des caractéristiques du système étudié, afin d’obtenir des résultats interprétables avec un minimum d’ambiguïté. On peut ainsi, comme nous l’avons vu plus haut, trouver une situation dans laquelle les variables sont fixées, sauf deux, puis faire varier l’une de ces deux variables et observer l’évolution conjointe de l’autre.

Une telle approche peut cependant poser un problème : pour maîtriser la variabilité, il faut agir sur le système étudié, qui peut alors être modifié. Ainsi, pour contrôler la variable « croyance en l’efficacité du traitement » au sein d’un essai thérapeutique, les médicaments sont souvent prescrits en double aveugle, ni le patient ni le médecin ne sachant quel est le traitement prescrit. Or il est possible que le fait de ne pas connaître le médicament que l’on prend, ou que l’on prescrit, modifie l’effet de ce dernier. De la même façon, dans le cadre d’une étude de cohorte, interroger les patients sur leur consommation d’alcool est susceptible de leur faire prendre conscience d’un éventuel abus, et donc d’induire une modification de leur comportement.

Il est aussi parfois tout simplement impensable de maîtriser les niveaux des variables à mesurer. C’est notamment le cas dans un grand nombre d’études épidémiologiques : impossible, par exemple, d’exposer la moitié d’un échantillon d’individus aux rayons X afin d’évaluer l’effet leucémogène des rayonnements ionisants.

Si l’on considère ainsi qu’il est nuisible ou impossible d’intervenir trop directement au niveau du phénomène étudié, il est toujours possible de se contenter de l’observer. Mais comment démêler alors l’effet de chacun des nombreux facteurs en jeu ? Une solution est de modéliser l’effet de ces facteurs, à partir de l’étude d’un échantillon de sujets, et d’utiliser les statistiques pour estimer les paramètres du modèle et en apprécier la pertinence, notamment en quantifiant la part possible des fluctuations aléatoires. Cette approche est largement utilisée en épidémiologie.

Enfin, on ne peut s’intéresser aux principales procédures utilisées en recherche médicale sans revenir sur la question du tirage au sort. Nous l’avons vu précédemment, le tirage au sort permet de donner un caractère probabiliste à l’aléa clinique et biologique, et donc de rendre rigoureux ce qui semblait ne jamais pouvoir l’être. Ce sont les tests statistiques qui apportent cette rigueur, en permettant d’estimer le risque pris par l’expérimentateur en affirmant à la communauté que les résultats obtenus ne correspondent pas exclusivement à des fluctuations aléatoires.

Conclusions

La méthodologie est l’étude des méthodes en tant que « manières de conduire sa pensée, d’établir ou de démontrer des vérités suivant certains principes et avec un certain ordre ». Nous avons vu que les « vérités », les connaissances médicales, pouvaient être de nature fort différente : simple constatation, souvent à vocation opératoire, ou connaissance théorique, appartenant à un tout cohérent, qui fascine et facilite la représentation des pathologies, ou encore connaissance causale, de nature essentiellement métaphysique, qui fait souvent l’objet d’interrogations brûlantes dans la pratique médicale. Ce distinguo n’est pas sans conséquence en termes méthodologiques. Les théories sont utiles car elles facilitent le choix des hypothèses à tester et celui des variables à mesurer, et améliorent l’interprétation des résultats de l’expérience. Le risque existe cependant de ne plus pouvoir penser en dehors de leur cadre, et donc de négliger toute source de connaissance qu’elles ne pourraient intégrer. La cause, elle, est inaccessible à la science ; il faudra, en pratique, se limiter à la recherche de variables d’amont sur lesquelles une action de prévention ou de guérison pourra être entreprise.

Pour établir et démontrer ces connaissances médicales, il faut non seulement recourir à la méthode scientifique en formulant des hypothèses réfutables par des expériences reproductibles, mais aussi aboutir à ce que ce processus s’accompagne d’une croyance dans les résultats obtenus. Il apparaît ainsi que, pour un même schéma expérimental, le niveau de croyance et donc le niveau de preuve des résultats sont dépendants du type de mesure réalisée (mesure triviale ou de haute technicité), de la discipline médicale et du caractère médiatique ou non de la pathologie étudiée, voire d’enjeux de pouvoir.

La reproductibilité des expériences médicales est problématique, d’autant que les résultats de ces expériences sont en général aléatoires. Cet aléa résulte du nombre considérable de variables entrant en jeu dans la genèse ou la guérison des pathologies humaines, et plus précisément du fait que la plupart de ces variables sont inconnues ou impossibles à maîtriser. Le tirage au sort permettant de donner un caractère probabiliste à cet aléa, il est alors possible de réaliser des tests statistiques et calculer des intervalles de confiance, afin de bénéficier d’une possibilité de faire des inférences avec une marge d’erreur connue. En l’absence de tirage au sort, les résultats, exploitables en recourant à des modèles statistiques hautement élaborés, sont à manier avec une plus grande prudence encore.