Article body

Les exemples auxquels il a été fait allusion dans l’article compagnon précédent [1] ((→) m/s 2005, n° 1, p. 78) et qui sont repris ici montrent l’importance des DSMB dans le suivi des essais cliniques, notamment dans les populations à haut risque d’évolution défavorable ou de complications. Ils sont empruntés à l’investigation clinique chez les malades de soins intensifs, qui illustrent bien ces situations [2, 3].

Essai thalidomide dans le syndrome de Lyell et essai CYTHAL

L’essai thalidomide-Lyell a été mené sur une population très particulière, représentant une maladie rare dans laquelle aucun essai randomisé n’avait été conduit jusque-là [4], et avec relativement peu de données épidémiologiques disponibles en termes de critères d’évaluation. La mortalité moyenne de ce syndrome est de l’ordre de 30 %. Le traitement visait à limiter l’extension du décollement cutané qui caractérise le syndrome. Les données précliniques, peu fournies, étaient fondées sur des études in vitro suggérant une réduction de la production de TNF (tumor necrosis factor), considéré comme participant à la pathogénie du décollement cutané, sous l’effet de la thalidomide. En l’absence de modèle disponible, aucune expérimentation animale, ni aucun essai de phase II n’avait été conduit, du fait de la rareté de la maladie. Cette situation réunissait toutes les caractéristiques de l’essai à « haut risque » dans lequel la constitution d’un DSMB est impérative. L’essai avait pour critère de jugement principal l’étendue du décollement cutané et était planifié pour inclure 50 malades. Rapidement, des investigateurs expérimentés appartenant au centre ayant le plus grand recrutement notèrent une mortalité inhabituellement élevée parmi les malades inclus [4]. Un comité fut réuni en urgence sur cette constatation. Les données agrégées de suivi (avant la levée de l’aveugle) montraient une mortalité globale de 50 %, élevée mais encore compatible avec des syndromes de Lyell étendus. Compte tenu du petit nombre de malades alors inclus (seulement 22), la probabilité de pouvoir conclure à un véritable problème de risque était très faible, et les membres du comité étaient partagés quant à la levée de l’aveugle dans une analyse non planifiée à ce stade de l’essai. L’approche suivie fut donc, dans un premier temps, de comparer la mortalité globale observée à celle attendue en fonction de la gravité de la maladie, mesurée par les scores habituellement utilisés en réanimation, de constater que celle-ci était plus élevée qu’attendue, puis de comparer ces mêmes données dans chacun des groupes en maintenant l’analyse en aveugle du traitement reçu. Lorsqu’il apparut que la mortalité dans l’un des groupes différait très sensiblement de celle attendue, l’aveugle fut levé, révélant une surmortalité nette dans le groupe traité, à la fois par rapport à la mortalité attendue et par rapport au groupe témoin : la mortalité était de 10/12 (83 %) dans le groupe traité versus 3/10 (30 %) dans le groupe témoin (p=0,03, test de Fisher). Cet exemple extrême illustre quelques-unes des questions que l’on peut être amené à se poser au cours d’une analyse pour événement indésirable grave. La constitution préalable d’un DSMB n’aurait pas évité les interrogations du comité lors de cette réunion extraordinaire, mais elle aurait permis une meilleure planification du suivi. Cette expérience illustre aussi l’importance de la vigilance des investigateurs, particulièrement chez des malades à haut risque et dans des situations où les données précliniques sont très limitées. Dans ce cas particulier, le centre investigateur principal a pu soupçonner l’effet indésirable grave, grâce à son recrutement exceptionnellement important relativement aux autres centres. Mais celui-ci n’aurait certainement pas été relevé aussi vite dans un essai multicentrique où le recrutement aurait été plus équilibré, en l’absence d’un comité de suivi examinant précocement et régulièrement les données.

Plus récemment, une situation similaire s’est produite avec l’essai infliximab (anticorps anti-TNF-α administré à raison de trois doses de 10 mg/kg) versus placebo, tous deux associés à la prednisolone (40 mg/j x 28 j), dans le traitement des hépatites alcooliques graves, dont la mortalité atteint 30 % [5]. De la même manière que dans le cas précédent, des résultats expérimentaux suggéraient le rôle joué par le TNF dans la progression de l’atteinte hépatique, mais on ne disposait pas de données cliniques confirmant ces données expérimentales. Cet essai a été interrompu après l’inclusion de seulement 36 patients, devant une tendance à la mortalité supérieure (39 % versus 18 %, p=0,26, test de Fisher) dans le groupe traité, associée à une proportion élevée de malades atteints d’infections graves (8 versus 1, p= 0,02). Dans ce cas, un comité de suivi avait bien été prévu et s’était réuni de manière précoce et adaptée par rapport au plan d’analyse séquentielle prévu. Cet essai a pu être interrompu rapidement par le promoteur, ainsi qu’à la demande de l’AFSSAPS (Agence française de sécurité sanitaire des produits de santé), après que le comité de suivi se soit réuni quatre fois pour analyser les résultats. Il est très probable que, dans ce cas particulier, les données extérieures à l’essai, non disponibles au moment de sa planification, et décrivant la survenue d’événements infectieux graves sous traitement par anti-TNF dans certaines populations à risque, ont fortement influencé cette décision d’arrêt précoce, avant que n’apparaisse une augmentation significative de la mortalité.

Essai « Hormone de croissance »

C’est également un essai multicentrique complexe, effectué dans un contexte de données précliniques très modestes, et en l’absence d’essai de phase II dans la population cible, mais où l’effet indésirable du traitement n’a pu être détecté à temps, faute d’un DSMB efficace. Cette étude d’un nouveau traitement des « états d’agression » par l’hormone de croissance, destiné à améliorer les défenses des malades de réanimation, et en particulier à réduire la fréquence des complications septiques, comportait deux essais menés en parallèle, l’un en Finlande, l’autre en Europe, de taille comparable (247 et 285 malades, respectivement). Les essais ont été menés à leur terme, avec pour critère de jugement principal la durée de séjour en réanimation, et pour critère secondaire la mortalité. Ils concluaient à une surmortalité très significative (p < 0,001) du groupe recevant le traitement à l’étude [6]. Le suivi de cet essai ne comportait pas de DSMB, mais un suivi habituel de safety, organisé par le promoteur.

Pourquoi ce comité n’a-t-il pas identifié le problème ? Les raisons en ont été analysées par B.D. Freeman et al. [3]. Le suivi de mortalité comportait la seule comparaison avec un groupe historique d’un seul centre, sur les données globales (en maintenant l’aveugle pour préserver l’intégrité scientifique de l’essai), et la surmortalité n’était pas aisément détectable, le groupe témoin ayant une mortalité plus faible que prévu (19 % versus 30 %). Un DSMB analysant les données d’efficacité par groupe aurait facilement détecté le problème et permis d’arrêter l’essai avant son terme, évitant ainsi un certain nombre de « décès indus », évalués par B.D. Freeman et al. à 44 malades (ou au minimum à huit si la distribution réelle de mortalité en excès au cours de l’essai était, par hypothèse, confinée à la fin de la période d’étude).

Cet exemple illustre le danger de se fier à une mortalité attendue à partir de contrôles historiques, dont les caractéristiques diffèrent nécessairement plus ou moins des malades réellement inclus dans les essais, et la nécessité d’un DSMB dans les grands essais multicentriques où des événements morbides graves sont, de toute façon, attendus.

L’arginine dans le choc septique

La L-N-méthyl-arginine (LNMA), vasoconstricteur puissant par son effet d’inhibition de la production de monoxyde d’azote endogène, a été proposée dans le traitement du choc infectieux pour améliorer la pression de perfusion et l’hémodynamique. Cet essai présente la particularité d’avoir été planifié alors que des résultats expérimentaux suggéraient la possibilité d’effets indésirables graves (ischémiques) sous traitement. Néanmoins, deux essais de phases I-II semblaient indiquer une tolérance acceptable chez les malades en choc septique et ne pas confirmer ce risque aux doses testées [7].

L’essai de phase III était un essai multicentrique (126 centres) international [8] conduit avec une durée d’administration plus longue que dans les essais préalables (14 jours versus 7 jours) afin d’augmenter la dose totale reçue et l’efficacité potentielle, mais exposant ainsi les malades à une accumulation du produit testé [3]. Le critère de jugement principal était la mortalité à 28 jours, critère habituel dans les essais sur le choc septique.

L’essai comportait un DSMB, mais la première analyse intermédiaire, qui n’avait été effectuée qu’après l’inclusion de 500 malades, montrait une surmortalité dans le groupe traité (p < 0,05). Cependant, les résultats ne furent diffusés que tardivement, et 250 malades supplémentaires avaient été recrutés entre-temps. Le résultat final de l’essai, après inclusion de près de 800 patients, montrait une surmortalité de 10 % dans le groupe traité (59 % versus 49 %, p=0,006). Cet exemple montre que, lorsque des risques particuliers ont été identifiés en préclinique, il convient de redoubler de prudence dans le suivi de l’essai et de prévoir des analyses intermédiaires avant qu’un nombre trop élevé de malades soient inclus, surtout si les conditions d’administration du traitement testé diffèrent de celles utilisées en phase II. Dans le cas présent, l’essai aurait pu probablement être arrêté après l’inclusion de deux fois moins de malades, permettant potentiellement d’éviter 25 à 50 « décès indus » [3]. Cet exemple montre également que la présence d’un DSMB ne suffit pas à assurer la sécurité d’un essai, si ses conditions de fonctionnement et sa réactivité ne sont pas adaptées.

Conclusions

Les DSMB sont devenus un partenaire indispensable à la conduite et à la surveillance des essais cliniques, particulièrement des essais multicentriques menés dans des populations à risque élevé de morbidité/mortalité. Leur composition et leur fonctionnement doivent obéir à des règles strictes pour être efficaces et réactifs. Garant de l’intégrité scientifique de l’essai clinique, leur rôle principal est de s’assurer du maintien d’un rapport bénéfice/risque favorable, sous tous ses aspects, tout au long de sa conduite. Leurs attributions sont larges, allant jusqu’à l’interruption de l’essai.