Chroniques génomiquesTales of the Genome

Coup de tabac sur les pucesStorm on microarrays[Notice]

  • Bertrand Jordan

…plus d’informations

  • Bertrand Jordan
    Marseille-Génopole,
    case 901, Parc Scientifique de Luminy,
    13288 Marseille Cedex 9, France.
    brjordan@club-internet.fr

Le secteur des puces à ADN fait preuve de dynamisme. Plusieurs fabricants mettent sur le marché des microarrays « génome entier » autorisant la mesure du niveau d’expression de l’ensemble des gènes humains. L’entreprise FeBit, dont nous avons déjà parlé dans ces colonnes [1], commercialise enfin son instrument-miracle, le Geniom One, automatisant fabrication, hybridation et lecture de réseaux d’oligonucléotides. Enfin, les puces à protéines, après des débuts difficiles, commencent à avoir une existence réelle. Pourtant le développement commercial reste en deçà des prévisions très optimistes d’il y a deux ou trois ans, et le marché des microarrays à usage clinique tarde à s’ouvrir. Et, surtout, apparaissent au grand jour des interrogations sur la qualité des données engendrées par les microarrays, notamment sur la cohérence entre les résultats produits par des plates-formes différentes. L’on s’attendrait a priori à ce que les profils d’expression obtenus à l’aide de réseaux d’oligonucléotides courts (Affymetrix), longs (Agilent), ou de produits de PCR provenant de clones d’ADNc soient très proches ; les efforts déployés par différentes équipes (notamment celle de l’European Bioinformatics Institute) pour constituer des bases de données d’expression reposent à l’évidence sur ce présupposé. Or, des articles récents mettent sérieusement en doute cette cohérence. Le plus radical est sans doute celui de l’équipe de Margaret Cam, responsable de la plate-forme microarrays au National Institute of Diabetes and Digestive and Kidney Disorders dans le cadre du National Institutes of Health (NIH) nord-américain [2]. Après la publication de deux études montrant d’importantes différences entre les résultats de différents systèmes [3, 4], Margaret Cam a voulu les comparer dans les meilleures conditions possibles, afin de choisir le plus performant pour son centre de ressources. La comparaison incluait le système Affymetrix (employé par un laboratoire du NIH qui en a une très bonne expérience), des réseaux d’ADNc fournis par Agilent (leurs réseaux d’oligonucléotides n’étant pas encore disponibles à l’époque) et le procédé Codelink d’Amersham (oligonucléotides 30-mères fixés dans une couche d’un gel spécifique). Les deux derniers étaient mis en oeuvre, dans le laboratoire du NIH, grâce à des ingénieurs envoyés par ces deux sociétés. Les échantillons fournis étaient identiques, provenant des mêmes préparations d’ARN. Parmi les gènes représentés sur les trois types de puces d’après les indications de leurs fabricants, deux mille (2 009 exactement) étaient communs aux trois plates-formes et permettaient donc une comparaison. La conclusion essentielle (et très dérangeante) de l’étude est que les indications données par les trois systèmes divergent presque totalement ! Bien que la reproductibilité technique et biologique de chaque série de mesures soit bonne (coefficient de corrélation de Pearson supérieur à 0,9), la corrélation entre les valeurs obtenues pour le même échantillon par différentes plates-formes plafonne à 0,5 dans tous les cas… Les diagrammes correspondants sont franchement mauvais. La Figure 1 montre la confrontation des données Codelink (Amersham) avec celles d’Agilent : la corrélation est à peine perceptible, et l’image est très différente de la diagonale attendue. Mais après tout, le but de l’exercice n’est pas tant de mesurer des niveaux d’expression que de repérer des gènes différentiellement exprimés, et l’on pourrait espérer que, malgré les différences individuelles, une certaine cohérence serait retrouvée à ce niveau-là. Hélas, ce n’est pas le cas. Selon les données obtenues avec la plate-forme Affymetrix, 34 gènes sont différentiellement exprimés entre les deux conditions examinées (culture avec ou sans sérum) ; pour Agilent, 67, et pour Amersham, 117. Mais seuls quatre d’entre eux sont communs aux trois listes ! Les comparaisons deux à deux ne sont guère plus probantes : cinq gènes communs entre Affymetrix (sur 34) et Amersham (sur 117), 23 entre Agilent …

Parties annexes