Article body

L’importance des ensembles de données, particulièrement des ensembles de données de panel

La recherche universitaire, notamment celle sur les politiques, a aussi utilisé à grande échelle ces bases de données standard. Cependant, conçues à des fins administratives, elles conviennent rarement lorsqu’il s’agit de répondre aux questions des chercheurs tant universitaires, que ceux oeuvrant dans les ministères. C’est pourquoi Statistique Canada, au cours de la dernière décennie, a largement investi dans la collecte d’ensembles de données. Chacun de ses ensembles correspond à un éventail suffisamment étendu de questions pour permettre une analyse approfondie. Plusieurs enquêtes ont utilisé la méthode des panels et ont généré des données longitudinales. Les méthodes de panel consistent à choisir un échantillon, puis à recueillir des données de façon répétée et à intervalles réguliers (d’habitude annuellement) sur les mêmes individus de l’échantillon, durant un certain nombre d’années. Des exemples illustrent bien comment l’analyse de données par panel a permis d’améliorer de façon considérable notre compréhension de plusieurs questions. En voici deux issus de recherches menées aux États-Unis.

Une proportion de la population vit sous le seuil de la pauvreté. Au cours d’une période donnée, cette proportion change peu. Habituellement, s’appauvrir implique, à tout le moins, un désagrément et souvent, une souffrance réelle. Néanmoins, le désagrément et la souffrance augmentent quand la pauvreté devient un état stable. La pauvreté est, en fait, transitoire pour une grande proportion de pauvres (Duncan, 1984). La pauvreté transitoire, notamment les difficultés éprouvées par les jeunes à franchir, avec succès, leur passage de l’école au travail, est très différente de la pauvreté durable, comme celle d’une mère monoparentale qui, plusieurs années durant, ne peut concilier le soin des enfants et un emploi. Cette différence est importante pour l’élaboration de politiques, et influence les théorisations de l’État-providence. De plus, dans certains pays, la pauvreté est plus susceptible d’être transitoire que dans d’autres (Diprete, 2002)[1].

Les syndiqués gagnent, en moyenne, plus que les employés non syndiqués. Est-ce un indicateur de pouvoir syndical ? Pas nécessairement. En plus des différences salariales, les emplois syndiqués et non syndiqués se distinguent de plusieurs manières. À titre d’exemple, citons le taux élevé de syndicalisation dans les secteurs manufacturier et public. Dans ces secteurs, les emplois ont tendance à être plus durables que là où sont concentrés les employés non syndiqués. La durée prolongée de l’emploi permet, vraisemblablement, aux syndiqués de développer plus de compétences spécifiques[2]. Ils sont aussi probablement plus nombreux à présenter d’autres compétences mesurables telles l’éducation et l’expérience. Les recherches qui ont tenté de mesurer l’importance de l’avantage salarial des travailleurs syndiqués ont, pour la plupart, utilisé des méthodes multivariées d’analyse de données transversales. Ce qui cause problème, c’est que le salaire varie selon la productivité, et que l’éducation, l’expérience et la permanence n’épuisent pas les habiletés relatives à la productivité. L’intelligence, la motivation et la minutie varient grandement chez les individus à niveau d’éducation et d’expérience égal. Il est possible que les syndiqués soient mieux rémunérés parce que leurs capacités non mesurées font en sorte que leur productivité moyenne est plus élevée.

Il est difficile, sinon impossible, d’élucider cette question en utilisant des données transversales. Toutefois, les données de panel permettent d’étudier les salaires des employés qui passent d’un emploi syndiqué à un emploi non syndiqué, et vice-versa. Cela réduit le problème des habiletés non mesurées puisqu’il est possible de supposer qu’au moment du changement, ces dernières demeurent à peu près constantes. Cette méthode à été utilisée pour estimer l’avantage salarial des syndiqués (Freeman, 1984 ; Polachek, Wunava et Hutchins, 1987). En fait, après ajustements appropriés, cette méthode conduit à des estimations plus petites que les estimations transversales ; la recherche arrive à la conclusion que les compétences non mesurées contribuent modestement à l’explication de l’avantage salarial des travailleurs syndiqués, évident dans les recherches transversales.

Le choix de ces deux exemples issus de la recherche américaine est ici délibéré. Les chercheurs américains travaillent depuis plus longtemps avec des ensembles de données de panel que leurs pairs canadiens. Or la recherche américaine a une influence importante sur les sciences sociales à l’échelle internationale ; cet accès aux données de panel a augmenté son influence et a, par le fait même, incité les chercheurs universitaires canadiens à utiliser des données américaines dans le cadre de leurs recherches. En même temps, puisque les données de panel permettaient aux chercheurs de répondre à des questions ne pouvant être élucidées à l’aide de données transversales, la tentation d’utiliser les résultats américains à des fins de discussions en matière de politiques au Canada (et dans d’autres pays aux sources de données moins riches) était bien réelle, mais risquée, les différences institutionnelles impliquant, vraisemblablement, l’impossibilité de transférer des résultats entre les pays.

Les données de panel ne sont pas une panacée méthodologique. Elles ne peuvent répondre à la question centrale de la recherche fondamentale et appliquée, qui est d’établir des séquences causales ; néanmoins, elles y aident assurément. Du coup, elles soulèvent de nouveaux problèmes méthodologiques dont voici trois exemples. D’abord, la difficulté de traiter l’effet de fatigue du panel. Puis, le problème de l’analyse des situations des individus qui changent de statut d’une vague de panel à une autre ; le nombre de « transfuges » est souvent limité, avec ce que cela implique en fiabilité des coefficients de régression (ce qui constituait un problème dans la recherche sur les effets des salaires des travailleurs syndiqués citée précédemment). Enfin, une analyse de panels requiert des compétences statistiques qui dépassent celles fournies dans la plupart des programmes de sciences sociales des cycles supérieurs, exception faite des sciences économiques. Pourtant, les deux exemples de recherches américaines mentionnés plus haut illustrent le potentiel de la recherche de panel de deux points de vue. Du point de vue descriptif, la recherche sur la pauvreté change notre compréhension du phénomène comme problème pratique et théorique. Du point de vue explicatif, la recherche de panel a permis de quantifier l’effet probable des « compétences non mesurées » sur les estimations transversales de l’avantage salarial des syndiqués.

Origines et développement du CIQSS

Les nouvelles enquêtes ont produit un grand nombre de données à analyser, et continuent de le faire. Bien qu’il y ait, à Statistique Canada, ainsi que dans d’autres composantes de l’appareil gouvernemental fédéral, des chercheurs de premier plan, leur nombre est limité. La quantité de données produites va au-delà des capacités des chercheurs gouvernementaux engagés pour les analyser. Plusieurs chercheurs universitaires sont intéressés par l’accès à ces données. Statistique Canada et le Conseil de recherche en sciences humaines ont réagi à cet intérêt en mettant sur pied un réseau de centres donnant accès à ces nouveaux ensembles de données, dont fait partie le CIQSS.

Bien que partie intégrante d’un réseau national, le CIQSS se distingue par certaines de ses caractéristiques. Dans le reste du pays, les centres ont tendance à être établis séparément, dans différentes universités. Six de ces centres sont en Ontario, et deux en Alberta. L’approche québécoise a été différente : sous le leadership de collègues à l’Université de Montréal et l’Institut national de la recherche scientifique (INRS) – Urbanisation, culture et société, le CIQSS a rassemblé les grandes universités québécoises et institutions sous un même toit. Ses membres initiaux sont l’Université de Montréal, l’INRS, l’Université du Québec à Montréal, l’Université Laval, l’Université Concordia et l’Université McGill, auxquels s’est jointe, tout récemment, l’Université de Sherbrooke. La réunion de toutes ces universités sous une même enseigne a augmenté la crédibilité du CIQSS dans sa démarche de support de la part du programme de Valorisation Recherche Québec et du programme du Fonds québécois de la recherche sur la société et la culture Installation majeure, qui ont tous deux subventionné le Centre de façon importante. Le CIQSS a donc été capable de fournir des services à plus grande échelle que les autres centres de données au Canada. Le CIQSS tient un programme actif de formation à diverses procédures statistiques, aidant ainsi à augmenter le nombre de chercheurs québécois aptes à relever les défis statistiques que posent les analyses d’ensembles de données de panel. Le centre a aussi créé un programme de bourses afin de subventionner la recherche étudiante.

Certains inconvénients sont rattachés à la création d’un seul centre. Pour satisfaire aux critères de confidentialité des données de Statistique Canada, imposés à l’agence par la Loi sur la protection des renseignements personnels, la recherche doit être menée dans un lieu physique satisfaisant aux critères de sécurité de l’agence. Dans le cas du CIQSS, cet emplacement sécuritaire se trouve sur le campus de l’Université de Montréal. Les chercheurs des autres universités montréalaises, ou leurs assistants, doivent donc se rendre au campus de l’Université de Montréal afin d’y analyser leurs données. Cela est un inconvénient, en plus d’être un élément dissuasif à l’utilisation de ces ensembles de données, même si ce n’est pas un obstacle insurmontable, du moins pour les chercheurs résolus. Ces problèmes d’accès sont naturellement plus importants pour les chercheurs universitaires à l’extérieur de Montréal. Le CIQSS a tenté de résoudre ce problème en négociant avec Statistique Canada la permission d’ouvrir des centres satellites qui permettent l’accès aux ensembles de données dans un emplacement satisfaisant aux critères de sécurité de Statistique Canada sur les campus des universités membres à l’extérieur de Montréal. Même si cela demeure moins commode que ce qu’on trouve à l’emplacement principal du CIQSS à l’Université de Montréal, cela constitue tout de même une amélioration considérable pour les universités Laval et de Sherbrooke. Le reste du réseau canadien, de même que Statistique Canada, suit ce développement avec grand intérêt.

Une dernière caractéristique du CIQSS est que le Centre combine, dans le même lieu physique, l’accès aux ensembles de données recueillis, et par Statistique Canada, et par l’Institut de la statistique du Québec (ISQ). Les rapports entre le CIQSS et l’ISQ se sont développés au fil du temps, et une nouvelle entente vient d’être signée entre ces derniers. Le CIQSS réunit donc une gamme plus étendue d’ensembles de données que tout autre centre de données au Canada. De plus, les données de l’ISQ fournissent des échantillons québécois suffisamment importants pour permettre des analyses intraprovinciales détaillées sur des sujets étudiés par l’ISQ[3].

L’utilisation des données du CIQSS dans les articles de ce numéro

Ce numéro de Recherches sociographiques présente une série d’articles qui non seulement contribuent aux sciences sociales, mais instruisent aussi sur l’utilisation des données du CIQSS. Ces articles ont beaucoup en commun, dont leur forme. Deux articles comprennent une participation étudiante (Martel, Laplante et Bernard ; Smith, Hsieh et Yoshida) et trois d’entre eux incluent une collaboration interinstitutionnelle. L’article de Juby, Le Bourdais et Marcil-Gratton a rassemblé des chercheurs de l’INRS[4] et de l’Université de Montréal. L’article de Martel, Laplante et Bernard est aussi le fruit d’une association entre l’INRS et l’Université de Montréal. Quant à l’article de Renaud et Goldmann, il est issu d’une collaboration entre chercheurs de l’Université de Montréal et de Statistique Canada. Juby, Le Bourdais et Marcil-Gratton ont aussi fait appel à l’expertise d’un statisticien de l’Université Laval.

Ces questions de forme sont révélatrices quant au type de recherche mené au CIQSS. L’aspect collaboratif des quatre projets est, en effet, typique des activités du CIQSS. Sans pression externe quelconque, les chercheurs semblent être arrivés à la conclusion qu’il y a fort à gagner d’une mise en commun de l’expertise. Puisque l’expertise appropriée n’est pas nécessairement concentrée à l’intérieur d’une seule université, il est sensé, pour les chercheurs de différents établissements, de collaborer. De plus, l’exigence de concentrer toute recherche au CIQSS ou dans l’un des centres satellites augmente la probabilité que les assistants de recherche étudiants participent de façon active au processus de recherche, ce qui conduit à la production d’oeuvres conjointes, comme dans le cas de Hsieh et Yoshida à travers leur collaboration avec Smith. La production de thèses de doctorat est une activité principale du CIQSS, ce qui entraîne souvent la collaboration entre un doctorant, tel Martel, et des professeurs, tels Bernard et Laplante.

Et que dire des résultats de ces quatre articles ? Une vaste gamme de sujets est abordée par ceux-ci. Chacun d’entre eux, selon moi, apporte des résultats qui remettent en question certaines idées préconçues.

Les chômeurs sont souvent caractérisés comme sans ressources, victimes de circonstances hors de leur contrôle et n’ayant point la capacité d’agir afin d’améliorer leur situation. L’inexactitude de cette caractérisation est la prémisse de base du changement de l’assurance chômage à l’assurance emploi. L’analyse de Martel, Bernard et Laplante suggère, en effet, que les responsables de la réforme avaient raison à cet égard. Comparé à l’ancien régime, sous le programme d’assurance emploi, le revenu familial des bénéficiaires de l’échantillon a pris moins de temps à retrouver son niveau d’avant la perte d’emploi. Ce résultat contredit l’avis de plusieurs. Les auteurs approfondissent leur analyse en se demandant si le recouvrement plus rapide du niveau de revenu d’avant la perte d’emploi indique une amélioration du bien-être des chômeurs ; ils concluent que cela n’est pas nécessairement le cas.

En termes simples, les chômeurs peuvent s’adapter de deux façons à la situation. Ils peuvent, en premier lieu, tenter d’améliorer leur position sur le marché du travail à long terme en investissant un effort considérable dans la recherche d’emploi, en déménageant dans une région où la demande de main-d’oeuvre est forte, ou bien en mettant leurs compétences à niveau par de la formation. Le passage de l’assurance chômage à l’assurance emploi n’a pas eu d’impact important sur la recherche d’emplois ou la propension au déménagement. La probabilité de formation a, quant à elle, été réduite. Le deuxième type d’adaptation est de trouver un emploi ou une combinaison d’emplois – peu importe le type – le plus rapidement possible. C’est cette deuxième forme d’adaptation qui semble avoir augmenté avec le nouveau régime. Certains, dont moi, peuvent tenir cela comme preuve que la réforme fut un succès. Cependant, l’analyse de Martel et al. laisse, sans aucun doute, place à la discussion à ce propos.

Il est facile d’alléguer que les intérêts des enfants, tout spécialement ceux des jeunes enfants, sont mieux servis lorsqu’un parent, habituellement la mère, se retire complètement ou partiellement du marché du travail afin d’en prendre soin. Il y a, sans aucun doute, des avantages pour l’enfant dans ce cas. Juby, Le Bourdais et Marcil-Gratton montrent cependant que les choses se compliquent lorsqu’une importante proportion de couples (mariés ou en union libre) se séparent, puisque les expériences du marché du travail des femmes après la séparation sont modelées de façon considérable sur leurs expériences du marché du travail d’avant la séparation. Les femmes n’étant pas sur le marché du travail avant la séparation sont bien moins susceptibles, à la suite de la séparation, de trouver un emploi bien rémunéré. Cela augmente la fréquence de pauvreté chez les enfants de ce groupe. Dans un monde où la séparation est répandue, il se peut que le bien-être des enfants soit mieux protégé lorsque les mères sont fortement impliquées dans le marché du travail après la naissance de leur enfant.

La tragédie du 11 septembre 2001 a eu bon nombre de conséquences. Aux États-Unis, cela a précipité, entre autres, une transformation de la politique étrangère ainsi qu’un changement de politique intérieure. Quantité d’actes répugnants, voire racistes, ont aussi été dirigés envers ceux identifiés (parfois incorrectement) comme Arabes. Ces derniers ont été victimes d’abus et aussi, dans certains cas, d’agressions, à la fois à l’intérieur et à l’extérieur des États-Unis. Comparativement à l’abus et l’agression, la discrimination sur le marché du travail peut être vue comme une forme moins maligne de racisme en réponse aux attentats du 11 septembre. On pourrait donc s’attendre à ce que les abus et agressions ne soient que la pointe de l’iceberg de l’antipathie envers ceux dont l’ethnicité pouvait être associée à celle des pirates de l’air. De là, l’hypothèse que les employeurs étaient moins disposés à embaucher des individus originaires du Moyen-Orient après le 11 septembre qu’avant. Cependant, Renaud et Goldmann ne trouvent aucun élément pour l’étayer. Il est vrai que les immigrants, à la suite du 11 septembre, ont pris plus de temps à trouver un emploi mais ce fut aussi long, sinon plus, pour les non-immigrants. En fait, il y eut, de façon générale, un déclin dans la demande de main-d’oeuvre. Plus important encore, le temps requis pour dénicher un emploi n’a pas spécialement augmenté pour les gens originaires du Moyen-Orient comparativement aux immigrants d’autres origines.

Comment expliquer ce « non-résultat » ? L’augmentation du nombre d’agressions après le 11 septembre a probablement été exagérée. Il est probable que les incidents qui auraient été auparavant liés à de la violence gratuite – et raciste – ont plutôt été associés aux conséquences de la tragédie du 11 septembre. Une autre possibilité est que des incitatifs économiques ont poussé les employeurs à engager les employés les plus productifs, indépendamment de leur ethnicité, puisque les employeurs (du moins dans le secteur privé) sont assujettis à des pressions concurrentielles. Ils ne peuvent donc pas se permettre de discriminer, un argument que Thomas Sowell a vigoureusement soutenu (voir Sowell, 2004 : p. 161-191). Les « non-résultats » de Renaud et Goldmann sont toutefois extrêmement intéressants et, de plus, étayent l’importance des « non-résultats ».

Plusieurs ouvrages affirment que le processus désigné sous le signe de la « mondialisation » a eu un large spectre d’effets négatifs sur le marché du travail : précarisation des emplois et augmentation des inégalités (voir, par exemple, Beck, 2000 et Munck, 2002)[5]. Les prétentions associées à cette théorie sont aussi vastes que les manières de les analyser. Smith, Hsieh et Yoshida ont examiné premièrement, les inégalités salariales entre 1993 et 1998 et, deuxièmement, les salaires des individus employés dans des industries sujettes à différents niveaux d’exposition à la concurrence étrangère. Ils ont découvert que les inégalités n’ont augmenté, ni en Ontario, ni au Québec, et que la croissance des salaires n’a pas été différente chez les industries sujettes à plus de concurrence étrangère et chez celles moins sujettes à cette concurrence. Une trouvaille potentiellement surprenante est que les différences entre les niveaux d’égalité salariale des deux provinces sont minimes, malgré les considérables différences politiques qui, supposément, existent entre les provinces.

Ce genre de résultats doit être traité avec prudence. Smith et al. concentrent leur analyse sur les inégalités salariales. Mais d’autres types d’inégalités sont intéressantes, telles celles des revenus du marché (revenus des salaires et des investissements) et les inégalités des revenus (incluant les salaires, revenus des investissements et transferts, avant et après impôts). De plus, cette analyse est seulement un examen restreint de la théorie dans deux régions du Canada. Cependant, ces résultats contredisent l’assertion souvent dénuée de preuves convaincantes que la mondialisation transforme le marché du travail, le rendant plus précaire et, par conséquent, pire.

Ces quatre articles emploient trois des ensembles de données de Statistique Canada disponibles au CIQSS et dans ses centres satellites. Les autres ensembles de données procurent une vaste gamme d’information sur la santé, la maladie et l’incapacité, les enfants et les jeunes, les immigrants, les autochtones, les diplômés des établissements postsecondaires, et, avec l’Enquête sociale générale, sur une variété de sujets variant d’année en année (comme la famille, l’emploi du temps, la victimisation et le vieillissement). Tous ces ensembles de données peuvent être utiles pour la recherche quantitative, et pourraient conduire à des résultats intéressants, voire surprenants. Les recherches qualitatives et historiques, naturellement, restent et devraient rester d’importantes et d’indispensables composantes de l’entreprise de recherche en sciences sociales. Le dessein du CIQSS n’est pas de remplacer cette recherche. En fait, ces ensembles de données peuvent être utilisées comme compléments aux recherches qualitatives et historiques. À mon avis, et tout en avouant mon biais, c’est à ce niveau que le CIQSS peut être considéré comme le développement le plus important des dernières décennies au niveau de la disponibilité des ressources pour la recherche en sciences sociales au Québec.