Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Le Programme des Centres de données de recherche (CDR)

Les décideurs ont besoin d'information à jour et approfondie sur la société canadienne, non seulement pour répondre aux besoins d'aujourd'hui, mais aussi pour prévoir ceux de demain. Ces besoins sont soulignés par une grande demande pour des produits analytiques provenant de la riche source de microdonnées receillies par Statistique Canada.

Les Centres de données de recherche CDR s’inscrit dans une initiative de Statistique Canada, du Conseil de recherches en sciences humaines (CRSH) et de consortiums universitaires visant à aider au renforcement de la capacité du Canada en recherche sociale et à soutenir le milieu de recherche sur les politiques. Il convient de souligner l’appui généreux de la Fondation canadienne pour l’innovation (FCI) et des Instituts de recherche en santé du Canada (IRSC) à l’endroit du Programme.

Les Centres de données de recherche CDR permettent aux chercheurs d'accéder aux microdonnées d'enquêtes sur les ménages et sur la population. Les centres comptent des employés de Statistique Canada. Ils sont exploités en vertu des dispositions de la Loi sur la statistique et sont administrés conformément à toutes les règles de confidentialité. Ils ne sont accessibles qu'aux chercheurs dont les propositions ont été approuvées et qui ont prêté serment en qualité de personnes réputées être employées de Statistique Canada.

On trouve des CDR à l'étendue du pays. Ainsi, les chercheurs n'ont pas à se déplacer vers Ottawa pour avoir accès aux microdonnées de Statistique Canada.

Pour en savoir plus sur les activités des CDR, veuillez visiter le site Web du Réseau canadien des Centres de données de recherche (RCCDR)

Les origines des CDR

En 1998, l'Initiative canadienne sur les statistiques sociales a étudié les défis auxquels faisait face le milieu canadien de la recherche. Le groupe de travail national recommandait notamment dans son rapport sur l'avancement de la recherche utilisant les statistiques sociales de créer des installations de recherche pour améliorer l'accès des chercheurs universitaires aux fichiers de microdonnées de Statistique Canada. Cet accès permettrait aux chercheurs en sciences sociales d'acquérir de l'expertise en méthodologie et analyse quantitatives.

Les avantages des CDR

Les CDR offrent la possibilité

  • de développer une vue d'ensemble du paysage social canadien;
  • d'élaborer un réseau de centres de recherche partout au pays, et ce, à la fois dans les grands et les petits centres de population;
  • d'élargir la collaboration entre Statistique Canada, le CRSH, les universités et les chercheurs universitaires, et de prendre appui sur l'Initiative de démocratisation des données;
  • de former une nouvelle génération de spécialistes canadiens des données

La différence entre les fichiers de microdonnées confidentielles et les fichiers de microdonnées à grande diffusion (FMGD)

Un centre de données de recherche (CDR) donne accès aux fichiers de microdonnées confidentielles de Statistique Canada. Les CDR sont exploités selon les dispositions de la Loi sur la statistique, en application des règles de confidentialité et ne sont accessibles qu’aux chercheurs dont les projets ont été approuvés et qui ont prêté serment en tant que « personnes réputées être employées » de Statistique Canada. Les fichiers de microdonnées confidentielles des CDR contiennent la plus grande partie des renseignements recueillis sur le sujet dans le cadre de l’interview d’enquête, ainsi que des variables dérivées ajoutées par la suite à l’ensemble des données. Ils contiennent également les poids bootstrap qui servent à calculer la variance exacte. Ces poids ne se trouvent que dans le fichier principal.

Toutefois, ce ne sont pas tous les projets de recherche qui nécessitent un accès aux fichiers de microdonnées confidentielles. Dans bien des cas, un fichier de microdonnées à grande diffusion (FMGD) suffit pour répondre aux besoins du chercheur. Un FMGD fait l’objet de manipulations, sous la forme d’agrégation, de plafonnement ou de suppression complète des variables qui sont considérées comme des « identificateurs ». Il est donc impossible d’identifier un répondant particulier à une enquête. Par exemple, l’âge et le revenu sont regroupés, la taille est plafonnée et regroupée, et la plupart des variables géographiques sont supprimées sauf, dans la majorité des cas, la province et la région sociosanitaire dans lesquelles réside le répondant. À Statistique Canada, l’Initiative de démocratisation des données (IDD) est le portail qui fournit les FMGD aux universités canadiennes.

Le mode d’accès des CDR est approprié lorsque le chercheur ne peut trouver de réponse à une question de recherche qu’en procédant à une analyse statistique d’inférence des microdonnées confidentielles. Le chercheur doit devenir une « personne réputée être employé » de Statistique Canada et effectue l’analyse dans au laboratoire informatique protégé. La recherche dans un CDR est appropriée dans les cas où

  • le FMGD ne donne pas accès à des variables délicates nécessaires à l’analyse;
  • il n’existe pas de FMGD;
  • des données longitudinales sont nécessaires à l’analyse;
  • l’analyse est de nature complexe et ne convient pas à un autre mode d’accès aux données.

Exemple d’un FMGD et d’un fichier de microdonnées confidentielles

Les données de l’Enquête sur la santé dans les collectivités canadiennes (ESCC) sont diffusées chaque année par Statistique Canada.

Pour protéger la confidentialité de l’information, le FMGD de l’ESCC ne comprend que des données limitées sur chaque répondant : des données sont supprimées, les niveaux géographiques se limitent à la province et à la région sociosanitaire, et le codage des variables est large (p. ex. catégories de revenu et de scolarité).

Par contre, le fichier principal de microdonnées de l’ESCC comprend des données désagrégées sur chaque répondant, y compris des variables supprimées dans le fichier à grande diffusion (p. ex. la taille exacte des répondants), des niveaux géographiques plus détaillés (p. ex. la RMR ou le code postal), un codage des variables plus détaillé (p. ex. catégories additionnelles de revenu et de scolarité), ainsi que des variables sur une échelle continue (p. ex. âge).

La page suivante présente de l’information détaillée sur la façon d’avoir accès à un CDR : Procédure de demande et lignes directrices