10 Sources de données et élaboration de données

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Les premières recherches sur les questions touchant l'immigration ont aidé à orienter l'élaboration des données. Statistique Canada, en collaboration avec les organismes d'orientation appropriés, a élaboré plusieurs ensembles de données utilisées dans les types d'analyses décrites ci-dessus.

10.1 Le Recensement de la population, pilier de la recherche sur l'immigration au Canada

Comme il faut utiliser de grands échantillons afin d'étudier des cohortes successives de nouveaux immigrants, les analystes se servent de grandes sources de données-échantillons dont l'une des principales est le Recensement de la population. Il s'agit de la source de données la plus importante pour la recherche sur l'immigration au Canada. Comme tous les ensembles de données, elle présente à la fois des avantages et des inconvénients.

10.1.1 Avantages du recensement pour la recherche sur l'immigration

  • La taille de l'échantillon est manifestement la raison pour laquelle de nombreux analystes utilisent le recensement. L'échantillon constitué de 20 % des Canadiens, qui procure des données détaillées sur la scolarité, la profession, les gains et le revenu familial, la mobilité géographique et le quartier de résidence, représente le pilier de la recherche sur l'immigration au Canada depuis quelques décennies. Il permet au chercheur d'examiner des cohortes successives de nouveaux immigrants, élément essentiel des recherches de ce type.
  • Des modifications apportées récemment au recensement permettent de déterminer le pays où le plus haut niveau de scolarité a été atteint. Comme le rendement économique des études diffère considérablement selon le pays où ces études ont été faites, il s'agit d'une information importante.
  • Le lieu de naissance des parents — variable ajoutée au recensement en 2001 — permet pour la première fois l'analyse de la situation des enfants d'immigrants.
  • La recherche sur l'incidence de l'immigration sur les quartiers est facilitée par le fait que la définition la plus couramment utilisée du concept de « quartier », soit le secteur de recensement, est longitudinalement constante d'un recensement à l'autre, ce qui représente un énorme avantage. Il est ainsi possible d'étudier sur des décennies l'évolution de la composition des quartiers sur les plans de l'ethnicité et de l'immigration, et d'examiner la corrélation avec d'autres résultats observés dans les quartiers.
  • L'un des événements les plus importants ayant encouragé et facilité l'analyse de l'immigration à Statistique Canada a été la création, à partir des données du recensement, de fichiers non hiérarchiques, SAS ou STATA, faciles à utiliser. Auparavant, les analystes n'avaient accès aux données du recensement que par l'intermédiaire d'un logiciel hiérarchique relativement difficile à utiliser qui ne produisait que des tableaux. Après le Recensement de 2001, des fichiers non hiérarchiques formatés pour être utilisables avec les progiciels courants d'analyse statistique ont permis aux chercheurs d'exploiter eux-mêmes les données du recensement. Ce changement a grandement facilité la recherche sur l'immigration dont il est question ici.

10.1.2 Quelques lacunes des données du recensement

  • La compétence linguistique (en français ou en anglais) est peut-être le facteur déterminant le plus important de l'intégration économique et sociale. Cependant, les mesures établies par la quasi-totalité des enquêtes ne permettent pas de bien cerner cet aspect. Il existe des variables telles que la langue maternelle et la langue parlée au travail, mais elles ne donnent pas une bonne mesure de la compétence. Ces variables sont autodéclarées, et elles ne sont pas conçues pour mesurer la compétence linguistique. L'absence de mesure fiable de la compétence linguistique est l'une des principales lacunes touchant les données nécessaires à la recherche sur l'immigration.
  • L'utilisation de « cohortes synthétiques » du recensement a permis aux chercheurs d'établir la trajectoire des gains au cours des années suivant l'immigration. Par exemple, on suppose que les immigrants âgés de 30 à 34 ans lors d'un recensement donné sont les mêmes personnes que les immigrants âgés de 35 à 39 ans le recensement suivant, soit cinq ans plus tard. C'est sur une telle hypothèse que différentes trajectoires (gains, emploi, pauvreté, etc.) sont déterminées (voir le graphique 1). Cependant, des études récentes démontrent qu'une proportion importante des immigrants (peut-être le quart) quittent le Canada dans les cinq ans suivant leur arrivée. On ne connaît pas encore très bien les caractéristiques des immigrants qui partent par rapport à ceux qui restent. Toutefois, des effets de « sélection » sont presque certainement présents dans les trajectoires des cohortes synthétiques produites à partir des données du recensement. On ignore encore si ces effets sont positifs ou négatifs, et on n'en connaît pas l'ampleur.
  • La catégorie d'admission (immigration économique [travailleurs qualifiés], regroupement familial, réfugié, etc.) est un déterminant important de divers résultats, mais elle ne peut être identifiée grâce au recensement. Il est peu probable que l'autodéclaration permettrait d'obtenir des données fiables.

10.2 Autres enquêtes permanentes utilisées pour la recherche sur l'immigration

Pour effectuer leurs études sur l'immigration au Canada, les chercheurs utilisent d'autres enquêtes permanentes, dont les suivantes :

• Enquête sur la dynamique du travail et du revenu (EDTR)

L'EDTR est une enquête longitudinale portant principalement sur les revenus et la situation sur le marché du travail de la population adulte, mais elle comporte un identificateur du statut d'immigrant qui permet la recherche sur l'immigration. L'un des principaux objectifs visés par cette enquête est de comprendre le bien-être économique des Canadiens (et des immigrants) et la façon dont la population réagit et s'adapte aux « chocs » économiques.

Menée pour la première fois en 1993, cette enquête longitudinale, à laquelle participent 30 000 ménages, est sous de nombreux aspects similaires aux enquêtes-ménages par panel effectuées en Allemagne et au Royaume-Uni. Cependant, par rapport à ces enquêtes européennes, son thème est moins large, son échantillon est plus grand et la durée du panel est plus courte (six ans). De plus, cette enquête est transversalement représentative, ce qui permet la production des statistiques annuelles officielles sur le revenu. Statistique Canada examine la possibilité de remplacer l'EDTR par une enquête-ménage par panel qui ressemblerait davantage, par la conception et le contenu, aux enquêtes en place dans certains pays d'Europe, aux États-Unis et en Australie, ce qui augmenterait les possibilités de recherche comparative internationale. On ne sait pas encore si une nouvelle enquête par panel auprès des ménages canadiens sera mise en œuvre; tout dépend, comme toujours, du financement disponible et du soutien des organismes d'orientation.

L'EDTR permet une certaine analyse des questions touchant l'assimilation économique des immigrants, mais elle n'a pas l'échantillon ni la fiabilité statistique nécessaires pour axer l'étude sur des nouvelles cohortes précises, comme c'était le cas dans les recherches décrites plus tôt.

• Enquête internationale sur l'alphabétisation et les compétences des adultes (EIACA)

L'EIACA de 2003 est le volet canadien de l'Enquête sur la littératie et les compétences des adultes. L'objectif principal de l'EIACA était de déterminer la mesure dans laquelle les adultes utilisent l'information imprimée pour mieux fonctionner dans la société. Les données de l'EIACA comprennent des renseignements généraux et des résultats psychométriques sur les compétences des répondants dans quatre domaines : la compréhension de textes suivis, la compréhension de textes schématiques, la numératie et la résolution de problèmes. L'Enquête peut servir de base à d'importantes recherches sur l'incidence de la littératie et de la numératie sur les gains des personnes nées au Canada et des immigrants (et sur l'écart entre ces deux populations). Citoyenneté et Immigration Canada a financé un suréchantillonnage des immigrants afin de pouvoir distinguer les nouveaux immigrants de ceux qui sont déjà au pays depuis un certain temps. Cette enquête a permis la réalisation d'études très importantes sur l'immigration, dont certains résultats ont été signalés précédemment dans le présent document.

• Enquête nationale sur la santé de la population (ENSP)

Lancée en 1994, l'ENSP est une enquête longitudinale menée auprès de 17 276 personnes de tous âges, qui sont interviewées tous les deux ans pendant 18 ans. Les objectifs de l'ENSP sont de faciliter l'élaboration de politiques gouvernementales en fournissant des données sur l'état de santé de la population, de comprendre les déterminants de la santé et de mieux saisir la relation entre l'état de santé et l'utilisation des services de santé. Un identificateur du statut d'immigrant permet à la fois d'étudier les divers aspects de la santé des immigrants et d'établir des comparaisons avec les personnes nées au Canada.

• Enquête longitudinale nationale sur les enfants et les jeunes (ELNEJ)

L'ELNEJ est une étude à long terme sur les enfants canadiens qui permet de suivre leur croissance et leur bien-être de la naissance au début de l'âge adulte. L'ELNEJ a été conçue pour recueillir des renseignements sur les facteurs qui influent sur le développement social et émotionnel ainsi que sur le comportement des enfants et des jeunes. Elle permet en outre de suivre les conséquences de ces facteurs sur leur développement dans le temps. Avec un très petit échantillon d'immigrants, cette enquête permet d'établir des comparaisons de base entre la situation des immigrants et celle des enfants nés au Canada, ainsi que la trajectoire des « écarts » observés à mesure que les enfants grandissent. Comme dans le cas d'autres enquêtes, la taille de l'échantillon représente un problème lorsqu'on veut étudier des questions concernant l'assimilation des enfants d'immigrants.

10.3 Élaboration de nouvelles sources de données pour l'étude de l'immigration

Malgré l'existence d'enquêtes telles que celles mentionnées ci-dessus, les premières recherches montraient un certain nombre de lacunes dans les données. C'est pourquoi les sources de données suivantes, en grande partie longitudinales, ont été élaborées.

10.3.1 Élaboration de la Base de données longitudinales sur les immigrants

Comme on l'a dit plus tôt, le recensement reste la principale source de données aux fins de la recherche sur l'immigration. Toutefois, comme il est réalisé une seule fois tous les cinq ans, la situation des cohortes des nouveaux immigrants peut changer pendant cette période. En outre, l'utilisation de véritables données longitudinales (plutôt que de cohortes synthétiques) améliorerait la puissance de l'analyse. Il fallait donc une autre source de données longitudinales avec de très grands échantillons d'immigrants. C'est pourquoi on a créé deux sources de données établies principalement à partir des dossiers fiscaux. L'une d'elles est la Base de données longitudinales sur les immigrants (BDIM).

Élaborée conjointement par Statistique Canada et Citoyenneté et Immigration Canada, la BDIM a été financée en partie par un consortium d'utilisateurs, dont les gouvernements provinciaux. Ce fichier fusionne les fiches d'établissement des immigrants et les dossiers fiscaux. Les premières fournissent des données détaillées sur les caractéristiques des immigrants, et les seconds des données longitudinales détaillées sur les gains d'emploi en particulier. Étant donné la couverture universelle des fichiers de données fiscales (couverture presque complète de la population dans de nombreux groupes d'âge), cette source de données permet de suivre de près les trajectoires des gains des cohortes de nouveaux immigrants depuis le début des années 1980 jusqu'en 2005. La BDIM a été créée en grande partie afin de fournir les données nécessaires pour évaluer la situation des immigrants classifiés dans les différentes catégories d'admission et les changements apportés aux programmes par Citoyenneté et Immigration Canada.

Cependant, la BDIM a également ses lacunes. Notamment, comme il n'y a pas de groupe de comparaison (absence de données sur la population née au Canada), il est donc impossible d'évaluer les écarts entre les gains des immigrants et ceux des personnes nées au Canada. En outre, les données de ce fichier portent uniquement sur les personnes, et non sur les familles. On ne peut donc pas mesurer des aspects du bien-être économique tels que les niveaux de faible revenu. Pour combler cette lacune, on a créé une autre source de données administratives.

10.3.2 Couplage de la Banque de données longitudinales sur les immigrants et de la Banque de données administratives longitudinales

La Banque de données administratives longitudinales (DAL) est une source de données longitudinales qui couvre 20 % de la population canadienne et qui est basée sur les données fiscales. Elle permet de former les familles et renferme des données allant de 1982 à aujourd'hui. La banque DAL se prête à de nombreux types d'analyses, comme l'incidence du divorce sur la situation économique des hommes et des femmes, la mobilité intergénérationnelle des gains chez les Canadiens, la dynamique de la pauvreté, l'adhésion au régime d'assistance sociale et aux autres programmes gouvernementaux et le retrait de ceux-ci ainsi que l'« exode des cerveaux ». Toutefois, jusqu'à tout récemment, il était impossible d'identifier les immigrants dans ce fichier, et donc de réaliser des études sur l'immigration qui auraient pu se révéler importantes. Le couplage de la banque DAL avec le fichier de la BDIM, qui contient des données détaillées sur les immigrants et un identificateur du statut d'immigrant, a résolu ce problème. Grâce à son très grand échantillon, cette source de données a permis de mener des études plus récentes (depuis le Recensement de 2001) sur les tendances de l'assimilation économique des immigrants qui arrivent au Canada. Elle a également servi à des recherches sur la dynamique des faibles revenus chez les immigrants, l'utilisation de transferts gouvernementaux (assistance sociale, assurance- emploi, etc.) par les immigrants, la migration continue des immigrants et d'autres sujets.

10.3.3 Élaboration de l'Enquête longitudinale auprès des immigrants du Canada

Si utiles que puissent être les sources de données administratives longitudinales décrites précédemment, elles présentent un inconvénient qui est commun à presque toutes les bases de données administratives : elles renferment un nombre limité de covariables. Elles contiennent beaucoup d'information sur les immigrants, mais elles sont dépourvues de données clés sur les personnes nées au Canada, notamment sur la scolarité et la profession. En outre, comme elles sont fondées sur des données fiscales, elles ne permettent pas d'étudier l'intégration sociale des immigrants. Afin de combler ces lacunes statistiques, Citoyenneté et Immigration Canada, de concert avec Statistique Canada, a élaboré une enquête-échantillon véritablement longitudinale. L'Enquête longitudinale auprès des immigrants du Canada (ELIC) a suivi une même cohorte de nouveaux immigrants (arrivés en 2000) pendant quatre ans, les interviews ayant été réalisées six mois, deux ans et quatre ans après l'arrivée au Canada.

Les sujets abordés dans l'ELIC sont notamment le logement, la scolarité, la reconnaissance des titres scolaires étrangers, l'emploi, la santé, les valeurs et attitudes, le développement et l'utilisation de réseaux sociaux, le revenu et les perceptions quant à l'établissement au Canada. Les données de cette enquête, dont l'échantillon initial comptait 12 000 immigrants, continuent d'être exploitées par des analystes de Statistique Canada et de l'extérieur, particulièrement pour l'étude de questions touchant l'intégration sociale.

10.3.4 Élaboration de l'Enquête sur la diversité ethnique

En 2002, Patrimoine canadien et Statistique Canada ont mené l'Enquête sur la diversité ethnique (EDE) qui portait sur des sujets liés à l'évolution rapide de la diversité culturelle au Canada. Bien qu'il ne s'agisse pas à proprement parler d'une enquête sur les immigrants, l'EDE a fourni de nombreuses possibilités d'étudier l'immigration. Utilisant le Recensement de 2001 comme base de sondage, cette enquête visait à mieux comprendre comment les antécédents des personnes influent sur leur participation à la vie sociale, économique et culturelle du Canada.

Les sujets abordés sont notamment l'ascendance ethnique, l'identité ethnique, le lieu de naissance, l'appartenance à une minorité visible, la religion, la pratique religieuse, la connaissance des langues, les antécédents familiaux, l'interaction familiale, les réseaux sociaux, la participation à la collectivité, l'interaction avec la société, les attitudes, la satisfaction à l'égard de la vie, la confiance et les activités socioéconomiques. L'échantillon, qui comptait environ 57 000 personnes, était stratifié afin de permettre l'établissement de grands échantillons pour les groupes ethniques dont la langue maternelle n'était pas l'anglais.

10.3.5 Modifications apportées récemment à des enquêtes déjà en place

D'autres mesures ont été prises afin d'améliorer l'accessibilité aux données à des fins de recherche sur l'immigration. Ainsi, un identificateur du statut d'immigrant a été ajouté l'année dernière dans l'Enquête sur la population active mensuelle, ce qui permettra d'accroître l'actualité des données sur la situation des immigrants.

Statistique Canada et ses partenaires dans les trois principaux organismes d'orientation que sont Citoyenneté et Immigration Canada, Patrimoine canadien et Ressources humaines et Développement des compétences Canada ont répondu de façon significative à la demande concernant l'amélioration et l'expansion des données longitudinales et transversales sur la situation des immigrants.