5 Données et échantillon

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

La Banque de données administratives longitudinales (DAL) représente un échantillon aléatoire à 20 % tiré des données annuelles des déclarations de revenus des particuliers. Une fois sélectionnés, les gens sont dans l'échantillon chaque fois qu'ils produisent une déclaration de revenus. Par souci d'actualisation de l'échantillon, on sélectionne chaque année en partie les particuliers qui produisent une déclaration une première fois. La première année de référence de la banque DAL est 1982; on a alors simplement un échantillon à 20 % de toutes les déclarations de revenus produites cette année-là. En 1983, l'échantillon comprend les déclarants sélectionnés en 1982 qui ont aussi produit une déclaration en 1983 et une partie des particuliers qui ont déclaré pour la première fois en 1983. Ces deux éléments composent l'échantillon de déclarants fiscaux de 1983. Dans ce plan d'échantillonnage, les augmentations annuelles de l'échantillon de la banque DAL sont en correspondance avec la croissance démographique annuelle au Canada.

La Base de données longitudinales sur les immigrants (BDIM) est un fonds d'information qui, en couplage avec la banque DAL, fait directement le lien entre les données sur l'immigration et la situation économique des immigrants. Une personne est prise en compte seulement si elle a

obtenu le droit d'établissement depuis 1980 et qu'elle a produit au moins une déclaration de revenus après avoir acquis le statut d'immigrant reçu. Chaque année, on actualise la BDIM en y ajoutant une nouvelle cohorte d'immigrants admis à l'établissement. Dans chaque nouvelle année d'imposition, il y a de nouveaux entrants qui viennent des cohortes antérieures — et non de la dernière cohorte qui s'ajoute — et qui produisent une déclaration (ou sont appariés) une première fois. Il y a enfin les immigrants qui ont déjà produit des déclarations, mais qui ne l'ont pas fait cette année-là; ils restent dans la BDIM, car ils pourraient être déclarants dans les années qui suivent.

Par le couplage de la BDIM (de 1980 à 2000) et de la banque DAL (de 1982 à 2004), on peut observer les gains de 1982 à 2004 des immigrants ayant obtenu le droit d'établissement pendant la période de 1980 à 2000. Nous constituons sept cohortes d'immigrants pour les périodes de 1980 à 1982, de 1983 à 1985, de 1986 à 1988, de 1989 à 1991, de 1992 à 1994, de 1995 à 1997 et de1998 à 2000. Nous optons pour des intervalles triennaux comme moyen terme entre la taille de chaque cohorte et le nombre total de cohortes.

La variable des gains que nous employons est la somme de deux variables de la banque DAL. Il y a d'abord le revenu d'emploi sur feuillet T4, c'est-à-dire le revenu tiré de l'emploi rémunéré (et non pas du travail indépendant) sous forme de salaires, de traitements et de commissions, et ce, avant les retenues. La seconde variable est ce qu'on appelle le « revenu autre d'emploi », c'est-à- dire le revenu imposable autre que les salaires, traitements et commissions (pourboires, gratifications ou jetons de présence non déclarés sur feuillet T4).

Le nombre d'années de scolarité de l'immigrant à son établissement est le nombre officiel d'années d'études (maximum de 25 ans) achevées à l'arrivée au Canada. L'indicateur de compétence linguistique (langues officielles) est celui de la capacité autodéclarée de communication en français et/ou en anglais. Enfin, on détermine le pays de naissance de l'immigrant d'après une liste des nations comprenant des pays qui n'existent plus ou qui ne sont plus reconnus comme États-nations 5 . On délimite ainsi neuf régions d'origine selon des facteurs religieux, ethniques et historiques (annexe A).

L'échantillon comprend tous les immigrants de sexe masculin de la BDIM s'ils avaient au moins 24 ans l'année où ils sont devenus immigrants reçus et qu'ils présentaient une valeur positive de gains l'année suivant la dernière année de l'intervalle triennal de la cohorte 6 . Avec cette restriction, on s'assure que les unités de l'échantillon ont acquis la totalité ou la majeure partie de leur scolarité à l'étranger et qu'elles sont entrées sur le marché du travail canadien peu après leur arrivée. Les unités restent dans l'échantillon tant qu'elles présentent des valeurs positives de gains et qu'elles ont moins de 55 ans pendant au moins deux périodes. La structure de ce panel ressemble à celle qui a été adoptée par Haider (2001). Il y a certes des inconvénients, mais les autres possibilités — panel équilibré ou non équilibré — paraissent pires. Avec un panel équilibré par exemple, les immigrants de la cohorte de 1980 à 1982 devraient présenter des gains positifs sur 22 ans pour être dans l'échantillon et celui-ci serait donc des plus modestes pour la cohorte en question : il comprendrait les immigrants qui sont entrés sur le marché du travail canadien jeunes et dont l'activité est intense. À l'autre extrême, les immigrants de la cohorte de 1998 à 2000 auraient seulement à présenter des gains positifs sur quatre ans pour être échantillonnés et comprendraient des gens qui ont immigré au Canada vers la fin de la quarantaine. Ces différences de répartition d'âge d'arrivée rendraient très difficile toute comparaison entre cohortes. Dans un panel non équilibré où on tiendrait compte de l'entrée ou du retour dans l'échantillon plus tardifs de gens ayant présenté des gains nuls certaines années, on se trouverait à englober dans l'échantillon des gens qui auraient fait des études dans l'intervalle. À tout le moins, l'« entrée décalée » de ceux qui auraient été aux études au Canada avant d'entrer sur le marché du travail créerait des différences temporelles dans les profils de gains des diverses cohortes d'arrivée et donc des difficultés d'interprétation des profils d'inégalité et d'instabilité. On peut aussi penser que les profils de gains des immigrants qui ont fait des études au Canada différeraient fort des profils de ceux qui ont fait toutes leurs études à l'étranger (voir un examen de la question dans Schaafsma et Sweetman, 2001).

Comme nous nous attachons aux immigrants touchant principalement un revenu du travail (salaires et traitements), nous excluons les immigrants ayant plus de 100 $ (dollars de 2004) comme revenu de travail indépendant en valeur absolue. Un certain nombre d'immigrants déclarent des gains annuels très faibles. En reversant ces observations dans l'échantillon, on n'exclurait pas, par une simple considération d'ordre technique, des immigrants appartenant plus ou moins à la catégorie des gains nuls. C'est pourquoi nous avons ramené à zéro les gains annuels de moins de 50 $.

On trouvera au tableau B.1 (annexe B) la récapitulation des pourcentages et des moyennes d'échantillon des immigrants des différentes catégories.

5 . Cette liste comprend, par exemple, la République tchèque, la République slovaque et la Tchécoslovaquie.

6 . Si quelqu'un est arrivé entre 1983 et 1985 par exemple, il figurerait dans l'échantillon s'il a produit une déclaration de revenus et présenté une valeur positive de gains en 1986.