Base de données longitudinales sur l’immigration (BDIM) - Rapport technique, 2014
Annexes

A) Liens vers les principaux documents et pages Web relatifs à la BDIM

Dictionnaires (composantes sur les impôts et l’immigration) :

Disponible aux utilisateurs de données ou sur demande en communiquant avec Statistique Canada par courriel à l’adresse STATCAN.infostats-infostats.STATCAN@canada.ca

Tableaux CANSIM de la BDIM :

http://www5.statcan.gc.ca/COR-COR/objList?tgtObjType=ARRAY&srcObjType=SDDS&srcObjId=5057&lang=fra

Historique de la BDIM :

http://www23.statcan.gc.ca/imdb/p2SV_f.pl?Function=getInstanceList&Id=7196

Publications de la BDIM dans Le Quotidien :

http://www5.statcan.gc.ca/COR-COR/objList?tgtObjType=DAILYART&srcObjType=SDDS&srcObjId=5057&lang=fra

Analyses fondées sur la BDIM :

http://www5.statcan.gc.ca/COR-COR/objList?tgtObjType=STUDIES&srcObjType=SDDS&srcObjId=5057&lang=fra

Indice des prix à la consommation (62-001-X) :

http://www5.statcan.gc.ca/olc-cel/olc.action?lang=fr&ObjId=62-001-X&ObjType=2

Description des estimations annuelles du revenu des familles de recensement et des particuliers (Fichier sur la famille T1) :

http://www23.statcan.gc.ca/imdb/p2SV_f.pl?Function=getSurvey&SDDS=4105&lang=fr&db=imdb&adm=8&dis=2.

B) Couverture

La BDIM de 2014 a été utilisée pour produire ces chiffres. Les déclarants sont des immigrants couplés ayant produit au moins une déclaration de revenus depuis 1982.

Tableau 15
Répartition des déclarants et des non-déclarants par année d’admission
Sommaire du tableau
Le tableau montre les résultats de Répartition des déclarants et des non-déclarants par année d’admission. Les données sont présentées selon Année d’admission (titres de rangée) et Déclarants, Non-déclarants, Total, Immigrants, résident permanent, résident permanent | résident non permanent et Décès, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Année d’admission DéclarantsTableau 15 Note 1 Non-déclarants Total
Immigrants RP RP | RNP Décès Immigrants RP RP | RNP Décès Immigrants RP RP | RNP Déclarants
nombre pourcentage
1980 114 200 109 700 4 500 15 600 28 900 28 200 700 1 700 143 100 137 900 5 200 79,8
1981 101 500 89 300 12 200 13 900 27 000 25 700 1 300 1 400 128 600 115 000 13 500 78,9
1982 98 100 83 400 14 700 12 500 23 000 21 700 1 300 1 300 121 100 105 100 16 000 81,0
1983 72 800 59 500 13 300 10 100 16 200 15 200 1 000 1 100 89 000 74 700 14 300 81,8
1984 73 500 58 200 15 300 9 300 14 500 13 500 1 100 1 000 88 000 71 700 16 400 83,5
1985 71 400 56 900 14 500 8 200 12 600 12 400 150 700 83 900 69 300 14 650 85,1
1986 84 800 63 300 21 500 8 300 13 900 13 700 300 600 98 800 77 000 21 800 85,8
1987 131 400 100 100 31 400 10 300 19 700 19 400 400 700 151 200 119 500 31 800 86,9
1988 138 800 122 900 15 900 9 700 22 000 21 100 900 600 160 700 144 000 16 800 86,4
1989 165 500 142 200 23 300 10 000 25 200 23 200 2 000 600 190 700 165 400 25 300 86,8
1990 186 100 153 500 32 600 10 600 29 300 26 900 2 400 500 215 400 180 400 35 000 86,4
1991 203 100 133 900 69 200 11 600 28 800 24 400 4 400 600 231 800 158 300 73 600 87,6
1992 223 800 141 500 82 300 11 600 30 100 25 100 5 000 500 253 900 166 600 87 300 88,1
1993 226 900 163 300 63 600 10 900 28 700 24 600 4 100 500 255 700 187 900 67 700 88,7
1994 196 000 158 400 37 600 8 800 27 600 25 300 2 200 400 223 600 183 700 39 800 87,7
1995 186 600 147 100 39 500 7 100 25 500 23 400 2 200 400 212 100 170 500 41 700 88,0
1996 196 300 155 000 41 300 6 000 29 000 26 700 2 300 300 225 300 181 700 43 600 87,1
1997 187 400 152 300 35 100 5 000 28 000 26 200 1 800 200 215 400 178 500 36 900 87,0
1998 154 100 122 700 31 400 3 600 19 600 18 000 1 600 200 173 700 140 700 33 000 88,7
1999 167 200 133 700 33 500 3 400 22 100 20 300 1 800 160 189 400 154 000 35 300 88,3
2000 199 000 160 600 38 300 3 400 27 800 25 500 2 300 200 226 700 186 100 40 600 87,8
2001 216 100 178 600 37 500 3 500 33 700 31 200 2 500 180 249 800 209 800 40 000 86,5
2002 193 800 161 800 32 000 3 200 34 400 32 500 1 900 180 228 200 194 300 33 900 84,9
2003 184 700 152 500 32 200 2 600 35 800 34 000 1 900 150 220 500 186 500 34 100 83,8
2004 194 800 152 500 42 300 2 100 40 300 38 100 2 200 130 235 100 190 600 44 500 82,9
2005 212 700 164 000 48 700 1 700 48 800 45 800 2 900 80 261 400 209 800 51 600 81,4
2006 203 800 150 600 53 100 1 800 47 000 43 800 3 200 110 250 800 194 400 56 300 81,3
2007 188 900 137 600 51 300 1 400 47 000 43 800 3 200 90 235 900 181 400 54 500 80,1
2008 193 600 140 000 53 600 1 200 52 700 49 700 3 100 90 246 300 189 700 56 700 78,6
2009 196 600 139 800 56 700 1 000 54 800 51 300 3 500 90 251 300 191 100 60 200 78,2
2010 210 800 151 400 59 300 700 69 000 64 600 4 400 70 279 700 216 000 63 700 75,4
2011 183 700 130 500 53 200 500 64 100 59 300 4 800 40 247 800 189 800 58 000 74,1
2012 189 000 129 300 59 700 400 67 800 62 600 5 200 10 256 900 191 900 64 900 73,6
2013 185 800 122 700 63 100 300 72 200 66 200 5 900 10 258 000 188 900 69 000 72,0
2014 175 700 96 700 79 000 40 83 600 76 000 7 600 10 259 200 172 700 86 600 67,8
Total 5 908 500 4 515 000 1 392 900 210 340 1 250 700 1 159 000 91 700 14 900 7 159 200 5 674 000 1 484 600 82,5
Tableau 16
Proportion de déclarants couplés par tranche d’âge à l’admission, sexe et décennie d’admission
Sommaire du tableau
Le tableau montre les résultats de Proportion de déclarants couplés par tranche d’âge à l’admission, sexe et décennie d’admission. Les données sont présentées selon Sexe et cohortes (titres de rangée) et Âge à l’admission, 0 à 14 ans, 15 à 24 ans, 25 à 34 ans, 35 à 44 ans, 45 à 64 ans, 65 ans ou plus et Total, calculées selon pourcentage unités de mesure (figurant comme en-tête de colonne).
Sexe et cohortes Âge à l’admission
0 à 14 ans 15 à 24 ans 25 à 34 ans 35 à 44 ans 45 à 64 ans 65 ans ou plus Total
pourcentage
Cohortes de 1980 à 1989
Hommes 77,8 91,9 93,3 91,4 81,0 57,2 86,5
Femmes 76,1 84,3 87,4 87,7 75,4 55,2 81,2
Total 77,0 88,0 90,4 89,5 77,9 56,1 83,8
Cohortes de 1990 à 1999
Hommes 78,5 92,9 92,8 92,1 88,3 74,2 88,5
Femmes 77,0 91,0 91,2 91,0 85,6 73,7 87,1
Total 77,7 91,9 92,0 91,6 86,8 73,9 87,8
Cohortes de 2000 à 2009
Hommes 43,6 95,0 92,4 92,9 92,8 88,6 81,8
Femmes 42,6 94,7 93,3 93,4 92,6 87,3 83,1
Total 43,1 94,8 92,9 93,2 92,7 88,0 82,5
Cohortes de 2010 à 2014
Hommes 4,4 82,8 93,2 90,5 86,7 82,7 71,3
Femmes 4,6 84,8 93,1 91,1 86,1 81,5 73,8
Total 4,5 83,9 93,1 90,8 86,4 82,1 72,6

C) Analyses précédentes

Depuis sa création, la BDIM a permis de produire plusieurs analyses. Trouvez ci-après un résumé de certaines des études de Statistique Canada fondées sur la BDIM.

Ces dernières années, plusieurs publications du Quotidien se sont basées sur la BDIM. Les sujets discutés ont inclus l’évolution de la répartition régionale des nouveaux immigrants au Canada, le revenu et la mobilité des immigrants, les immigrants dans les régions et les immigrants qui quittent le Canada. Ces articles sont accessibles sur le site Web de Statistique Canada.

Les séries de publications L’emploi et le revenu en perspective (75-001-X) et de documents de recherche de la Direction des études analytiques ont proposé plusieurs documents fondés sur la BDIM. Parmi les sujets couverts, on peut citer le revenu des immigrants qui entreprennent des études postsecondaires au Canada et les avantages en matière de revenu des immigrants admis ayant été auparavant résidents temporaires au Canada.

D) Pratiques exemplaires et conseils pour les analystes

D.1 Conseils de programmation

Cette section offre des renseignements relatifs à la programmation pour les personnes souhaitant mieux comprendre la structure de programmation utilisée pour accéder aux données des fichiers de la BDIM. Toute personne peut utiliser sa propre programmation. Il existe deux types de fichiers au sein de la BDIM : les fichiers de données annuelles de la BDIM et les données sur l’immigration (pour de plus amples détails sur les fichiers constituant la BDIM, reportez-vous à la section 3). Le nom des variables relatives à l’impôt dans la BDIM consiste en trois parties : 1) le sigle indiqué dans le dictionnaire sur les données fiscales de la BDIM, 2) le niveau d’agrégation (I ou F) et 3) l’année (l’extension de l’année à quatre chiffres existe dans la plupart des cas, mais pas tous).

Exemple : La variable de revenus d’intérêts et d’investissements au niveau individuel pour 2014 serait intitulée INVI_I2014.

Les observations contenues dans les fichiers de la BDIM sont triées en fonction d’une variable, IMDB_id (qui ne comprend pas d’extension d’année), permettant aux utilisateurs de maintenir un lien entre les années. L’accès aux données est rendu possible par le langage de programmation SAS. Un exemple de programme SAS permettant d’accéder aux données de la BDIM est fourni ci-dessous. Les exemples ci-dessous permettent d’effectuer la tâche suivante :

« obtenir le nombre de bénéficiaires d’aide sociale (AS) parmi les immigrants admis entre 2000 et 2005, vivant en Ontario entre 2010 et 2012 et pour lesquels aucun revenu ne figurait sur leur feuillet T4, par sexe et année (de 2010 à 2012) ».

Nous encourageons les chercheurs utilisant nouvellement la BDIM à passer cet exemple de programme SAS en revue. L’exemple comprend généralement trois composantes :

  1. la configuration de la bibliothèque : les attributions de bibliothèque sur les deux premières lignes sont les emplacements des fichiers d’entrée (première ligne) et de sortie (deuxième ligne);
  2. les étapes permettant de générer un ensemble de données de travail :
    1. Les fichiers d’entrée étant au format SAS, ils sont accessibles au moyen d’une instruction SET ou MERGE.
    2. Ce programme vise à obtenir le nombre de bénéficiaires d’aide sociale (AS) parmi les immigrants :
      1. admis entre 2000 et 2005;
      2. vivant en Ontario de 2010 à 2012;
      3. dont le feuillet T4 n’indiquait aucun revenu;
    3. et génère le nombre de bénéficiaires d’aide sociale, par sexe et année (dans ce cas, de 2010 à 2012);
  3. l’ensemble de données utilisé pour produire le nombre de bénéficiaires d’aide sociale. Cette partie, qui commence par « proc freq », produit les chiffres souhaités, tels qu’ils sont précisés dans le reste du document. À la fin du programme, quatre tableaux sont générés à partir du fichier de données créé.

Il est généralement recommandé que les programmes utilisent des variables figurant dans le FRPN plutôt que dans les fichiers de données fiscales annuelles, par souci de cohérence. L’exemple de programme utilise, par exemple, la variable de groupement par sexe GENDER_ROLLUP, variable figurant dans le FRPN (PNRF), plutôt que SXCO_I&year, variable figurant dans le fichier IMDB_T1FF annuel. Dans ce programme, seules les personnes ayant rempli une déclaration chaque année entre 2000 et 2002 sont sélectionnées.

Lors de toute programmation dans SAS, il est important de distinguer les valeurs manquantes des zéros présents dans les champs numériques. Dans SAS, la plupart des opérations mathématiques effectuées avec des valeurs manquantes produiront des valeurs manquantes. Dans la BDIM, pour les années au cours desquelles une personne est présente, les variables numériques qui ne s’appliquent pas à cette personne prennent la valeur zéro « 0 ». Par exemple, si une personne sans conjoint a déclaré un revenu en 2010, la valeur de la variable RRSPSI2010 (contributions au REER d’un conjoint) devrait être zéro « 0 ». Si cette personne n’avait pas produit de déclaration de revenus en 2010, la valeur serait manquante.

Exemple de programme pour la BDIM

* Exemple de programme SAS pour la BDIM

libname source1 ‘\\f8prod05\cic\1.Database’; * emplacement des fichiers de la BDIM ;

libname Out ‘\\f8prod05\cic\3.workarea’; * répertoire de l’utilisateur ;

* L’objectif de ce programme est d’utiliser la BDIM pour obtenir le nombre de personnes recevant des prestations d’aide sociale, vivant en Ontario, pour lesquelles aucun revenu d’emploi ne figurait sur leur feuillet T4, selon le sexe et l’année (dans ce cas, de 2010 à 2012). Les données relatives aux provinces et aux revenus proviennent des fichiers annuels de la BDIM, alors que la variable relative au sexe provient du fichier PNRF_2014 (FRPN). ;

* La première étape est de créer un fichier de données contenant toute l’information nécessaire à la création de nos tableaux. Ce fichier est nommé ASOnt et est enregistré dans le répertoire de sortie. L’identifiant longitudinal (IMDB_ID) est utilisé pour fusionner les ensembles de données annuels de la BDIM. ;

data out.SAOnt;
merge
source1.imdb_t1ff_2010_outliers(where=(prco_i2010 = 5) in=a keep=imdb_id prco_i2010 saspyf2010 t4e__i2010)

source1.imdb_t1ff_2011_outliers(where=(prco_i2011 = 5) in=b keep= imdb_id prco_i2011 saspyf2011 t4e__i2011)

source1.imdb_t1ff_2012_outliers(where=(prco_i2012 = 5) in=c keep= imdb_id prco_i2012 saspyf2012 t4e__i2012)

source1.pnrf_2014(keep= imdb_id gender_rollup landing_year immigration_category);

by IMDB_id ;

If a and b and c and (landing_year>=2000 and landing_year<=2005);

* La personne doit avoir produit une déclaration de revenus pour chacune des trois années et avoir été admise entre 2000 et 2005 (population d’intérêt).;

* On crée une variable dichotomique identifiant les bénéficiaires d’aide sociale pour chaque année. Cela produit trois variables :
flag_sa2010, flag_sa2011 et flag_sa2012, prenant la valeur 1 ou 0.;
If (t4e__i2010=0 and saspyf2010>0) then flag_sa2010 = 1 ;
else flag_sa2010 = 0 ;
if (t4e__i2011=0 and saspyf2011>0) then flag_sa2011 = 1 ;
else flag_sa2011 = 0 ;
if (t4e__i2012=0 and saspyf2012>0) then flag_sa2012 = 1 ;
else flag_sa2012 = 0 ;
run;

* La procédure ’freq’ de SAS permet de produire nos tableaux. On doit ensuite s’assurer que les règles relatives à la confidentialité sont respectées. ;

proc freq data = out.SAOnt;
tables immigration_category*flag_sa2010*flag_sa2011*flag_sa2012
gender_rollup*flag_sa2010*flag_sa2011*flag_sa2012 /missing ;
run ;
* Fin de l’exemple de programmation.;

D.2 Création d’une cohorte

Avant de commencer l’analyse, il est essentiel de déterminer la cohorte d’intérêt. Cette cohorte peut être limitée par l’année d’admission, des variables géographiques ou toute autre variable d’intérêt (p. ex. la catégorie d’admission ou le sexe), selon les besoins du chercheur. Une cohorte unique clairement définie doit être choisie pour assurer la comparabilité. Un chercheur peut s’intéresser, par exemple, aux femmes admises en 2000 et vivant au sein d’une famille ayant reçu l’aide sociale en 2001 (tableau 17). Une question d’étude relative à cette cohorte pourrait être « Quelle portion de cette cohorte a reçu l’aide sociale au cours des deux années suivantes (2002 et 2003)? » Il convient de noter que l’Agence du revenu du Canada (ARC) exige que le conjoint recevant le revenu net le plus élevé déclare le versement de l’aide sociale. Par conséquent, il est conseillé de générer la mesure de l’aide sociale (SASPY_F), y compris pour les particuliers, à partir des données au niveau familial.

Tableau 17
Exemple : Femmes admises en 2000 ayant reçu l’aide sociale (SASPY_F) en 2001
Sommaire du tableau
Le tableau montre les résultats de Exemple : Femmes admises en 2000 ayant reçu l’aide sociale (SASPY_F) en 2001. Les données sont présentées selon IMDB_ID (titres de rangée) et Année d’admission, Sexe, SASPY_F2001, SASPY_F2002 et SASPY_F2003, calculées selon dollars unités de mesure (figurant comme en-tête de colonne).
IMDB_ID Année d’admission Sexe SASPY_F2001 SASPY_F2002 SASPY_F2003
dollars
IM583 2000 Femme 20 500 19 000 14 000
IM145 2000 Femme 3 000 0 0
IM548 2000 Femme 11 500 13 800 0
IM798 2000 Femme 16 000 18 000 8 000
IM961 2000 Femme 10 000 0 0
IM967 2000 Femme 9 500 0 0
IM110 2000 Femme 5 000 2 000 1 000
IM125 2000 Femme 1 000 0 200

D.3 Calcul des taux de rétention

L’un des principaux avantages de la BDIM est qu’elle comprend des variables géographiques permettant d’étudier la mobilité et la rétention. Aucune autre base de données ne présente un niveau comparable de détails annuels relatifs aux déclarants, en particulier pour des régions plus réduites. Disposer de mises à jour annuelles au niveau des provinces, des divisions de recensement, des régions métropolitaines de recensement, des agglomérations de recensement, des subdivisions de recensement et des secteurs de recensement permet une vaste gamme d’analyses.

Il est possible d’étudier les trajectoires de mobilité individuelle en attribuant simplement des indicateurs aux changements de code postal et de calculer des tendances de mobilité en étudiant les déménagements à des niveaux géographiques donnés. La mobilité au niveau des subdivisions de recensement (changements de subdivision de recensement d’une année à l’autre) et la mobilité à l’échelle provinciale (changement de province d’une année à l’autre) varie de manière significative en fonction de plusieurs caractéristiques d’immigrant, comme l’âge et la catégorie d’admission. Ces données géographiques sont dérivées du code postal (variable PSCO dans la BDIM au niveau individuel et familial). Le code postal est un code alphanumérique à six caractères définissant le lieu de livraison du courrier adressé aux clients du service postal au Canada. Voir la section 3.4.1 pour une description des variables géographiques.

Dans l’exemple ci-dessous (tableau 18), le chercheur s’intéresse à la mobilité jusqu’en 2002. Les personnes IM798, IM961, IM967 et IM110 peuvent être exclues de l’étude sur la mobilité du fait de l’absence de données (ou de fichiers).

Tableau 18
Exemple : Mobilité jusqu’en 2002 des immigrants admis en 2000
Sommaire du tableau
Le tableau montre les résultats de Exemple : Mobilité jusqu’en 2002 des immigrants admis en 2000. Les données sont présentées selon IMDB_ID (titres de rangée) et Année d’admission, Province de destination, province de résidence 2000, province de résidence 2001 et province de résidence 2002 (figurant comme en-tête de colonne).
IMDB_ID Année d’admission Province de destination PRCO 2000 PRCO 2001 PRCO 2002
IM583 2000 C.-B. C.-B. C.-B. C.-B.
IM145 2000 Alb. Alb. Sask. Sask.
IM548 2000 Alb. Ont. Ont. Ont.
IM798 2000 Ont. Note ..: indisponible pour une période de référence précise Ont. Ont.
IM961 2000 N.-B. N.-B. N.-B. Note ..: indisponible pour une période de référence précise
IM967 2000 Ont. Note ..: indisponible pour une période de référence précise Alb. Ont.
IM110 2000 Note ..: indisponible pour une période de référence précise Qc Note ..: indisponible pour une période de référence précise Sask.

Alors que la mobilité au niveau individuel est relativement simple, le taux de rétention des immigrants dans un territoire peut être calculé de diverses manières. La façon de calculer cette rétention est une décision analytique fondée sur les besoins particuliers du chercheur. Il est relativement simple de définir le nombre de personnes restant : il s’agit du nombre de personnes produisant une déclaration de revenus dans le territoire d’intérêt à un moment donné. Il est nécessaire de prendre une décision quant à la cohorte initiale d’admission pour laquelle le chiffre de rétention est calculé (le dénominateur du taux de rétention).

Les taux provinciaux publiés dans Le Quotidien indiquent la proportion des immigrants déclarants résidant dans la province où ils ont été admis (définie comme la province de destination envisagée) à un moment donné. Pour une cohorte donnée (p. ex. l’année d’admission) et une année d’imposition donnée (ou un certain nombre d’années depuis l’admission), le dénominateur est le nombre de déclarants correspondant à la province d’admission sélectionnée. Le numérateur est le nombre de déclarants correspondant à la province d’admission sélectionnée qui résident également dans cette province.

En utilisant le tableau CANSIM 054-0003 pour calculer les taux de rétention de la cohorte de 2011 trois ans après l’admission, un chercheur choisirait, par exemple, toutes les provinces d’admission (p. ex. la province de destination envisagée), toutes les provinces de résidence, l’année d’admission = 2011 et l’année de référence = 2014. Ce tableau ressemblerait au suivant :

Tableau 19
Province de résidence en 2014 et province d’admission, cohorte de 2011
Sommaire du tableau
Le tableau montre les résultats de Province de résidence en 2014 et province d’admission, cohorte de 2011. Les données sont présentées selon Province d’admission (titres de rangée) et Province de résidence, Total – Province de résidence, Terre-Neuve-et-Labrador, Île-du-Prince-Édouard, Nouvelle-Écosse, Nouveau-Brunswick, Québec, Ontario, Manitoba, Saskatchewan, Alberta, Colombie-Britannique et Autre lieu de résidence, calculées selon nombre d’immigrants unités de mesure (figurant comme en-tête de colonne).
Province d’admission Province de résidence
Total – Province de résidence Terre-Neuve-et-Labrador Île-du-Prince-Édouard Nouvelle-Écosse Nouveau-Brunswick Québec Ontario Manitoba Saskatchewan Alberta Colombie-Britannique Autre lieu de résidence
nombre d’immigrants
Total – Province d’admission 174 740 405 330 1 365 880 31 505 70 590 9 695 6 120 26 965 26 390 500
Terre-Neuve-et-Labrador 515 325 0 5 0 5 75 5 0 60 30 0
Île-du-Prince-Édouard 1 245 0 265 25 10 30 560 0 0 50 295 0
Nouvelle-Écosse 1 460 10 5 1 080 10 25 185 0 5 90 30 10
Nouveau-Brunswick 1 340 0 10 35 750 55 275 0 10 80 120 0
Québec 36 275 10 10 35 15 30 200 3 255 40 75 1 190 1 400 45
Ontario 69 135 35 25 115 70 875 63 145 275 335 2 815 1 325 115
Manitoba 11 190 0 0 15 0 55 645 9 170 80 825 380 10
Saskatchewan 6 360 0 0 0 0 20 295 45 5 370 445 165 10
Alberta 21 940 10 0 20 0 95 810 65 140 20 170 590 35
Colombie-Britannique 25 000 5 0 30 5 140 1 330 85 100 1 200 22 030 70
Autre 280 0 0 0 0 0 15 0 0 35 20 200

Les résultats pour la Nouvelle-Écosse donnent des renseignements à ce sujet. Au total, 1 460 personnes ont été admises en Nouvelle-Écosse en 2011 et ont produit une déclaration de revenus en 2014. Pour 1 080 de ces personnes, la Nouvelle-Écosse figurait comme province de résidence en 2014. Le taux de rétention sur trois ans pour la Nouvelle-Écosse serait 1 080/1 460, soit environ 74 %. Le tableau CANSIM fournit également des renseignements sur les migrants secondairesNote 1 : 1 365 personnes admises en 2011 résidaient en Nouvelle-Écosse en 2014; parmi ces dernières, 1 080 envisageaient de résider en Nouvelle-Écosse et 285 avait indiqué une autre province de destination.

La définition susmentionnée de rétention part du principe que le nombre de déclarants pour la province donnée de destination envisagée est la population totale pouvant y rester au cours d’une année (c.-à-d., si les 1 460 personnes ayant envisagé de résider en Nouvelle-Écosse y avaient produit une déclaration de revenus en 2014, la province aurait enregistré un taux de rétention de 100 %). Cette méthode ne tient pas compte du comportement de déclaration de revenus tardif ou sporadique. Alors que la population totale visée pour la Nouvelle-Écosse pour l’année d’imposition de 2014 comprend 1 460 personnes, 1 425 immigrants ayant envisagé de s’installer en Nouvelle-Écosse ont produit une déclaration de revenus pour l’année d’imposition de 2013.

Une option est une approche purement longitudinale, selon laquelle on sélectionne une seule cohorte d’admission (selon la province de destination envisagée, la province de déclaration de revenus initiale, ou les deux) et le taux de rétention est calculé comme la portion de cette cohorte déclarant toujours ses revenus dans cette province. Lorsque la province de déclaration de revenus initiale est utilisée pour définir la cohorte d’admission, il est recommandé que la première déclaration de revenus ait lieu l’année d’admission des immigrants (année d’admission = année d’imposition), afin d’exclure les personnes arrivées ailleurs et ayant ensuite migré dans cette région avant de déclarer leurs revenus pour la première fois. Il est possible d’ajouter une autre restriction, si le chercheur s’intéresse à la population dont le lieu de destination correspond au lieu géographique de la première déclaration de revenus.

Étant donné qu’une portion de chaque cohorte ne déclare pas de revenus pour l’année d’admission, il peut être nécessaire d’accroître la taille de la population pour une région en définissant la cohorte d’admission comme toute personne ayant déclaré ses revenus pour la première fois dans la région au cours des deux années suivant son admission (c.-à-d., first_tax_year = landing_year ou landing_year+1). Il n’est pas recommandé d’inclure à la « cohorte d’admission » les personnes dont la première déclaration de revenus a eu lieu plusieurs années après leur admission, car il est possible que ces personnes soient d’abord arrivées ailleurs sans toutefois avoir déclaré de revenus. Il est également suggéré d’exclure les déclarants intermittents de ces analyses, car leur lieu de résidence n’est pas connu pour les années pour lesquelles aucune donnée fiscale n’existe. La rétention calculée de cette manière indiquera une diminution graduelle du nombre; cette diminution est due aux immigrants cessant de déclarer leurs revenus, émigrant ailleurs ou décédant.

Si un chercheur s’intéresse aux migrations secondaires vers une région, il est possible de l’évaluer en supprimant les personnes de la cohorte d’admission définie du nombre total d’immigrants déclarant des revenus dans la région au moment souhaité. Toutefois, à nouveau, il est suggéré de limiter ces analyses aux personnes ayant déclaré leurs revenus pour la première fois au cours de cette période (année 0 ou année 1), afin de ne pas prendre des déclarants tardifs pour des migrants dans la région. Si la cohorte d’admission est limitée aux immigrants dont la destination correspond au lieu de la première déclaration de revenus, il est suggéré de faire une autre distinction entre les migrants secondaires ayant produit leur première déclaration de revenus ailleurs (puis dans la région d’intérêt) et les immigrants ayant produit leur première déclaration de revenus dans la région d’intérêt, puis ayant été admis dans une autre région (ou lorsque toute donnée manque quant à leur destination envisagée).

Le tableau suivant présente un exemple d’une approche longitudinale de rétention provinciale utilisant des données fictives, selon diverses définitions de la cohorte d’admission initiale.

Tableau 20
Nombre d’immigrants déclarants au sein de la population en question résidant en Colombie-Britannique et taux de rétention associé, par année depuis l’admission
Sommaire du tableau
Le tableau montre les résultats de Nombre d’immigrants déclarants au sein de la population en question résidant en Colombie-Britannique et taux de rétention associé, par année depuis l’admission. Les données sont présentées selon Années depuis l’admission (titres de rangée) et Déclarants ayant pour la première fois déclaré des revenus en Colombie-Britannique au cours de l’année 0, Taux de rétention, Déclarants ayant pour la première fois déclaré des revenus en Colombie-Britannique au cours de l’année 0 ou 1 et Déclarants ayant pour la première fois déclaré des revenus en Colombie-Britannique au cours de l’année 0 ou 1 et pour lesquels la destination envisagée était la Colombie-Britannique, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Années depuis l’admission Déclarants ayant pour la première fois déclaré des revenus en C.-B. au cours de l’année 0 Taux de rétention Déclarants ayant pour la première fois déclaré des revenus en C.-B. au cours de l’année 0 ou 1 Taux de rétention Déclarants ayant pour la première fois déclaré des revenus en C.-B. au cours de l’année 0 ou 1 et pour lesquels la destination envisagée était la C.-B. Taux de rétention
nombre pourcentage nombre pourcentage nombre pourcentage
0 20 000 100 20 000 Note ...: n'ayant pas lieu de figurer 17 500 Note ...: n'ayant pas lieu de figurer
1 18 000 90 25 000 100 19 000 100
2 17 000 85 23 000 92 18 000 95
3 16 500 83 22 000 88 17 500 92

Dans l’exemple ci-dessus, il est possible de calculer la rétention en Colombie-Britannique selon trois définitions de la population; le taux de rétention sur trois ans varie alors en fonction de la définition adoptée. Il est important que toutes les personnes de l’échantillon déclarent des revenus à chaque moment d’intérêt.

Enfin, les analystes doivent procéder avec précaution lors de l’étude de divisions géographiques de faible niveau sur une longue période, car les frontières des agglomérations et des régions métropolitaines de recensement évoluent et des subdivisions de recensement sont abandonnées et ajoutées. Lorsque cela est possible, les analystes devraient exécuter le programme de Fichier de conversion des codes postaux (FCCP+) pour uniformiser les codes postaux en divisions géographiques constantes.

D.4 Calcul des trajectoires de revenu au cours du temps

Comme pour le taux de rétention, calculer l’évolution des revenus d’emploi d’une année à l’autre (ou, d’ailleurs, toute variable économique) nécessite des données consécutives. Si un chercheur, par exemple, souhaite comparer le revenu d’emploi médian de la cohorte de femmes âgées de 24 ans à 54 ans en 2000, un an après leur admission et cinq ans après leur admission (tableau 21), les enregistrements présentant des fichiers FFT1 manquants devraient être supprimés de l’analyse. La décision de supprimer ces enregistrements se baserait sur le souhait d’évaluer le revenu médian de la cohorte par rapport au revenu médian des déclarants de la cohorte.

Tableau 21
Revenu d’emploi médian de la cohorte de femmes âgées de 24 à 54 ans en 2000, 1 an et 5 ans après l’admission
Sommaire du tableau
Le tableau montre les résultats de Revenu d’emploi médian de la cohorte de femmes âgées de 24 à 54 ans en 2000, 1 an et 5 ans après l’admission. Les données sont présentées selon IMDB_ID (titres de rangée) et Année d’admission, Âge à l’admission, Sexe, Revenu d’emploi 2001 et Revenu d’emploi 2005, calculées selon dollars unités de mesure (figurant comme en-tête de colonne).
IMDB_ID Année d’admission Âge à l’admission Sexe Revenu d’emploi 2001 Revenu d’emploi 2005
dollars
IM583 2000 34 Femme 20 500 49 000
IM145 2000 53 Femme Note ..: indisponible pour une période de référence précise 56 000
IM548 2000 29 Femme 11 500 33 800
IM798 2000 31 Femme 36 000 0
IM961 2000 42 Femme 10 000 Note ..: indisponible pour une période de référence précise
IM967 2000 40 Femme Note ..: indisponible pour une période de référence précise Note ..: indisponible pour une période de référence précise
IM110 2000 35 Femme 0 59 000

Des précautions doivent être prises lors du calcul du revenu pour la « première année au Canada », car il peut ne pas représenter une année d’imposition complète. Une personne admise, par exemple, en novembre 2013 et ayant déclaré des revenus pour 2013 ne déclarerait que deux mois de revenus en 2013. Une pratique exemplaire est d’utiliser la première année de revenu complète (année d’admission +1, voir le tableau 19). Une exception concerne les déclarants précoces, ayant déclaré des revenus au Canada avant leur admission ainsi que pour l’année d’imposition, car ils sont plus susceptibles de déclarer des revenus pour une année entière.

Il est également important d’étudier le revenu au cours du temps en dollars constants. Par conséquent, il est nécessaire d’apporter des ajustements à l’aide de l’Indice des prix au Canada (IPC) (voir l’annexe D.7). Cet ajustement a été apporté dans les tableaux CANSIM de la BDIM.

D.5 Arrondissement des données

Statistique Canada s’engage à respecter la vie privée des Canadiens. Par conséquent, tous les tableaux produits à partir des fichiers IMDB_TIFF font l’objet d’un arrondissement. L’intérêt de cet arrondissement est de veiller à ce qu’aucune cellule réduite ne soit divulguée pouvant révéler des renseignements sur des personnes données ou de petits groupes de personnes. En général, les macros prélèveront un ensemble de données d’entrée non arrondies de diverses statistiques (nombres, moyennes, médianes, etc.) et créeront un ensemble de données arrondi.

Les règles d’arrondissement sont confidentielles, mais les macros d’arrondissement sont à la disposition de tout chercheur. Des documents décrivant comment utiliser ces macros sont disponibles. Ces macros s’appliquent aux tableaux de données de sortie de tous les chercheurs, à toutes les demandes de données externes et à tous les tableaux CANSIM publiés.

D.6 Détection de valeurs aberrantes

La variable de valeur aberrante OUTLIER_IND a été créée pour détecter les valeurs aberrantes au sein du fichier FFT1 (voir la section 5.5). Elle devrait être utilisée pour supprimer les données aberrantes de tout calcul (p. ex. moyenne, médiane ou régression) utilisant des données fiscales. Les valeurs aberrantes varient d’une année à l’autre; ce qui signifie que les données relatives à une personne peuvent être détectées comme valeur aberrante pour une année, mais pas pour une année ultérieure.

Le tableau suivant présente la répartition des valeurs aberrantes dans les fichiers de données fiscales à partir de 1982, par type de résident, pour la BDIM de 2014. Moins de 0,1 % des enregistrements ont été relevés comme étant des valeurs aberrantes par année d’imposition. La proportion de valeurs aberrantes a augmenté de 1995 à 1996, du fait de mises à jour de la méthode de détection des valeurs aberrantes appliquée aux fichiers de données fiscales à partir de l’année d’imposition de 1997.

Tableau 22
Répartition des déclarants avec des valeurs aberrantes par année d’imposition
Sommaire du tableau
Le tableau montre les résultats de Répartition des déclarants avec des valeurs aberrantes par année d’imposition. Résident permanent, Résident permanent avec permis de résident non permanent et Total, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
RP RP avec permis de RNP Total
nombre pourcentage
1982 10 10 20 0,01
1983 30 0 30 0,01
1984 40 10 50 0,01
1985 30 0 40 0,01
1986 50 10 50 0,01
1987 60 10 70 0,01
1988 70 20 90 0,01
1989 70 20 90 0,01
1990 60 20 80 0,01
1991 70 20 100 0,01
1992 150 40 180 0,01
1993 150 60 210 0,01
1994 60 20 90 0,01
1995 160 70 230 0,01
1996 340 190 530 0,03
1997 360 220 580 0,03
1998 470 250 720 0,03
1999 390 230 620 0,03
2000 480 260 740 0,03
2001 440 260 700 0,03
2002 510 260 780 0,03
2003 470 240 710 0,02
2004 600 290 890 0,03
2005 660 340 1 000 0,03
2006 610 310 920 0,03
2007 590 340 930 0,02
2008 620 380 1 000 0,03
2009 710 370 1 080 0,03
2010 720 430 1 150 0,03
2011 730 430 1 150 0,03
2012 730 420 1 150 0,02
2013 790 460 1 250 0,03
2014 920 440 1 350 0,02

D.7 Ajustement du revenu selon l’Indice des prix à la consommation (IPC)

Afin de tenir compte du coût de la vie, il est nécessaire d’ajuster tous les revenus en fonction de l’Indice des prix à la consommation (IPC) du Canada. « L’Indice des prix à la consommation (IPC) est un indicateur de la variation des prix à la consommation payés par les Canadiens. Pour l’établir, on compare au fil du temps le coût d’un panier fixe de biens et services achetés par les consommateurs. Puisque le panier comprend des biens et services d’une quantité et d’une qualité constante ou équivalente, l’indice reflète uniquement la fluctuation pure des prixNote 2. » Les facteurs de correction pour 2104 sont présentés au tableau 23. Pour convertir les données en dollars constants d’une année donnée (année de référence), les utilisateurs de données doivent multiplier les valeurs en dollars de toutes les années, à l’exception de l’année de référence, par un facteur de correction propre à une année. Pour obtenir ces facteurs de correction, les utilisateurs de données doivent diviser l’IPC de l’année de référence par l’IPC de l’année étudiée. L’année de référence dans le tableau 23 est 2014.

Tableau 23
Facteur de correction de l’Indice des prix à la consommation de 2014
Sommaire du tableau
Le tableau montre les résultats de Facteur de correction de l’Indice des prix à la consommation de 2014. Les données sont présentées selon Année (titres de rangée) et L’ajustement de l’Indice des prix à la consommation de 2014 est égal à 125,2 divisé par, calculées selon nombre unités de mesure (figurant comme en-tête de colonne).
Année L’ajustement de l’Indice des prix à la consommation de 2014 est égal à 125,2 divisé par
nombre
1982 54,9
1983 58,1
1984 60,6
1985 63,0
1986 65,6
1987 68,5
1988 71,2
1989 74,8
1990 78,4
1991 82,8
1992 84,0
1993 85,6
1994 85,7
1995 87,6
1996 88,9
1997 90,4
1998 91,3
1999 92,9
2000 95,4
2001 97,8
2002 100,0
2003 102,8
2004 104,7
2005 107,0
2006 109,1
2007 111,5
2008 114,1
2009 114,4
2010 116,5
2011 119,9
2012 121,7
2013 122,8
2014 125,2

D.8 Calcul de mesures de revenu clés

Les tableaux CANSIM de la BDIM contiennent plusieurs mesures du revenu. Le tableau 22 décrit les variables du FFT1 incluses dans ces calculs.

Tableau 24
Description des mesures de revenu dans la Base de données longitudinales sur l'immigration
Sommaire du tableau
Le tableau montre les résultats de Description des mesures de revenu dans la Base de données longitudinales sur l'immigration. Les données sont présentées selon Mesure (titres de rangée) et Composantes et Formule(figurant comme en-tête de colonne).
Mesure Composantes Formule
Revenu d’emploi Revenu des feuillets T4; autre revenu d’emploi T4E__i + OEI__i
Revenu de travail indépendant
Depuis 1988 Revenu provenant d’un travail indépendant comme des revenus d’entreprise, de profession libérale, de commissions, d’agriculture ou de pêche; revenu de société en commandite SEI__i + LTPI_i
Avant 1988 Revenu provenant d’un travail indépendant comme des revenus d’entreprise, de profession libérale, de commissions, d’agriculture ou de pêche SEI__i
Revenu de placements Revenus d’intérêts et d’investissements; dividendes; gains et pertes en capital  net imposable* INVi_i + XDIV_i + CLKGLi*
1982 à 1987 Gains et pertes en capital, net imposable 2 x CLKGLi
1988 et 1989 Gains et pertes en capital, net imposable (3/2) x CLKGLi
1990 à 1999 Gains et pertes en capital, net imposable (4/3) x CLKGLi
2000 Gains et pertes en capital, net imposable (100/64,58) x CLKGLi
Depuis 2000 Gains et pertes en capital, net imposable 2 x CLKGLi
Indemnités d’assurance-emploi Indemnités d’assurance-emploi EINS_i
Allocations sociales Allocations sociales (utiliser le niveau familial) SASPYf
Revenu total Somme de toutes les mesures décrites ci-dessus

Il convient de noter que toutes les valeurs aberrantes sont supprimées de ces calculs (Outlier_ind=1), que l’on utilise la variable de province de résidence à la fin de l’année (PRCO_) pour déterminer la province et que tous les revenus sont corrigés en fonction de l’Indice des prix à la consommation (IPC) de l’année la plus récente pour laquelle le FFT1 est disponible. « Moyenne, avec revenu » désigne le revenu moyen des immigrants déclarants ayant un revenu du type donné. « Médiane, avec revenu » désigne le revenu médian des immigrants déclarants ayant un revenu du type donné.

Notes

Date de modification :