Demosim : un aperçu des méthodes et sources de données
Demosim 2017

par l’équipe de Demosim

Rapport rédigé par Éric Caron-Malenfant, Simon Coulombe et Dominic Grenier

Date de diffusion : le 25 janvier 2017

Passer au texte

Le texte commence ici

Remerciements

Ce rapport est le fruit du travail de l’équipe de Demosim, sous la direction d’Éric Caron-Malenfant. Les personnes suivantes font partie ou ont fait partie de l’équipe de Demosim au cours du développement des versions du modèle qui se basent sur l’Enquête nationale auprès des ménages de 2011 : Éric Caron-Malenfant, Jonathan Chagnon, Simon Coulombe, Patrice Dion, Harry François, Nora Galbraith, Mark Knarr, Stéphanie Langlois, Samuel MacIsaac, Laurent Martel et Jean-Dominique Morency, de la Division de la démographie; Melanie Abeysundera, Dominic Grenier, Chantal Grondin et Soumaya Moussa, de la Division des méthodes d’enquêtes sociales; Karla Fox, de la Division de la recherche et de l’innovation en statistique; Martin Spielauer, de la Division de l’analyse sociale et de la modélisation; Jean-Pierre Corbeil et René Houle, de la Division de statistique sociale et autochtone.

Le développement de la présente version de Demosim a bénéficié du support financier d’Affaires autochtones et du Nord Canada (AANC), d’Immigration, Réfugiés et Citoyenneté Canada (IRCC) et de Patrimoine canadien (PCH). Des représentants de ces ministères ont également été consultés en cours de route, par le biais d’un groupe de travail interministériel et d’un comité directeur interministériel. Il convient de souligner l’apport du comité scientifique de Demosim, dont le mandat est de formuler des recommandations quant aux méthodes, aux hypothèses, aux sources de données et aux produits issus du modèle Demosim. Ce comité, présidé par Michael Wolfson (Université d’Ottawa), est composé de Stewart Clatworthy (Four Directions Project Consultants), David Coleman (Oxford University), Eric Guimond (AANC), Peter Hicks (consultant), Jack Jedwab (Association d’études canadiennes), Don Kerr (University of Western Ontario) et Réjean Lachapelle (consultant).

Des remerciements à Carol D’Aoust, Daniel Bannatyne et Simon Larose pour leur support technique lors de la préparation du présent rapport. Merci également aux personnes qui ont révisé les versions préliminaires de ce rapport. Il s’agit de Rosalinda Costa, André Cyr, Marc Lachance, Anne Milan et Pierre Turcotte.

Introduction

Demosim est un modèle de projections démographiques par microsimulation de Statistique Canada conçu afin de projeter la population canadienne selon diverses caractéristiques ethnoculturelles. Créé en 2004 sous le nom de Popsim afin de produire les Projections de la population des groupes de minorités visibles, Canada, provinces et régions, 2001 à 2017 (Statistique Canada 2005Note 1 ), ses versions subséquentes (sous l’appellation Demosim) ont servi à la préparation des Projections de la diversité de la population canadienne, 2006 à 2031 (Statistique Canada 2010), des Projections de la population selon l’identité autochtone au Canada, 2006 à 2031 (Statistique Canada 2011), de La population active canadienne : tendances projetées à l’horizon 2031 (Martel et coll. 2011), des Projections de la population et des ménages autochtones au Canada, 2011 à 2036 (Statistique Canada 2015-2) puis de plusieurs articles analytiques et méthodologiquesNote 2, entre autres applications.

C’est en 2015 qu’est paru pour la première fois Demosim : un aperçu des méthodes et sources de données (Statistique Canada 2015-3), afin de documenter la version du modèle (Demosim 2015) ayant servi à la préparation des Projections de la population et des ménages autochtones au Canada, 2011 à 2036. Ces projections résultaient d’une refonte en profondeur des méthodes et du contenu du modèle de projection tenant compte des sources de données les plus récentes. Leur parution initiait un nouveau cycle de diffusion de produits prospectifs basés sur l’Enquête nationale auprès des ménages (ENM) de 2011, les cycles précédents s’étant basés sur les recensements de 2001 et de 2006.

Depuis, une nouvelle version du modèle (Demosim 2017) aussi basée sur l’ENM de 2011 a été achevée. Cette nouvelle version de Demosim a été développée aux fins de la préparation de deux rapports analytiques, l’un intitulé Immigration et diversité : projections de la population du Canada et de ses régions, 2011 à 2036 et l’autre Projections linguistiques pour le Canada, 2011 à 2036. Bien que se situant en continuité par rapport à la version 2015 de Demosim, elle comprend quelques ajouts et modifications qui appelaient à une mise à jour de sa documentation méthodologique (voir un sommaire des changements à l’encadré 1).

Le présent document donne un aperçu du fonctionnement de la version 2017 du modèle de projection Demosim. Il présente sa population de base ainsi que les sources de données et méthodes relatives à chacune de ses composantes. Les hypothèses et scénarios sélectionnés pour la présentation des résultats issus de cette version sont quant à eux décrits, aux fins de l’interprétation de leurs résultats, dans les rapports analytiques dont le présent rapport constitue un complément technique.

Notons enfin que la description de Demosim que comprend le présent rapport doit être vue dans le prolongement de la documentation des versions précédentes du modèleNote 3. Bien que les versions du modèle servant au présent cycle de projections aient été l’objet d’une refonte et d’une mise à jour complètes, c’est sur la base de cette documentation que la description de Demosim présentée ici construit et développe.

début de encadré 1

Encadré 1

Sommaire des changements depuis la version 2015 de Demosim

Les principales modifications qui ont été apportées à Demosim depuis la version 2015 décrite dans Statistique Canada 2015-3 sont les suivantes :

  • Une variable de citoyenneté canadienne a été ajoutée à la population de base. Afin que celle-ci soit maintenue à jour en cours de projection, un module d’acquisition de la citoyenneté canadienne chez les immigrants a été ajouté à Demosim, puis des modifications ont été apportées en conséquence au module d’attribution des caractéristiques aux nouveau-nés.
  • Le module de migration interne a été modifié de manière à tenir compte de manière plus détaillée des variables linguistiques et du caractère francophone ou non des régions de destination.
  • Les modules de transitions linguistiques au cours de la vie et de transmission intergénérationnelle des langues ont aussi subi plusieurs modifications, notamment quant aux choix des transitions qui sont modélisées aux fins de la simulation et aux variables explicatives incluses dans les modèles.

Fin de encadré 1

Population de base

La population de base de la présente version de Demosim est dérivée essentiellement du fichier de microdonnées de l’Enquête nationale auprès des ménages (ENM) de 2011Note 4, une base de données qui comprend environ 7,3 millions d’enregistrements représentatifs de la population canadienne vivant en ménages privés au 10 mai 2011. Les principales variables de la population de base sont les suivantesNote 5:

La catégorie d’inscription au Registre des Indiens et la catégorie d’admission des immigrants sont deux variables qui, absentes de la base de données de l’ENM, y ont été ajoutées au moyen d’appariements de fichiers. La catégorie d’inscription, qui définit les modalités de transmission du statut d’Indien inscrit des parents aux enfants, a été obtenue d’un appariement existant entre le Registre des Indiens et l’ENM de 2011 (via le Recensement de 2011) afin de distinguer, parmi les répondants à l’ENM ayant déclaré être des Indiens inscrits, ceux qui l’étaient en vertu du paragraphe 1 et du paragraphe 2 de l’article 6 de la Loi sur les IndiensNote 6. L’appariement a permis de déterminer la catégorie d’inscription dans 66 % des cas. Pour les 34 % restants, les catégories 6(1) et 6(2) ont été imputées de manière déterministe lorsque l’information sur l’inscription des membres du reste de la famille de recensement le permettait puis au moyen d’un modèle probabiliste (régression logistique) pour les autresNote 7. La catégorie d’admission des immigrants (composante économique, humanitaire (réfugiés), réunification familiale ou autres) a pour sa part été obtenue d’appariements existants entre les fichiers d’admission d’Immigration, Réfugiés et Citoyenneté Canada de 1980 à 2011 et l’ENM de 2011 (via le Recensement de 2011). L’appariement, pour les personnes ayant déclaré à l’ENM avoir été admises au Canada à titre d’immigrantes depuis 1980, a été un succès dans 82 % des cas. Pour les 18 % restants, la variable a été imputée de façon probabiliste au moyen de modèles de régressions logistiques multinomiales. Pour les immigrants qui ont été admis avant 1980, la catégorie d’admission demeure inconnue.

Certains ajustements ont aussi été apportés au fichier de microdonnées de l’ENM afin que la population de base de Demosim reflète le mieux possible l’ensemble de la population canadienne.

La population résidant dans les 31 réserves indiennes partiellement dénombrées au Recensement de 2011 et les cinq réserves indiennes additionnelles non répondantes à l’ENM a été ajoutée à la population de base de Demosim. Pour 13 des 31 réserves partiellement dénombrées au recensement, le questionnaire de l’ENM n’a été administré que plusieurs mois après l’ENM, lors d’une collecte spéciale, puisque des feux de forêt n’avaient pas permis que la collecte de l’ENM se tienne plus tôt, comme cela avait été initialement prévuNote 8. Les enregistrements provenant de cette collecte spéciale ont été ajoutés à la population de base de Demosim. Pour la population des 18 autres réserves indiennes partiellement dénombrées au recensement, on a fait l’hypothèse d’une population conforme aux estimations produites par la Division des méthodes d’enquêtes sociales de Statistique Canada, puis on a imputé des enregistrements ayant des caractéristiques représentatives de ceux des réserves de taille similaire dénombrées dans la même province. On a procédé à une imputation similaire pour les cinq réserves dénombrées au recensement mais pas à l’ENM, en calibrant leur population sur les comptes du Recensement de 2011 par groupe d’âge et sexe.

Des ajustements ont enfin été effectués de manière à obtenir une population représentative des estimations démographiques au 10 mai 2011, laquelle inclut les personnes vivant en logements collectifs et tient compte du sous-dénombrement net au recensement. L’ajustement pour les logements collectifs a consisté à multiplier les poids de sondage des individus par des ratios entre la population du Recensement de 2011 (qui comprend les logements collectifs) et celle de l’ENM, par âge, sexe et lieu de résidenceNote 9. Des taux de sous-dénombrement nets ont ensuite été appliqués aux poids de sondage par âge, sexe et lieu de résidence.

L’ensemble de ces ajustements a haussé la population totale de quelque 1,4 million de personnes. L’effet de ces ajustements est plus important pour certains sous-groupes de la population. C’est notamment le cas des jeunes adultes, chez qui le sous-dénombrement net est plus élevé, et des Indiens inscrits, en raison de l’ajustement pour les réserves partiellement dénombrées.Note 10.

Fonctionnalités générales et caractéristiques de Demosim

Demosim est un modèle par microsimulation, ce qui signifie qu’il projette la population non pas sur la base de données agrégées comme le font les modèles par cohortes et composantes ou multi-états, mais en projetant un à un les individus la composantNote 11. Pour ce faire, il simule la vie de chacune des personnes qui se trouvent dans sa population de base, de même que celle des individus qui s’ajoutent à la population en cours de simulation, soit les nouveau-nés et les immigrantsNote 12. Les individus progressent au fil du temps en étant soumis au risque de « vivre » les divers événements simulés par le modèle (naissance d’un enfant, décès, changement de niveau de scolarité, changement de connaissance de langues officielles, etc.), jusqu’à ce qu’ils ne décèdent, n’émigrent ou n’atteignent la fin de la simulation.

Les probabilités (ou risques) de « vivre » chacun des événements sont fonction des caractéristiques individuelles. De ces probabilités sont dérivés des temps d’attente qui, fonctions des probabilités associées aux événements, des caractéristiques individuelles et d’un processus aléatoire, correspondent au temps qui doit s’écouler entre le moment actuel et le moment de l’occurrence de chacun des événements (voir l’encadré 2). L’événement dont le temps d’attente est le plus court survient en premier. Suite à l’occurrence d’un événement, les temps d’attente des événements qui dépendent de la caractéristique qui a été modifiée sont recalculés, permettant d’obtenir un nouveau jeu complet de temps d’attente; l’individu avance ainsi jusqu’à l’événement suivant (toujours celui dont le temps d’attente est le plus court), et ainsi de suite. Demosim étant un modèle en temps continu, les divers événements simulés peuvent se produire à n’importe quel moment de l’année, bien que certains d’entre eux surviennent à date fixe (l’anniversaire de naissance par exemple). En outre, certaines caractéristiques sont imputées annuellement aux individus. La gestion des événements et des temps d’attente est assurée par le langage informatique ModgenNote 13, avec lequel Demosim est programmé.

Une telle approche permet d’obtenir des projections dont le niveau de détail ne pourrait pas être atteint à l’aide des modèles classiques de projection en raison de leur nature matricielle. La projection simultanée et cohérente d’un grand nombre de variables que rend possible la microsimulation présente l’avantage de permettre l’usage d’une quantité accrue de caractéristiques à la fois comme déterminants des événements simulés puis pour la tabulation des résultats. Demosim a également montré sa flexibilité en ce qui a trait à la constitution d’hypothèses et de scénarios de projection, de même que sa capacité à reproduire les résultats des modèles par cohortes et composantes au niveau agrégéNote 14.

L’application de cette méthode suppose que l’on ait au préalable calculé des probabilités (ou risques) associées aux événements simulés. Cela est fait en tirant parti des sources de données existantes – recensements, enquêtes, données administratives – auxquelles diverses méthodes ont été appliquées. Leur description est l’objet de la section qui suit.

début de encadré 2

Encadré 2

À propos du calcul des temps d’attente, des notions de taux de transition (risque) et de probabilité

Dans un modèle en temps continu comme Demosim, les événements peuvent se produire à tout moment. Leur occurrence dépend de temps d’attente qui eux, sont associés à chaque individu selon ses caractéristiques du moment. Les temps d’attente à l’échelon des individus nécessaires au fonctionnement d’un modèle de microsimulation comme Demosim ne peuvent être obtenus de données d’observation; ils doivent être dérivés.

Le temps d’attente est dérivé du taux de transition (qui quantifie le risque), lequel est dénoté λ MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai abeU7aSbaa@39AD@ . Le taux de transition est défini par le nombre d’événements observés divisé par le nombre d’années-personnes vécues. Un exemple de taux de transition en démographie est le taux de mortalité ( m x MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai aad2gadaWgaaWcbaGaamiEaaqabaaaaa@3A15@ ), que l’on retrouve dans les tables de mortalité aux côtés du quotient de mortalité ( q x MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai aadghadaWgaaWcbaGaamiEaaqabaaaaa@3A19@ ), qui représente quant à lui la probabilité qu’une personne décède au cours de l’année.

La distribution du temps d’attente avant qu’un événement ne survienne suit une loi exponentielle de paramètre λ MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai abeU7aSbaa@39AD@ . Avec la loi exponentielle, on suppose que le risque de subir un événement (par exemple mourir) demeure constant au cours d’une période de temps donnée. Dans Demosim, les risques sont ainsi supposés constants tant que les caractéristiques dont dépend l’événement modélisé demeurent inchangées chez l’individu. Comme la plupart des événements dans Demosim dépendent de l’âge, cette période est, pour ces événements, d’au plus un an.

La probabilité qu’un événement survienne avant ou exactement au temps t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai aadshaaaa@38F3@ est donnée par la fonction de répartition de la loi exponentielle :

P(Tt)=F(t)=1 e λt MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai aabcfacaGGOaGaaeivaiabgsMiJkaadshacaGGPaGaeyypa0JaaeOr aiaacIcacaWG0bGaaiykaiabg2da9iaaigdacqGHsislcaqGLbWaaW baaSqabeaacqaH7oaBcaWG0baaaaaa@483C@

La fonction de distribution inverse de la loi exponentielle, t=ln(1F(t))/λ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai aadshacqGH9aqpcqGHsislcaqGjbGaaeOBaiaacIcacaaIXaGaeyOe I0IaaeOraiaacIcacaWG0bGaaiykaiaacMcacaGGVaGaeq4UdWgaaa@4526@ , indique à quel moment t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai aadshaaaa@38F3@ une proportion F(t) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai aabAeacaGGOaGaamiDaiaacMcaaaa@3B15@ de la population aura vécu l’événement, sachant que le taux de transition est de λ MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai abeU7aSbaa@39AD@ .

Dans Demosim, un processus aléatoire est utilisé en conjonction avec la fonction de distribution inverse de la loi exponentielle pour générer au niveau individuel les temps d’attente relatifs à chacun des événements simulés. Tout d’abord, une valeur aléatoire est obtenue de la distribution uniforme U[0,1]. Cette valeur est insérée dans la fonction de distribution inverse de la loi exponentielle à la place de F(t) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai aabAeacaGGOaGaamiDaiaacMcaaaa@3B15@ . Par exemple, si un événement a un taux de transition λ MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai abeU7aSbaa@39AD@ = 0,15 et que le nombre aléatoire généré est de 0,5, alors le temps d’attente généré pour cet événement sera t=ln(1F(t))/λ=ln(10,5)/0,15= MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai aadshacqGH9aqpcaqGjbGaaeOBaiaacIcacaaIXaGaeyOeI0IaaeOr aiaacIcacaWG0bGaaiykaiaacMcacaGGVaGaeq4UdWMaeyypa0Jaey OeI0Iaaeysaiaab6gacaGGOaGaaGymaiabgkHiTiaaicdacaGGUaGa aGynaiaacMcacaGGVaGaaGimaiaac6cacaaIXaGaaGynaiabg2da9a aa@51B4@ 4,62 ans. Toute valeur aléatoire inférieure donnera un temps d’attente inférieur à 4,62 ans et toute valeur supérieure donnera un temps d’attente plus élevé.

Il arrive souvent que les paramètres de projection soient constitués de probabilités plutôt que de taux de transition. Il faut alors les convertir en taux de transition. Pour ce faire, il suffit d’isoler λ MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai abeU7aSbaa@39AD@ dans la fonction de distribution de la loi exponentielle pour obtenir λ=ln(1F(t))/t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai abeU7aSjabg2da9iabgkHiTiaabMeacaqGUbGaaiikaiaaigdacqGH sislcaqGgbGaaiikaiaadshacaGGPaGaaiykaiaac+cacaWG0baaaa@4526@ , et d’y remplacer F(t) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai aabAeacaGGOaGaamiDaiaacMcaaaa@3B15@ par la probabilité annuelle et t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai aadshaaaa@38F3@ par 1 an. Une probabilité annuelle de décéder de 0,10 correspond donc à un taux de transition de 0,1053 car λ=ln(10,10)/1=0,1053 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbbjxAHX garmWu51MyVXgaruWqVvNCPvMCG4uz3bqefqvATv2CG4uz3bIuV1wy Ubqee0evGueE0jxyaibaieYlf9irVeeu0dXdh9vqqj=hEeeu0xXdbb a9frFj0=OqFfea0dXdd9vqaq=JfrVkFHe9pgea0dXdar=Jb9hs0dXd bPYxe9vr0=vr0=vqpWqaaeaabiGaciaacaqabeaadaabauaaaOqaai abeU7aSjabg2da9iaadMeacaWGUbGaaiikaiaaigdacqGHsislcaaI WaGaaiOlaiaaigdacaaIWaGaaiykaiaac+cacaaIXaGaeyypa0JaaG imaiaac6cacaaIXaGaaGimaiaaiwdacaaIZaaaaa@4928@ .

Bien qu’il soit souvent fait usage dans le présent document de la notion de probabilité, il convient de garder à l’esprit que ce sont plutôt les risques qui sont utilisés pour dériver les temps d’attente dans le modèle Demosim. Aussi, ce n’est que par souci de simplification que le terme de « risque » est utilisé en référence à la notion, plus précise, de taux de transition.

Pour en connaître davantage sur le calcul des temps d’attente, prière de consulter Willekens (2011).

Fin de encadré 2

Composantes principales projetées par Demosim

Cette section, qui vise à documenter les principales composantes projetées par Demosim, se subdivise en trois principales parties. La première traite des évènements qui sont modélisés au moyen d’un temps d’attente, la deuxième des caractéristiques imputées annuellement et finalement, la dernière donne un aperçu de la façon dont les individus sont créés en cours de simulation.

Il est à noter qu’il arrivera qu’il soit fait référence, dans la suite du texte, à la notion de « module ». C’est que le modèle Demosim est construit de manière modulaire, chacune des composantes correspondant à un module. Un module comprend le code informatique spécifiant les dimensions et le fonctionnement de l’événement modélisé, incluant ses relations aux autres parties du modèle, ainsi que les paramètres qui y sont associés. Le tableau 1 présente les différentes composantes existant dans le modèle de projection et résume les méthodes et sources de données utilisées pour leur fonctionnementNote 15 .

Événements avec temps d’attente

La première catégorie d’événements comprend les événements modélisés au moyen de temps d’attente (voir l’encadré 2). Ils permettent la création de parcours de vie dynamiques et distincts pour chacun des individus simulés. Les événements entrant dans cette catégorie sont la fécondité, la mortalité, la migration interne, l’émigration, l’inscription au Registre des Indiens et la reclassification des catégories d’inscription au cours de la vie, la mobilité ethnique intragénérationnelle des Autochtones, la mobilité religieuse intragénérationnelle, la mobilité linguistique intragénérationnelle, l’acquisition de la citoyenneté canadienne par les nouveaux arrivants et les changements de niveaux de scolarité.

Fécondité

Le module de fécondité a été conçu de manière à obtenir une projection des naissances qui reflète les différences qui séparent les divers groupes projetés – Autochtones, immigrants, etc. – à l’égard de la fécondité. Il comprend, d’une part, des « probabilités de base » d’avoir donné naissance à au moins un enfant au cours de l’année qui a précédé l’ENM de 2011. Il s’agit de probabilités selon l’âge, le nombre d’enfants au foyer et le fait d’être ou non d’identité autochtone calculées à l’aide de la méthode du décompte des enfants au foyerNote 16appliquée à cette source de donnéesNote 17. Elles comprennent des ajustements pour les enfants ne vivant pas avec leur mère, pour la mortalité, et elles sont aussi ajustées pour refléter ce qui est observé à l’état civil. Ces probabilités de base sont ensuite combinées à des résultats de régressions log-log complémentaires (voir l’encadré 3) obtenus eux aussi des données de l’ENM auxquelles la méthode du décompte des enfants au foyer a été appliquée. Les régressions visent à estimer la probabilité, pour diverses combinaisons de groupe d’âge, de nombre d’enfants au foyer et d’identité autochtoneNote 18, d’avoir donné naissance à au moins un enfant au cours de la même période selon d’autres variables : état matrimonial, scolarité, groupe autochtone, statut d’Indien inscrit, statut d’immigrant, temps écoulé depuis l’immigration, statut des générations, catégorie d’admission des immigrants, lieu de naissance, groupe de minorités visibles, religion, langue maternelle et lieu de résidence détaillé (dans et hors des réserves indiennes, Inuit Nunangat, RMR et provinces et territoires).Note 19 Il convient de souligner qu’à des fins de cohérence entre les probabilités de base et les résultats des régressions, tous deux estiment le nombre de femmes ayant donné naissance à au moins un enfant, et non le nombre total de naissances (les naissances pouvant être multiples). Pour cela, un ajustement supplémentaire, composé de ratios entre le nombre de naissances au cours de la période et le nombre de femmes qui ont donné naissance, selon l’identité autochtone ou le groupe de minorité visible, est ensuite appliqué.

début de encadré 3

Encadré 3

Combinaison de taux ou probabilités de base à des résultats de régression

Dans plusieurs modules de Demosim, les probabilités d’occurrence des événements sont estimées à l’aide de taux de base qui sont combinés à des facteurs relatifs dérivés de résultats de régressions. Cette combinaison de taux de base et de résultats de régression accroît la flexibilité pour l’élaboration d’hypothèses de projection et permet l’intégration d’information provenant de sources de données différentes lors de la modélisation des événements. Elle présente cependant certaines difficultés.

Une première difficulté vient de ce que normalement, ce n’est pas la population entière qui constitue la catégorie de référence des modèles de régression, mais seulement un (ou des) sous-groupe(s) au sein de celle-ci. Une transformation ou un ajustement est donc nécessaire si l’on veut combiner le résultat de telles régressions avec un ou des taux référant à l’ensemble de la population.

Une seconde difficulté vient des différences entre la composition de la population ayant servi à calculer les modèles de régression et celle de la population à laquelle on applique ces résultats de régression, soit la population servant de base à la projection. Ainsi, lorsqu’une source de données autre que la population de base de Demosim est nécessaire au calcul des paramètres, la somme pondérée des probabilités issues de la régression ne sera pas nécessairement égale à celle que l’on obtiendrait en pondérant ces mêmes probabilités au moyen de la population d’une autre source de données.

En réponse à ces deux difficultés, on a recours à une méthode de calibration qui vise à ajuster l’ordonnée à l’origine des modèles de régression sans en modifier les autres coefficients. Cette modification est effectuée de manière à reproduire des taux cibles (taux de base) au sein d’une population dont la composition est la même que celle de la population de base de Demosim.

Pour illustrer la méthode, supposons que l’on ait effectué une régression logistique estimant la probabilité qu’un événement Y survienne selon un ensemble de caractéristiques X. Cette régression a été effectuée sur une enquête que l’on nommera source A. Cette source de données A a une population dont la composition selon les caractéristiques X diffère de celle de la population de base de Demosim, à laquelle seront pourtant appliquées les probabilités de la source A. Appelons la population de base de Demosim la source de données B. Supposons qu’en plus nous voulions faire l’hypothèse que la probabilité que l’événement en question survienne atteigne une cible préétablie, comme c’est souvent le cas lorsque l’on effectue des projections.

Rappelons qu’avec une régression logistique, la probabilité P A MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGqbWdamaaBaaaleaapeGaamyqaaWdaeqaaaaa@380B@ (où A réfère à la source de données A) que l’événement Y survienne étant donné l’ensemble de caractéristiques X (P A ( Y=1|X )) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGqbWdamaaBaaaleaapeGaamyqaaWdaeqaaOWdbmaabmaapaqa a8qacaWGzbGaeyypa0JaaGymaiaabYhaieWacaWFybaacaGLOaGaay zkaaaaaa@3E51@ est obtenu de la formule suivante :

P A ( Y = 1 | X ) = exp ( α A + β X ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGqbWdamaaBaaaleaapeGaamyqaaWdaeqaaOWdbmaabmaapaqa a8qacaWGzbGaeyypa0JaaGymaiaabYhaieWacaWFybaacaGLOaGaay zkaaGaeyypa0JaaeyzaiaabIhacaqGWbWaaeWaa8aabaWdbiabeg7a H9aadaWgaaWcbaWdbiaadgeaa8aabeaak8qacqGHRaWkceWFYoWday aafaWdbiaa=HfaaiaawIcacaGLPaaaaaa@49CA@

Si l’on pondère les probabilités au moyen de poids dérivés de la source de données A ( w A MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG3bWdamaaBaaaleaapeGaamyqaaWdaeqaaaaa@3833@ ), la probabilité globale (c’est-à-dire moyenne dans la population) que l’événement Y survienne est

   w A * P A ( Y=1|X )= P A ( Y=1 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaGGGcGaaiiOaiabggHiLlaadEhapaWaaSbaaSqaa8qacaWGbbaa paqabaGcpeGaaiOkaiaadcfapaWaaSbaaSqaa8qacaWGbbaapaqaba GcpeWaaeWaa8aabaWdbiaadMfacqGH9aqpcaaIXaGaaeiFaGqadiaa =HfaaiaawIcacaGLPaaacqGH9aqpcaWGqbWdamaaBaaaleaapeGaam yqaaWdaeqaaOWdbmaabmaapaqaa8qacaWGzbGaeyypa0JaaGymaaGa ayjkaiaawMcaaaaa@4C7C@

Si on applique les probabilités issues de cette régression à une autre source de données, disons la source B, et que l’on pondère en fonction de la composition de cette dernière source (avec des poids w B MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG3bWdamaaBaaaleaapeGaamOqaaWdaeqaaaaa@3834@ ), on obtiendra une probabilité globale que l’événement Y survienne qui ne sera ni égale à celle que l’on obtenait en n’utilisant que la source A, ni à celle qu’on aurait pu obtenir en n’utilisant que la source B.

w B * P A ( Y=1|X ){ P A ( Y=1 ) ou P B ( Y=1 ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaubiaeqale qabaGaaGzaVdqdbaaeaaaaaaaaa8qacqGHris5aaGccaWG3bWdamaa BaaaleaapeGaamOqaaWdaeqaaOWdbiaacQcacaWGqbWdamaaBaaale aapeGaamyqaaWdaeqaaOWdbmaabmaapaqaa8qacaWGzbGaeyypa0Ja aGymaiaabYhaieWacaWFybaacaGLOaGaayzkaaGaeyiyIK7aaiqaa8 aabaqbaeqabmqaaaqaa8qacaWGqbWdamaaBaaaleaapeGaamyqaaWd aeqaaOWdbmaabmaapaqaa8qacaWGzbGaeyypa0JaaGymaaGaayjkai aawMcaaaWdaeaapeGaam4Baiaadwhaa8aabaWdbiaadcfapaWaaSba aSqaa8qacaWGcbaapaqabaGcpeWaaeWaa8aabaWdbiaadMfacqGH9a qpcaaIXaaacaGLOaGaayzkaaaaaaGaay5Eaaaaaa@56AC@

Supposons maintenant que l’on veuille trouver un ajustement permettant de reproduire la probabilité globale de la source A ou de la source B. Puisque le résultat de l’équation précédente ne donne ni la probabilité globale de la source A, ni celle de la source B, il ne serait pas suffisant de le multiplier par le quotient des deux ( P B / P A  ou  l'inverse MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGqbWdamaaBaaaleaapeGaamOqaaWdaeqaaOWdbiaac+cacaWG qbWdamaaBaaaleaapeGaamyqaaWdaeqaaOWdbiaacckacaWGVbGaam OCaiaacckacaWG0bGaamiAaiaadwgacaGGGcGaamyAaiaad6gacaWG 2bGaamyzaiaadkhacaWGZbGaamyzaaaa@49AF@ ).

L’ajustement que l’on utilise pour y arriver consiste à trouver, au moyen d’une méthode itérative, un α cible MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacqaHXoqypaWaaSbaaSqaa8qacaWG0bGaamyyaiaadkhacaWGNbGa amyzaiaadshaa8aabeaaaaa@3DB5@ que l’on ajoute à l’ordonnée à l’origine α A MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacqaHXoqypaWaaSbaaSqaa8qacaWGbbaapaqabaaaaa@38D6@ pour que w B * P A ˜ ( Y=1|X )=Cible MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacqGHris5caWG3bWdamaaBaaaleaapeGaamOqaaWdaeqaaOWdbiaa cQcapaWaaacaaeaapeGaamiua8aadaWgaaWcbaWdbiaadgeaa8aabe aaaOGaay5adaWdbmaabmaapaqaa8qacaWGzbGaeyypa0JaaGymaiaa bYhaieWacaWFybaacaGLOaGaayzkaaGaeyypa0Jaamivaiaadggaca WGYbGaam4zaiaadwgacaWG0baaaa@4A46@

P A ˜ ( Y=1|X )=exp( α cible + α A + β X ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaacaaeaaqa aaaaaaaaWdbiaadcfapaWaaSbaaSqaa8qacaWGbbaapaqabaaakiaa woWaa8qadaqadaWdaeaapeGaamywaiabg2da9iaaigdacaqG8bacbm Gaa8hwaaGaayjkaiaawMcaaiabg2da9iaabwgacaqG4bGaaeiCamaa bmaapaqaa8qacqaHXoqypaWaaSbaaSqaa8qacaWGubGaamyyaiaadk hacaWGNbGaamyzaiaadshaa8aabeaak8qacqGHRaWkcqaHXoqypaWa aSbaaSqaa8qacaWGbbaapaqabaGcpeGaey4kaSIab8NSd8aagaqba8 qacaWFybaacaGLOaGaayzkaaaaaa@5306@

Cette méthode, si elle permet dans l’exemple plus haut d’atteindre une cible comme la probabilité globale de la source A ou de la source B, peut également être généralisée à n’importe quelle cible. Dans Demosim, pour modifier l’hypothèse en changeant les taux de base (la cible à atteindre), on n’a qu’à calculer un nouvel ajustement spécifique à la cible visée. Ce type d’ajustement peut également être adapté à d’autres types de régressions.

Cette façon de calibrer le modèle permet de préserver les rapports de cote du modèle de régression tout en assurant d’atteindre précisément la cible, dans l’hypothèse d’une population dont la composition demeurerait inchangée par rapport au point de départ de la projection. La méthode permet donc le maintien des effets de composition pouvant survenir en cours de projection. Par ailleurs, l’atteinte de la cible fixée par les taux de base se faisant par l’intermédiaire d’un ajustement de l’ordonnée à l’origine des régressions, elle contraint les probabilités à ne pas dépasser 100 %, quelle que soit la cible. Cela signifie du même coup que c’est en termes de rapports de cotes (dans le cas d’une régression logistique) ou de rapports de risque (dans le cas d’une régression à risques proportionnels) que les écarts relatifs sont maintenus en cours de projection.

Fin de encadré 3

Mortalité

Le module de mortalité est structuré de manière similaire au module de fécondité en ce qu’il fait appel à des taux de base qui sont combinés à des résultats de régressions (voir l’encadré 3). Ce module vise à simuler le nombre futur de décès en tenant compte des différences entre les groupes projetés. En raison du caractère fragmenté des données disponibles, la mortalité est modélisée distinctement pour les Inuits et les non-Inuits puis, chez les non-Inuits, distinctement pour la population âgée de 25 ans et plus et celle de 24 ans et moinsNote 20.

  1. Chez les non-Inuits de 25 ans ou plus, les taux de base sont constitués des taux de mortalité projetés selon l’âge et le sexe à l’échelon canadien conformément aux méthodes documentées dans le rapport technique des plus récentes projections nationales (Dion et coll. 2014)Note 21. Ceux-ci sont combinés à des résultats de régressions à risques proportionnels (modèles de Cox) stratifiées selon le sexe et de grands groupes d’âge. Ces régressions estiment le risque de décéder selon le groupe d’ascendance autochtone, le groupe de minorités visibles, le temps écoulé depuis l’immigration, la scolarité, le fait de résider dans une réserve indienne et la province ou territoire de résidence. Les modèles ont été estimés avec les données de l’Étude canadienne de suivi de la mortalité selon le recensement, 1991-2006Note 22, soit un appariement entre les données du Recensement de 1991 relatives à la population âgée de 25 ans et plus et celles de l’État civil jusqu’en 2006.
  2. Pour la population non inuite de 24 ans et moins, la mortalité est modélisée de manière distincte pour les non-Autochtones, le groupe autochtone des Premières Nations et le groupe autochtone des Métis. Pour les non-Autochtones, des taux de mortalité selon l’âge, le sexe et la province ou territoire de résidence, projetés au moyen du modèle Li-Lee, sont utilisés. Pour le groupe autochtone des Premières Nations, les taux de mortalité proviennent de tables de mortalité pour les Indiens inscritsNote 23, puis sont projetés en supposant constants les écarts entre ceux-ci et ceux des non-AutochtonesNote 24. Pour le groupe autochtone des Métis, en l’absence de données sur cette population précise, les taux sont obtenus en multipliant les taux des Indiens inscrits par un facteur dérivé de l’écart séparant la mortalité des Métis et des Indiens inscrits chez la population âgée de 25 à 64 ans selon l’Étude canadienne de suivi de la mortalité selon le recensement, 1991-2006.
  3. Pour les Inuits, des tables de mortalité ont été calculées à partir des données de décès des Inuits résidant au Nunavut provenant d’extractions spéciales de l’État civil pour les années 2000 à 2002, 2005 à 2007 puis 2010 et 2011. Les risques de décéder des Inuits sont projetés en maintenant constant l’écart relatif entre eux et l’ensemble de la population canadienneNote 25observé au cours de ces périodes.

Migration interne

Le module de migration interne vise à simuler les mouvements entre les 84 régions géographiques que compte Demosim en tenant compte des principales caractéristiques incluses dans la projection. Deux types de migrations sont modélisés :

  1. la migration inter-régionale, c’est-à-dire entre les 50 régions principales du modèle (régions RMR et non-RMRNote 26);
  2. la migration intra-régionale, c’est-à-dire entre les parties se trouvant dans les réserves et celles à l’extérieur des réserves ou entre les parties se trouvant dans l’Inuit Nunangat et celles à l’extérieur de l’Inuit Nunangat au sein des régions principales où ces distinctions existent.

La modélisation est réalisée en plusieurs étapes. Les premières visent à estimer la migration inter-régionale et la migration intra-régionale sur la base de l’information sur la relation entre le lieu de résidence un an auparavant et le lieu de résidence actuel (mobilité 1 an) contenue dans une base de données constituée des recensements de 2001, de 2006 puis de l’ENM de 2011, auxquels une géographie constante a été appliquéeNote 27.

La migration inter-régionale est ainsi modélisée en deux moments distincts. D’abord, des modèles de régressions log-log complémentaires ont servi à estimer les probabilités de sortie de chacune des régions selon l’âge, le groupe autochtone, le statut d’Indien inscrit, le statut d’immigrant, le temps écoulé depuis l’immigration, l’état matrimonial, le lieu de naissance, le statut des générations, le groupe de minorités visibles, le nombre d’enfants au foyer, l’âge du plus jeune enfant au foyer, la langue maternelle, la langue parlée le plus souvent à la maison, la connaissance des langues officielles et le fait de résider dans une réserve indienne ou une région de l’Inuit NunangatNote 28. Ensuite, les migrants se voient attribuer une région de destination. Lors de l’attribution d’une région de destination, des modèles de régression logistique déterminent d’abord si les migrants s’établiront dans une région francophone et si c’est le cas, s’ils s’établiront dans une région à forte majorité francophoneNote 29. Ces modèles sont stratifiés selon le statut d’immigrant et le fait de résider ou non dans une région francophone et tiennent compte des mêmes variables que celles utilisées pour estimer les probabilités de sortie. Des matrices tenant compte de la région d’origine, du lieu de naissance, de la langue maternelle, du groupe autochtone, du statut d’Indien inscrit, du groupe de minorités visibles et de l’âge servent ensuite à déterminer la région spécifique de destination parmi les 49 autres régions. Si la région de destination comprend des réserves indiennes ou une région de l’Inuit Nunangat, des modèles supplémentaires qui tiennent compte soit du statut d’Indien inscrit ou du fait d’être d’identité inuite déterminent si l’individu ira ou non résider dans une réserve ou dans une communauté de l’Inuit Nunangat de la région de destinationNote 30. Les migrations intra-régionales sont de leur côté simulées au moyen de taux de migration spécifiques à l’origine et la destination qui tiennent compte de l’âge et, selon le cas, de l’identité autochtone et de la scolarité.

Les étapes suivantes consistent en une série d’ajustements aux résultats des modèles de régression, aux matrices origine-destination et aux vecteurs supplémentaires. Ils ont été effectués sur la même base de données que celle servant aux étapes précédentes, mais en mettant en relation l’information sur la mobilité au cours de la dernière année et celle sur la mobilité au cours des cinq dernières années. Ces ajustements ont été effectués avec l’objectif que les paramètres de migration de Demosim reproduisent, au départ d’une projection, la contribution de la migration interne nette à l’accroissement de la population de chacune des régions telle qu’elle a été observée en moyenne au cours des périodes 1996-2001, 2001-2006 et 2006-2011. Cela offre l’avantage, en faisant reposer les schèmes de migration régionaux sur une période plus longue, de réduire le poids des phénomènes conjoncturels exceptionnels susceptibles de modifier substantiellement les soldes migratoires une année donnée.

Émigration

Le module d’émigration vise à projeter l’émigration nette, laquelle se définit, selon les composantes du Programme des estimations démographiques (PED) de Statistique Canada, comme la somme de l’émigration et de l’émigration temporaire nette, de laquelle on soustrait l’émigration de retour. Le module d’émigration a été structuré d’une manière similaire aux modules de fécondité et de mortalité en ce qu’il est lui aussi constitué de taux de base qui sont combinés à des résultats de régression (voir l’encadré 3), du moins pour la population âgée de 18 ans et plus. Cela permet de tenir compte de plusieurs caractéristiques, notamment du statut d’immigrant, que l’on sait être un facteur prédisposant à émigrerNote 31. Pour cette population, les taux de base d’émigration ont été calculés par année d’âge et sexe à l’échelon national en divisant le nombre net d’émigrants estimé par le PED de Statistique Canada de 2002-2003 à 2011-2012 par la population excluant les résidents non permanentsNote 32 provenant de la même source pour la même périodeNote 33. Ils sont combinés aux résultats d’une régression à risques proportionnels (modèle de Cox) qui estime, au moyen des Données administratives longitudinales appariées aux données d’immigration de 1995 à 2010, la propension à émigrer de la population adulte selon le pays/région de naissance, le temps écoulé depuis l’immigration, la province ou territoire de résidence, l’âge et le sexe.

Pour la population de 17 ans et moins, des taux d’émigration nette ont été calculés par année d’âge, sexe et province ou territoire à partir des estimations de la population de 2002-2003 à 2011-2012.

Inscription au Registre des Indiens et reclassification de catégorie d’inscription au cours de la vie

Les modules touchant l’inscription au Registre des Indiens poursuivent trois objectifs distincts : 1) modéliser les inscriptions pouvant survenir au cours de la vieNote 34en raison de changements législatifs ou de l’accord reconnaissant la Première Nation Qalipu Mi’kmaqNote 35; 2) modéliser les reclassifications de 6(2) à 6(1) des catégories d’inscription pouvant survenir au cours de la vieNote 36; 3) modéliser l’inscription tardive de personnes qui avaient droit à l’inscription depuis leur naissance.

  1. Les inscriptions survenant au cours de la vie en raison de changements législatifs comprennent les inscriptions découlant des modifications de 1985 à la Loi sur les Indiens (C-31) et de la Loi sur l’équité entre les sexes relativement à l’inscription au Registre des Indiens (C-3), qui est entrée en vigueur en janvier 2011. Pour ces changements législatifs, des nombres-cibles d’inscriptions selon l’année d’inscription ont d’abord été établis. Pour l’inscription découlant de C-31, pour la période qui s’étale de mai 2011 à août 2014, les nombres-cibles correspondent aux inscriptions réelles survenues au cours de la période selon les données du Registre des Indiens. Pour les périodes suivantes, les nombres-cibles ont été calculés en poursuivant la tendance baissière moyenne de ces inscriptions observée dans les données du Registre des Indiens de 2007 à 2014. Pour C-3, on a également utilisé comme premières cibles les inscriptions qui sont survenues entre mai 2011 et août 2014 selon le Registre des Indiens. Pour les années suivantes, les nombres-cibles proviennent de projections de ce type d’inscriptions effectuées par Affaires autochtones et du Nord Canada. Pour l’inscription découlant de l’accord reconnaissant la Première Nation Qalipu Mi’kmaq, les nombres-cibles sont constitués des inscriptions qui sont survenues entre l’entrée en vigueur du décret du 22 septembre 2011 (date de création de la bande) et l’accord supplémentaire de juin 2013, dont l’impact sur le nombre d’inscriptions de Qalipu n’est pas connu à ce jour. Les cibles ayant été établies, on a identifié, dans la population de base, des personnes qui seront susceptibles de devenir inscrites en vertu de ces composantes parmi celles qui n’ont pas le statut d’Indien inscrit (selon des distributions spécifiques à chacune de ces composantes), puis on a déterminé à l’avance le moment de leur inscriptionNote 37. La vaste majorité des individus ainsi sélectionnés étaient, au départ, des Indiens non inscrits.
  2. Les reclassifications de catégorie d’inscription 6(2) à la catégorie 6(1) peuvent résulter de l’application de la loi C-3 ou de raisons diversesNote 38. La modélisation des reclassifications survenant en vertu de C-3 a été effectuée suivant une méthode semblable à celle qui vient d’être décrite quant à l’inscription en vertu de changements législatifs. Des nombres-cibles ont d’abord été établis selon l’âge, le sexe et l’année du changement. Pour la période allant de mai 2011 à août 2014, ceux-ci ont été déterminés à partir des reclassifications survenues au cours de la période selon le Registre des Indiens. Pour les années suivantes, les nombres-cibles de reclassifications varient au même rythme que les inscriptions en vertu de C-3. Pour les reclassifications de nature autre, on a calculé des taux annuels de reclassification selon l’âge et le sexe basés sur les données de 2010 du Registre des Indiens. Ceux-ci sont supposés constants tout au long de la projection, sauf de 2011 à 2014 où ils ont été ajustés pour refléter les reclassifications observées dans le Registre des Indiens.
  3. Les inscriptions tardives d’individus ayant un droit à l’inscription au Registre des Indiens depuis la naissance sont modélisées distinctement pour les enfants et les adultes. Chez les enfants nés en cours de simulation, la modélisation est effectuée en deux étapes. D’abord, afin d’identifier les individus potentiellement sujets à ce type d’inscription, on détermine parmi les naissances simulées les enfants qui auront le droit à l’inscription au RegistreNote 39. Ce droit est fonction de la catégorie d’inscription de la mère, du fait qu’elle soit ou non en union mixte au moment de la naissance de son enfant et des règles de transmission du statut d’Indien inscrit. Ceux qui ont droit à l’inscription mais qui n’ont pas le statut d’Indien inscrit à la naissance se voient attribuer une probabilité de s’inscrire au Registre des Indiens qui dépend de l’âge et du fait de résider ou non dans une réserve indienne. Ces probabilités ont été dérivées de manière à ce qu’elles puissent reproduire la progression selon l’âge observée à l’ENM de la proportion d’enfants ayant le statut d’Indien inscrit parmi ceux qui ont en principe droit à l’inscription, soit les enfants dont les deux parents sont inscrits ou dont l’un des deux parents est de catégorie 6(1)Note 40. Des taux d’inscription tardive dérivés des mêmes données sont également appliqués à certains enfants faisant partie de la population de base. Chez les adultes âgés de 19 ans ou plus, on applique aux populations à risque des taux d’inscription tardive selon l’âge et le sexe qui ont été obtenus en divisant le nombre annuel moyen d’inscriptions de ce type de 2008 à 2014 selon le Registre des Indiens par la population d’Indiens non inscrits vivant hors réserve et ne devant pas s’inscrire comme Qalipu ou pour des raisons législatives estimée en 2011.

Mobilité ethnique intragénérationnelle des Autochtones

Le module de mobilité ethnique intragénérationnelle des Autochtones vise à simuler les changements de déclaration du groupe autochtone lors des recensements de la population, lesquels sont responsables d’une part importante de l’accroissement du nombre de Métis et de Premières Nations depuis au moins 1986 au CanadaNote 41. Les paramètres de mobilité ethnique intragénérationnelle des Autochtones ont été calculés au moyen d’une méthode résiduelle appliquée aux recensements de 1996, 2001, 2006 et à l’ENM de 2011, ajustés pour le sous-dénombrement net. Elle consiste à calculer, pour chaque période de 5 ans, la part de l’accroissement des groupes autochtones qui demeure inexpliquée après que l’on ait tenu compte de la fécondité, de la mortalité et de la migration nette, puis à interpréter cette part inexpliquée comme provenant de changements dans la déclaration du groupe autochtone aux recensements (ou à l’ENM). Les gains nets des Métis et des Premières Nations ainsi obtenus ont été divisés par la population non autochtone, non immigrante et n’appartenant pas à un groupe de minorités visibles en début de période afin d’obtenir des probabilités de changement vers le groupe des Premières Nations et le groupe des Métis sur 5 ans et ce, en tenant compte de l’âge et de la région de résidence. On a ensuite effectué une moyenne des probabilités des trois périodes considérées (1996-2001, 2001-2006 et 2006-2011).Note 42

Mobilité religieuse intragénérationnelle

La mobilité religieuse intragénérationnelle réfère aux changements de religion survenant au cours de la vie des individus. Les probabilités de changer de religion au cours de la vie ont été estimées selon la religion, l’âge, le statut d’immigrant et le lieu de naissance en appliquant, à l’instar de la mobilité ethnique intragénérationnelle, une méthode résiduelle au Recensement de 2001 et à l’ENM de 2011 (et parallèlement aux recensements de 1991 et 2001) ajustés pour le sous-dénombrement netNote 43. Les pertes nettes des religions ayant perdu des effectifs par voie de mobilité religieuse au cours de la période ont été divisées par la population de ces religions en début de période pour obtenir des taux nets de « sortie » sur 10 ans. Les personnes ayant quitté une religion sont ensuite distribuées parmi les religions « gagnantes » proportionnellement aux gains nets enregistrés au cours de la même période par ces dernières.

Mobilité linguistique intragénérationnelle

Le module de mobilité linguistique intragénérationnelle modélise les changements pouvant survenir au cours de la vie quant à la langue parlée le plus souvent à la maison et la connaissance des langues officiellesNote 44. Il comprend deux ensembles de paramètres distincts :

  1. Les changements de langue parlée le plus souvent à la maison ont été estimés au moyen de modèles de régression logistique tirant parti des données provenant de l’appariement entre les recensements de 2001 et de 2006Note 45. Les modèles ont été stratifiés selon le statut d’immigrant, le fait de résider ou non au Québec et le profil linguistique en début de période défini en fonction de la langue parlée le plus souvent à la maison et la langue maternelleNote 46. Les modèles estimaient la probabilité d’avoir changé de langue parlée le plus souvent à la maison au cours des cinq années considérées en tenant compte de l’âge, du sexe, de la région de résidence, du statut des générations, de l’âge à l’immigration, de la période d’immigration, de l’origine géolinguistique des immigrants et de la connaissance des langues officielles. Seules les transitions les plus fréquentes ont été modélisées; les transitions s’étant révélées les moins fréquentes au vu des données de l’appariement entre les recensements de 2001 et de 2006 ne peuvent donc pas se produire en cours de simulationNote 47.
  2. Les changements quant à la connaissance des langues officielles ont été modélisés au moyen de régressions logistiques spécifiques au profil linguistique d’origine (défini cette fois en fonction de la connaissance des langues officielles et de la langue parlée le plus souvent à la maison), au statut d’immigrant et au fait de résider ou non au Québec. Les modèles sont estimés en utilisant les données de l’appariement entre les recensements de 2006 et de 2011, tiennent compte de l’âge, du sexe, du temps écoulé depuis l’immigration, de l’âge à l’immigration, du statut des générations, du lieu de naissance, du lieu de résidence, de la scolarité et de la langue maternelle. Encore ici, seules les transitions les plus fréquentes ont été modélisées, les autres n’étant donc pas possibles durant la simulationNote 48.

Acquisition de la citoyenneté canadienne

Dans le contexte de Demosim, l’acquisition de la citoyenneté canadienne réfère au processus par lequel les immigrants obtiennent leur citoyenneté par naturalisation après leur arrivée au pays. Cet événement a été modélisé en appliquant aux données de l’ENM de 2011 ajustées pour le sous-dénombrement net un modèle de régression logistique estimant la probabilité d’avoir obtenu la citoyenneté canadienne selon le nombre d’années écoulées depuis l’immigration, le lieu de naissance, la catégorie d’admission des immigrants, le groupe de minorités visibles et l’âge à l’immigration. En raison des règles régissant l’obtention de la citoyenneté par naturalisation, les immigrants qui s’établissent au Canada en cours de simulation ne peuvent obtenir leur citoyenneté avant que ne se soient écoulées trois années de résidence au pays. De plus, les données montrant que le pourcentage d’immigrants ayant la citoyenneté canadienne ne s’élève plus après quinze ans depuis l’obtention du statut d’immigrant, les taux d’obtention de la citoyenneté sont considérés nuls après quinze ans de résidence au pays.

Changement de niveau de scolarité

Un dernier événement projeté à l’aide de temps d’attente est le changement de niveau de scolarité. Les probabilités associées à cet événement ont été dérivées en combinant les données de l’Enquête sociale générale (ESG) de 2001 et celles de l’ENM de 2011 ajustées pour le sous-dénombrement net qui, ensemble, comprennent l’information nécessaire à la projection. Dans un premier temps, des probabilités de changer de niveau de scolarité selon l’année de naissance, l’âge, le sexe et le statut d’immigrant ont été obtenues de l’application de modèles de régressions logistiques aux données rétrospectives de l’ESG de 2001. La population de l’ESG de 2001 a ensuite été projetée jusqu’en 2011 en utilisant les probabilités précédemment calculées, lesquelles ont été calibrées en trois étapes distinctes. Une première calibration visait à reproduire exactement les distributions de l’ENM selon le niveau de scolarité, l’année de naissance, l’âge, le sexe et le statut d’immigrant. Une deuxième calibration a permis l’ajout de probabilités différentielles selon le groupe de minorités visibles, l’identité autochtone et le statut d’Indien inscrit permettant de reproduire les distributions de ces groupes à l’ENM. La troisième calibration avait pour sa part comme objectif l’ajout de différentiels par province et territoire de naissance.

Caractéristiques imputées annuellement

Certaines composantes de Demosim ne visent pas à projeter des évènements, mais plutôt à imputer des caractéristiques aux individus, nommément l’état matrimonial, le statut de chef de famille et de ménage ainsi que la participation à la population active. Ces caractéristiques sont attribuées à date fixe, une fois par année.

État matrimonial

L’état matrimonial est une variable qui est projetée essentiellement pour servir de déterminant à d’autres événements en cours de simulation, spécialement la fécondité, dont elle constitue un facteur explicatif clé. Le module d’état matrimonial est formé de modèles de régressions logistiques estimés sur les données de l’ENM de 2011 relatives à la population de 15 ans et plus. Les premiers modèles déterminent si l’individu est ou non en union. S’il est en union, d’autres modèles en déterminent le type (marié ou union libre). Les modèles sont stratifiés selon le sexe et le fait d’être ou non d’identité autochtone. Ils tiennent compte de l’âge, du nombre d’enfants au foyer, du statut d’immigrant, du statut des générations, du temps écoulé depuis l’immigration, du lieu de naissance, de la langue maternelle, du groupe de minorités visibles, de la religion, du groupe autochtone, du statut d’Indien inscrit et du lieu de résidence. Les probabilités dérivées de ces modèles évoluent au cours de la projection, sur la base des tendances observées dans les recensements de 2001 et 2006 et de l’ENM de 2011 (ajustés), lesquelles montrent notamment une propension grandissante des couples à choisir l’union libre. Le module d’état matrimonial trouve également son prolongement dans les paramètres d’union mixte qui servent à l’attribution de certaines caractéristiques, dont le statut des générations, aux nouveau-nés (voir la section intitulée « Création d’individus en cours de simulation »).Note 49

Chef de ménage

Un statut de chef de ménageNote 50 est attribué annuellement aux individus afin d’obtenir une projection du nombre de ménages privés selon certaines caractéristiques, dont la composition autochtone. La méthode des taux de chefsNote 51est appliquée pour établir un rapport entre le nombre de chefs de ménages et la population selon certaines des caractéristiques de la population projetée afin d’obtenir, par multiplication de ce taux à la population projetée, un nombre futur de ménages privés. Aux fins des présentes projections, des types de ménages selon une combinaison de caractéristiques du ménage (la composition autochtone, la taille du ménage et la présence de personnes de moins de 19 ansNote 52 ) ont d’abord été identifiés au sein des données de l’ENM de 2011. On a ensuite établi le compte du nombre de chefs de ménages de chacun de ces types selon l’âge, l’identité autochtone, le statut d’Indien inscrit, l’état matrimonial et le lieu de résidence, puis on l’a divisé par la population totale selon ces mêmes caractéristiques afin d’obtenir les taux de chefs servant à l’imputation annuelle du statut de chef de ménage en cours de simulationNote 53. Il est à noter que le statut de chef de ménage ne sert strictement qu’à dériver un nombre de ménages. Il n’est en effet pas utilisé comme déterminant d’autres événements en cours de simulation. C’est également le cas de la participation au marché du travail.

Participation à la population active

Le module de participation à la population active vise à imputer aux individus de 15 ans ou plus un statut quant à leur participation à la population active. Il a été conçu afin qu’il puisse tenir compte des écarts à cet égard entre les divers groupes projetés (Autochtones, groupes de minorités visibles, immigrants, etc.). Il comprend deux ensembles de paramètres. Le premier est constitué de taux de participation à la population active selon le sexe et le groupe d’âge provenant des données de l’Enquête sur la population active (EPA) auxquels un ajustement a été appliqué pour tenir compte des populations exclues de l’enquête, notamment les réserves indiennes. Le second est constitué des résultats de régressions logistiques qui estiment, sur la base des données d’un fichier qui combine les données des recensements de 2001 et 2006 puis de l’ENM de 2011 (ajustées) et séparément selon le sexe et le groupe d’âge, la probabilité d’être dans la population active selon les variables suivantes : groupe autochtone, statut d’Indien inscrit, groupe de minorités visibles, statut d’immigrant, période d’immigration, statut des générations, lieu de naissance, état matrimonial, présence d’enfant et âge du plus jeune enfant, scolarité, connaissance des langues officielles et lieu de résidence. Ces deux séries de paramètres sont combinées l’une à l’autre pour déterminer, chaque premier janvier, la participation à la population active au cours de l’année à suivre. Une version alternative de ce module, basée seulement sur l’ENM de 2011, inclut également la catégorie d’admission des immigrants.

Création d’individus en cours de simulation

En plus des individus présents dans la population de base de Demosim, des individus peuvent être ajoutés à la population en cours de simulation en conséquence des naissances, de l’immigration et de l’arrivée de résidents non permanents. L’ajout de ces individus est effectué par création d’enregistrements complets, c’est-à-dire d’individus ayant toutes les caractéristiques nécessaires à leur projection par Demosim. Le processus d’assignation de caractéristiques à ces nouveaux individus est décrit ci-dessous.

Création des nouveau-nés

La création des nouveau-nés issus des naissances survenant après le début de la simulation requiert l’usage de méthodes qui diffèrent suivant la caractéristique à attribuer aux nouveaux individus. D’abord, plusieurs caractéristiques à attribuer aux nouveau-nés ne nécessitent le calcul d’aucun paramètre et peuvent être assignées automatiquement, par exemple l’état matrimonial (hors union), la scolarité (inférieure au secondaire), le statut d’immigrant (non-immigrant), la citoyenneté canadienne (citoyen canadien à la naissance), etc. D’autres caractéristiques sont assignées de façon probabiliste. Le sexe de l’enfant est déterminé par l’application d’un rapport de masculinité à la naissance de 105 garçons pour 100 filles, tel qu’on l’observe au Canada depuis plusieurs décennies. Dans le cas de la religion, des trois variables linguistiques, du groupe de minorités visibles et du groupe autochtone, l’assignation se fait sur la base de paramètres dérivés de la méthode du décompte des enfants au foyer appliquée aux données ajustées de l’ENM de 2011. Ayant lié au sein de cette source de données les plus jeunes enfants à la femme la plus susceptible d’en être la mère, il devient possible de calculer la probabilité que l’enfant ait telle ou telle caractéristique en fonction de celles de la mère (voir les caractéristiques considérées au tableau 2). Des matrices et des vecteurs de transition ont ainsi été créés aux fins de l’attribution de la religion, du groupe de minorités visibles et du groupe autochtone. Pour ce qui est des variables linguistiques, les probabilités relatives aux transitions les plus fréquentes proviennent de modèles de régressions logistiques multinomiales, les autres probabilités provenant de matrices de transition. Afin d’assurer la cohérence entre les variables linguistiques, la langue maternelle et la langue parlée le plus souvent à la maison sont attribuées simultanément au moyen des mêmes modèlesNote 54. Toujours pour la même raison, les modèles de transmission de la connaissance des langues officielles tiennent compte de résultat des modèles précédents, en plus des caractéristiques de la mère.

Les méthodes d’attribution du statut d’Indien inscrit, de la catégorie d’inscription et du statut des générations se distinguent des méthodes précédentes en ce qu’elles tiennent également compte, indirectement, d’informations relatives au père de l’enfant. Dans Demosim, les naissances sont générées par les femmes, et les femmes ne sont pas liées à un conjoint, ce qui fait qu’il n’est pas possible de connaître directement les caractéristiques du père au moment d’une naissance. On peut cependant associer à la mère des attributs du conjoint par le biais d’unions mixtes, ce qui est fait dans Demosim au moment de la naissance d’un enfant.

Un premier module d’unions mixtes vise à déterminer si la mère est en union avec un Indien inscrit de catégorie 6(1), de catégorie 6(2) ou une personne n’ayant pas le statut d’Indien inscrit. La probabilité qu’une mère soit dans l’un ou l’autre de ces types d’union est estimée à l’aide d’un fichier dérivé des microdonnées ajustées de l’ENM de 2011 qui, tirant parti de l’information sur la relation entre les membres d’une même famille de recensement, crée un lien entre les femmes en union ayant donné naissance à un enfant au cours de la dernière année, leur conjoint et leur(s) enfants(s). Les probabilités sont calculées en tenant compte de l’état matrimonial, du statut d’Indien inscrit combiné à la catégorie d’inscription, et de la région de résidence (dans une réserve ou hors réserve) de la mère, de même que du groupe autochtone et du statut de minorités visibles de l’enfant. Des probabilités ont aussi été calculées avec le Recensement de 2001 afin d’établir des tendances relatives aux unions mixtes selon le statut d’Indien inscrit et le fait de résider ou non dans une réserve. Le statut d’Indien inscrit (incluant la catégorie d’inscription) est ensuite attribué aux nouveau-nés de manière probabiliste au moyen de matrices de transition qui tiennent ainsi compte du type d’union mixte de la mère, en plus d’autres caractéristiques de la mère et de l’enfant (tableau 2Note 55).

Un second module d’union mixte détermine, en utilisant la même source de données, la probabilité que la femme soit en union avec un conjoint dont le statut d’immigrant est identique ou différent du sien au moment de la naissance de son enfant, afin de déterminer le statut des générations de ce dernier. Le module est constitué de modèles de régressions logistiques qui tiennent compte de l’âge, de la religion, du groupe de minorités visibles, du groupe autochtoneNote 56, du temps écoulé depuis l’immigration, de la langue maternelle et celle parlée le plus souvent à la maison, de la présence d’enfants en jeune âge au foyer et du lieu de résidenceNote 57. Le statut des générations est par la suite attribué de la manière suivante au nouveau-né : il est de génération 2 si la mère est une immigrante qui n’est pas en union mixte, de génération 2,5 si la mère est en union mixte et de génération 3 ou plus si la mère n’est ni immigrante ni en union mixte.

Immigration

L’immigration nécessite elle aussi la création d’individus possédant toutes les caractéristiques requises pour assurer leur simulation suite à leur arrivée au pays. Ce module comprend deux dimensions principales. D’abord, un nombre de nouveaux arrivants est projeté annuellement. Ensuite, les caractéristiques de ces nouveaux arrivants sont déterminées au moyen d’une méthode d’imputation par donneurs, les donneurs étant sélectionnés parmi les immigrants faisant partie de la population de base de Demosim. Il en résulte une population immigrante projetée dont la composition est représentative de la population immigrante du bassin de donneurs, ce bassin pouvant être un sous-ensemble de la population immigrante, par exemple les immigrants admis récemment. Des ajustements sont également apportés à certaines des caractéristiques qui sont susceptibles d’avoir changé entre le moment de l’immigration et le moment de l’enquête servant de base à Demosim (l’ENM de 2011) afin qu’elles soient au plus près de ce qu’elles étaient au moment de l’arrivée. Par exemple, lors de la création d’un nouvel arrivant, l’âge qui est attribué au nouvel arrivant est l’âge à l’immigration du donneur (et non son âge), l’état matrimonial est imputé dès l’arrivée en utilisant les paramètres d’imputation annuelle de l’état matrimonial de Demosim, la scolarité à l’arrivée est imputée avec le module de scolarité de Demosim.

Résidents non permanents

Enfin, la dernière composante qui requiert la création d’individus, l’arrivée de nouveaux résidents non permanents, fonctionne d’une manière similaire à l’immigration. La projection des résidents non permanents se fait, comme pour les immigrants, en deux étapes : 1) un gain annuel net de résidents non permanents est déterminé; 2) les caractéristiques des nouveaux résidents non permanents sont imputées au moyen de donneurs, les donneurs étant sélectionnés parmi les résidents non permanents faisant partie de la population de base de DemosimNote 58.

Pour en savoir plus sur Demosim

Pour en connaître davantage sur la version 2017 de Demosim, il est possible de consulter les rapports analytiques intitulés Immigration et diversité : projections de la population du Canada et de ses régions, 2011 à 2036 (Statistique Canada 2017-1) et Projections linguistiques pour le Canada, 2011 à 2036 (Statistique Canada 2017-2). La description qui y est faite de certains concepts puis des hypothèses et scénarios sélectionnés constituent un complément aux descriptions du présent document.

Il est également possible de contacter directement la Division de la démographie de Statistique Canada, soit par courriel (statcan.demography-demographie.statcan@canada.ca) ou par téléphone (1-866-767-5611).

Bibliographie

AMOREVIETA-GENTIL, Marilyn, David DAIGNAULT, Norbert ROBITAILLE et Robert BOURBEAU. 2014. La mortalité des Indiens inscrits (1989-2008), rapport du Groupe d’études sur la dynamique démographique des Indiens inscrits (GEDDII), Université de Montréal, Département de démographie.

AYDEMIR, Abdurrahman et Chris ROBINSON. 2006. Retour et reprise de migration chez les hommes en âge de travailler, no 11F0019 au catalogue de Statistique Canada.

BÉLANGER, Alain, Éric CARON-MALENFANT, Laurent MARTEL et René VÉZINA. 2008. « Projecting Ethno- Cultural Diversity of the Canadian Population Using a Microsimulation Approach », compte-rendu de l’atelier de l’UNECE/Eurostat sur les projections démographiques à Bucarest (Roumanie).

BÉLANGER, Alain et Stéphane GILBERT. 2003. « La fécondité des immigrantes et de leurs filles nées au Canada », Rapport sur l’état de la population du Canada, 2002, no 91-209 au catalogue de Statistique Canada.

BOHNERT, Nora, Patrice DION et Jonathan CHAGNON. 2014. « Projection de l’émigration », dans BOHNERT, Nora, Jonathan CHAGNON, Simon COULOMBE, Patrice DION et Laurent MARTEL (éditeurs), Projections démographiques pour le Canada (2013 à 2063), les provinces et les territoires (2013 à 2038) : rapport technique sur la méthodologie et les hypothèses, no 91-620 au catalogue de Statistique Canada.

BOUCHER, Alexandre, Norbert ROBITAILLE et Éric GUIMOND. 2009. « La mobilité ethnique intergénérationnelle des enfants de moins de 5 ans chez les populations autochtones, Canada, 1996 et 2001 », Cahiers québécois de démographie, volume 38, no 2.

BRITISH COLUMBIA PROVINCIAL HEALTH OFFICER. 2012. The Health and Well-Being of the Aboriginal Population : Interim Update, Provincial Health Officer’s Special Report.

CARON-MALENFANT, Éric, Anne GOUJON et Vegard SKIRBEKK. À paraître. « The religious mobility of immigrants in Canada ».

CARON-MALENFANT, Éric. 2015. « Le modèle de projections démographiques Demosim : mise à jour et nouveaux développements », Actes du Symposium international de 2014 sur les questions de méthodologie de Statistique Canada : Au-delà des méthodes traditionnelles d’enquêtes : l’adaptation à un monde en évolution.

CARON-MALENFANT, Éric et Alain BÉLANGER. 2006. « La fécondité des femmes de minorités visibles au Canada », Rapport sur l’état de la population du Canada, 2003 et 2004, no 91-209 au catalogue de Statistique Canada.

CARON-MALENFANT, Éric, Patrice DION, André LEBEL et Dominic GRENIER. 2011. « Immigration et structure par âge de la population canadienne : quelles relations? », Cahiers québécois de démographie, volume 40, no 2.

CARON-MALENFANT, Éric, Simon COULOMBE, Eric GUIMOND, Chantal GRONDIN et André LEBEL. 2014. « La mobilité ethnique des Autochtones du Canada entre les recensements de 2001 et 2006 », Population, volume 69, no 1.

CYR, André, Julien BÉRARD-CHAGNON, Patrice DION, Dominic GRENIER et Éric CARON-MALENFANT. 2010. Des calculs démographiques traditionnels aux projections par microsimulation, atelier présenté au Symposium de méthodologie de Statistique Canada de 2010.

DESPLANQUES, Guy. 1993. « Mesurer les disparités de fécondité à l’aide du seul recensement », Population, volume 48, no 6.

DION, Patrice, Éric CARON-MALENFANT, Chantal GRONDIN et Dominic GRENIER. 2015. « Long-Term Contribution of Immigration to Population Renewal in Canada: A Simulation », Population and Development Review, volume 41, no 1.

DION, Patrice, Nora BOHNERT, Simon COULOMBE et Laurent MARTEL. 2014. « Projection de la mortalité », dans BOHNERT, Nora, Jonathan CHAGNON, Simon COULOMBE, Patrice DION et Laurent MARTEL (éditeurs), Projections démographiques pour le Canada (2013 à 2063), les provinces et les territoires (2013 à 2038) : rapport technique sur la méthodologie et les hypothèses, no 91-620 au catalogue de Statistique Canada.

GRABILL, Wilson R. et Lee Jay CHO. 1965. « Methodology for the Measurement of Current Fertility from Population Data on Young Children », Demography, volume 2, no 1.

GUIMOND, Eric. 1999. « Mobilité ethnique et croissance démographique des populations autochtones du Canada de 1986 à 1996 », Rapport sur l’état de la population du Canada, 1998 et 1999, no 91-209 au catalogue de Statistique Canada.

GUIMOND, Eric, Norbert ROBITAILLE et Sacha SENÉCAL. 2007. « Définitions floues et explosion démographique chez les populations autochtones du Canada de 1986 à 2001 », article présenté à la conférence Statistiques sociales et diversité ethnique co-organisée par le Centre interuniversitaire québécois de statistiques sociales (CIQSS) et l’Institut national d’études démographiques (INED).

HOULE, René et Jean-Pierre CORBEIL. 2013. Document méthodologique sur les données linguistiques du Recensement de 2011, no 98-314-X2011051 au catalogue de Statistique Canada.

LEPAGE, Jean-François. 2011. « L’oubli des langues maternelles : les données du recensement sous-estiment-elles les transferts linguistiques? », Cahiers québécois de démographie, volume 40, no 2.

LI, Nan et Ronald LEE. 2005. « Coherent Mortality Forecast for a Group of Populations : An Extension of the Lee-Carter Method », Demography, volume 42, no 3.

MARTEL, Laurent, Éric CARON-MALENFANT, Jean-Dominique MORENCY, André LEBEL, Alain BÉLANGER et Nicolas BASTIEN. 2011. « La population active canadienne : tendances projetées à l’horizon 2031 », L’Observateur économique canadien, no 11-010 au catalogue de Statistique Canada, août 2011.

MORENCY, Jean-Dominique. 2015. « Projections des familles et ménages autochtones au Canada », Actes du Symposium international de 2014 sur les questions de méthodologie de Statistique Canada : Au-delà des méthodes traditionnelles d’enquêtes : l’adaptation à un monde en évolution.

MORENCY, Jean-Dominique et Éric CARON-MALENFANT. 2014. « Variations de la fécondité selon diverses caractéristiques au recensement », présentation au colloque de l’Association des démographes du Québec, Congrès de l’ACFAS 2014 (Montréal).

NATIONS UNIES. 1973. Manuel VII. Méthode de projections des ménages et des familles, Études démographiques no 54, ST/OA/SERA, New York.

RAM, Bali. 2004. « New Estimates of Aboriginal Fertility 1966-1971 to 1996-2001 », Canadian Studies in Population, volume 31, no 4.

SPIELAUER, Martin. 2010. « Persistence and Change of the Relative Difference in Educational Attainment by Ethnocultural Group and Gender in Canada », Vienna Yearbook of Population Research, volume 8.

SPIELAUER, Martin. 2014. « The Relation Between Education and Labour Force Participation of Aboriginal Peoples: A Simulation Analysis Using the Demosim Population Projection Model », Canadian Studies in Population, volume 41, no 1-2.

STATISTIQUE CANADA. 2005. Projections de la population des groupes de minorités visibles, Canada, provinces et régions, 2001 à 2017, no 91-541 au catalogue de Statistique Canada.

STATISTIQUE CANADA. 2010. Projections de la diversité de la population canadienne, 2006 à 2031, no 91-551 au catalogue de Statistique Canada.

STATISTIQUE CANADA. 2011. Projections de la population selon l’identité autochtone au Canada, 2006 à 2031, no 91-552 au catalogue de Statistique Canada.

STATISTIQUE CANADA. 2012. Dictionnaire du recensement : Année de recensement 2011, no 98-301 au catalogue de Statistique Canada.

STATISTIQUE CANADA. 2013. Dictionnaire de l’Enquête nationale auprès des ménages, 2011, no 99-000 au catalogue de Statistique Canada.

STATISTIQUE CANADA. 2014. Projections démographiques pour le Canada (2013 à 2063), les provinces et les territoires (2013 à 2038), no 91-520 au catalogue de Statistique Canada.

STATISTIQUE CANADA. 2015. Rapport technique du recensement : Couverture. Recensement de 2011, no 98-303 au catalogue de Statistique Canada.

STATISTIQUE CANADA. 2015-2. Projections de la population et des ménages autochtones au Canada, 2011 à 2036, no 91-552 au catalogue de Statistique Canada.

STATISTIQUE CANADA. 2015-3. Demosim : un aperçu des méthodes et sources de données : Demosim 2015, no 91-621 au catalogue de Statistique Canada.

STATISTIQUE CANADA. 2016. Méthodes d’estimation de la population et des familles à Statistique Canada, no 91-528 au catalogue de Statistique Canada.

STATISTIQUE CANADA. 2017-1. Immigration et diversité : projections de la population du Canada et de ses régions, 2011 à 2036, no 91-551 au catalogue de Statistique Canada.

STATISTIQUE CANADA. 2017-2. Projections linguistiques pour le Canada, 2011 à 2036, no 89-657 au catalogue de Statistique Canada.

TJEPKEMA, Michael et Russell WILKINS. 2011. « Espérance de vie restante à l’âge de 25 ans et probabilité de survie jusqu’à l’âge de 75 ans, selon la situation socioéconomique et l’ascendance autochtone », Rapports sur la santé, volume 22, no 4.

UNITED NATIONS. 1973. Manual VII. Methods of Projecting Households and Families, Demographic Studies no 54 ST/OA/SERA, New York.

VAN IMHOFF, Evert et Wendy POST. 1997. « Méthodes de micro-simulation pour des projections de population », Population, 52e année, no 4.

WILKINS, Russell, Michael TJEPKEMA, Cameron MUSTARD et Robert CHOINIÈRE. 2008. « Étude canadienne de suivi de la mortalité selon le recensement, 1991 à 2001 », Rapports sur la santé, volume 19, no 3.

WILLEKENS, Frans. 2011. « La microsimulation dans les projections de population », Cahiers québécois de démographie, volume 40, no 2.

Glossaire

Date de modification :