Quand la microsimulation dynamique est-elle l'approche de simulation appropriée?

Chaque fois que nous étudions la dynamique d’un système constitué d’unités plus petites, la microsimulation est une approche possible — mais quand cela vaut‑il la peine de créer des milliers ou des millions de micro-unités? À la présente section, nous donnons trois réponses à cette question, la première axée sur l’hétérogénéité de la population, la deuxième, sur la difficulté d’agréger les relations comportementales et la troisième, sur les antécédents individuels.

Hétérogénéité de la population

La microsimulation est le mode de modélisation privilégié si les individus sont différents, si les différences importent et si le nombre de combinaisons possibles de caractéristiques prises en considération est trop grand pour diviser la population en un nombre pratique de groupes.

La théorie macroéconomique classique est en majeure partie fondée sur l’hypothèse que le secteur des ménages peut être représenté par un agent représentatif. L’hypothèse est que les individus sont identiques ou, dans le cas de modèles de générations chevauchantes, qu’ils ne se distinguent que par l’âge. (Chaque cohorte est représentée par un agent représentatif.) Cependant, cette approche n’est pas applicable si les distributions à un niveau plus fin de détail ont de l’importance. Imaginons que nous souhaitons étudier la viabilité et l’effet distributionnel du régime d’avantages fiscaux. S’il n’existe qu’un seul individu représentatif et que le régime d’avantages fiscaux est équilibré, cette personne moyenne recevra en avantages et en services ce qu’elle verse en impôts et en contributions au régime d’assurance sociale (certaines de ses heures de travail étant consacrées à l’administration du système). Pour modéliser les recettes fiscales, nous devons tenir compte de l’hétérogénéité de la population — si l’impôt sur le revenu est progressif, les recettes fiscales dépendent non seulement du revenu total, mais aussi de sa distribution. Quand nous concevons une réforme fiscale, nous visons habituellement à répartir les fardeaux différemment. Nous devons représenter l’hétérogénéité de la population dans le modèle pour déterminer quels seront les gagnants et les perdants de la réforme.

La microsimulation n’est pas le seul mode de modélisation privilégié pour traiter l’hétérogénéité. L’autre option consiste à grouper les personnes par combinaisons de caractéristiques pertinentes au lieu de les représenter individuellement. Nous utilisons pour cela des modèles à cellules. Une analogie directe existe entre les deux approches en ce qui concerne le stockage des données : un ensemble d’enregistrements individuels contre un tableau croisé dans lequel chaque cellule correspond à une combinaison de caractéristiques. Nous pouvons prendre comme exemple un recensement de population. Si nous nous intéressons uniquement à une ventilation selon l’âge et le sexe, nous pourrions procéder à un recensement en comptant les personnes présentant chaque combinaison de caractéristiques. Le recensement complet pourrait être présenté dans un seul tableau sauvegardé sous forme de tableur. Cependant, si nous voulons ajouter d’autres caractéristiques que l’âge et le sexe à notre description, le nombre de cellules du tableau augmentera exponentiellement, rendant l’approche de moins en moins pratique. Par exemple, 12 variables ou caractéristiques comportant chacune 6 niveaux nous obligeraient à grouper notre population dans plus de 2 milliards de cellules (6^12 = 2 176 782 336). Nous nous retrouverions rapidement avec un plus grand nombre de cellules que de personnes. En présence de variables continues (p. ex.le revenu), l’approche du groupement devient carrément impossible sans perte d’information, puisque nous devrions grouper des données (c.‑à‑d. définir des niveaux de revenu). La solution consiste à garder les caractéristiques de chaque personne dans un enregistrement individuel, qui correspond au questionnaire et, en dernière analyse, à une ligne dans une base de données.

Ces deux types de représentation des données (un tableau croisé par opposition à un ensemble d’enregistrements individuels) correspondent aux deux types de simulation dynamique. Dans les modèles à cellules, nous mettons à jour un tableau; dans les modèles de microsimulation, nous modifions les caractéristiques de chaque enregistrement (et créons un nouvel enregistrement à chaque événement de naissance). Dans le premier cas, nous devons trouver des formules pour représenter la façon dont l’occupation de chaque cellule évolue au cours du temps; dans le second, nous devons modéliser les changements individuels au cours du temps. Les deux approches ont pour but de modéliser les mêmes processus, mais à des niveaux différents. La modélisation au niveau macro pourrait nous épargner beaucoup de travail, mais elle n’est possible que sous des conditions contraignantes, puisque les relations comportementales individuelles proprement dites doivent être agrégées, ce qui n’est pas toujours possible. Sinon, aucune formule n’existera pour décrire comment l’occupation de chaque cellule évolue au cours du temps.

La comparaison de l’approche de microsimulation aux modèles à cellules facilite sa compréhension. Nous approfondissons ci‑après cette comparaison en prenant des projections démographiques comme exemple. Dans une approche fondée sur des cellules, si nous ne nous intéressons qu’à des taux de population selon l’âge, la mise à jour d’un tableau agrégé (une pyramide de population) ne requiert que quelques éléments d’information, à savoir les taux de fécondité par âge, les taux de mortalité par âge et la répartition de la population par âge à la période précédente. En l’absence de migration, la population d’âge x à la période t est la population survivante qui était d’âge x­1 à la période t­1. Pour une hypothèse donnée de mortalité, nous pouvons calculer directement la taille future prévue de la population d’âge x. Dans une approche de microsimulation, la survie correspond à une probabilité individuelle (ou à un taux, si nous faisons la modélisation en temps continu). L’hypothèse que 95 % d’un groupe d’âge seront encore en vie dans un an résulte en un processus stochastique au niveau micro — les individus peuvent être soit en vie soit décédés. Nous tirons un nombre aléatoire compris entre 0 et 1 — s’il est inférieur au seuil de 0,95, la personne simulée survit. Ce genre d’exercice porte le nom de simulation Monte Carlo. En raison de cet élément aléatoire, chaque expérience de simulation produit un résultat agrégé légèrement différent, qui converge vers la valeur prévue à mesure que nous augmentons la taille de la population simulée. Cette différence entre les résultats agrégés, appelée variation Monte Carlo, est un attribut type de la microsimulation.

Le problème de l'agrégation

La microsimulation est le choix de modélisation adéquat si les comportements sont complexes au niveau macro, mais qu’ils sont mieux compris au niveau micro.

De nombreux comportements sont plus faciles à modéliser au niveau micro, car c’est à ce niveau que sont prises les décisions et définies les règles fiscales. Très souvent, les comportements sont aussi plus stables au niveau micro auquel il n’existe aucune interférence des effets de composition. Même une stabilité totale au niveau micro ne correspond pas automatiquement à la stabilité au niveau macro. Par exemple, si l’on examine le niveau d’études, un des meilleurs prédicteurs des décisions en matière d’éducation est le niveau d’études des parents. Donc, si nous observons une expansion éducationnelle — par exemple une hausse du taux d’obtention d’un diplôme — au niveau de la population, celle‑ci n’est pas forcément due à un changement de comportement de niveau micro; elle peut tenir entièrement à l’évolution de la composition de la génération parentale.

Les règlements en matière d’impôts et de sécurité sociale relient les règles de manière non linéaire aux caractéristiques individuelles et familiales, ce qui empêche l’agrégation de leurs opérations. De nouveau, il n’existe aucune formule pour calculer directement l’effet d’une réforme ou la viabilité d’un système, même si l’on ignore les problèmes de distribution. Pour calculer les recettes fiscales totales, nous devons connaître la composition de la population selon le revenu (impôts progressifs), les caractéristiques familiales (enfants et conjoints à charge) et toutes les autres caractéristiques qui ont une incidence sur le calcul de la dette d’impôt individuelle. En recourant à la microsimulation, nous pouvons modéliser un tel système à n’importe quel niveau de détail au niveau micro, puis agréger les impôts, cotisations et avantages individuels.

Biographies individuelles

La microsimulation est le seul choix de modélisation si les biographies individuelles importent, c’est‑à‑dire si les processus possèdent une mémoire.

Le décrochage scolaire est influencé par les expériences antérieures de décrochage, la mortalité, par les antécédents d’usage du tabac, les pensions de vieillesse, par les antécédents de cotisation individuels, et le chômage, par les périodes antérieures de chômage et leur durée. Les processus auxquels s’intéressent les spécialistes des sciences sociales sont fréquemment de ce type, c’est‑à‑dire qu’ils ont une mémoire. Dans de tels processus, les événements survenus dans le passé peuvent exercer une influence directe sur ce qui se passera dans l’avenir, ce qui empêche l’utilisation de modèles à cellules, parce qu’une fois que les données d’une cellule sont saisies, toute l’information sur l’appartenance à des cellules antérieures est perdue. Dans de tels cas, la microsimulation devient la seule option de modélisation disponible.