3 Données et cadre d'analyse

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

L'approche empirique est motivée par le modèle de régression vers la moyenne utilisé dans l'analyse économique pour mesurer la mobilité des gains, du revenu et d'autres indicateurs de la situation socioéconomique d'une génération à l'autre, comme le font, par exemple, Corak (2004) et Mulligan (1997). Ce modèle est donné par l'équation (1), où Y représente un résultat d'intérêt, dans notre cas les années de scolarité, et t est un indice de génération.

(1)

Description

Si l'on prend l'exemple de la scolarité, dans cette équation, le niveau de scolarité de l'enfant de la famille i serait Y_i,t, qui est égal au nombre moyen d'années de scolarité des enfants de la génération t, représenté par α_t, auquel s'ajoute deux facteurs déterminant l'écart par rapport à cette moyenne, c'est-à-dire une fraction du niveau de scolarité des parents ( β Y_i,t-₁ ) et d'autres influences qui ne sont pas associées au niveau de scolarité des parents ( ε_i,t ).

Le niveau moyen de scolarité évolue au fil du temps et il est très probable qu'un grand nombre de membres d'une génération seront plus scolarisés que leurs parents, ce qui est traduit dans l'équation (1) par la valeur de α . Cependant, fait tout aussi important, l'équation reflète l'idée que le niveau de scolarité d'une personne est malgré tout relié à celui de ses parents. C'est ce qu'indique la valeur de β, qui représente la fraction de l'avantage au chapitre de la scolarité transmise en moyenne d'une génération à l'autre. Autrement dit, β résume en un seul chiffre le degré de mobilité intergénérationnelle du niveau de scolarité dans une société. Il pourrait théoriquement être égal à n'importe quel nombre réel. Une valeur positive indiquerait la persistance intergénérationnelle du niveau de scolarité, où un niveau de scolarité plus élevé des parents est associé à un niveau de scolarité plus élevé des enfants; une valeur négative indiquerait une inversion intergénérationnelle du revenu, où un niveau de scolarité plus élevé des parents est associé à un niveau de scolarité plus faible des enfants. En fait, les ouvrages publiés montrent que ce coefficient a toujours été positif, même s'il varie de façon significative d'un pays à l'autre, et selon le niveau de développement comme, par exemple, dans l'analyse de plus de 30 pays par Hertz et coll. (2007) ³.

Nous utilisons ce cadre de deux façons distinctes : indirectement, grâce à un estimateur groupé tiré du recensement, et directement, grâce aux données déclarées par les personnes sur le niveau de scolarité de leurs parents dans l'Enquête sur la diversité ethnique. Nous nous inspirons de l'analyse américaine de Card, DiNardo et Estes (2000) et nous définissons les immigrants de deuxième génération comme étant les personnes nées au Canada dont la mère et le père sont tous deux nés en dehors du Canada. Les immigrants de première génération sont définis comme étant ceux qui ont immigré au Canada, quel que soit l'âge qu'ils avaient à leur arrivée. En commençant, il convient de souligner que les données du Recensement de 2001 ne permettent pas d'établir de lien direct entre les résultats des enfants à l'âge adulte et la situation des parents quand ils élevaient leur famille. Toutefois, elles permettent de construire un estimateur « groupé » reliant les résultats moyens des adultes de deuxième génération en 2001 aux caractéristiques moyennes des adultes immigrants compris dans le Recensement de 1981, qui pourraient être leurs parents. Une analyse de la mobilité intergénérationnelle des immigrants au moyen de données détaillées sur le pays d'origine selon ces lignes est également donnée dans Borjas (1993) et Card, DiNardo et Estes (2000), aux États-Unis, ainsi que dans les recherches sur la mobilité intergénérationnelle des gains des enfants des immigrants canadiens, dans Aydemir, Chen, Corak (à paraître).

Les fichiers d'analyse du recensement sont construits de la façon suivante. L'échantillon de pères immigrants est tiré du Recensement de 1981 et est limité aux individus dont la conjointe était également immigrante et qui ont des enfants de 5 à 17 ans nés au Canada. Nous procédons à une régression par les moindres carrés pour calculer les valeurs prévues de Y_i,t-₁ pour chaque pays d'origine pour les individus satisfaisant à ces critères. De façon correspondante, l'échantillon d'immigrants de deuxième génération comprend les individus âgés de 25 à 37 ans en 2001, dont les parents sont tous deux immigrants. De même, les valeurs prévues de Y_i,t sont calculées pour chaque pays mentionné par les répondants comme étant le pays d'origine du père.

Comme la variation des variables de résultat peut être due aux différences de caractéristiques démographiques entre les groupes de pays, nous avons calculé le nombre d'années de scolarité et les gains corrigés de l'effet de l'âge et de la région pour chaque groupe de pays d'origine. Pour les parents immigrants, nous calculons la régression des variables d'intérêt — années de scolarité et aussi logarithme des gains hebdomadaires — sur l'âge, le carré de l'âge, des variables nominales de pays d'origine, des variables nominales de province de résidence au Canada et des variables nominales de pays d'origine avec l'âge et avec le carré de l'âge. L'inclusion de ces termes d'interaction permet de tenir compte des différences de profils de cycle de vie entre pays. Puis, nous calculons les valeurs prévues du nombre d'années de scolarité ou des gains pour chaque pays d'origine à l'âge de 40 ans, dans le cas des personnes résidant en Ontario, la province la plus populeuse ⁴. Pour les fils et les filles de deuxième génération, nous produisons des résultats corrigés des effets de l'âge et de la région par régression du nombre d'années de scolarité sur l'âge, le carré de l'âge, des variables nominales de pays d'origine du père et des variables nominales de région, puis nous calculons les résultats prévus pour chaque groupe de pays pour un individu de 31 ans vivant en Ontario. Ces points du cycle de vie correspondent à ceux utilisés dans Aydemir, Chen, Corak (à paraître) et dans la majeure partie des ouvrages publiés sur la mobilité intergénérationnelle des gains au Canada, ainsi qu'à la suggestion de Haider et Solon (2006), qui examinent les biais du cycle de vie dans le calcul du revenu permanent.

Pour éviter les problèmes que posent les échantillons de petite taille, nous agrégeons certains pays pour lesquels le nombre d'observations est inférieur à 30 dans les groupes, et nous arrivons à un total de 70 pays/régions. L'agrégation est faite séparément pour les fils et les filles. Nous utilisons ces 70 points de données pour estimer l'équation (1) pour les fils et pour les filles en utilisant comme variable de résultat les années de scolarité, pondérées selon les parts de la population. Comme il est mentionné précédemment, nous calculons aussi les gains des parents de la même façon, ce qui offre la possibilité d'établir un lien à la fois entre le niveau de scolarité des parents et les gains et le niveau de scolarité des enfants.

L'estimateur de données groupées de l'équation (1) comporte à la fois des avantages et des inconvénients. Ceux-ci sont abordés dans Card, DiNardo et Estes (2000). L'inconvénient le plus évident est le décalage possible entre les générations. Les « parents » sont les parents potentiels des enfants et il pourrait y avoir un décalage dans leur représentativité des parents réels en raison du décès ou de l'émigration. Parallèlement, toutefois, il convient de souligner que l'important échantillon dont nous disposons grâce au fichier complet à 20 % du recensement réduit ce problème dans la plus large mesure possible dans les ouvrages publiés avec lesquels nous sommes familiers. De façon plus particulière, il s'agit d'une correspondance plus étroite que celle possible à partir des données américaines. Par exemple, Card, DiNardo et Estes (2000) sont en mesure d'élaborer une structure similaire pour seulement 30 pays d'origine, et les données les obligent à établir un lien entre les gains et le niveau de scolarité de tous les immigrants et tous les individus de deuxième génération de 16 à 65 ans. Par ailleurs, comme le démontrent Aydemir et Borjas (inédit), étant donné que les moyennes à l'intérieur des cellules sont fondées sur des calculs qui représentent des échantillons, leur exactitude variera selon le nombre d'observations disponibles. Cela a pour effet que la variation d'échantillonnage lié à la variable indépendante entraînera un biais d'atténuation. Aydemir et Borjas (inédit) examinent la nature et la portée de ce biais, et démontrent en outre que l'utilisation du fichier à 20 % du recensement, par opposition aux taux d'échantillonnage plus faibles disponibles dans les versions à grande diffusion des données du Recensement, produit un échantillon suffisamment important pour réduire ses répercussions.

Par ailleurs, cet estimateur a comme avantage qu'il est plus résistant aux erreurs mesure. Il s'agit d'une préoccupation particulièrement importante pour l'analyse de la transmission intergénérationnelle de l'inégalité des gains, dont parle, par exemple, Solon (1999, 1992). Dans ces ouvrages, les chercheurs sont aux prises avec la difficulté de devoir inférer des données sur le revenu permanent à partir des gains annuels, ainsi que de tenter de réduire un problème classique d'erreurs dans les variables, grâce à des variables instrumentales ou à des moyennes pluriannuelles, à partir de données de panel sur les gains annuels individuels. Au premier abord, il pourrait sembler raisonnable de supposer que les problèmes d'erreur de mesure dans un résultat comme la scolarité ne sont pas aussi graves que pour les gains. Une part importante des ouvrages publiés supposent implicitement, et même explicitement, que de tels problèmes sont absents dans les faits, mais Ermisch et Francesconi (2004), à partir de données du Royaume-Uni concernant une mesure couramment utilisée du statut socioéconomique, soulignent que ce n'est peut-être pas le cas.

Ceci étant dit, nous utilisons les données du Recensement en parallèle et en complément des données de l'Enquête sur la diversité ethnique (EDE), cette dernière ayant comme avantage d'offrir des données sur le niveau de scolarité au niveau de la personne pour deux générations. Il s'agit d'une enquête postcensitaire représentative de l'ensemble de la population, mais dont l'objectif est de produire des données sur les antécédents ethniques et culturels des Canadiens. Un échantillon d'un peu moins de 42 500 personnes de 15 ans et plus ont été interviewées en 2002, les données d'un questionnaire sur cinq du Recensement de 2001 servant de base d'échantillonnage, et la sélection de l'échantillon étant fondée sur l'origine ethnique, le lieu de naissance et le lieu de naissance des parents. Les personnes qui n'indiquaient pas être canadiennes, britanniques, françaises, américaines, australiennes ou néo-zélandaises dans leurs réponses aux questions sur l'origine ethnique ont été suréchantillonnées (Statistique Canada, 2003). L'EDE a comme limite qu'elle ne fournit pas de données sur les gains et le revenu des parents, et que la taille plus limitée de l'échantillon restreint dans une certaine mesure l'examen qui peut être fait de pays d'origine particuliers. C'est de cette façon que les données du recensement peuvent être utilisées comme complément utile. Les avantages de cette enquête par rapport au recensement sont qu'elle fournit des données rétrospectives sur le niveau de scolarité des parents recueillies auprès des répondants, et qu'elle permet d'estimer l'équation (1), à la fois pour les enfants d'immigrants, pour l'ensemble de la population de Canadiens et pour différentes cohortes de naissance.

L'EDE comprend toutes les données du Recensement de 2001 pour chacun des répondants, y compris, ce qui importe le plus à nos fins, le niveau de scolarité. Les données sur le niveau de scolarité des parents, toutefois, font partie de l'une des neuf catégories. En convertissant ces données en années de scolarité, nous tenons compte du fait que, outre qu'elles rendent compte des années réelles de scolarité, les données du recensement sont catégoriques et plus détaillées dans les faits, 16 catégories étant utilisées. Nous recodons à la fois les catégories de l'EDE et celles du Recensement de 1981 en sept catégories communes ⁵. Puis, nous apparions les années de scolarité du recensement et de l'EDE par cellule définie selon le sexe, le pays d'origine, la catégorie de scolarité et l'âge (25 à 44 ans, 45 à 54 ans et 55 ans et plus). À l'intérieur de chacune de ces cellules, nous calculons, à partir du Recensement de 1981, le mode des années de scolarité et nous apparions cette statistique aux personnes de l'EDE dans des cellules définies de façon similaire, selon les renseignements fournis par ces personnes sur leurs mères et leurs pères ⁶.

Un résumé de ces données selon la grande région d'origine figure dans le tableau 5, de même que des données du recensement. Les années moyennes de scolarité pour les hommes et les femmes de deuxième génération des parties 3 et 4 du tableau sont essentiellement les mêmes pour les deux sources de données, ne différant jamais plus de 0,3 à 0,4 année. Cela n'est par surprenant, étant donné que les données de l'EDE sont tirées du recensement, les différences rendant probablement compte de l'erreur d'échantillonnage. Les Canadiens de deuxième génération, peu importe la région du monde où leurs parents sont nés, sont tous plus scolarisés que les Canadiens dont les parents sont nés au Canada. L'avantage est le plus grand pour les personnes ayant des origines africaines et asiatiques.

Les données des parties 1 et 2 servent à comparer les mesures directes des années de scolarité du recensement et les données calculées à partir des catégories comprises dans l'EDE. Les moyennes de ces deux sources sont similaires, sauf peut-être pour les personnes originaires d'Afrique, les données du recensement indiquant une moyenne de 14,9 années et nos calculs à partir de l'EDE supposant 16,1 années. Toutefois, les données de l'EDE sont fondées sur un échantillon assez petit de seulement 68 observations, ce qui fait que cette différence est probablement due à la variation d'échantillonnage. La différence suivante en importance est 0,7 an pour les personnes originaires d'Asie.

Par ailleurs, l'ensemble des données laisse supposer que tous les groupes ont réalisé des gains par rapport à leurs parents. Les Canadiens de 25 à 37 ans dont les parents sont nés au Canada comptent deux ou trois années de plus de scolarité que leurs parents. Des gains sont aussi réalisés par les Canadiens de deuxième génération, même si dans certains cas, ils ne sont pas aussi élevés en niveaux absolus, du fait que leurs parents partent à un niveau plus élevé. Les gains sont particulièrement élevés pour ceux dont les parents sont nés en Europe de Sud et de l'Est. En moyenne, les pères avaient un peu moins de neufannées de scolarité, mais les enfants, 15 ans. Ceux dont les parents sont nés en Asie avaient aussi des niveaux de scolarité significativement plus élevés que leurs parents, soit environ deux à trois années de plus en moyenne. Un examen plus détaillé de ce type de mobilité, dans le contexte de l'équation (1), à la fois à partir des données regroupées et des données individuelles, figure dans le reste du présent document.

3. La mobilité intergénérationnelle du niveau de scolarité est évidemment une préoccupation de longue date en économie et en sociologie. Certains des travaux canadiens les plus fréquemment cités dans ce domaine comprennent de Broucker et Lavallée (1998), à partir de l'Enquête internationale sur l'alphabétisation des adultes, Fournier, Butlin et Giles (1995), à partir de l'Enquête sur la dynamique du travail et du revenu, et Sen et Clemente (inédit), à partir de l'Enquête sociale générale. L'esprit de ce dernier travail est celui qui se rapproche le plus de la méthodologie que nous utilisons, mais toutes ces études font ressortir une association positive étroite entre les niveaux de scolarité des parents et celui des enfants, même si aucune n'est axée sur les immigrants. Plus récemment, l'attention s'est portée sur le rapport entre les antécédents familiaux et les résultats proprement dits des enfants au chapitre de la littératie et de la numératie, par opposition à la scolarité en bonne et due forme. Voir, par exemple, OCDE et UNESCO (2003), sur la base du Programme international pour le suivi des acquis des élèves.

4. Les restrictions quant à l'exclusion imposées aux données sous-jacentes diffèrent légèrement pour les deux variables d'intérêt. Dans le cas de la scolarité, nous utilisons toutes les observations disponibles; dans le cas des gains hebdomadaires, nous utilisons uniquement les observations dans lesquelles les répondants déclarent des gains positifs.

5. Il s'agit des suivants : 1) niveau inférieur au secondaire, y compris absence de scolarité; 2) diplôme d'études secondaires; 3) études collégiales partielles, sans diplôme ou certificat; 4) études universitaires partielles, sans diplôme ou certificat; 5) diplôme ou certificat collégial; 6) diplôme universitaire de premier cycle; et 7) diplôme universitaire de deuxième et de troisième cycles.

6. Nous avons aussi calculé les médianes et les moyennes des cellules. Tous ces calculs ont produit des résultats similaires, mais le mode s'est rapproché le plus des résultats du recensement dans une comparaison selon les grandes régions d'origine.