Annexe 3
Méthodologie de l'enquête

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Population cible
Base de sondage
Plan d'échantillonnage
Taux de réponse
Estimation et pondération
Exactitude des données

L'Enquête nationale auprès des apprentis (ENA) de 2007 est une enquête transversale conçue de manière à recueillir des données directement auprès des apprentis au Canada. Statistique Canada a interrogé les apprentis de janvier à mai 2007 dans le cadre d'un sondage volontaire effectué par téléphone. Rappelons que l'échantillon est constitué de trois types particuliers d'apprentis et non pas de toute la population des apprentis, et que les résultats de l'enquête constituent un échantillon représentatif - un instantané de chacun des groupes à un moment précis dans le temps.

Population cible

Pour les fins de l'ENA, une personne choisie est dans le champ d'enquête si elle avait pris part à des activités d'apprentissage de 2000 à 2004. L'ENA ciblait les apprentis inscrits dans les dix provinces et les trois territoires en fonction de leur statut d'apprenti. Ces répondants ne sont pas représentatifs de tous les apprentis. Les trois groupes retenus sont les suivants :

Finissants : identifiés comme tels par 12 provinces et territoires1 et ayant terminé leur programme d'apprentissage au cours de l'une ou l'autre des années de référence 2002, 2003 ou 2004, et non inscrits à une activité d'apprentissage au 31 décembre 2004.

Décrocheurs : identifiés par 12 provinces et territoires1 et ayant interrompu leur programme d'apprentissage durant l'une ou l'autre des années de référence 2002, 2003 ou 2004, et non inscrits à une activité d'apprentissage au 31 décembre 2004.

Persévérants à long terme : apprentis actifs au 31 décembre 2004, inscrits comme apprentis avant l'an 2000 et inscrits pendant plus d'une fois et demie la durée prescrite et requise pour terminer le programme dans le même métier en 2004. Environ 19 % des persévérants de 2004 étaient des persévérants à long terme.

Ont été exclus de la population cible les inscrits à une activité d'apprentissage au 31 décembre 2004 effectuée dans les limites de la durée prescrite et requise. Ce groupe représente 81 % de tous les persévérants en 2004.

La population cible a été déterminée à l'étape de la création du plan de sondage à l'aide des définitions ci-dessus. Les répondants ont été invités à confirmer les activités d'apprentissage auxquelles ils étaient inscrits en 2000 et en 2004. Si leur statut confirmé n'entrait pas dans l'un des trois groupes de la population cible, ils étaient considérés comme hors du champ de l'enquête.

Base de sondage

La base de sondage a été constituée à partir des listes d'apprentis inscrits fournies par les provinces et les territoires pour les années de référence visées (2002, 2003 et 2004). Ces listes présentent toute l'information nécessaire pour stratifier et sélectionner l'échantillon, soit le statut de l'apprenti, l'année de l'inscription, le métier ou le programme de formation, son âge et son sexe. On y trouve aussi les coordonnées de l'apprenti (adresse et numéro de téléphone). Certains secteurs de compétence ont fourni une seconde source de coordonnées.

Nous avons évalué la couverture, la qualité et l'uniformité des données fournies par 12 provinces et territoires. Il nous a fallu réunir ces données pour les trois années de référence pour pouvoir classer chacun des apprentis dans le groupe approprié (persévérants à long terme, finissants ou décrocheurs ) et éliminer les chevauchements à l'intérieur et dans l'ensemble des provinces et territoires.

Tableau A.3.1 Nombre d'apprentis de la base de sondage, par province et territoire et statut de la base. Une nouvelle fenêtre s'ouvrira.

Tableau A.3.1
Nombre d'apprentis de la base de sondage, par province et territoire et statut de la base

Plan d'échantillonnage

Trois variables ont servi à stratifier l'échantillon : la province ou le territoire, le statut de l'apprenti et les groupes de métier principaux. Il y a 12 provinces et territoires, trois statuts d'apprentis et sept groupes de métiers principaux. Ces variables ont produit 231 strates.

Il a été nécessaire de constituer un échantillon national d'au moins 30 000 répondants afin de produire des estimations fiables pour chacune des strates. Un échantillon minimum a été réparti entre chaque strate et le reste de l'échantillon a été réparti proportionnellement au nombre d'apprentis de chacune d'entre elles. Pour plusieurs de ces strates, nous avons effectué un recensement des apprentis. De plus, dans les provinces et les territoires de petite taille, un recensement a été effectué pour les apprentis d'une même province ou d'un même territoire.

Un échantillon aléatoire des apprentis a été sélectionné pour chaque strate. Nous avons procédé en sept étapes. Pour la première et la deuxième étapes, nous avons réparti l'échantillon selon le statut final (statut prévu au moment de la collecte des données), puis selon le statut de l'échantillon. Les troisième et quatrième étapes ont consisté à attribuer un nombre minimum de cas par strate, puis à déterminer les strates à tirage complet. À la cinquième étape, nous avons réparti proportionnellement les cas restants. Les deux dernières étapes ont été celles des corrections pour le dépistage des répondants et les taux de réponse, ainsi que pour les données d'appoint dans les cas ne présentant aucune coordonnée utile sur les répondants.

Le tableau ci-dessous montre le nombre total de cas répartis par province et territoire et statut de l'échantillon et transmis aux différents bureaux régionaux de Statistique Canada pour la réalisation de l'enquête. C'est à partir de cet échantillonnage que l'échantillon visé de 30 000 répondants est réuni de manière à obtenir une précision minimale pour tous les domaines d'intérêt (un CV de 33,3 % pour une proportion estimée de 10 % dans autant de strates que possible et un CV d'environ 16,6 % pour une proportion estimative de 25 %).

Tableau A.3.2 Taille de l'échantillon par province et territoire et statut de la base de sondage. Une nouvelle fenêtre s'ouvrira.

Tableau A.3.2
Taille de l'échantillon par province et territoire et statut de la base de sondage

À mi-chemin de la collecte, nous avons observé un taux beaucoup plus élevé que prévu de données hors du champ de l'enquête pour certaines strates et avons donc décidé d'ajouter des données d'appoint afin de compenser la perte prévue de répondants par rapport au nombre voulu avant la collecte.

Tableau A.3.3 Répartition de l'échantillon brut par province et territoire après ajout de données d'appoint (en fonction du statut de la base de sondage). Une nouvelle fenêtre s'ouvrira.

Tableau A.3.3
Répartition de l'échantillon brut par province et territoire après ajout de données d'appoint (en fonction du statut de la base de sondage)

Taux de réponse

Les taux de réponse à l'enquête aident à mesurer l'efficacité de notre échantillon de la population et du processus de collecte. Ces données sont de bons indicateurs de la qualité des données estimatives produites. Le tableau ci-dessous montre le taux de réponse lors de la collecte de l'ENA à l'échelon national et des provinces et territoires.

Tableau A.3.4 Taux de réponse par province et territoire et statut de la base de sondage pour l'ENA de 2007. Une nouvelle fenêtre s'ouvrira.

Tableau A.3.4
Taux de réponse par province et territoire et statut de la base de sondage pour l'ENA de 2007

Estimation et pondération

Le principe sous-jacent à l'estimation d'un échantillon probabiliste comme l'ENA est que chaque personne de l'échantillon « représente », outre elle-même, plusieurs autres personnes qui ne sont pas dans l'échantillon. Pour obtenir des estimations à partir de données d'enquêtes représentatives de la population cible, on attribue un poids à chaque personne ayant répondu aux questions de l'enquête. Ce poids correspond au nombre de personnes de la population cibles représentées par le répondant. La phase de pondération est une étape où l'on calcule ce nombre pour chaque enregistrement. Ce poids figure dans le fichier de microdonnées et doit être appliqué de manière que l'on puisse dériver de l'enquête des données significatives.

Pour les fins de la pondération, cette enquête peut être prise comme une enquête en deux phases. La première phase correspond à la sélection d'un échantillon et les unités déclarantes correspondent à l'échantillon de la seconde phase. Le poids de la première est l'inverse de la probabilité qu'un apprenti soit sélectionné. On multiple ensuite ce poids de la première phase par le facteur de correction de la seconde phase. Aux fins de la correction de la seconde phase, des groupes de réponse homogènes (GRH) sont créés en fonction des caractéristiques des répondants et des non-répondants. Le facteur de correction est simplement l'inverse du taux de réponse pondéré de chaque GRH.

L'approche en deux phases du Système généralisé d'estimations (SGE) a servi à l'estimation de la variance.

Exactitude des données

Bien que l'on s'efforce d'appliquer des normes élevées tout au long du processus de collecte et de traitement des données, les estimations qui en résultent sont inévitablement sujettes à un certain degré d'erreurs. Nous retiendrons ici deux types d'erreurs : les erreurs non dues à l'échantillonnage et les erreurs d'échantillonnage.

Des erreurs non dues à l'échantillonnage peuvent découler des imperfections de la base de sondage et de la non-réponse. On a constaté qu'une proportion importante des apprentis (25,9 %) de l'échantillon étaient hors du champ de l'enquête (aucune activité d'apprentissage durant la période de référence visée en raison de l'imperfection de la base de sondage). Ils étaient hors du champ de l'enquête parce qu'ils ont déclaré n'avoir jamais été apprentis ou l'avoir été mais en dehors des périodes de référence visées. Les taux de répondants hors du champ de l'enquête pour les provinces et les territoires allaient de 10 % à 40 %. Le taux était de 7,8 % pour les finissants, de 35 % pour les persévérants à long terme et de 39,3 % pour les non-persévérants.

Tableau A.3.5 Taux de répondants hors du champ de l'enquête selon la province ou le territoire et le statut dans la base de sondage (calculés à partir des unités résolues seulement. Une nouvelle fenêtre s'ouvrira.

Tableau A.3.5
Taux de répondants hors du champ de l'enquête selon la province ou le territoire et le statut dans la base de sondage (calculés à partir des unités résolues seulement

On observe une différence importante dans le champ d'enquête entre le Québec et les autres provinces. Au Québec, près de la moitié des métiers de la construction sont représentés dans la base de sondage de l'ENA. La liste des apprentis dans les métiers de la construction a été fournie par la Commission de la construction du Québec (CCQ). Emploi-Québec (EQ) a fourni une liste pour quatre catégories de métier, mais cette liste était incomplète (aucun finissant pour trois des quatre métiers). C'est pourquoi un seul métier (électricien industriel) a été retenu de la liste des apprentis d'EQ pour la base de sondage de l'ENA. Ainsi, on prendra soin de ne comparer les estimations entre le Québec et les autres provinces que pour des métiers analogues.

Une autre importante source d'erreurs non dues à l'échantillonnage est l'effet des non-réponses sur les résultats des enquêtes. Les non-réponses varient de non-réponse partielle (réponse manquante à une seule question ou à quelques questions) à non-réponse totale. On obtient une non-réponse totale dans le cas où l'intervieweur n'a pu communiqué avec le répondant ou lorsqu'aucun membre du ménage ne peut fournir l'information demandée, ou encore, lorsque le répondant refuse de participer à l'enquête. On établit le taux de non-réponse totale en ajustant le poids des personnes qui ont répondu à l'enquête afin de compenser pour celles qui n'y ont pas répondu.

Dans la plupart des cas, on observe une non-réponse partielle quand le répondant ne comprend pas ou interprète erronément une question, refuse de répondre à une question ou déclare ne plus se rappeler l'information demandée. Dans les cas de non-réponse partielle, on a procédé à une imputation par enregistrement donneur pour certaines variables. Les variables imputées sont les variables connexes des salaires et traitements de la population active et des modules de l'emploi le plus récent (EPR).

La base de mesure de la taille potentielle des erreurs d'échantillonnage est l'erreur type des estimations dérivées des résultats d'enquête. Étant donné la grande variété d'estimations susceptibles d'être produites au cours d'une enquête, l'erreur type d'une estimation est normalement exprimée par rapport à l'estimation afférente. On obtient la mesure qui en résulte, que l'on appelle coefficient de variation (CV) d'une estimation, en divisant l'erreur type de l'estimation par l'estimation elle-même, et elle s'exprime en tant que pourcentage de l'estimation.


Notes :

  1. Les données du Nunavut n'étaient pas disponibles pour l'enquête.