7. Qualité des données

Warning Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

7.1 Aperçu de l’évaluation de la qualité des données

L’objectif de l’Enquête auprès des peuples autochtones (EAPA) de 2012 est de produire des estimations de qualité dans les domaines de l’éducation, de l’emploi, de la santé et d’autres indicateurs de base pour les membres des Premières Nations vivant à l’extérieur des réserves, les Métis et les Inuit âgés de 6 ans et plus.

Les sections 7.2 et 7.3 ci-après expliquent les deux types d’erreurs qui se produisent dans les enquêtes : erreurs d’échantillonnage et erreurs non dues à l’échantillonnage. Chaque type d’erreur est évalué dans le contexte de l’EAPA de 2012. L’erreur d’échantillonnage est la différence entre les données obtenues à partir de l’échantillon de l’enquête et les données qui auraient découlé d’un recensement complet de l’ensemble de la population mené dans des conditions similaires. Ainsi, l’erreur d’échantillonnage peut être décrite comme les différences découlant de la variabilité d’un échantillon à l’autre. Les erreurs non dues à l’échantillonnage sont toutes les autres erreurs qui ne sont pas liées à l’échantillonnage. Les erreurs non dues à l’échantillonnage peuvent se produire à n’importe quelle étape du processus d’enquête et comprennent la non-réponse à l’enquête, ainsi que les erreurs qui se sont produites pendant la collecte des données ou le traitement informatique. Il se peut que des erreurs figurent dans les réponses des répondants qui tentent de se rappeler des faits du passé, par exemple, ou se produisent lorsque la réponse est obtenue par personne interposée. Il se peut qu’une réponse soit saisie de façon incorrecte en raison de la fatigue de l’intervieweur ou d’un problème informatique. Une erreur peut avoir été faite au moment de la programmation, lorsque les données ont été traitées ou totalisées. Ce sont tous là des exemples d’erreurs non dues à l’échantillonnage.

Le présent chapitre décrit les diverses mesures adoptées pour prévenir les erreurs dans la mesure du possible et pour corriger les erreurs qui se produisent aux différentes étapes de l’EAPA. Les domaines où il convient de faire preuve de prudence pour l’interprétation des données de l’EAPA sont aussi notés.

7.2 Erreurs d’échantillonnage et méthode bootstrap

Les estimations qui peuvent être calculées à partir de l’Enquête auprès des peuples autochtones (EAPA) de 2012 sont fondées sur un échantillon de personnes. Des estimations quelque peu différentes auraient pu être obtenues si l’on avait procédé à un recensement complet au moyen des mêmes questionnaires, intervieweurs, superviseurs, méthodes de traitement, etc. que ceux réellement utilisés. La différence entre une estimation obtenue à partir de l’échantillon et celle découlant d’un dénombrement complet effectué dans des conditions similaires est appelée « erreur d’échantillonnage » de l’estimation.

Afin de fournir des estimations de l’erreur d’échantillonnage pour les statistiques produites dans le cadre de l’EAPA, on a eu recours à une méthode bootstrap particulière (le bootstrap étant elle-même une méthode de ré-échantillonnage particulière). Plusieurs méthodes bootstrap existent dans la littérature, mais aucune d’elles n’était appropriée pour le plan d’échantillonnage de l’EAPA. Les particularités du plan d’échantillonnage qui rendaient difficile l’estimation des erreurs d’échantillonnage étaient les suivantes :

  • Plan d’échantillonnage à trois phases dans lequel des ménages (ou logements) étaient sélectionnés aux deux premières phases, et des personnes l’étaient à la troisième (sous-section 3.2.3).
  • Fraction de sondage de l’échantillon de première phase (échantillon de l’Enquête nationale auprès des ménages, ENM) non négligeable (environ 1/3 dans les régions N1) et fraction de sondage de l’EAPA généralement assez élevée dans la plupart des strates.
  • Strates de l’EAPA (combinaisons de domaines d’estimation, régions N1 ou N2, répondant initial vs répondant au suivi des cas de non-réponse (SCNR), identité vs ascendance seulement) non imbriquées dans les strates de l’ENM (unités de collecte ou groupes d’unités de collecte).
  • Méthode utilisée devait être suffisamment souple pour produire des statistiques standards, comme des proportions, des totaux, des moyennes et des ratios, mais aussi des statistiques plus poussées, y compris des centiles, des coefficients de régression logistique, etc.

Certaines de ces particularités avaient été rencontrées lors de l'EAPA de 2006. Cependant, en 2006, la base de sondage était construite à partir du formulaire long du Recensement. La fraction de sondage était alors d’environ un ménage sur cinq et le taux de réponse était élevé en raison du caractère obligatoire du Recensement. En 2011, l’ENM avait une fraction de sondage encore plus grande d’environ un ménage sur trois. L’ENM étant une enquête volontaire, la non-réponse était passablement plus élevée qu’au questionnaire long de 2006, et un sous-échantillon de non-répondants a été sélectionné pour un suivi de la non-réponse, ce qui a complexifié le plan d’échantillonnage. Une description plus détaillée du plan d’échantillonnage de l’ENM se trouve au chapitre 3 du Guide de l’utilisateur de l’Enquête nationale auprès des ménages.

Comme la non-réponse à l’ENM était relativement considérable, pour les besoins du calcul de la variance seulement (la variance étant une mesure particulière de l’erreur d’échantillonnage), les répondants au SCNR ont été considérés comme formant  un échantillon de 3e phase, où la probabilité d’inclusion d’un ménage était égale à une probabilité de répondre qui lui était propre et qui ne dépendait pas des probabilités de répondre des autres ménages.

Plusieurs méthodes bootstrap existent dans la littérature pour l’échantillonnage à une phase ainsi que l’échantillonnage à plusieurs degrés. La plus courante est appelée bootstrap avec remise (en anglais, « with-replacement bootstrap ») et consiste à sélectionner M sous-échantillons avec remise à partir de l’échantillon principal et à produire des estimations pour chaque sous-échantillon. L’estimation de la variance bootstrap est par la suite calculée comme fonction du carré des différences entre les estimations provenant de chacun des M sous-échantillons bootstrap et l’estimation provenant de l’échantillon de l’enquête.

L’utilisation de poids bootstrap simplifie grandement le calcul de la variance. Pour chaque sous‑échantillon (répétition bootstrap), on doit ajuster les poids d’échantillonnage initiaux en fonction du sous-échantillonnage bootstrap, ce qui produit ce que l’on appelle les « poids bootstrap initiaux ». Étant donné que chaque échantillon bootstrap est le résultat de la sélection d’unités avec remise, une unité peut se retrouver plusieurs fois dans un échantillon bootstrap particulier. On peut démontrer que les poids bootstrap sont une fonction du poids d’échantillonnage initial de l’observation multiplié par ce que l’on appelle « la multiplicité » de l’unité dans l’échantillon bootstrap, c’est‑à‑dire le nombre de fois où l’unité est sélectionnée dans l’échantillon bootstrap. La multiplicité d’une unité dans l’échantillon bootstrap est une variable aléatoire qui suit ce que l’on appelle une « distribution multinomiale ». Ainsi, les poids bootstrap peuvent être considérés comme le produit des poids d’échantillonnage initiaux par un facteur d’ajustement aléatoire (qui est, dans ce cas-ci, une fonction de la multiplicité de l’unité). Une fois les poids bootstrap initiaux calculés, tous les ajustements de poids appliqués aux poids d’échantillonnage initiaux sont appliqués aux poids bootstrap initiaux en vue d’obtenir les poids bootstrap finaux, qui rendront compte de la variance liée non seulement au plan d’échantillonnage particulier, mais aussi à tous les ajustements de poids appliqués à l’ensemble de l’échantillon pour calculer les poids finaux.

Pour l’EAPA de 2006, une méthode bootstrap généralisée pour plan d’échantillonnage à deux phasesNote1 a été élaborée. Tel que mentionné précédemment, les poids bootstrap peuvent être considérés comme le produit des poids d’échantillonnage initiaux et d’un facteur d’ajustement aléatoire. Il s’agit du concept qui sous-tend la méthode bootstrap généralisée utilisée en 2006. Dans le cas de cet échantillon à deux phases, la variance a été décomposée en deux composantes, chacune étant associée à une phase de l’échantillonnage. La méthode bootstrap généralisée à deux phases produit un facteur d’ajustement aléatoire pour chaque phase d’échantillonnage. Dans ce cas, le poids bootstrap initial d’une unité était le produit du poids d’échantillonnage initial par ces deux facteurs d’ajustement aléatoires.

Or en 2011, pour l’estimation de la variance seulement, on considère que l’ENM avait deux phases supplémentaires, soit celle correspondant au sous-échantillon du SCNR ainsi que celle associée à la non-réponse au sous-échantillon duSCNR ainsi que celle associée à la non-réponse au sous-échantillon du SCNR. Dans le cadre de l'EAPA de 2012, nous avons combiné les trois phases de l’ENM en une seule pour ensuite utiliser la méthode bootstrap généralisée à deux phases, (une phase à l’ENM et une phase à l’EAPA). Dans la méthode bootstrap généralisée à deux phases, on peut montrer que les facteurs d’ajustement aléatoires sont fonctions des probabilités d’inclusion simples et doubles associées à chacune des phases. Afin de regrouper les trois phases en une seule, on a combiné les probabilités d’inclusion simples et doubles pour les trois phases de l’ENM. Les probabilités d’inclusion simples et doubles des trois phases combinées sont données par le produit des probabilités d’inclusion simples et doubles de chacune des trois phases. Les détails de la méthodologie utilisée se trouvent dans Haddou (2013)Note2.

Une fois les trois phases de l’ENM combinées en une seule, on a utilisé la méthode bootstrap généralisée pour plan d’échantillonnage à deux phases, qui impliquait le calcul de deux ensembles de facteurs d’ajustement aléatoires pour chacune des phases.

La présence de ces deux ensembles de facteurs d’ajustement aléatoires comportait un avantage majeur. Le premier ensemble pouvait être utilisé pour les estimations fondées sur la première phase seulement, c’est-à-dire, les estimations fondées sur l’échantillon de l’ENM. Ces estimations ont été utilisées lorsque les poids ont été ajustés en fonction des totaux de l’ENM au moment de la poststratification (section 6.5). Cette méthode a produit des totaux de l’ENM variables pour chaque échantillon bootstrap. Cela rendait compte du fait que les totaux de l’ENM utilisés étaient fondés sur un échantillon et non sur des totaux fixes connus.

Dans le cas de l’EAPA, 1 000 ensembles de poids bootstrap ont été produits au moyen de la méthode décrite précédemment. La méthode utilisée est légèrement biaisée à la hausse, en ce sens qu’elle surestime légèrement la variance. Cependant, l’ampleur de la surestimation est considérée comme négligeable pour l’EAPA. La méthode peut aussi produire des poids bootstrap négatifs. Pour remédier à ce problème, on a procédé à une transformation des poids bootstrap en vue de réduire leur variabilité. Par conséquent, la variance calculée à partir de ces poids bootstrap transformés doit être multipliée par un facteur qui est fonction d’un certain paramètre appelé phi. La valeur de ce paramètre correspond au plus petit nombre entier faisant en sorte que tous les poids bootstrap soient positifs. Pour l’EAPA, ce facteur est de 4. Les variances calculées à partir des poids bootstrap transformés doivent donc être multipliées par 42 = 16. De même, les coefficients de variation obtenus (racine carrée de la variance divisée par l’estimation proprement dite) doivent être multipliés par 4. Toutefois, la plupart des logiciels qui produisent des estimations de l’erreur d’échantillonnage à partir de poids bootstrap comportent une option permettant de préciser ce facteur d’ajustement, afin que la bonne estimation de la variance soit obtenue sans la nécessité d’une étape additionnelle de multiplication par la constante.

Il est extrêmement important d’utiliser le facteur multiplicatif approprié pour n’importe quelle mesure de l’erreur d’échantillonnage, telle la variance, l’erreur type et le coefficient de variation (c.v.). L’omission de ce facteur multiplicatif produira des résultats et des conclusions erronés. Ce facteur est souvent spécifié comme étant « l’ajustement de Fay » dans les logiciels qui produisent des estimations de l’erreur d’échantillonnage à partir de poids bootstrap.

À noter que si C est le facteur multiplicatif de la variance, certains logiciels utilisent plutôt le paramètre k tel que k = 1 1 / C MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbcvPDwzYbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0x e9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKk Fr0xfr=xfr=xb9adbaqaaeGacaGaaiaabeqaamaabeabaaGcbaGaam 4Aaiabg2da9iaaigdacqGHsislcaaIXaGaai4lamaakaaabaGaam4q aaWcbeaaaaa@3DFF@ . Dans notre cas, puisque C=16, alors k=0,75. Pour des exemples de procédures utilisant l’ajustement de Fay, voir « Enquête auprès de peuples autochtones de 2012 : Guide d’utilisation du fichier analytique».

La mesure de l’erreur d’échantillonnage utilisée pour l’EAPA est le coefficient de variation (c.v.) de l’estimation, c’est‑à‑dire l’erreur type de l’estimation divisée par l’estimation proprement dite. Dans le cas de cette enquête, lorsque le c.v. d’une estimation est inférieur ou égal à 16,6 %, l’estimation peut être utilisée sans restriction. Si le c.v. est supérieur à 16,6 %, mais inférieur ou égal à 33,3 %, l’estimation est accompagnée de la lettre « E », ce qui indique que les données doivent être utilisées avec prudence. Lorsque le c.v. d’une estimation est supérieur à 33,3 %, l’estimation de la cellule est remplacée par la lettre « F », ce qui indique que l’estimation a été supprimée pour des raisons de fiabilité. La lettre « X » est utilisée pour indiquer qu’une estimation a été supprimée parce qu’elle était confidentielle en vertu des dispositions de la Loi sur la statistique. Le tableau 5 résume ces règles.

Tableau 5 
Lignes directrices relatives à la variabilité d’échantillonnage Sommaire du tableau
Le tableau montre les résultats de lignes directrices relatives à la variabilité d’échantillonnage. Les données sont présentées selon type d’estimation (titres de rangée) et c.v. (en %) , lignes directrices et symbole(figurant comme en-tête de colonne).
Type d’estimation c.v. (en %) Lignes directrices Symbole
Acceptable c.v. <= 16.6 On peut envisager une diffusion générale non restreinte des estimations. Aucune annotation particulière n’est nécessaire.  
Marginale 16,6 < c.v. ≤ 33,3 On peut envisager une diffusion générale non restreinte des estimations, en y joignant une mise en garde aux utilisateurs quant à la variabilité d’échantillonnage élevée liée aux estimations. Les estimations de ce genre doivent être identifiées par la lettre E (ou d’une autre manière similaire). E – utiliser avec prudence
Inacceptable c.v. > 33,3 Statistique Canada recommande de ne pas publier des estimations dont la qualité est inacceptable. Toutefois, si l’utilisateur choisit de le faire, il doit alors adjoindre la lettre F (ou un autre identificateur semblable) et les diffuser avec l’avertissement suivant : « Nous avisons l’utilisateur que ... (précisez les données)... ne répondent pas aux normes de qualité de Statistique Canada pour ce programme statistique. Les conclusions tirées de ces données ne sauraient être fiables et seront fort probablement erronées. Ces données et toute conclusion qu’on pourrait en tirer ne devraient pas être publiées. Si l’utilisateur choisit de les publier, il est alors tenu de publier également le présent avertissement. » F – pas assez fiable pour être publié

7.3 Erreurs non dues à l’échantillonnage

Outre l’échantillonnage, un certain nombre de facteurs à presque toutes les étapes d’une enquête peuvent entraîner des erreurs dans les résultats. Les erreurs non dues à l’échantillonnage sont attribuables principalement aux causes suivantes : la non-réponse, la couverture, la mesure et le traitement. Pour chacun de ces domaines, les sous-sections qui suivent examinent les diverses mesures utilisées pour réduire et corriger les erreurs. Par exemple, les erreurs de mesure peuvent être dues à une mauvaise compréhension par les répondants des questions et aux réponses inexactes; par ailleurs, il se peut que les réponses soient entrées de façon incorrecte pendant la saisie des données et que des erreurs se produisent au moment du traitement et de la totalisation des données. Le passage du questionnaire papier-crayon, en 2006, à l’interview assistée par ordinateur (IAO) en 2012 a réduit considérablement le nombre d’erreurs non dues à l’échantillonnage, parce que l’IAO permet la saisie directe des réponses, des enchaînements automatisés entre les questions, ainsi que des contrôles intégrés qui éliminent les incohérences et les valeurs aberrantes, etc. (pour plus de renseignements sur l’IAO, voir la section 2.1).

En présence d’un grand nombre d’observations, les erreurs aléatoires auront peu d’effet sur les estimations de l’enquête. Toutefois, les erreurs qui se produisent systématiquement contribueront au biais dans les estimations de l’enquête. Ainsi, beaucoup de temps et d’énergie a été consacré à la réduction du nombre d’erreurs non dues à l’échantillonnage dans l’enquête, comme décrit aux sous-sections suivantes.

7.3.1 Erreurs de non-réponse

Les erreurs de non-réponse surviennent lorsqu’il est impossible d’obtenir des données complètes pour toutes les unités de l’échantillon sélectionné. La non-réponse produit des erreurs dans les estimations d’enquête de deux façons. Tout d’abord, les non-répondants ont souvent des caractéristiques différentes des répondants, ce qui peut donner lieu à des estimations d’enquête biaisées si la non-réponse n’est pas corrigée de façon appropriée. Plus le taux de non-réponse est élevé, plus le risque de biais possible le sera. En deuxième lieu, le fait d’avoir un plus grand nombre de non-répondants réduit la taille réelle de l’échantillon. Par conséquent, la précision des estimations diminue (l’erreur d’échantillonnage des estimations augmente). Ce deuxième aspect peut être évité grâce à la sélection d’un échantillon plus important au départ. Toutefois, cela ne réduira pas le biais possible dans les estimations.

Il existe de nombreux types de non-réponse. L’une des formes de non-réponse est la non-réponse partielle (parfois appelée « non-réponse d’item »), c’est-à-dire un répondant qui ne répond pas à une ou plusieurs questions, mais qui répond à la majeure partie du questionnaire. La non-réponse partielle peut être attribuable à la difficulté à comprendre une question particulière.

En général, l’étendue de la non-réponse partielle a été relativement faible dans l’EAPA. Des examens qualitatifs exhaustifs et une mise à l’essai des questionnaires ont eu lieu avant l’enquête, ce qui a réduit l’étendue de la non-réponse partielle. Une réponse à des questions clés déterminées au préalable était requise pour classer un cas comme « répondant », conformément à la description de la sous-section 5.3.1. On retrouvait un nombre important de cas, toutefois, dans lesquels il manquait une proportion importante des réponses à des questions clés. Ces cas ont été éliminés de la base de données des répondants (ne répondaient pas à la définition de répondant) et ont été traités pendant la pondération comme des cas spéciaux de non-réponse totale (section 6.4). Enfin, il y a non-réponse totale lorsque la personne sélectionnée pour participer à l’enquête n’a pu être contactée ou n’a pas participé une fois qu’elle a été contactée. Les poids des répondants ont été augmentés, afin de compenser pour ceux qui n’ont pas répondu, conformément à la description de la section 6.3.

Afin d’atténuer le nombre de cas de non-réponse, de nombreuses initiatives ont été entreprises. Au cours des mois ayant mené à l’enquête, une stratégie de communication exhaustive décrite au chapitre 4 a été mise en œuvre pour encourager la participation. En outre, les intervieweurs ont reçu une formation approfondie, colligée dans des manuels à leur intention et offerte par des formateurs expérimentés qui ont également supervisé les activités sur le terrain. Des efforts pour joindre les non-répondants, sous forme de rappels et de suivis, ont aussi été faits par des intervieweurs principaux pour encourager les répondants à participer à l’enquête. Des intervieweurs employant l’IPAO ont aussi assuré un suivi sur le terrain dans de nombreuses régions particulières.

Un tableau détaillé des taux de réponse finaux obtenus pour l’EAPA de 2012 figure à la section 3.3 du présent guide (tableau 4).

7.3.2 Erreurs de couverture

Tel que mentionné à la section 3.1, la population cible de l’EAPA 2012 incluait la population d’identité autochtone du Canada, âgée de 6 ans et plus au 1er février 2012, vivant dans les logements privés à l’extérieur des établissements indiens ou des réserves, de même qu’à l’extérieur de certaines communautés des Premières Nations au Yukon et aux Territoires du Nord-Ouest. La population échantillonnée ou couverte par l’enquête correspondait aux répondants de l’ENM ayant déclaré soit l’ascendance ou l’identité autochtone (voir la sous-section 3.1.1) avec les mêmes restrictions que celles concernant la population cible en ce qui a trait à l’âge et à la géographie. Pour des données sur les Premières Nations vivant dans les réserves, on conseille aux chercheurs d’utiliser les données de l’ENM de 2011. Sinon, de l’information sur cette population sera disponible par l’entremise de l’Enquête régionale sur l’éducation, l’emploi et la petite enfance chez les Premières Nations menée par le Centre de gouvernance de l'information des Premières Nations (voir la section 2.2).

Des erreurs de couverture se produisent lorsqu’il y a des différences entre la population cible et la population échantillonnée (population couverte par la base de sondage). Le surdénombrement n’est généralement pas problématique, étant donné que les unités de l’échantillon hors du champ de l’enquête sont habituellement déterminées pendant la collecte des données et peuvent être estimées pour l’ensemble de la base de sondage. Il pourrait toutefois y avoir sous-dénombrement. Comme l’échantillon de l’EAPA a été sélectionné à partir des personnes qui avaient participé à l’ENM, les personnes qui n’ont pas participé à l’ENM n’ont pas pu être échantillonnées pour l’EAPA (le taux de réponse non pondéré à l’ENM s’établit à 68,6 %). En conséquence, un biais de non-réponse à l’ENM peut se traduire par un biais de couverture dans l’EAPA (même si, techniquement, cela pourrait être considéré comme un biais de non-réponse pour l’EAPA). Statistique Canada a mené plusieurs études, avant et après la collecte des données de l’ENM, pour évaluer le risque et la portée du biais de non-réponse possible à l’ENM. Un certain nombre de mesures ont été prises pour atténuer ces effets, nommément des procédures de suivi particulières de la non-réponse, qui ont été utilisées pour réduire le biais possible pour les populations à risque, comme la population autochtone. Des stratégies de pondération particulières ont aussi été utilisées pour réduire le biais. Pour un examen complet de la qualité des données de l’ENM, voir le Guide de l’utilisateur de l’Enquête nationale auprès des ménages.

7.3.3 Erreurs de mesure

Des erreurs de mesure se produisent lorsqu’une réponse fournie diffère de la valeur réelle. Ces erreurs peuvent être attribuables aux répondants, à l’intervieweur, au questionnaire, à la méthode de collecte ou au système de conservation des dossiers du répondant. Des efforts exhaustifs ont été déployés afin d’élaborer des questions pour l’EAPA de 2012 qui seraient compréhensibles, pertinentes et adaptées sur le plan culturel.  

Par suite de la diffusion des données de l’EAPA de 2006, un examen exhaustif du contenu a été mené pour les questions existantes de l’EAPA. Cet examen a réuni l’expertise d’un groupe diversifié de chercheurs et de spécialistes du domaine provenant de Statistique Canada et de l’extérieur. Une analyse a été effectuée au sujet des questions qui fonctionnaient le mieux et qui étaient les plus efficaces pour produire des indicateurs valides. Ce processus s’est aussi prolongé par une recherche exhaustive de questions pertinentes à partir d’autres questions d’enquête uniformisées à Statistique Canada. Les questions sélectionnées pour être incluses dans le questionnaire de 2012 ont par la suite fait l’objet de plusieurs rondes d’essais qualitatifs au moyen d’interviews individuelles avec les répondants dans huit communautés différentes de diverses régions du Canada, y compris Iqaluit dans le Nord. La mise à l’essai a touché les Premières Nations, les Métis et les Inuit. Un essai qualitatif du questionnaire d’enquête a été mené par le Centre de ressources en conception de questionnaires (CRCQ) de Statistique Canada. Pour réduire l’erreur de mesure, des ajustements ont été apportés au libellé des questions et aux enchaînements, à partir de ces résultats.

De nombreux autres moyens ont aussi été pris pour réduire de façon particulière l’erreur de mesure, y compris le recours à des intervieweurs qualifiés la formation exhaustive des intervieweurs en ce qui a trait aux procédures et au contenu de l’enquête, ainsi que l’observation et le contrôle des intervieweurs, afin de déceler les problèmes de conception du questionnaire ou de mauvaise compréhension des instructions.

7.3.4 Erreurs de traitement

Des erreurs de traitement peuvent se produire à diverses étapes du processus d’enquête, y compris la saisie des données, le codage et le contrôle. Des procédures de contrôle de la qualité ont été appliquées à chaque étape du traitement des données de l’EAPA, afin de réduire ce type d’erreur. Comparativement à l’EAPA de 2006, les erreurs de traitement en 2012 ont été considérablement réduites, du fait que la méthode de collecte papier-crayon de 2006 a été remplacée par l’interview assistée par ordinateur.

Les questionnaires de l’EAPA ont d’abord été passés en revue sur le terrain par le superviseur des intervieweurs. À l’étape du traitement des données, un ensemble détaillé de procédures et de règles de contrôle ont servi à déterminer et à corriger les incohérences entre les réponses fournies. Un ensemble de procédures rigoureuses et systématisées a été élaboré pour évaluer la qualité de chaque variable et pour apporter des corrections à chaque erreur décelée. Un instantané des fichiers de sortie a été pris à chaque étape et une vérification a été effectuée en comparant les fichiers de l’étape en cours et de l’étape précédente. La programmation de toutes les règles de contrôle a fait l’objet d’un essai exhaustif avant d’être appliquée aux données. Parmi les exemples de vérifications du traitement des données figurent l’examen de tous les enchaînements de questions, y compris les séquences très complexes, afin de faire en sorte que les valeurs de sauts de questions soient attribuées avec exactitude et distinguées des différents types de valeurs manquantes; le double codage de contrôle de la qualité des réponses « Autre – Précisez »; la supervision experte du codage des classifications uniformisées; et l’examen de toutes les variables dérivées par rapport aux variables qui les composent, afin d’assurer une programmation appropriée de la logique de calcul, y compris les calculs très complexes. Voir le chapitre sur le traitement des données du présent guide pour plus de détails (chapitre 5).


Notes

  1. Langlet, É., Beaumont, J.-F., et Lavallée, P. 2008. Bootstrap Methods for Two-Phase Sampling Applicable to Postcensal Surveys. Article présenté au Comité consultatif des méthodes statistiques de Statistique Canada, mai 2008, Ottawa.
  2. Haddou, M. 2013. Bootstrap Variance Estimation Specifications - Aboriginal Peoples Survey. Document interne, janvier 2013.
Date de modification :