Concepts, définitions et qualité des données

L’Enquête mensuelle sur les industries manufacturières (EMIM) contient des séries de données statistiques sur les ventes de biens manufacturés, les stocks, les commandes en carnet et les nouvelles commandes des fabricants. Chacune des valeurs associées à ces composantes représente une projection mensuelle des données de l'Enquête annuelle sur les manufactures et l’exploitation forestière (EAMEF).

L'EMIM est une enquête par échantillonnage menée auprès d'environ 10 500 établissements manufacturiers canadiens, lesquels sont catégorisés en plus de 220 industries. Les industries sont classées selon le Système de classification des industries de l'Amérique du Nord (SCIAN) de 2007. Des séries désaisonnalisées sont disponibles pour les principaux agrégats.

Un établissement comporte la plus petite unité de fabrication en mesure d’informer sur les variables à l’étude. Les données recueillies par l’EMIM tracent le « portrait » de la valeur des ventes de biens fabriqués, réalisées par le secteur manufacturier canadien et nous permettent d’analyser la situation de l’économie canadienne, ainsi que la santé d’industries spécifiques à court et à moyen termes. Les données de l’enquête sont employées par des intervenants des secteurs privé et public, notamment par Statistique Canada, les gouvernements fédéraux et provinciaux, des entités commerciales et industrielles, des organismes non gouvernementaux nationaux et internationaux, des experts-conseils, la presse d’affaires et de simples citoyens. Ces données permettent d’analyser la part du marché, les tendances, l’étalonnage des entreprises, l’analyse des politiques, l’élaboration des programmes, la politique fiscale et la politique commerciale.

1. Ventes de biens fabriqués

Les ventes de biens fabriqués (anciennement les livraisons des produits de propre fabrication) sont définies comme étant la valeur des produits fabriqués par les établissements qui ont été livrés à des clients. Elles n’incluent aucune activité de commerce de gros et aucune recette provenant de la location de matériel ou de la vente d’électricité. Dans la pratique, certains répondants déclarent les transactions financières plutôt que les paiements ayant trait au travail fait. Les ventes de biens fabriqués, pour le Canada et les provinces,  sont disponibles selon le SCIAN, au niveau de détails des trois chiffres.

Dans le cas des industries des produits aérospatiaux et leurs pièces d’aéronef et de la construction navale, on se fonde sur la valeur de la production plutôt que sur celle des ventes de biens fabriqués. Pour déterminer cette valeur, on ajuste la valeur mensuelle des ventes de biens fabriqués en fonction de la variation mensuelle des stocks détenus pour les stocks de biens/travaux en cours de fabrication et les produits finis fabriqué). Ce calcul ne tient pas compte des matières premières, car les chiffres de production visent à mesurer le « travail fait » durant le mois. On cherche ainsi à réduire la distorsion causée par les ventes de biens fabriqués de produits d'une grande valeur comme lors d'une vente complétée.

2. Stocks

Il est important de mesurer la valeur des composantes des stocks et ce, aussi bien pour les études économiques que pour le calcul de la valeur de la production économique. On demande aux répondants de déclarer la valeur comptable (au prix coûtant) de leurs matières premières et composantes, de leurs biens / travaux en cours de fabrication et de leurs produits finis fabriqués séparément. Dans certains cas, les répondants estiment la valeur totale de leurs stocks, que l’on répartit ensuite en fonction des pourcentages déclarés dans le cadre de l’EAMEF. Les niveaux des stocks sont calculés pour l’ensemble du Canada et non par province.

3. Commandes

a) Commandes en carnet

Les commandes en carnet sont une réserve de commandes qui génèreront les ventes de biens fabriqués futures, à la condition qu’elles ne soient pas annulées. À l’instar des stocks, les commandes en carnet et les nouvelles commandes sont estimées pour l’ensemble du Canada et non par province.

L'EMIM produit des estimations relativement aux commandes en carnet pour toutes les industries à l'exception de celles où les commandes sont habituellement livrées à partir des stocks détenus et où l’on ne tient pas, par conséquent, de carnet de commande.

b) Nouvelles commandes

Les nouvelles commandes représentent la demande courante pour les produits manufacturés. Les estimations portant sur les nouvelles commandes sont établies à partir des données sur les ventes de biens fabriqués et les commandes en carnet. Toutes les ventes de biens fabriqués effectuées au cours d'un mois donné résultent d'une commande reçue ce mois-là ou avant. Ainsi, la valeur des nouvelles commandes s'obtient en additionnant les ventes de biens fabriqués au cours d'un mois donné avec la différence entre les commandes en carnet pour ce mois et les commandes en carnet pour le mois précédent.

4. Biens non-durables/biens durables

a) Industries des biens non-durables

Aliments (SCIAN 311),
Boissons et produits du tabac (312),
Usines de textiles (313),
Usines de produits textiles (314),
Vêtements (315),
Produits en cuir et produits analogues (316),
Papier (322), 
Impressions et activités connexes de soutien (323),
Produits du pétrole et du charbon (324),
Produits chimiques (325) et
Produits en caoutchouc et en plastique (326).

b) Industries des biens durables

Produits en bois (SCIAN 321),
Produits minéraux non-métalliques (327),
Première transformation des métaux (331),
Fabrication des produits métalliques (332),
Machines (333),
Produits informatiques et électroniques (334),
Matériel, appareils et composants électriques (335),
Matériel de transport (336),
Meubles et produits connexes (337) et
Activités diverses de fabrication (339).     

Conception de l'enquête et méthodologie

L’Enquête mensuelle sur les industries manufacturières (EMIM) a fait l’objet d’un vaste remaniement à compter du mois de référence août 1999.

L’analyse conceptuelle 

En 1998, il a été décidé qu’avant d’entreprendre tout travail de remaniement, les concepts et les définitions de base du programme seraient vérifiés.

Cela a été fait de deux façons : premièrement, une analyse des exigences des utilisateurs a été amorcée. À cet effet, un rapport interne a été réexaminé pour s’assurer qu’on avait satisfait aux exigences des utilisateurs au cours de cet exercice. De plus, une analyse auprès des principaux utilisateurs des comptes nationaux a été entreprise. Cette analyse avait principalement pour objet de repérer toute faille présente dans les données.

Deuxièmement, avec en mains l’information sur ces failles et exigences, une étude des répondants de l’enquête a été menée pour vérifier leur capacité de fournir des données existantes et nouvelles. L’étude avait également pour objet de vérifier si les définitions utilisées par les analystes de l’enquête correspondaient à celles utilisées par les répondants.

Cet exercice a entraîné une réduction du nombre de questions de l’enquête, soit de seize à sept. La plupart des questions abandonnées portaient sur les ventes de biens fabriqués à l’égard de travaux partiellement exécutés.

En 2007, la terminologie de l’EMIM a été mise à jour afin qu'elle soit conforme au plan comptable (PC). Avec la diffusion du mois de référence d'août 2007, l’EMIM a harmonisé ses concepts avec ceux de l’EAMEF. La variable anciennement intitulée « Livraisons » correspond désormais à « Vente de biens fabriqués ». En outre, des modifications mineures ont été apportées aux noms des composants des stocks. Les définitions et les renseignements issus de l’enquête n’ont toutefois pas été modifiés.

Méthodologie

La nouvelle conception de l’échantillon tient compte du Système de classification des industries de l’Amérique du Nord (SCIAN) de 1997 et accorde une importance beaucoup plus grande aux données provinciales. La stratification est effectuée par province avec des exigences égales en matière de qualité pour chaque province. Les grandes unités sont sélectionnées avec certitude, alors que les petites unités le sont selon une probabilité fondée sur la qualité souhaitée de l’estimation pour chaque cellule.

La technique d’estimation permet à l’enquête de produire des estimations à partir du SCIAN. Les séries continueront également à faire l’objet d’un rapprochement avec l’EAMEF. Des estimations provinciales seront produites pour toutes les variables. Une mesure de la qualité (CV) sera également produite.

Volets de conception de l'enquête

Population cible et base de sondage

Le Registre des entreprises de Statistique Canada a fourni la base de sondage pour l’EMIM. La population cible de l’EMIM comprend tous les établissements statistiques figurant au Registre des entreprises qui sont classés dans le secteur manufacturier (le SCIAN). La base de sondage de l’EMIM est déterminée à partir de la population cible, après avoir enlevé les établissements faisant partie de la tranche inférieure de 5 % de l’estimation totale des ventes de biens fabriqués pour chaque province. Ces établissements ont été exclus de la base afin de réduire la taille de l’échantillon sans influer significativement sur la qualité.

L'échantillon

L'échantillon de l'EMIM est un échantillon aléatoire formé de quelque 10 500 établissements. Un nouvel échantillon a été choisi au cours de l’automne 2006, puis un essai parallèle a été réalisé sur une durée de six mois (du mois de référence de septembre 2006 au mois de référence de février 2007). L’échantillon renouvelé est officiellement devenu le nouvel échantillon de l’EMIM à partir de janvier 2007.

Cette étape marque le premier processus de renouvellement de l’échantillon de l’EMIM depuis 2002. Le processus consiste à faire en sorte que l’échantillon soit aussi récent et à jour que possible. Tous les établissements de l’échantillon sont renouvelés en tenant compte des changements dans la valeur de leurs ventes de biens fabriqués; les unités qui ne sont plus actives sont enlevées de l'échantillon et certaines petites unités sont remplacées par d'autres dans la partie de l’échantillon basée sur la TPS alors que d’autres s’alternent dans l’échantillon.

Avant la sélection, la base de sondage est subdivisée en cellules industrie-province. On a surtout utilisé les codes du SCIAN. Selon le nombre d’établissements dans chaque cellule, on a regroupé au sein d’autres subdivisions (appelées strates) les établissements de taille similaire. Pour déterminer la taille d’un établissement, on s’est basé sur les chiffres les plus récents disponibles quant à la valeur annuelle des ventes de biens fabriqués ou des ventes.

Chaque cellule industrie-province comporte une strate à tirage complet où on retrouve les établissements échantillonnés chaque mois avec certitude. Cette strate comprend les plus grandes entreprises statistiques, c’est-à-dire celles qui ont le plus d’impact sur les estimations d’une cellule industrie-province particulière. Ces grandes entreprises statistiques représentent 45 % de l’estimation nationale des ventes de biens fabriqués.

Chaque cellule industrie-province ne peut compter plus de trois strates à tirage partiel. Les établissements de ces strates n'ont pas tous à être échantillonnés avec certitude. On prélève un échantillon aléatoire sur les strates restantes. Un poids égal à l’inverse de la probabilité de sélection est attribué aux réponses de ces établissements échantillonnés. Au sein des cellules à tirage partiel, un échantillon doit être composé au minimum de 10 établissements afin d’obtenir une meilleure stabilité.

La partie à tirage nul de l’échantillon est désormais estimée à partir des données administratives, ce qui fait que 100 % de l’environnement de l’échantillon est couvert. L’estimation de la partie à tirage nul a également permis d’améliorer l’efficacité puisqu’une partie à tirage nul plus importante a été délimitée et l’échantillon a pu être utilisé de manière plus efficace sur la plus petite partie échantillonnée de la base.

Collecte des données

Seulement un sous groupe des établissements de l’échantillon est envoyé pour la collecte. Pour le restant des unités des données administratives sont utilisées pour dérivées les ventes de biens fabriqués. Pour les établissements qui sont collectés, la collecte des données, la saisie des données, la vérification préliminaire et le suivi auprès des non-répondants sont effectués par les bureaux régionaux de Statistique Canada. On communique avec les établissements échantillonnés par la poste ou par téléphone, selon ce qu'ils préfèrent. La saisie des données et la vérification préliminaire sont effectuées en même temps afin de garantir la validité des données.

Dans certains cas, on reçoit des rapports globaux des entreprises ou compagnies qui comptent plus d'un établissement au sein de l'échantillon et où les répondants préfèrent ne pas produire un rapport distinct pour chaque établissement. On fait immédiatement le suivi auprès des entreprises qui n'ont pas répondu ou dont les données contiennent des erreurs.

Utilisation de données administratives

La gestion du fardeau de réponse est un défi constant pour Statistique Canada. Afin de tenter de réduire le fardeau de réponse, particulièrement auprès des petites entreprises, Statistique Canada a étudié  différentes options de rechange à la réalisation d'enquêtes. Les fichiers de données administratives sont une grande source de données relatives aux entreprises et Statistique Canada travaille actuellement à l'exploitation du plein potentiel de cette riche source de données. De ce fait, depuis le mois de référence d'août 2004, l'EMIM a réduit le nombre d'établissements simples de l'échantillon qui sont interviewés directement et tire plutôt les données sur les ventes de biens fabriqués de ces établissements des dossiers de la taxe sur les produits et services (TPS) au moyen d'un modèle statistique. Le modèle rend compte de la différence entre les ventes de biens fabriqués (declarées de l’EMIM) et les ventes (déclarées aux fins de la TPS) en plus du délai entre la période de référence de l'enquête et la période de référence du dossier de TPS.

Parallèlement à l’échantillon le plus récent, depuis janvier 2007, environ 2 500 établissements simples ont été sélectionnés pour composer la partie de l’échantillon basée sur la TPS.

Les estimations des stocks et des commandes en carnet des établissements dont les données sur les ventes de biens fabriqués sont basées sur la TPS sont obtenues au moyen du système d'imputation de l'EMIM. Le système d'imputation applique, aux valeurs des mois précédents, les variations mensuelles et annuelles des entreprises répondantes semblables. Avec le plus récent échantillon, on a raffiné les règles d'inclusion des établissements dont les données sont basées sur la TPS de manière à accroître le nombre de ces établissements dans les industries qui tiennent des stocks plus bas.  Ainsi, on réduira au minimum les répercussions des établissements dont les données sont basées sur la TPS pour lesquels on doit estimer les stocks.

Des renseignements détaillés sur la méthodologie utilisée afin de modéliser les estimations des ventes de biens fabriqués dérivées de sources de données administratives se trouvent dans le document « l'Enquête mensuelle sur les industries manufacturières : l'utilisation de données administratives » (catalogue n31-533-XIF).

Qualité des données

Vérification statistique et imputation

Les données sont analysées à l’intérieur de chaque cellule industrie-province. Les valeurs extrêmes sont inscrites sur une liste, pour qu’on puisse en faire un contrôle en fonction de l’ampleur de l’écart par rapport à la moyenne. On communique avec les répondants afin de vérifier les valeurs extrêmes. Les enregistrements qui sont rejetés à la vérification statistique sont considérés comme des valeurs aberrantes et ne servent pas au calcul des valeurs d’imputation.

Des valeurs d’imputation sont attribuées aux cas de non-réponse, pour les établissements qui n’ont pas répondu ou qui n’ont répondu que partiellement au questionnaire d’enquête. Diverses méthodes d’imputation (tendances des cellules industrie-province, réponses antérieures, EAMEF, etc.) sont employées selon la variable exigeant le traitement. Après l’imputation, le personnel de l’EMIM effectue une vérification finale des réponses qui ont été imputées.

Révisions

Parallèlement à l’élaboration des estimations préliminaires du mois courant, les estimations des trois mois précédents sont révisées pour tenir compte des réponses tardives. Les données sont révisées lorsqu’on reçoit des réponses tardives ou lorsqu’on a reçu antérieurement des réponses erronées.

Estimation

Les estimations sont fournies en fonction des réponses d’un échantillon d’établissements manufacturiers associées aux données administratives relatives à une partie des plus petits établissements. L’échantillonnage de l’enquête comprend la couverture totale des établissements manufacturiers importants de chaque industrie-province, ainsi que la couverture partielle des petites et moyennes entreprises. On répartit au prorata les rapports combinés des sociétés à unités multiples parmi leurs établissements, et les ajustements faits pour tenir compte de la facturation provisoire traduisent les recettes reçues pour les travaux effectués dans le cadre des contrats importants. Environ 2 500 des petites et moyennes entreprises sondées ne reçoivent pas de questionnaire. Les données relatives à leurs ventes de biens fabriqués sont optenues à partir des recettes reçues indiquées dans les fichiers de la TPS. La partie qui n’est pas représentée dans l’échantillon (la partie à tirage nul) comporte les établissements en-dessous du seuil spécifié dans chaque province et industrie. Les sous-totaux relatifs à cette partie sont également déduits en fonction de leurs recettes.

On estime les valeurs des ventes de biens fabriqués, des stocks et des commandes en carnet en pondérant les réponses, les valeurs dérivées des fichiers de la TPS et les imputations par le nombre d'établissements que chacune représente. Les estimations pondérées sont ensuite ajoutées à la partie à tirage nul. Les estimations des ventes de biens fabriqués sont produites par province, mais aucun détail géographique n'est établi pour les stocks et les commandes, car nombre d'entreprises ne peuvent pas déclarer la valeur comptable de ces articles mensuellement.

Étalonnage

Jusqu’en 2003 (inclusivement), l’Enquête mensuelle sur les industries manufacturières (EMIM) était étalonnée en fonction de l’Enquête annuelle sur les manufactures et l’exploitation forestière (EAMEF). L’étalonnage consistait en l’examen régulier des estimations de l’EMIM dans le cadre des données annuelles fournies par l’EAMEF. L’étalonnage réalignait le niveau annualisé de l'EMIM en fonction des dernières données annuelles vérifiées fournies par l'EAMEF.

En 2006 à 2007, Statistique Canada a mené une enquête importante pour déterminer s’il était judicieux de conserver le processus d’étalonnage. Les résultats ont indiqué que l’étalonnage des estimations de l’EMIM en fonction de l’EAMEF devrait cesser. Grâce au renouvellement de l’échantillon de l’EMIM en 2007, on a déterminé que l’étalonnage ne serait plus nécessaire (rétroactif à l'année 2004) puisque l’EMIM représentait depuis précisément 100 % de l'univers de l'échantillon. Le rapprochement entre les données de l’EMIM et l’EAMEF sera maintenu afin de résoudre d’éventuelles anomalies.

Depuis le mois de référence de janvier 2007, un nouvel échantillon a été introduit. La pratique normale veut qu’au bout de quelques années l’échantillon soit renouvelé afin de garantir que la base de sondage est à jour sur le plan des naissances, des décès et des autres changements relatifs à la population. L’échantillon renouvelé est lié au niveau détaillé pour empêcher les ruptures de données et pour s’assurer de la continuité de la série chronologique. Il est conçu de façon à mieux représenter l’industrie manufacturière aux échelles nationale et provinciale.

Comparaisons et rapprochements avec d'autres sources de données

À chaque année, au moment où la Section de l'Enquête annuelle sur les manufactures et l'exploitation forestière élabore ses estimations annuelles, la Section de l'Enquête mensuelle sur les industries manufacturières travaille conjointement avec celle de l'EAMEF à comparer et à rapprocher les écarts de valeurs importants entre les données fondées sur les exercices financiers que fournit l'EAMEF et les données annualisées de l'EMIM aux niveaux des strates et des industries.

L'objectif de cet exercice de rapprochement de données est de faire ressortir et de résoudre les différences importantes entre les deux enquêtes et d'aider à réduire au minimum les différences entre les microdonnées de l'EMIM et de l'EAMEF.  

Erreurs d'échantillonnage et autres erreurs

Ce bulletin présente des estimations fondées sur une enquête par  échantillonnage qui risquent, par conséquent, d'être entachées d'erreurs. La section qui suit vise à faciliter, pour le lecteur, l'interprétation des estimations qui sont publiées.

Les estimations établies sur la base d'une enquête par échantillonnage sont sujettes à différents types d'erreurs. On les regroupe en deux grandes catégories: les erreurs qui sont dues à l'échantillonnage et celles qui ne le sont pas.

1. Erreurs d'échantillonnage

Les erreurs d’échantillonnage constituent un risque inhérent aux enquêtes par échantillonnage. Elles découlent de la différence notée entre la valeur d’une variable échantillonnée aléatoirement et celle d’une variable obtenue grâce à un recensement (ou la moyenne de toutes les valeurs aléatoires possibles). Ce genre d’erreur existe parce que les observations portent uniquement sur un échantillon, non sur l’ensemble de la population.

L’erreur d’échantillonnage dépend de facteurs tels que la taille de l’échantillon, la variabilité de la population, le plan de sondage et la méthode d’estimation. Par exemple, pour une taille donnée d’échantillon, l’erreur d’échantillonnage sera fonction de la méthode de stratification adoptée, de l’attribution de l’échantillon, du choix des unités sondées et de la méthode de sélection. (On peut même, dans le cadre d’un seul plan de sondage, effectuer plusieurs calculs pour arriver à la méthode d’estimation la plus efficace.)  La plus importante caractéristique des sondages probabilistes, c’est que l’erreur d’échantillonnage peut être mesurée à partir de l’échantillon lui-même.

2. Erreurs non liées à l'échantillonnage

Les erreurs qui ne sont pas liées à l’échantillonnage découlent d’une faille systématique dans la structure de la procédure de collecte des données ou dans l’élaboration d’une variable ou de l’ensemble des variables à l’étude. Ces erreurs occasionnent une différence entre la valeur d’une variable obtenue par échantillonnage ou par recensement et la valeur réelle de cette variable. Ces erreurs se retrouvent tant dans les recensements que dans les enquêtes par échantillonnage. Elles sont dues à un ou plusieurs facteurs parmi les suivants:

a) Erreur de couverture. L'erreur peut résulter d'un listage incomplet et d'une couverture insuffisante de la population visée.

b) La réponse. Ici, l'erreur peut être attribuable à la conception du questionnaire et aux caractéristiques de la question, à l'incapacité ou au refus de l'enquêté de fournir des renseignements exacts, à l'interprétation fautive des questions ou à des problèmes d'ordre sémantique.

c) La non-réponse. Certains enquêtés refusent de répondre, tandis que d'autres en sont incapables ou encore répondent trop tard. Les données relatives aux non-répondants peuvent être imputées à partir des chiffres fournis par les répondants ou à l'aide des statistiques antérieures sur les non-répondants, lorsque celles-ci existent.

On ne connaît généralement pas avec précision l'importance de l'erreur d'imputation; celle-ci varie beaucoup selon les caractéristiques qui distinguent les répondants des non-répondants. Comme ce type d'erreur prend habituellement de l'ampleur à mesure que diminue le taux de réponse, on s'efforce d'obtenir le meilleur taux de réponse possible.

d) Le traitement. L'erreur peut se produire lors des diverses étapes du traitement (codage, entrée, vérification, pondération, totalisation, etc.). Il est difficile de mesurer les erreurs non liées à l'échantillonnage. De plus, il faut les cerner à un niveau où elles ne nuisent pas à l'utilisation ou à l'interprétation des chiffres définitifs.

Des mesures ont été prises afin de minimiser les erreurs non liées à l'échantillonnage. Ainsi, les unités ont été définies avec beaucoup de précision au moyen des listes les plus à jour. Les questionnaires ont été conçus avec soin afin de réduire au minimum les différentes interprétations possibles. De plus, les diverses étapes de vérification et de traitement ont fait l'objet de contrôles d'acceptation détaillés et on n'a absolument rien négligé pour que le taux de non-réponse et le fardeau de réponse soient faibles.

Évaluation de l'erreur d'échantillonnage et de l'erreur non liée à l'échantillonnage

1. Évaluation de l'erreur d'échantillonnage

L'échantillon utilisé aux fins de la présente enquête est un des nombreux échantillons de même taille qui auraient pu être choisis selon le même plan et les mêmes conditions. Si chaque échantillon pouvait faire l'objet d'une enquête menée essentiellement dans les mêmes conditions, il faudrait s'attendre à ce que l'estimation calculée varie d'un échantillon à l'autre.

On nomme valeur probable l'estimation moyenne obtenue de tous les échantillons possibles. Autrement dit, la valeur probable est celle qu'on obtiendrait en recensant toute la population dans des conditions identiques de collecte et de traitement. Une estimation calculée à partir d'une enquête par échantillonnage est dite précise lorsqu'elle s'approche de la valeur probable.

Les estimations fondées sur un échantillon peuvent ne pas correspondre à la valeur probable. Cependant, comme les estimations proviennent d'un échantillon probabiliste, il est possible d'en mesurer la variabilité par rapport à leur valeur probable. La variance d'une estimation, qui en mesure la précision, se définit comme la moyenne, parmi tous les échantillons possibles, des carrés de la différence entre l'estimation et la valeur probable.

Une fois qu'on a calculé l'estimation et sa variance, il devient possible de calculer d'autres mesures de précision. Par exemple, l'erreur-type, soit la racine carrée de la variance, mesure l'erreur d'échantillonnage dans la même unité que l'estimation (en dollars, notamment). Autrement dit, l'erreur-type mesure la précision en termes absolus. Par contre, le coefficient de variation, c'est-à-dire l'erreur-type divisée par l'estimation, mesure la précision en termes relatifs. Ainsi, l'emploi du coefficient de variation facilite la comparaison de l'erreur d'échantillonnage de deux estimations.

Dans cette publication, on utilise le coefficient de variation pour évaluer l'erreur d'échantillonnage des estimations. Cependant, puisque le coefficient de variation publié pour cette enquête est calculé à partir des réponses des unités, il mesure aussi une certaine erreur non liée à l'échantillonnage.

Voici la formule utilisée pour calculer les coefficients de variation (CV) du tableau 1 :

CV(X) = S(X)/X

où X est l'estimation et S(X) est l'écart type de X.

Le coefficient de variation est exprimé en pourcentage dans cette publication.

L'estimation et le coefficient de variation nous permettent de construire des intervalles de confiance autour de l'estimation. Ainsi, pour notre échantillon, on peut affirmer qu'avec un niveau de confiance donné, la valeur probable est comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si le coefficient de variation d'une estimation de 12 000 000 $ est égal à 10 %, l'écart type sera de 1 200 000 $, soit l'estimation multipliée par le coefficient de variation. Alors, on peut affirmer avec un niveau de confiance de 68 % que la valeur probable sera contenue dans l'intervalle d'une longueur égale à un écart-type autour de l'estimation, soit entre 10 800 000 $ et 13 200 000 $. Ou encore, on peut affirmer avec une confiance de 95 % que la valeur probable sera contenue dans l'intervalle d'une longueur de deux écart-types autour de l'estimation, soit entre 9 600 000 $  et 14 400 000 $.

Le tableau explicatif 1 qui suit indique, pour l’ensemble du secteur manufacturier, les coefficients de variation nationaux, exprimé en pourcentage, des éléments de l’EMIM. Pour les CV à d’autres niveaux d’agrégation, veuillez communiquer avec la section de Marketing et diffusion au (613) 951-9497, sans frais au 1-866-873-8789 ou par courriel manufact@statcan.gc.ca.

Tableau explicatif 1 : CV nationaux par caractéristique
Mois Ventes de biens fabriqués Stocks de matières premières et composantes Stocks de biens/travaux en cours de fabrication Stocks de produits finis fabriqués Commandes en carnet
%
Août 2009 0,75 1,13 1,78 1,33 1,22
Septembre 2009 0,77 1,11 1,69 1,34 1,19
Octobre 2009 0,78 1,15 1,82 1,36 1,22
Novembre 2009 0,87 1,11 1,83 1,38 1,24
Décembre 2009 0,83 1,14 1,98 1,39 1,22
Janvier 2010 0,80 1,17 1,96 1,34 1,22
Février 2010 0,86 1,16 2,27 1,39 1,22
Mars 2010 0,86 1,19 2,33 1,43 1,22
Avril 2010 0,77 1,18 2,19 1,38 1,21
Mai 2010 0,83 1,20 2,36 1,41 1,30
Juin 2010 0,84 1,17 2,46 1,42 1,29
Juillet 2010 0,80 1,19 2,45 1,43 1,35
Août 2010 0,82 1,19 2,43 1,42 1,33

2. Évaluation de l'erreur non liée à l'échantillonnage

L'enquête par échantillonnage et le recensement cherchent tous deux à déterminer la valeur exacte de l'ensemble. L'estimation est dite précise si elle se rapproche de cette valeur. Bien qu'il s'agisse d'une valeur souhaitable, il n'est pas réaliste de supposer que la valeur exacte de chaque unité de l'ensemble ou de l'échantillon peut être obtenue et traitée sans erreur. La différence entre la valeur probable et la valeur exacte de l'ensemble s'appelle le biais. On ne peut calculer les biais systématiques des données en recourant aux mesures de probabilité de l'erreur d'échantillonnage décrites auparavant. La précision d'une estimation est déterminée par l'effet conjugué des erreurs d'échantillonnage et des erreurs non liées à l'échantillonnage.

On distingue trois types d’erreur non liée à l'échantillonnage dans l’EMIM : l'erreur due à la non-réponse, l’erreur d’imputation et l’erreur due à la vérification. Afin d’aider l’utilisateur à évaluer ces trois types d’erreur, le tableau explicatif 2 présente les taux pondérés correspondants. Voici un exemple qui illustre ce qu’est un taux pondéré. Supposons que le taux de réponse d'une cellule comportant un échantillon de 20 unités dont cinq répondent lors d'un mois donné atteint 25 %. Si les cinq unités déclarantes représentent 8 millions de dollars sur l'estimation globale de 10 millions de dollars, le taux de réponse pondéré s'élève à 80 %.

Les trois taux pondérés mentionnés dans le tableau explicatif 2 se définissent comme suit : le taux de réponse pondéré est le pourcentage de l’estimation globale d’un élément qui est basé sur des données déclarées (données vérifiées exclues) ; le taux d’imputation pondéré est le pourcentage de l’estimation globale d’un élément qui est fondé sur des données imputées ; le taux de vérification pondéré est le pourcentage de l’estimation globale d’un élément qui est basé sur des données vérifiées (lesquelles peuvent avoir été déclarées ou imputées initialement).

Le tableau explicatif 2 qui suit présente les trois types de taux pondérés pour chaque élément de l’ensemble de l’activité manufacturière à l’échelle nationale. Dans le tableau, les taux sont  exprimés en pourcentage.

Tableau explicatif 2 : Taux pondérés nationaux par source et par caractéristique
Caractéristique Source d’enquête Source des données administratives
Réponse Imputation Vérification Modélisation Imputation Vérification
%
Ventes de biens fabriqués 81,73 5,81 5,33 6,48 0,60 0,05
Matières premières et composantes 71,25 13,82 4,94 0 9,97 0,02
Stocks de biens/travaux en cours de fabrication 55,77 9,59 26,94 0 6,21 1,49
Stocks de produits finis fabriqués 72,43 12,23 5,18 0 9,53 0,63
Commandes en carnet 50,20 6,50 38,49 0 4,28 0,53

Interprétation simultanée des mesures d'erreur

Il faut tenir compte simultanément de la mesure d'erreurs non liées à l'échantillonnage ainsi que du coefficient de variation pour avoir un aperçu de la qualité des estimations. Plus le coefficient de variation sera bas et que le taux de réponse pondéré sera élevé, meilleure sera l'estimation publiée.

Désaisonnalisation

Les séries chronologiques économiques comportent les éléments essentiels à la description, l'explication et la prévision du comportement d'un phénomène économique. Ce sont des enregistrements statistiques de l'évolution des processus économiques dans le temps. L'observation par les économistes et les statisticiens de l'activité économique à l'aide des séries chronologiques a donc permis de distinguer quatre composantes principales du comportement de ces séries : le mouvement à long terme ou tendance, le mouvement cyclique, les variations saisonnières et les fluctuations irrégulières. Ces mouvements sont causés par différents facteurs, soit économiques, climatiques ou institutionnels. Les variations saisonnières sont les fluctuations périodiques plus ou moins régulières qui se produisent au cours d'une année en raison du cycle météorologique normal, des congés fixes et d'autres événements qui se répètent à intervalles avec une certaine régularité pour influencer de façon significative le taux d'activité économique.

Afin de favoriser l'interprétation exacte de l'évolution fondamentale d'un phénomène économique et de produire une meilleure prévision, Statistique Canada rajuste les séries chronologiques au moyen de la méthode de désaisonnalisation X12-ARIMA de façon à minimiser l'impact des variations saisonnières sur les séries. Cette technique consiste essentiellement à ajouter les estimations d'une année de données brutes à la fin de la série initiale avant de procéder à la désaisonnalisation proprement dite. Les données estimées proviennent de prévisions réalisées par des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées) du type Box-Jenkins.

Le programme X12 fait surtout appel à la méthode de rapport aux moyennes mobiles pour effectuer le lissage de la série modifiée et obtenir une estimation provisoire de la tendance-cycle, calculer les rapports de la série initiale (ajustée) aux estimations de la tendance-cycle, et estimer les facteurs saisonniers à partir de ces dits rapports. Les facteurs saisonniers définitifs ne sont produits que lorsque ces opérations ont été exécutées à plusieurs reprises. La technique utilisée consiste essentiellement, dans un premier temps, à corriger la série initiale de toute sorte d’effets indésirables, tels l’effet des jours ouvrableset l’effet de Pâques, par un module appelé regARIMA.

L’estimation de ces effets se fait grâce à l’utilisation de modèles de régression à erreurs ARIMA. On peut également extrapoler la série d'au moins une année à l'aide du modèle. Dans un deuxième temps, la série brute, pré-ajustée et extrapolée s’il y a lieu, est désaisonnalisée par la méthode X-12.

Les étapes déterminant les facteurs saisonniers nécessaires au calcul des données désaisonnalisées finales sont exécutées à chaque mois. Cette approche garantit que la série non désaisonnalisée, à partir de laquelle sont calculées les estimations des facteurs saisonniers, inclut toutes les données les plus récentes relativement à ladite série, c.-à-d., les données non désaisonnalisées qui portent sur le mois courant et les données non désaisonnalisées révisées du mois précédent.

Bien que la désaisonnalisation permette de mieux comprendre la tendance-cycle fondamentale d'une série, la série désaisonnalisée n'en contient pas moins une composante irrégulière. De légères variations d'un mois à l'autre dans la série désaisonnalisée peuvent n'être que de simples mouvements irréguliers. Pour avoir une meilleure idée de la tendance fondamentale, les utilisateurs doivent donc examiner les séries désaisonnalisées d'un certain nombre de mois.

Les séries de données agrégées au niveau du Canada sont maintenant désaisonnalisées de façon directe, ce qui signifie que les totaux désaisonnalisés sont obtenus au moyen de X12 ARIMA. Ces totaux sont ensuite utilisés pour réconcilier les séries de totaux provinciaux qui ont été désaisonnalisés séparément au préalable.

Pour ce qui est des autres séries agrégées, on a utilisé la désaisonnalisation indirecte. En d’autres mots, leurs totaux désaisonnalisés sont dérivés de façon indirecte en faisant la somme des genres de commerce désaisonnalisés séparément au préalable.  

Tendance

Une série désaisonnalisée peut montrer encore les effets d'irrégularités et de circonstances spéciales;  et cela peut masquer la tendance. La tendance à court terme montre la direction prise dans une série désaisonnalisée en  affectant une moyenne à travers les mois de sorte que ces mouvements irréguliers soient aplanis. Le résultat est une série plus stable. La tendance pour le dernier mois apparaît sous réserve de rectification, car les valeurs des mois à venir sont inclues dans le calcul de la moyenne.

Déflation des ventes de biens fabriqués, des commandes et des stocks manufacturiers

La variation des valeurs des données publiées dans le cadre de l'Enquête mensuelle sur les industries manufacturières (EMIM) peut être attribuable à l'évolution des prix ou des quantités mesurées, ou des deux. Pour analyser l'activité du secteur manufacturier, il est souvent souhaitable de séparer les variations causées par des changements de prix de celles causées par des changements des quantités produites. Cet ajustement est connu sous le nom de déflation.

La déflation consiste à diviser les valeurs aux prix courants obtenues grâce à l'enquête par des indices de prix pertinents afin d'obtenir des estimations évaluées aux prix d'une période antérieure, actuellement l'année 2002. On dit des valeurs finales qu'elles sont « aux prix de 2002 ». Il faut noter que l'expression « aux prix courants » désigne le moment où s'est déroulée l'activité et non le moment présent, ni le moment de la compilation.

Les estimations déflatées de l'EMIM reflètent les prix de 2002, qui constitue l'année de base. On a choisi l’année 1997 parce qu’elle correspond à l'année de base des indices de prix utilisés pour déflater les estimations de l'EMIM. L'utilisation des prix d'une année de base pour mesurer l’activité courante produit une mesure représentative du volume d'activité actuel par rapport à cette année de base. Les variations actuelles du volume ne se reflètent convenablement dans les mesures à prix constants que si l'importance relative actuelle des industries n'est pas très différente de celle observée pendant l'année de base.

La déflation des estimations de l'EMIM est effectuée à un niveau industriel très détaillé, équivalant aux classes à 6 chiffres du Système de classification des industries de l'Amérique du Nord (SCIAN). Pour chaque industrie à ce niveau, on utilise des indices de prix composites qui décrivent la fluctuation des prix des différents groupes de produits fabriqués par cette industrie.

Sauf quelques rares exceptions, les indices de prix sont des moyennes pondérées des indices des prix des produits industriels (IPPI). Les poids utilisés sont tirés des tableaux annuels des entrées-sorties du Canada et varient d'année en année. Comme les tableaux d’entrées-sorties sont publiés avec un retard d'environ deux ans et demi, les poids utilisés pour les plus récentes années sont fondés sur les tableaux d'entrées-sorties les plus récents.

On utilise le même indice de prix pour déflater les ventes de biens fabriqués, les nouvelles commandes et les commandes en carnet d'une industrie. Les poids servant à la compilation de cet indice de prix sont tirés des tableaux de sorties, évalués aux prix à la production. Les prix à la production sont les prix des produits à leur sortie de l'établissement de fabrication et ne comprennent pas des éléments tels que les frais de transport, les taxes, etc. Ainsi, l'indice de prix de chaque industrie reflète la production des établissements de l’industrie.

Les indices de prix qu'on utilise pour déflater les stocks de biens/travaux en cours de fabrication et les stocks de produits finis fabriqués d'une industrie sont des moyennes mobiles de l'indice de prix utilisé pour les ventes de biens fabriqués. En ce qui concerne les stocks de biens/travaux en cours de fabrication, le nombre de termes de la moyenne mobile correspond à la durée du processus de fabrication. On obtient la durée en calculant la moyenne, au cours des 48 mois précédents, du ratio entre les stocks de biens/travaux en cours de fabrication à la fin du mois et la production de l'industrie, cette dernière étant égale aux ventes de biens fabriqués additionnées des variations des stocks de biens/travaux en cours de fabrication et de produits finis fabriqués.

En ce qui a trait aux stocks de produits finis fabriqués, le nombre de termes dans la moyenne mobile reflète la durée pendant laquelle un produit fini demeure en stock. On obtient ce chiffre, connu sous le nom de période de rotation des stocks, en calculant la moyenne, au cours des 48 mois précédents, du ratio entre les stocks de produits finis fabriqués à la fin du mois et les ventes de biens fabriqués.

Pour déflater les stocks de matières premières et composantes, les indices de prix correspondant à la consommation des matières premières sont obtenus en tant que moyennes pondérées des IPPI. Les poids sont tirés des tableaux d'entrées évalués aux prix à la consommation, c'est-à-dire que ces prix comprennent les marges de gros, les frais de transport et les taxes, etc. L'indice de prix qui en découle reflète donc la structure des coûts des matières premières de chaque industrie.

Les stocks de matières premières et composantes sont ensuite déflatés à l'aide d'une moyenne mobile de l'indice de prix correspondant à la consommation des matières premières. Le nombre de termes de la moyenne mobile correspond au taux de consommation des matières premières. Le taux est calculé comme étant la moyenne, au cours des quatre années précédentes, du ratio entre les stocks de matières premières et composantes à la fin de l'année et les entrées intermédiaires de l'industrie.

Méthode employée pour les régions métropolitaines de recensement1

Aux fins de la déclaration des données sur la criminalité et sur le personnel des services de police, les populations des régions métropolitaines de  recensement (RMR) de Statistique Canada ont été ajustées pour qu’elles correspondent aux frontières des services de police. Il arrive souvent que les frontières des services de police ne concordent pas entièrement avec les limites des RMR, en particulier dans les détachements ruraux. Afin d’assurer la plus grande concordance possible entre les deux, les directives suivantes sont utilisées :

  • Si plus de la moitié de la population d’un détachement de trouve dans les limites d’une RMR, alors tous les crimes déclarés par ce détachement sont inclus et la partie de la population à l’extérieur de la RMR est ajoutée à la population officielle de la RMR.

  • Par contre, si moins de la moitié de la population desservie par un détachement se trouve dans les limites d’une RMR, alors tous les crimes déclarés par le détachement sont exclus et la partie de la population qui se trouve à l’intérieur des limites de la RMR est soustraite de la population officielle de la RMR.

RMR d’Abbotsford-Mission

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Fraser Valley H (5909064) et Upper Sumas 6 (5909877).

RMR Barrie

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Bradford West Gwillimbury (3543014).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Springwater (3543009).

RMR Brantford

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Six Nations (Part) 40 (3528037).

RMR de Calgary

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Acme (4805044), Linden (4805046), Waiparous (4815030), Stoney 142, 143, 144 (4815802), Ghost Lake (4815027), 8% de Kananaskis (4815013) 36% de Bighorn No. 8 (4815015), 27% de Kneehill County (4805041), 4% de Weatland County (4805012) et 2% de Mountain View County (4806028).

  • Les régions suivantes à l’extérieur de la RMR ont été exclues: 10% de Rocky View No. 44 (4806014).

RMR d’Edmonton

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Nakamun Park (4813003), Val Quentin (4813005), West Cove (4813006), Yellowstone (4813007), Ross Haven (48 13 008), Castle Island (4813009), Sunset Point (4813011), Alberta Beach (4813012), Onoway (4813014), 4% d’Alexis 133 (4813811), 8% de Wetaskiwin County No.10 (48 11 001), Argentina Beach (4811003), Silver Beach (4811009), 57% de Lac Ste. Anne County (4813001), Westlock County (4813028), 96% de Thorhild County No. 7 (4813036), Thorhild (4813042), Sandy Beach (4813016), Sunrise Beach (4813017).

  • Les régions suivantes à l’intérieure de la RMR ont été exclues: 11% de Parkland County (4811034), Seba Beach (4811038), Betula Beach (4811039), Point Alison (4811041), 10% de Leduc County (4811012), 2% de Golden Days (4811023), 6% de Sturgeon County (4811059).

RMR du Grand Sudbury

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Wahnapitei 11 (3553040), Whitefish Lake 6 (3552051)

RMR Guelph

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Guelph/Eramosa (3523009).

RMR de Halifax

  • Concordance parfaite.

RMR de Hamilton

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : 63% de Burlington (3524002), Grimsby (3526065).

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : 37% d’Oakville (3524001), 37% de Milton (3524009), 37% de Halton Hills (3524015).

RMR Kelowna

  • Concordance parfaite.

RMR de Kingston

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Frontenac Islands (3510005).

RMR de Kitchener

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Wellesley (3530027), Wilmot (3530020).

RMR de London

  • Les régions suivantes à l’extérieur de la RMR ont été incluses :  Newbury (3539002), Southwest Middlesex (3539005), Chippewas of the Thames First Nation 42 (3539017), Munsee-Delaware Nation 1 (3539018), Oneida 41 (3539021), North Middlesex (3539041), Lucan Biddulph (3539060).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Southwold (3534024), Central Elgin (35 34 020).

RMR Moncton

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : 40% de Brunswick (1304016), 10% de Cardwell (1305026), 50% de Havelock (1305028), Hopewell (1306001), Riverside-Albert (1306003), Harvey (1306004), Alma (1306006), Alma (1306007), Salisbury (1307024), Petitcodiac (1307029).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Saint-Paul (1308008), Dorchester (1307011), Dorchester (1307012), Memramcook (1307013), Fort Folly 1 (1307014).

RMR de Montréal

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Rivière-Beaudette (2471005), Saint-Télesphore (2471015), Saint-Polycarpe (2471020), Les Coteaux (2471033), Saint-Clet (2471045), Pointe-Fortune (2471140), Rigaud (2471133), Très-Saint-Rédempteur, (2471125), Sainte-Marthe, (2471110), Sainte-Justine-de-Newton, (2471115), Sainte-Jean-Baptiste (2457033), Calixa-Lavallée (2459030), Contrecoeur (2459035).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Lavaltrie (2452007), Gore (2476025), L’Épiphanie (2460035), L’Épiphanie (2460040).

RMR d’Oshawa

  • N’est pas présentement utilisé en vue que les données sera basé sur des estimés de Durham Regional Police.

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : 64% de Pickering (3518001), 64% d’Ajax (3518005), 64% de Scugog (3518020), 64% de Mississaugas of Scugog Island (3518022), 64% de Uxbridge (3518029), 64% de Brock (3518039).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : 36% de Whitby (3518009), 36% d’Oshawa (3518013), 36% de Clarington (3518017).

RMR d’Ottawa–Gatineau (partie de l’Ontario)

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : 62% de The Nation / La Nation (3502025).

RMR d’Ottawa–Gatineau (partie du Québec)

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Notre-Dame-de-la-Salette (2482010).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Denholm (2483005).

RMR Peterborough

  • Concordance parfaite.

RMR de Québec

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Sainte-Anne-de-Beaupré (2421030), Beaupré (2421025), Saint-Joachim (2421020), Saint-Tite-des-Caps (2421005), Saint-Ferréol-les-Neiges (2421010), Lac-Croche (2422902).

  • Les régions suivantes de la RMR ont été exclues : Saint-Lambert-de-Lauzon (2426070), Beaumont (2419105) Saint-Henri (2419068).

RMR de Regina

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Findlater (4706062), Bethune (4706061), Dufferin No.190, (4706059), Silton (4706077), Kannata Valley (4706075), Craven (4706078), South Qu'Appelle No. 157 (4706034), Lajord No. 128 (4706011).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Pense no. 160 (4706021), Pense (4706023), Belle Plaine (4706022).

RMR de Saguenay

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: Saint-Honoré (2494060), Saint-Fulgence (2494035).

RMR de Saint John

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: Saint Martins (1301001), St. Martins (1301002), Simonds (1301004), Petersville (1304001), Upham (1305004), Hampton (1305006), Westfield (1305011), Kingston (1305014), Grand Bay-Westfield (1305015), Greenwich (1305038), Musquash (1301016), Lepreau (1302008).

RMR de Saskatoon

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Ruddell (4716003), Maymont (4716004), Mayfield No. 406 (4716005), Great Bend No. 405 (4716008), Radisson (4716009), Borden (4716011), Rosedale No. 283 (4711031), Hanley (4711032), Lost River No. 313 (4711059), Kenaston (4711036), McCraney No. 282 (4711034), Bladworth (4711038), Viscount (4711092), Plunkett (4711094), Viscount No. 341 (4711091), Wolverine No. 340 (4711096). Bayne No. 371 (4715011), Bruno (4715012), Grant No. 372 (4715014), Prud’Homme (4715016), Vonda (4715017), Aberdeen No. 373 (4715018), Aberdeen (4715019).

RMR de Sherbrooke

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Sainte-Catherine-de-Hatley (2445060), Austin (2445085), Orford (2445115).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: North Hatley (2445050), Hatley  (2445055), Ascot Corner (2441055), Saint-Denis-de-Brompton (2442025), Stoke (2442005), Waterville (2444080), Compton (2444071), Waterville (2444080).

RMR de St. Catharines-Niagara

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Grimsby (3526065), West Lincoln (3526021).

RMR de St. John’s

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: Bay Bulls (1001557), Witless Bay (1001559).

RMR de Thunder Bay

  • Les régions suivantes à l’intérieur de la RMR a été exclues: Neebing (3558001), Gillies (3558012), O’Connor (3558016), Conmee (3558019), Fort William 52 (3558003).

RMR de Toronto

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: 30% of Whitby (3518009), 30% of Oshawa (3518013), 30% of Clarington (3518017), 30% of Scugog (3518020), 30% of Mississaugas of Scugog Island (3518022), 30% of Brock (3518039), Adjala Tosorontio (3543003), 78% of Essa (3543021), 63% of Burlington (3524002).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: 70% of Pickering (3518001), 70% of Ajax (3518005), 70% of Uxbridge (3518029), Bradford West Gwillimbury (3543014), 37% of Oakville (3524001), 37% of Milton (3524009), 37% of Halton Hills (3524015).

RMR de Trois-Rivières

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Deschaillons-sur-Saint-Laurent (2438070), Saint-Pierre-les-Becquets (2438065), Sainte-Cécile-de-Lévrard (2438060), Parisville (2438055), Fortierville (2438047), Sainte-Sophie-de-Lévrard (2438040), Sainte-Françoise (2438035), Manseau (2438028), Sainte-Marie-de-Blandford (2438015), Lemieux (2438020), Saint-Sylvère (2438005).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: Wôlinak (2438802), Saint-Maurice (2437230), Champlain (2437220).

RMR de Vancouver

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: 69% de Squamish-Lillooet D (5931021), Cheakamus 11 (5931801).

RMR de Victoria

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Capital H (Part 2) (5917056), Gordon River 2 (5917815), 3% de Capital G (5917029).

RMR de Windsor

  • Concordance parfaite.

RMR de Winnipeg

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Brokenhead (4612054), Cartier (4610043), Niverville (4602046), St-Pierre-Jolys (4602037), 10% de Hanover (4602041), De Salaberry (4602032), St. Andrews (4613043), Dunnottar (4613049).

  • Les régions suivantes de la RMR ont été exclues: 50% de Rosser (4614015).

Notes

  1. Source: Statistique Canada, Division de la démographie et Centre canadien de la statistique juridique

Méthode employée pour les régions métropolitaines de recensement1

Aux fins de la déclaration des données sur la criminalité et sur le personnel des services de police, les populations des régions métropolitaines de  recensement (RMR) de Statistique Canada ont été ajustées pour qu’elles correspondent aux frontières des services de police. Il arrive souvent que les frontières des services de police ne concordent pas entièrement avec les limites des RMR, en particulier dans les détachements ruraux. Afin d’assurer la plus grande concordance possible entre les deux, les directives suivantes sont utilisées :

  • Si plus de la moitié de la population d’un détachement de trouve dans les limites d’une RMR, alors tous les crimes déclarés par ce détachement sont inclus et la partie de la population à l’extérieur de la RMR est ajoutée à la population officielle de la RMR.

  • Par contre, si moins de la moitié de la population desservie par un détachement se trouve dans les limites d’une RMR, alors tous les crimes déclarés par le détachement sont exclus et la partie de la population qui se trouve à l’intérieur des limites de la RMR est soustraite de la population officielle de la RMR.

RMR d’Abbotsford-Mission

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Fraser Valley H (5909064) et Upper Sumas 6 (5909877).

RMR Barrie

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Bradford West Gwillimbury (3543014).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Springwater (3543009).

RMR Brantford

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Six Nations (Part) 40 (3528037).

RMR de Calgary

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Acme (4805044), Linden (4805046), Waiparous (4815030), Stoney 142, 143, 144 (4815802), Ghost Lake (4815027), 8% de Kananaskis (4815013) 36% de Bighorn No. 8 (4815015), 27% de Kneehill County (4805041), 4% de Weatland County (4805012) et 2% de Mountain View County (4806028).

  • Les régions suivantes à l’extérieur de la RMR ont été exclues: 10% de Rocky View No. 44 (4806014).

RMR d’Edmonton

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Nakamun Park (4813003), Val Quentin (4813005), West Cove (4813006), Yellowstone (4813007), Ross Haven (48 13 008), Castle Island (4813009), Sunset Point (4813011), Alberta Beach (4813012), Onoway (4813014), 4% d’Alexis 133 (4813811), 8% de Wetaskiwin County No.10 (48 11 001), Argentina Beach (4811003), Silver Beach (4811009), 57% de Lac Ste. Anne County (4813001), Gibbons (4811064), Westlock County (4813028), 96% de Thorhild County No. 7 (4813036), Thorhild (4813042), Sandy Beach (4813016), Sunrise Beach (4813017), Clearwater 175 (4816823).

  • Les régions suivantes à l’intérieure de la RMR ont été exclues: 11% de Parkland County (4811034), Seba Beach (4811038), Betula Beach (4811039), Point Alison (4811041), 10% de Leduc County (4811012), 2% de Golden Days (4811023), 6% de Sturgeon County (4811059).

RMR du Grand Sudbury

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Wahnapitei 11 (3553040), Whitefish Lake 6 (3552051)

RMR Guelph

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Guelph/Eramosa (3523009).

RMR de Halifax –

Concordance parfaite.

RMR de Hamilton

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Burlington (3524002), Grimsby (3526065).

RMR Kelowna -

Concordance parfaite.

RMR de Kingston

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Frontenac Islands (3510005).

RMR de Kitchener

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Wellesley (3530027), Wilmot (3530020).

RMR de London

  • Les régions suivantes à l’extérieur de la RMR ont été incluses :  Newbury (3539002), Southwest Middlesex (3539005), Chippewas of the Thames First Nation 42 (3539017), Munsee-Delaware Nation 1 (3539018), Oneida 41 (3539021), North Middlesex (3539041), Lucan Biddulph (3539060).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Southwold (3534024), Central Elgin (35 34 020).

RMR Moncton

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : 40% de Brunswick (1304016), 10% de Cardwell (1305026), 50% de Havelock (1305028), Hopewell (1306001), Riverside-Albert (1306003), Harvey (1306004), Alma (1306006), Alma (1306007), Salisbury (1307024), Petitcodiac (1307029).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Saint-Paul (1308008), Dorchester (1307011), Dorchester (1307012), Memramcook (1307013), Fort Folly 1 (1307014).

RMR de Montréal

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Rivière-Beaudette (2471005), Saint-Télesphore (2471015), Saint-Polycarpe (2471020), Les Coteaux (2471033), Saint-Clet (2471045), Pointe-Fortune (2471140), Rigaud (2471133), Très-Saint-Rédempteur, (2471125), Sainte-Marthe, (2471110), Sainte-Justine-de-Newton, (2471115), Sainte-Jean-Baptiste (2457033), Calixa-Lavallée (2459030), Contrecoeur (2459035).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Lavaltrie (2452007), Gore (2476025), L’Épiphanie (2460035), L’Épiphanie (2460040).

RMR d’Oshawa

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Pickering (3518001), Ajax (3518005), Scugog (3518020), Mississaugas of Scugog Island (3518022), Uxbridge (3518029), Brock (3518039).

RMR d’Ottawa–Gatineau (partie de l’Ontario)

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : 62% de The Nation / La Nation (3502025).

RMR d’Ottawa–Gatineau (partie du Québec)

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Notre-Dame-de-la-Salette (2482010).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Denholm (2483005).

RMR Peterborough - Concordance parfaite.

RMR de Québec

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Sainte-Anne-de-Beaupré (2421030), Beaupré (2421025), Saint-Louis-de-Gonzague-du-Cap-Tourmente (2421015) Saint-Joachim (2421020), Saint-Tite-des-Caps (2421005), Saint-Ferréol-les-Neiges (2421010), Sault-au-Cochon (2421902), Lac-Jacques-Cartier (2421904), Lac-Croche (2422902).

  • Les régions suivantes de la RMR ont été exclues : Saint-Lambert-de-Lauzon (2426070), Beaumont (2419105) Saint-Henri (2419068).

RMR de Regina

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Findlater (4706062), Bethune (4706061), Dufferin No.190, (4706059), Silton (4706077), Kannata Valley (4706075), South Qu'Appelle (4706034), Lajord No. 128 (4706011).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues : Pense no. 160 (47 06 021), Pense (47 06 023), Belle Plaine (47 06 022).

RMR de Saguenay

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: Saint-Honoré (2494060), Saint-Fulgence (2494035).

RMR de Saint John

  • Les régions suivantes à l’extérieur de la RMR ont été incluses : Wickham (1304008), 80% de Johnston (1304014), 60% de Brunswick (1304016), Hammond (1305001), Norton (1305016), Norton (1305018), Sussex (1305021), Sussex (1305022), Sussex Corner (1305023), Waterford (1305024), 90% de Cardwell (1305026), 50% de Havelock (1305028), Studholm (1305031), Springfield (1305034), Kars (1305036).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: Musquash (1301016), Lepreau (1302008).

RMR de Saskatoon

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Ruddell (4716003), Maymont (4716004), Mayfield No. 406 (4716005), Great Bend No. 405 (4716008), Radisson (4716009), Borden (4716011), Rosedale No. 283 (4711031), Hanley (4711032), Lost River No. 313 (4711059), Kenaston (4711036), McCraney No. 282 (4711034), Bladworth (4711038), Viscount (4711092), Plunkett (4711094), Viscount No. 341 (4711091), Wolverine No. 340 (4711096). Bayne No. 371 (4715011), Bruno (4715012), Grant No. 372 (4715014), Prud’Homme (4715016), Vonda (4715017), Aberdeen No. 373 (4715018), Aberdeen (4715019).

RMR de Sherbrooke

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Sainte-Catherine-de-Hatley (2445060), Austin (2445085), Orford (2445115).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: North Hatley (2445050), Hatley  (2445055), Ascot Corner (2441055), Saint-Denis-de-Brompton (2442025), Stoke (2442005), Waterville (2444080), Compton (2444071), Waterville (2444080).

RMR de St. Catharines-Niagara

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Grimsby (3526065), West Lincoln (3526021).

RMR de St. John’s

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: Bay Bulls (1001557), Witless Bay (1001559).

RMR de Thunder Bay

  • Les régions suivantes à l’intérieur de la RMR a été exclues: Neebing (3558001), Gillies (3558012), O’Connor (3558016), Conmee (3558019), Fort William 52 (3558003).

RMR de Toronto

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Burlington (3524002), Adjala Tosorontio (3543003), 78% de Essa (3543021), Georgina (3519070).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: Bradford West Gwillimbury (3543014) Pickering (3518001), Ajax (3518005), Uxbridge (3518029).

RMR de Trois-Rivières

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Deschaillons-sur-Saint-Laurent (2438070), Saint-Pierre-les-Becquets (2438065), Sainte-Cécile-de-Lévrard (2438060), Parisville (2438055), Fortierville (2438047), Sainte-Sophie-de-Lévrard (2438040), Sainte-Françoise (2438035), Manseau (2438028), Sainte-Marie-de-Blandford (2438015), Lemieux (2438020), Saint-Sylvère (2438005).

  • Les régions suivantes à l’intérieur de la RMR ont été exclues: Wôlinak (2438802), Saint-Maurice (2437230), Champlain (2437220).

RMR de Vancouver

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: 69% de Squamish-Lillooet D (5931021), Cheakamus 11 (5931801).

RMR de Victoria

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: Capital H (Part 2) (5917056), Gordon River 2 (5917815), Pacheena 1 (5917816), 3% de Capital G (5917029).

RMR de Windsor –

Concordance parfaite.

RMR de Winnipeg

  • Les régions suivantes à l’extérieur de la RMR ont été incluses: 10% de Alexander (4601071), Brokenhead (4612054), Cartier (4610043), Niverville (4602046), St-Pierre-Jolys (4602037), 10% de Hanover (4602041), De Salaberry (46 02 032), St. Andrews (4613043), Dunnottar (4613049).

  • Les régions suivantes de la RMR ont été exclues: 50% de Rosser (4614015).

Notes

  1. Source: Statistique Canada, Division de la démographie et Centre canadien de la statistique juridique

Statistique de l’état civil : Base de données sur les mariages Exactitude des données (2005 à 2008)

Mariages de personnes de même sexe

À la suite de décisions de tribunaux provinciaux en 2003, les registres de l’état civil de l’Ontario et de la Colombie–Britannique commencèrent à enregistrer les mariages de couples de même sexe. En 2004, des décisions prises par les cours de cinq provinces (Québec, Manitoba, Nouvelle–Écosse, Saskatchewan et Terre–Neuve–et–Labrador) et d’un territoire (Yukon) ont eu pour effet d’augmenter le nombre de provinces et de territoires à enregistrer les mariages entre conjoints de même sexe. Une décision d'un tribunal du Nouveau–Brunswick a autorisé le mariage entre personnes de même sexe, un mois avant qu’une législation fédérale légalise le 20 juillet 2005 ce type de mariage pour l’ensemble du Canada. Après les Pays–Bas et la Belgique, le Canada est devenu le troisième pays au monde à légaliser le mariage de personnes de même sexe sur son territoire.

En raison de ce changement législatif, l’information relative au sexe des époux a fait l’objet d’un enregistrement partiel dans certaines provinces ou territoires et elle n’est pas disponible pour l’Ontario (2003 à 2008) et la Saskatchewan (2007 et 2008).

Taux de réponse

Réponse partielle

Pour la période de 2005 à 2008, le taux de réponse variait de 99 % à 100 % pour les principales variables démographiques figurant dans la base de données sur les mariages (âge, état matrimonial antérieur). Pour le lieu de naissance du marié et de la mariée, le taux de réponse global variait de 84 % (2008) à 97 % (2005). Les taux de réponse sur les données sur le sexe variaient de 55 % (2008) à 58 % (2005).

Concepts, définitions et qualité des données

L’Enquête mensuelle sur les industries manufacturières (EMIM) contient des séries de données statistiques sur les ventes de biens manufacturés, les stocks, les commandes en carnet et les nouvelles commandes des fabricants. Chacune des valeurs associées à ces composantes représente une projection mensuelle des données de l'Enquête annuelle sur les manufactures et l’exploitation forestière (EAMEF).

L'EMIM est une enquête par échantillonnage menée auprès d'environ 10 500 établissements manufacturiers canadiens, lesquels sont catégorisés en plus de 220 industries. Les industries sont classées selon le Système de classification des industries de l'Amérique du Nord (SCIAN) de 2007. Des séries désaisonnalisées sont disponibles pour les principaux agrégats.

Un établissement comporte la plus petite unité de fabrication en mesure d’informer sur les variables à l’étude. Les données recueillies par l’EMIM tracent le « portrait » de la valeur des ventes de biens fabriqués, réalisées par le secteur manufacturier canadien et nous permettent d’analyser la situation de l’économie canadienne, ainsi que la santé d’industries spécifiques à court et à moyen termes. Les données de l’enquête sont employées par des intervenants des secteurs privé et public, notamment par Statistique Canada, les gouvernements fédéraux et provinciaux, des entités commerciales et industrielles, des organismes non gouvernementaux nationaux et internationaux, des experts-conseils, la presse d’affaires et de simples citoyens. Ces données permettent d’analyser la part du marché, les tendances, l’étalonnage des entreprises, l’analyse des politiques, l’élaboration des programmes, la politique fiscale et la politique commerciale.

1. Ventes de biens fabriqués

Les ventes de biens fabriqués (anciennement les livraisons des produits de propre fabrication) sont définies comme étant la valeur des produits fabriqués par les établissements qui ont été livrés à des clients. Elles n’incluent aucune activité de commerce de gros et aucune recette provenant de la location de matériel ou de la vente d’électricité. Dans la pratique, certains répondants déclarent les transactions financières plutôt que les paiements ayant trait au travail fait. Les ventes de biens fabriqués, pour le Canada et les provinces,  sont disponibles selon le SCIAN, au niveau de détails des trois chiffres.

Dans le cas des industries des produits aérospatiaux et leurs pièces d’aéronef et de la construction navale, on se fonde sur la valeur de la production plutôt que sur celle des ventes de biens fabriqués. Pour déterminer cette valeur, on ajuste la valeur mensuelle des ventes de biens fabriqués en fonction de la variation mensuelle des stocks détenus pour les stocks de biens/travaux en cours de fabrication et les produits finis fabriqué). Ce calcul ne tient pas compte des matières premières, car les chiffres de production visent à mesurer le « travail fait » durant le mois. On cherche ainsi à réduire la distorsion causée par les ventes de biens fabriqués de produits d'une grande valeur comme lors d'une vente complétée.

2. Stocks

Il est important de mesurer la valeur des composantes des stocks et ce, aussi bien pour les études économiques que pour le calcul de la valeur de la production économique. On demande aux répondants de déclarer la valeur comptable (au prix coûtant) de leurs matières premières et composantes, de leurs biens / travaux en cours de fabrication et de leurs produits finis fabriqués séparément. Dans certains cas, les répondants estiment la valeur totale de leurs stocks, que l’on répartit ensuite en fonction des pourcentages déclarés dans le cadre de l’EAMEF. Les niveaux des stocks sont calculés pour l’ensemble du Canada et non par province.

3. Commandes

a) Commandes en carnet

Les commandes en carnet sont une réserve de commandes qui génèreront les ventes de biens fabriqués futures, à la condition qu’elles ne soient pas annulées. À l’instar des stocks, les commandes en carnet et les nouvelles commandes sont estimées pour l’ensemble du Canada et non par province.

L'EMIM produit des estimations relativement aux commandes en carnet pour toutes les industries à l'exception de celles où les commandes sont habituellement livrées à partir des stocks détenus et où l’on ne tient pas, par conséquent, de carnet de commande.

b) Nouvelles commandes

Les nouvelles commandes représentent la demande courante pour les produits manufacturés. Les estimations portant sur les nouvelles commandes sont établies à partir des données sur les ventes de biens fabriqués et les commandes en carnet. Toutes les ventes de biens fabriqués effectuées au cours d'un mois donné résultent d'une commande reçue ce mois-là ou avant. Ainsi, la valeur des nouvelles commandes s'obtient en additionnant les ventes de biens fabriqués au cours d'un mois donné avec la différence entre les commandes en carnet pour ce mois et les commandes en carnet pour le mois précédent.

4. Biens non-durables/biens durables

a) Industries des biens non-durables

Aliments (SCIAN 311),
Boissons et produits du tabac (312),
Usines de textiles (313),
Usines de produits textiles (314),
Vêtements (315),
Produits en cuir et produits analogues (316),
Papier (322), 
Impressions et activités connexes de soutien (323),
Produits du pétrole et du charbon (324),
Produits chimiques (325) et
Produits en caoutchouc et en plastique (326).

b) Industries des biens durables

Produits en bois (SCIAN 321),
Produits minéraux non-métalliques (327),
Première transformation des métaux (331),
Fabrication des produits métalliques (332),
Machines (333),
Produits informatiques et électroniques (334),
Matériel, appareils et composants électriques (335),
Matériel de transport (336),
Meubles et produits connexes (337) et
Activités diverses de fabrication (339).     

Conception de l'enquête et méthodologie

L’Enquête mensuelle sur les industries manufacturières (EMIM) a fait l’objet d’un vaste remaniement à compter du mois de référence août 1999.

L’analyse conceptuelle 

En 1998, il a été décidé qu’avant d’entreprendre tout travail de remaniement, les concepts et les définitions de base du programme seraient vérifiés.

Cela a été fait de deux façons : premièrement, une analyse des exigences des utilisateurs a été amorcée. À cet effet, un rapport interne a été réexaminé pour s’assurer qu’on avait satisfait aux exigences des utilisateurs au cours de cet exercice. De plus, une analyse auprès des principaux utilisateurs des comptes nationaux a été entreprise. Cette analyse avait principalement pour objet de repérer toute faille présente dans les données.

Deuxièmement, avec en mains l’information sur ces failles et exigences, une étude des répondants de l’enquête a été menée pour vérifier leur capacité de fournir des données existantes et nouvelles. L’étude avait également pour objet de vérifier si les définitions utilisées par les analystes de l’enquête correspondaient à celles utilisées par les répondants.

Cet exercice a entraîné une réduction du nombre de questions de l’enquête, soit de seize à sept. La plupart des questions abandonnées portaient sur les ventes de biens fabriqués à l’égard de travaux partiellement exécutés.

En 2007, la terminologie de l’EMIM a été mise à jour afin qu'elle soit conforme au plan comptable (PC). Avec la diffusion du mois de référence d'août 2007, l’EMIM a harmonisé ses concepts avec ceux de l’EAMEF. La variable anciennement intitulée « Livraisons » correspond désormais à « Vente de biens fabriqués ». En outre, des modifications mineures ont été apportées aux noms des composants des stocks. Les définitions et les renseignements issus de l’enquête n’ont toutefois pas été modifiés.

Méthodologie

La nouvelle conception de l’échantillon tient compte du Système de classification des industries de l’Amérique du Nord (SCIAN) de 1997 et accorde une importance beaucoup plus grande aux données provinciales. La stratification est effectuée par province avec des exigences égales en matière de qualité pour chaque province. Les grandes unités sont sélectionnées avec certitude, alors que les petites unités le sont selon une probabilité fondée sur la qualité souhaitée de l’estimation pour chaque cellule.

La technique d’estimation permet à l’enquête de produire des estimations à partir du SCIAN. Les séries continueront également à faire l’objet d’un rapprochement avec l’EAMEF. Des estimations provinciales seront produites pour toutes les variables. Une mesure de la qualité (CV) sera également produite.

Volets de conception de l'enquête

Population cible et base de sondage

Le Registre des entreprises de Statistique Canada a fourni la base de sondage pour l’EMIM. La population cible de l’EMIM comprend tous les établissements statistiques figurant au Registre des entreprises qui sont classés dans le secteur manufacturier (le SCIAN). La base de sondage de l’EMIM est déterminée à partir de la population cible, après avoir enlevé les établissements faisant partie de la tranche inférieure de 5 % de l’estimation totale des ventes de biens fabriqués pour chaque province. Ces établissements ont été exclus de la base afin de réduire la taille de l’échantillon sans influer significativement sur la qualité.

L'échantillon

L'échantillon de l'EMIM est un échantillon aléatoire formé de quelque 10 500 établissements. Un nouvel échantillon a été choisi au cours de l’automne 2006, puis un essai parallèle a été réalisé sur une durée de six mois (du mois de référence de septembre 2006 au mois de référence de février 2007). L’échantillon renouvelé est officiellement devenu le nouvel échantillon de l’EMIM à partir de janvier 2007.

Cette étape marque le premier processus de renouvellement de l’échantillon de l’EMIM depuis 2002. Le processus consiste à faire en sorte que l’échantillon soit aussi récent et à jour que possible. Tous les établissements de l’échantillon sont renouvelés en tenant compte des changements dans la valeur de leurs ventes de biens fabriqués; les unités qui ne sont plus actives sont enlevées de l'échantillon et certaines petites unités sont remplacées par d'autres dans la partie de l’échantillon basée sur la TPS alors que d’autres s’alternent dans l’échantillon.

Avant la sélection, la base de sondage est subdivisée en cellules industrie-province. On a surtout utilisé les codes du SCIAN. Selon le nombre d’établissements dans chaque cellule, on a regroupé au sein d’autres subdivisions (appelées strates) les établissements de taille similaire. Pour déterminer la taille d’un établissement, on s’est basé sur les chiffres les plus récents disponibles quant à la valeur annuelle des ventes de biens fabriqués ou des ventes.

Chaque cellule industrie-province comporte une strate à tirage complet où on retrouve les établissements échantillonnés chaque mois avec certitude. Cette strate comprend les plus grandes entreprises statistiques, c’est-à-dire celles qui ont le plus d’impact sur les estimations d’une cellule industrie-province particulière. Ces grandes entreprises statistiques représentent 45 % de l’estimation nationale des ventes de biens fabriqués.

Chaque cellule industrie-province ne peut compter plus de trois strates à tirage partiel. Les établissements de ces strates n'ont pas tous à être échantillonnés avec certitude. On prélève un échantillon aléatoire sur les strates restantes. Un poids égal à l’inverse de la probabilité de sélection est attribué aux réponses de ces établissements échantillonnés. Au sein des cellules à tirage partiel, un échantillon doit être composé au minimum de 10 établissements afin d’obtenir une meilleure stabilité.

La partie à tirage nul de l’échantillon est désormais estimée à partir des données administratives, ce qui fait que 100 % de l’environnement de l’échantillon est couvert. L’estimation de la partie à tirage nul a également permis d’améliorer l’efficacité puisqu’une partie à tirage nul plus importante a été délimitée et l’échantillon a pu être utilisé de manière plus efficace sur la plus petite partie échantillonnée de la base.

Collecte des données

Seulement un sous groupe des établissements de l’échantillon est envoyé pour la collecte. Pour le restant des unités des données administratives sont utilisées pour dérivées les ventes de biens fabriqués. Pour les établissements qui sont collectés, la collecte des données, la saisie des données, la vérification préliminaire et le suivi auprès des non-répondants sont effectués par les bureaux régionaux de Statistique Canada. On communique avec les établissements échantillonnés par la poste ou par téléphone, selon ce qu'ils préfèrent. La saisie des données et la vérification préliminaire sont effectuées en même temps afin de garantir la validité des données.

Dans certains cas, on reçoit des rapports globaux des entreprises ou compagnies qui comptent plus d'un établissement au sein de l'échantillon et où les répondants préfèrent ne pas produire un rapport distinct pour chaque établissement. On fait immédiatement le suivi auprès des entreprises qui n'ont pas répondu ou dont les données contiennent des erreurs.

Utilisation de données administratives

La gestion du fardeau de réponse est un défi constant pour Statistique Canada. Afin de tenter de réduire le fardeau de réponse, particulièrement auprès des petites entreprises, Statistique Canada a étudié  différentes options de rechange à la réalisation d'enquêtes. Les fichiers de données administratives sont une grande source de données relatives aux entreprises et Statistique Canada travaille actuellement à l'exploitation du plein potentiel de cette riche source de données. De ce fait, depuis le mois de référence d'août 2004, l'EMIM a réduit le nombre d'établissements simples de l'échantillon qui sont interviewés directement et tire plutôt les données sur les ventes de biens fabriqués de ces établissements des dossiers de la taxe sur les produits et services (TPS) au moyen d'un modèle statistique. Le modèle rend compte de la différence entre les ventes de biens fabriqués (declarées de l’EMIM) et les ventes (déclarées aux fins de la TPS) en plus du délai entre la période de référence de l'enquête et la période de référence du dossier de TPS.

Parallèlement à l’échantillon le plus récent, depuis janvier 2007, environ 2 500 établissements simples ont été sélectionnés pour composer la partie de l’échantillon basée sur la TPS.

Les estimations des stocks et des commandes en carnet des établissements dont les données sur les ventes de biens fabriqués sont basées sur la TPS sont obtenues au moyen du système d'imputation de l'EMIM. Le système d'imputation applique, aux valeurs des mois précédents, les variations mensuelles et annuelles des entreprises répondantes semblables. Avec le plus récent échantillon, on a raffiné les règles d'inclusion des établissements dont les données sont basées sur la TPS de manière à accroître le nombre de ces établissements dans les industries qui tiennent des stocks plus bas.  Ainsi, on réduira au minimum les répercussions des établissements dont les données sont basées sur la TPS pour lesquels on doit estimer les stocks.

Des renseignements détaillés sur la méthodologie utilisée afin de modéliser les estimations des ventes de biens fabriqués dérivées de sources de données administratives se trouvent dans le document « l'Enquête mensuelle sur les industries manufacturières : l'utilisation de données administratives » (catalogue n31-533-XIF).

Qualité des données

Vérification statistique et imputation

Les données sont analysées à l’intérieur de chaque cellule industrie-province. Les valeurs extrêmes sont inscrites sur une liste, pour qu’on puisse en faire un contrôle en fonction de l’ampleur de l’écart par rapport à la moyenne. On communique avec les répondants afin de vérifier les valeurs extrêmes. Les enregistrements qui sont rejetés à la vérification statistique sont considérés comme des valeurs aberrantes et ne servent pas au calcul des valeurs d’imputation.

Des valeurs d’imputation sont attribuées aux cas de non-réponse, pour les établissements qui n’ont pas répondu ou qui n’ont répondu que partiellement au questionnaire d’enquête. Diverses méthodes d’imputation (tendances des cellules industrie-province, réponses antérieures, EAMEF, etc.) sont employées selon la variable exigeant le traitement. Après l’imputation, le personnel de l’EMIM effectue une vérification finale des réponses qui ont été imputées.

Révisions

Parallèlement à l’élaboration des estimations préliminaires du mois courant, les estimations des trois mois précédents sont révisées pour tenir compte des réponses tardives. Les données sont révisées lorsqu’on reçoit des réponses tardives ou lorsqu’on a reçu antérieurement des réponses erronées.

Estimation

Les estimations sont fournies en fonction des réponses d’un échantillon d’établissements manufacturiers associées aux données administratives relatives à une partie des plus petits établissements. L’échantillonnage de l’enquête comprend la couverture totale des établissements manufacturiers importants de chaque industrie-province, ainsi que la couverture partielle des petites et moyennes entreprises. On répartit au prorata les rapports combinés des sociétés à unités multiples parmi leurs établissements, et les ajustements faits pour tenir compte de la facturation provisoire traduisent les recettes reçues pour les travaux effectués dans le cadre des contrats importants. Environ 2 500 des petites et moyennes entreprises sondées ne reçoivent pas de questionnaire. Les données relatives à leurs ventes de biens fabriqués sont optenues à partir des recettes reçues indiquées dans les fichiers de la TPS. La partie qui n’est pas représentée dans l’échantillon (la partie à tirage nul) comporte les établissements en-dessous du seuil spécifié dans chaque province et industrie. Les sous-totaux relatifs à cette partie sont également déduits en fonction de leurs recettes.

On estime les valeurs des ventes de biens fabriqués, des stocks et des commandes en carnet en pondérant les réponses, les valeurs dérivées des fichiers de la TPS et les imputations par le nombre d'établissements que chacune représente. Les estimations pondérées sont ensuite ajoutées à la partie à tirage nul. Les estimations des ventes de biens fabriqués sont produites par province, mais aucun détail géographique n'est établi pour les stocks et les commandes, car nombre d'entreprises ne peuvent pas déclarer la valeur comptable de ces articles mensuellement.

Étalonnage

Jusqu’en 2003 (inclusivement), l’Enquête mensuelle sur les industries manufacturières (EMIM) était étalonnée en fonction de l’Enquête annuelle sur les manufactures et l’exploitation forestière (EAMEF). L’étalonnage consistait en l’examen régulier des estimations de l’EMIM dans le cadre des données annuelles fournies par l’EAMEF. L’étalonnage réalignait le niveau annualisé de l'EMIM en fonction des dernières données annuelles vérifiées fournies par l'EAMEF.

En 2006 à 2007, Statistique Canada a mené une enquête importante pour déterminer s’il était judicieux de conserver le processus d’étalonnage. Les résultats ont indiqué que l’étalonnage des estimations de l’EMIM en fonction de l’EAMEF devrait cesser. Grâce au renouvellement de l’échantillon de l’EMIM en 2007, on a déterminé que l’étalonnage ne serait plus nécessaire (rétroactif à l'année 2004) puisque l’EMIM représentait depuis précisément 100 % de l'univers de l'échantillon. Le rapprochement entre les données de l’EMIM et l’EAMEF sera maintenu afin de résoudre d’éventuelles anomalies.

Depuis le mois de référence de janvier 2007, un nouvel échantillon a été introduit. La pratique normale veut qu’au bout de quelques années l’échantillon soit renouvelé afin de garantir que la base de sondage est à jour sur le plan des naissances, des décès et des autres changements relatifs à la population. L’échantillon renouvelé est lié au niveau détaillé pour empêcher les ruptures de données et pour s’assurer de la continuité de la série chronologique. Il est conçu de façon à mieux représenter l’industrie manufacturière aux échelles nationale et provinciale.

Comparaisons et rapprochements avec d'autres sources de données

À chaque année, au moment où la Section de l'Enquête annuelle sur les manufactures et l'exploitation forestière élabore ses estimations annuelles, la Section de l'Enquête mensuelle sur les industries manufacturières travaille conjointement avec celle de l'EAMEF à comparer et à rapprocher les écarts de valeurs importants entre les données fondées sur les exercices financiers que fournit l'EAMEF et les données annualisées de l'EMIM aux niveaux des strates et des industries.

L'objectif de cet exercice de rapprochement de données est de faire ressortir et de résoudre les différences importantes entre les deux enquêtes et d'aider à réduire au minimum les différences entre les microdonnées de l'EMIM et de l'EAMEF.  

Erreurs d'échantillonnage et autres erreurs

Ce bulletin présente des estimations fondées sur une enquête par  échantillonnage qui risquent, par conséquent, d'être entachées d'erreurs. La section qui suit vise à faciliter, pour le lecteur, l'interprétation des estimations qui sont publiées.

Les estimations établies sur la base d'une enquête par échantillonnage sont sujettes à différents types d'erreurs. On les regroupe en deux grandes catégories: les erreurs qui sont dues à l'échantillonnage et celles qui ne le sont pas.

1. Erreurs d'échantillonnage

Les erreurs d’échantillonnage constituent un risque inhérent aux enquêtes par échantillonnage. Elles découlent de la différence notée entre la valeur d’une variable échantillonnée aléatoirement et celle d’une variable obtenue grâce à un recensement (ou la moyenne de toutes les valeurs aléatoires possibles). Ce genre d’erreur existe parce que les observations portent uniquement sur un échantillon, non sur l’ensemble de la population.

L’erreur d’échantillonnage dépend de facteurs tels que la taille de l’échantillon, la variabilité de la population, le plan de sondage et la méthode d’estimation. Par exemple, pour une taille donnée d’échantillon, l’erreur d’échantillonnage sera fonction de la méthode de stratification adoptée, de l’attribution de l’échantillon, du choix des unités sondées et de la méthode de sélection. (On peut même, dans le cadre d’un seul plan de sondage, effectuer plusieurs calculs pour arriver à la méthode d’estimation la plus efficace.)  La plus importante caractéristique des sondages probabilistes, c’est que l’erreur d’échantillonnage peut être mesurée à partir de l’échantillon lui-même.

2. Erreurs non liées à l'échantillonnage

Les erreurs qui ne sont pas liées à l’échantillonnage découlent d’une faille systématique dans la structure de la procédure de collecte des données ou dans l’élaboration d’une variable ou de l’ensemble des variables à l’étude. Ces erreurs occasionnent une différence entre la valeur d’une variable obtenue par échantillonnage ou par recensement et la valeur réelle de cette variable. Ces erreurs se retrouvent tant dans les recensements que dans les enquêtes par échantillonnage. Elles sont dues à un ou plusieurs facteurs parmi les suivants:

a) Erreur de couverture. L'erreur peut résulter d'un listage incomplet et d'une couverture insuffisante de la population visée.

b) La réponse. Ici, l'erreur peut être attribuable à la conception du questionnaire et aux caractéristiques de la question, à l'incapacité ou au refus de l'enquêté de fournir des renseignements exacts, à l'interprétation fautive des questions ou à des problèmes d'ordre sémantique.

c) La non-réponse. Certains enquêtés refusent de répondre, tandis que d'autres en sont incapables ou encore répondent trop tard. Les données relatives aux non-répondants peuvent être imputées à partir des chiffres fournis par les répondants ou à l'aide des statistiques antérieures sur les non-répondants, lorsque celles-ci existent.

On ne connaît généralement pas avec précision l'importance de l'erreur d'imputation; celle-ci varie beaucoup selon les caractéristiques qui distinguent les répondants des non-répondants. Comme ce type d'erreur prend habituellement de l'ampleur à mesure que diminue le taux de réponse, on s'efforce d'obtenir le meilleur taux de réponse possible.

d) Le traitement. L'erreur peut se produire lors des diverses étapes du traitement (codage, entrée, vérification, pondération, totalisation, etc.). Il est difficile de mesurer les erreurs non liées à l'échantillonnage. De plus, il faut les cerner à un niveau où elles ne nuisent pas à l'utilisation ou à l'interprétation des chiffres définitifs.

Des mesures ont été prises afin de minimiser les erreurs non liées à l'échantillonnage. Ainsi, les unités ont été définies avec beaucoup de précision au moyen des listes les plus à jour. Les questionnaires ont été conçus avec soin afin de réduire au minimum les différentes interprétations possibles. De plus, les diverses étapes de vérification et de traitement ont fait l'objet de contrôles d'acceptation détaillés et on n'a absolument rien négligé pour que le taux de non-réponse et le fardeau de réponse soient faibles.

Évaluation de l'erreur d'échantillonnage et de l'erreur non liée à l'échantillonnage

1. Évaluation de l'erreur d'échantillonnage

L'échantillon utilisé aux fins de la présente enquête est un des nombreux échantillons de même taille qui auraient pu être choisis selon le même plan et les mêmes conditions. Si chaque échantillon pouvait faire l'objet d'une enquête menée essentiellement dans les mêmes conditions, il faudrait s'attendre à ce que l'estimation calculée varie d'un échantillon à l'autre.

On nomme valeur probable l'estimation moyenne obtenue de tous les échantillons possibles. Autrement dit, la valeur probable est celle qu'on obtiendrait en recensant toute la population dans des conditions identiques de collecte et de traitement. Une estimation calculée à partir d'une enquête par échantillonnage est dite précise lorsqu'elle s'approche de la valeur probable.

Les estimations fondées sur un échantillon peuvent ne pas correspondre à la valeur probable. Cependant, comme les estimations proviennent d'un échantillon probabiliste, il est possible d'en mesurer la variabilité par rapport à leur valeur probable. La variance d'une estimation, qui en mesure la précision, se définit comme la moyenne, parmi tous les échantillons possibles, des carrés de la différence entre l'estimation et la valeur probable.

Une fois qu'on a calculé l'estimation et sa variance, il devient possible de calculer d'autres mesures de précision. Par exemple, l'erreur-type, soit la racine carrée de la variance, mesure l'erreur d'échantillonnage dans la même unité que l'estimation (en dollars, notamment). Autrement dit, l'erreur-type mesure la précision en termes absolus. Par contre, le coefficient de variation, c'est-à-dire l'erreur-type divisée par l'estimation, mesure la précision en termes relatifs. Ainsi, l'emploi du coefficient de variation facilite la comparaison de l'erreur d'échantillonnage de deux estimations.

Dans cette publication, on utilise le coefficient de variation pour évaluer l'erreur d'échantillonnage des estimations. Cependant, puisque le coefficient de variation publié pour cette enquête est calculé à partir des réponses des unités, il mesure aussi une certaine erreur non liée à l'échantillonnage.

Voici la formule utilisée pour calculer les coefficients de variation (CV) du tableau 1 :

CV(X) = S(X)/X

où X est l'estimation et S(X) est l'écart type de X.

Le coefficient de variation est exprimé en pourcentage dans cette publication.

L'estimation et le coefficient de variation nous permettent de construire des intervalles de confiance autour de l'estimation. Ainsi, pour notre échantillon, on peut affirmer qu'avec un niveau de confiance donné, la valeur probable est comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si le coefficient de variation d'une estimation de 12 000 000 $ est égal à 10 %, l'écart type sera de 1 200 000 $, soit l'estimation multipliée par le coefficient de variation. Alors, on peut affirmer avec un niveau de confiance de 68 % que la valeur probable sera contenue dans l'intervalle d'une longueur égale à un écart-type autour de l'estimation, soit entre 10 800 000 $ et 13 200 000 $. Ou encore, on peut affirmer avec une confiance de 95 % que la valeur probable sera contenue dans l'intervalle d'une longueur de deux écart-types autour de l'estimation, soit entre 9 600 000 $  et 14 400 000 $.

Le tableau explicatif 1 qui suit indique, pour l’ensemble du secteur manufacturier, les coefficients de variation nationaux, exprimé en pourcentage, des éléments de l’EMIM. Pour les CV à d’autres niveaux d’agrégation, veuillez communiquer avec la section de Marketing et diffusion au (613) 951-9497, sans frais au 1-866-873-8789 ou par courriel manufact@statcan.gc.ca.

Tableau explicatif 1 : CV nationaux par caractéristique
Mois Ventes de biens fabriqués Stocks de matières premières et composantes Stocks de biens/travaux en cours de fabrication Stocks de produits finis fabriqués Commandes en carnet
%
Juillet 2009 0,73 1,14 2,08 1,31 1,09
Août 2009 0,75 1,13 1,78 1,33 1,22
Septembre 2009 0,77 1,11 1,69 1,34 1,19
Octobre 2009 0,78 1,15 1,82 1,36 1,22
Novembre 2009 0,87 1,11 1,83 1,38 1,24
Décembre 2009 0,83 1,14 1,98 1,39 1,22
Janvier 2010 0,80 1,17 1,96 1,34 1,22
Février 2010 0,86 1,16 2,27 1,39 1,22
Mars 2010 0,86 1,19 2,33 1,43 1,22
Avril 2010 0,77 1,18 2,19 1,38 1,21
Mai 2010 0,82 1,21 2,34 1,41 1,30
Juin 2010 0,83 1,17 2,45 1,43 1,28
Juillet 2010 0,77 1,18 2,43 1,42 1,33

2. Évaluation de l'erreur non liée à l'échantillonnage

L'enquête par échantillonnage et le recensement cherchent tous deux à déterminer la valeur exacte de l'ensemble. L'estimation est dite précise si elle se rapproche de cette valeur. Bien qu'il s'agisse d'une valeur souhaitable, il n'est pas réaliste de supposer que la valeur exacte de chaque unité de l'ensemble ou de l'échantillon peut être obtenue et traitée sans erreur. La différence entre la valeur probable et la valeur exacte de l'ensemble s'appelle le biais. On ne peut calculer les biais systématiques des données en recourant aux mesures de probabilité de l'erreur d'échantillonnage décrites auparavant. La précision d'une estimation est déterminée par l'effet conjugué des erreurs d'échantillonnage et des erreurs non liées à l'échantillonnage.

On distingue trois types d’erreur non liée à l'échantillonnage dans l’EMIM : l'erreur due à la non-réponse, l’erreur d’imputation et l’erreur due à la vérification. Afin d’aider l’utilisateur à évaluer ces trois types d’erreur, le tableau explicatif 2 présente les taux pondérés correspondants. Voici un exemple qui illustre ce qu’est un taux pondéré. Supposons que le taux de réponse d'une cellule comportant un échantillon de 20 unités dont cinq répondent lors d'un mois donné atteint 25 %. Si les cinq unités déclarantes représentent 8 millions de dollars sur l'estimation globale de 10 millions de dollars, le taux de réponse pondéré s'élève à 80 %.

Les trois taux pondérés mentionnés dans le tableau explicatif 2 se définissent comme suit : le taux de réponse pondéré est le pourcentage de l’estimation globale d’un élément qui est basé sur des données déclarées (données vérifiées exclues) ; le taux d’imputation pondéré est le pourcentage de l’estimation globale d’un élément qui est fondé sur des données imputées ; le taux de vérification pondéré est le pourcentage de l’estimation globale d’un élément qui est basé sur des données vérifiées (lesquelles peuvent avoir été déclarées ou imputées initialement).

Le tableau explicatif 2 qui suit présente les trois types de taux pondérés pour chaque élément de l’ensemble de l’activité manufacturière à l’échelle nationale. Dans le tableau, les taux sont  exprimés en pourcentage.

Tableau explicatif 2 : Taux pondérés nationaux par source et par caractéristique
Caractéristique Source d’enquête Source des données administratives
Réponse Imputation Vérification Modélisation Imputation Vérification
%
Ventes de biens fabriqués 82,27 5,97 4,19 6,86 0,63 0,08
Matières premières et composantes 72,13 14,23 3,6 0 9,99 0,06
Stocks de biens/travaux en cours de fabrication 56,45 10,38 25,51 0 7,44 0,22
Stocks de produits finis fabriqués 71,31 11,81 6,77 0 8,75 1,37
Commandes en carnet 53,84 9,34 31,94 0 4,22 0,67

Interprétation simultanée des mesures d'erreur

Il faut tenir compte simultanément de la mesure d'erreurs non liées à l'échantillonnage ainsi que du coefficient de variation pour avoir un aperçu de la qualité des estimations. Plus le coefficient de variation sera bas et que le taux de réponse pondéré sera élevé, meilleure sera l'estimation publiée.

Désaisonnalisation

Les séries chronologiques économiques comportent les éléments essentiels à la description, l'explication et la prévision du comportement d'un phénomène économique. Ce sont des enregistrements statistiques de l'évolution des processus économiques dans le temps. L'observation par les économistes et les statisticiens de l'activité économique à l'aide des séries chronologiques a donc permis de distinguer quatre composantes principales du comportement de ces séries : le mouvement à long terme ou tendance, le mouvement cyclique, les variations saisonnières et les fluctuations irrégulières. Ces mouvements sont causés par différents facteurs, soit économiques, climatiques ou institutionnels. Les variations saisonnières sont les fluctuations périodiques plus ou moins régulières qui se produisent au cours d'une année en raison du cycle météorologique normal, des congés fixes et d'autres événements qui se répètent à intervalles avec une certaine régularité pour influencer de façon significative le taux d'activité économique.

Afin de favoriser l'interprétation exacte de l'évolution fondamentale d'un phénomène économique et de produire une meilleure prévision, Statistique Canada rajuste les séries chronologiques au moyen de la méthode de désaisonnalisation X12-ARIMA de façon à minimiser l'impact des variations saisonnières sur les séries. Cette technique consiste essentiellement à ajouter les estimations d'une année de données brutes à la fin de la série initiale avant de procéder à la désaisonnalisation proprement dite. Les données estimées proviennent de prévisions réalisées par des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées) du type Box-Jenkins.

Le programme X12 fait surtout appel à la méthode de rapport aux moyennes mobiles pour effectuer le lissage de la série modifiée et obtenir une estimation provisoire de la tendance-cycle, calculer les rapports de la série initiale (ajustée) aux estimations de la tendance-cycle, et estimer les facteurs saisonniers à partir de ces dits rapports. Les facteurs saisonniers définitifs ne sont produits que lorsque ces opérations ont été exécutées à plusieurs reprises. La technique utilisée consiste essentiellement, dans un premier temps, à corriger la série initiale de toute sorte d’effets indésirables, tels l’effet des jours ouvrableset l’effet de Pâques, par un module appelé regARIMA.

L’estimation de ces effets se fait grâce à l’utilisation de modèles de régression à erreurs ARIMA. On peut également extrapoler la série d'au moins une année à l'aide du modèle. Dans un deuxième temps, la série brute, pré-ajustée et extrapolée s’il y a lieu, est désaisonnalisée par la méthode X-12.

Les étapes déterminant les facteurs saisonniers nécessaires au calcul des données désaisonnalisées finales sont exécutées à chaque mois. Cette approche garantit que la série non désaisonnalisée, à partir de laquelle sont calculées les estimations des facteurs saisonniers, inclut toutes les données les plus récentes relativement à ladite série, c.-à-d., les données non désaisonnalisées qui portent sur le mois courant et les données non désaisonnalisées révisées du mois précédent.

Bien que la désaisonnalisation permette de mieux comprendre la tendance-cycle fondamentale d'une série, la série désaisonnalisée n'en contient pas moins une composante irrégulière. De légères variations d'un mois à l'autre dans la série désaisonnalisée peuvent n'être que de simples mouvements irréguliers. Pour avoir une meilleure idée de la tendance fondamentale, les utilisateurs doivent donc examiner les séries désaisonnalisées d'un certain nombre de mois.

Les séries de données agrégées au niveau du Canada sont maintenant désaisonnalisées de façon directe, ce qui signifie que les totaux désaisonnalisés sont obtenus au moyen de X12 ARIMA. Ces totaux sont ensuite utilisés pour réconcilier les séries de totaux provinciaux qui ont été désaisonnalisés séparément au préalable.

Pour ce qui est des autres séries agrégées, on a utilisé la désaisonnalisation indirecte. En d’autres mots, leurs totaux désaisonnalisés sont dérivés de façon indirecte en faisant la somme des genres de commerce désaisonnalisés séparément au préalable.  

Tendance

Une série désaisonnalisée peut montrer encore les effets d'irrégularités et de circonstances spéciales;  et cela peut masquer la tendance. La tendance à court terme montre la direction prise dans une série désaisonnalisée en  affectant une moyenne à travers les mois de sorte que ces mouvements irréguliers soient aplanis. Le résultat est une série plus stable. La tendance pour le dernier mois apparaît sous réserve de rectification, car les valeurs des mois à venir sont inclues dans le calcul de la moyenne.

Déflation des ventes de biens fabriqués, des commandes et des stocks manufacturiers

La variation des valeurs des données publiées dans le cadre de l'Enquête mensuelle sur les industries manufacturières (EMIM) peut être attribuable à l'évolution des prix ou des quantités mesurées, ou des deux. Pour analyser l'activité du secteur manufacturier, il est souvent souhaitable de séparer les variations causées par des changements de prix de celles causées par des changements des quantités produites. Cet ajustement est connu sous le nom de déflation.

La déflation consiste à diviser les valeurs aux prix courants obtenues grâce à l'enquête par des indices de prix pertinents afin d'obtenir des estimations évaluées aux prix d'une période antérieure, actuellement l'année 2002. On dit des valeurs finales qu'elles sont « aux prix de 2002 ». Il faut noter que l'expression « aux prix courants » désigne le moment où s'est déroulée l'activité et non le moment présent, ni le moment de la compilation.

Les estimations déflatées de l'EMIM reflètent les prix de 2002, qui constitue l'année de base. On a choisi l’année 1997 parce qu’elle correspond à l'année de base des indices de prix utilisés pour déflater les estimations de l'EMIM. L'utilisation des prix d'une année de base pour mesurer l’activité courante produit une mesure représentative du volume d'activité actuel par rapport à cette année de base. Les variations actuelles du volume ne se reflètent convenablement dans les mesures à prix constants que si l'importance relative actuelle des industries n'est pas très différente de celle observée pendant l'année de base.

La déflation des estimations de l'EMIM est effectuée à un niveau industriel très détaillé, équivalant aux classes à 6 chiffres du Système de classification des industries de l'Amérique du Nord (SCIAN). Pour chaque industrie à ce niveau, on utilise des indices de prix composites qui décrivent la fluctuation des prix des différents groupes de produits fabriqués par cette industrie.

Sauf quelques rares exceptions, les indices de prix sont des moyennes pondérées des indices des prix des produits industriels (IPPI). Les poids utilisés sont tirés des tableaux annuels des entrées-sorties du Canada et varient d'année en année. Comme les tableaux d’entrées-sorties sont publiés avec un retard d'environ deux ans et demi, les poids utilisés pour les plus récentes années sont fondés sur les tableaux d'entrées-sorties les plus récents.

On utilise le même indice de prix pour déflater les ventes de biens fabriqués, les nouvelles commandes et les commandes en carnet d'une industrie. Les poids servant à la compilation de cet indice de prix sont tirés des tableaux de sorties, évalués aux prix à la production. Les prix à la production sont les prix des produits à leur sortie de l'établissement de fabrication et ne comprennent pas des éléments tels que les frais de transport, les taxes, etc. Ainsi, l'indice de prix de chaque industrie reflète la production des établissements de l’industrie.

Les indices de prix qu'on utilise pour déflater les stocks de biens/travaux en cours de fabrication et les stocks de produits finis fabriqués d'une industrie sont des moyennes mobiles de l'indice de prix utilisé pour les ventes de biens fabriqués. En ce qui concerne les stocks de biens/travaux en cours de fabrication, le nombre de termes de la moyenne mobile correspond à la durée du processus de fabrication. On obtient la durée en calculant la moyenne, au cours des 48 mois précédents, du ratio entre les stocks de biens/travaux en cours de fabrication à la fin du mois et la production de l'industrie, cette dernière étant égale aux ventes de biens fabriqués additionnées des variations des stocks de biens/travaux en cours de fabrication et de produits finis fabriqués.

En ce qui a trait aux stocks de produits finis fabriqués, le nombre de termes dans la moyenne mobile reflète la durée pendant laquelle un produit fini demeure en stock. On obtient ce chiffre, connu sous le nom de période de rotation des stocks, en calculant la moyenne, au cours des 48 mois précédents, du ratio entre les stocks de produits finis fabriqués à la fin du mois et les ventes de biens fabriqués.

Pour déflater les stocks de matières premières et composantes, les indices de prix correspondant à la consommation des matières premières sont obtenus en tant que moyennes pondérées des IPPI. Les poids sont tirés des tableaux d'entrées évalués aux prix à la consommation, c'est-à-dire que ces prix comprennent les marges de gros, les frais de transport et les taxes, etc. L'indice de prix qui en découle reflète donc la structure des coûts des matières premières de chaque industrie.

Les stocks de matières premières et composantes sont ensuite déflatés à l'aide d'une moyenne mobile de l'indice de prix correspondant à la consommation des matières premières. Le nombre de termes de la moyenne mobile correspond au taux de consommation des matières premières. Le taux est calculé comme étant la moyenne, au cours des quatre années précédentes, du ratio entre les stocks de matières premières et composantes à la fin de l'année et les entrées intermédiaires de l'industrie.

Documentation

Pour obtenir un exemplaire des documents suivants, veuillez communiquer avec les Services à la clientèle au (613-951-1746; télécopieur : 613-951-0792 ou hd-ds@statcan.gc.ca).

  • Composante annuelle de l'ESCC – Plan de contenu 2007-2014
  • Aperçu du contenu de l'enquête sur la santé dans les collectivités canadiennes (2011-2012)
  • Sélection du contenu optionnel, 2011-2012
  • ESCC - Guide de l'utilisateur des fichiers de microdonnées 2012 et 2011-2012
  • ESCC 2011-2012 Documentation sur les variables dérivées
  • ESCC 2011-2012 Table Alphabétique
  • ESCC 2011-2012 Index des variables par sujet
  • ESCC 2011-2012 Dictionnaire de données (fréquences arrondies)
  • ESCC 2011-2012 Cliché d'enregistrement
  • Poids ménage
  • ESCC Fichier Partagé – 2011-2012 – Tableaux de la variabilité d’échantillonnage approximative
  • Enquête sur la santé dans les collectivités canadiennes - Errata (mise à jour juin 2013)
  • Imputation sur le revenu pour l'Enquête sur la santé dans les collectivités canadiennes
  • Interprétation des estimations de l'ESCC remaniée
  • Étude sur le mode de collecte
  • Enquêtes sur la santé - Aspects pouvant expliquer les différences entre des estimations obtenues à deux différentes occasions d'enquête

Documentation – Réponse rapide sur les connaissances et l’utilisation du Guide alimentaire canadien

Pour obtenir un exemplaire des documents suivants, veuillez communiquer avec les Services à la clientèle au (613-951-1746; télécopieur : 613-951-0792 ou hd-ds@statcan.gc.ca).

  • ESCC 2012 Réponse rapide sur le Guide alimentaire canadien – Questionnaire
  • ESCC - Guide de l'utilisateur des fichiers de microdonnées 2011
  • ESCC 2012 réponse rapide sur le guide alimentaire canadien – Complément au guide de l’utilisateur
  • ESCC 2012 réponse rapide sur le guide alimentaire canadien – Spécifications des variables dérivées (VD)

Effets du mode de collecte à l’Enquête sur la santé dans les collectivités canadiennes : une comparaison de l’IPAO et l’ITAO

Martin St-Pierre (martin.st-pierre@statcan.ca) et Yves Béland (yves.beland@statcan.ca), Statistique Canada

Cet article devrait être cité comme suit: St-Pierre, M. et Béland, Y. (2004). «Mode effects in the Canadian Community Health Survey: a Comparison of CAPI and CATI», 2004 Proceedings of the American Statistical Association Meeting, Survey Research Methods. Toronto, Canada: American Statistical Association.

Mots–clés: effets du mode, IPAO, ITAO.

1. Introduction

L’Enquête sur la santé dans les collectivités canadiennes (ESCC) comprend deux enquêtes transversales distinctes formant un cycle bisannuel répétitif. La première enquête (2001, 2003, 2005, etc.) recueille des données auprès de plus de 130000 ménages sur une gamme de sujets ayant trait à la santé de la population pour produire des statistiques fiables à l’échelle de la région sociosanitaire. La deuxième enquête (2002, 2004, 2006, etc.), menée auprès d’un échantillon d’environ 30000 ménages et dont chaque cycle porte sur un sujet particulier, vise à produire des estimations fiables à l’échelle de la province (santé mentale, nutrition, mesures d’examen de la santé, etc.).

Pour la première enquête du premier cycle (cycle1.1) réalisée en 2001, on a utilisé de multiples bases de sondage et modes de collecte de données (Statistique Canada, 2003). Pour sélectionner l’échantillon de ménages du cycle1.1, on s’est servi surtout d’une base de sondage aréolaire. Les intervieweurs de l’équipe-terrain ont mené des interviews téléphoniques ou personnelles au moyen d’un questionnaire conçu pour l’interview assistée par ordinateur (IPAO ou ITAO). L’échantillon a été complété par des ménages sélectionnés à partir d’une base de sondage à composition aléatoire ou d’une liste de numéros de téléphone; les intervieweurs des centres d’appels ont mené des interviews téléphoniques assistées par ordinateur (ITAO) auprès des répondants sélectionnés à partir d’un centre d’appels. Pour des raisons opérationnelles et budgétaires, on a modifié le ratio entre les cas de la base de sondage aréolaire et ceux de la base de sondage téléphonique pour le cycle 2.1 de l’ESCC de manière à accroître le nombre de cas complétés par ITAO. Le tableau1 montre la variation de la répartition de l’échantillon entre les deux cycles. On s’attendait à ce que cette modification de la méthode de collecte ait un effet sur la comparabilité de certains indicateurs de la santé clés au cours des deux cycles en amplifiant ou en masquant artificiellement un véritable changement de comportement. Les pourcentages dans le tableau ci–dessous reflètent le fait que certaines unités de la base de sondage aréolaire et toutes les unités de la base de sondage téléphonique sont interviewées par la méthode ITAO.

Tableau 1. Répartition de l’échantillon selon la base de sondage et le mode
Cycle 1.1
(2001)
Cycle 2.1
(2003)
Base de sondage Aréolaire 80 % 50 %
Téléphonique 20 % 50 %
Mode IPAO 50 % 30 %
ITAO 50 % 70 %

Une étude basée sur les données du cycle 1.1. de l’ESCC a révélé d’éventuels effets de mode qui diffèrent selon qu’il s’agit d’IPAO ou d’ITAO; cependant, cette étude présentait de nombreuses limites, certains facteurs non contrôlés faussant l’interprétation des résultats de l’étude (PierreetBéland, 2002).

Afin de mieux comprendre les différences relatives aux méthodes de collecte (IPAO ou ITAO) dans une grande enquête sur la santé, il a été décidé de concevoir une étude spéciale des effets de mode et de l’intégrer au cycle2.1 de l’ESCC. Même si l’on comprend que les différences entre les estimations de l’enquête pourraient être attribuables à de nombreux facteurs, on croit que les résultats de cette étude fourniront aux utilisateurs des données de l’ESCC des renseignements utiles sur l’ampleur des différences dans certaines estimations clés liées à la santé attribuables à la méthode de collecte des données.

Le présent document expose les résultats de l’étude des modes. D’abord, la section 2 expose la méthodologie utilisée pour réaliser l’étude. Elle est suivie d’un résumé des procédures de collecte. La section 4 comprend une brève description de la stratégie de traitement, de pondération et d’estimation. Les résultats de l’étude des modes sont présentés aux sections 5 et 6 où l’on procède à plusieurs analyses univariées et multivariées pour évaluer la présence et l’ampleur des effets de mode. Vient ensuite une discussion des résultats, à la section7. Enfin, la dernière section du document présente les conclusions et quelques recommandations.

2. Méthodologie de l’étude

En raison de contraintes opérationnelles, on a procédé à l’intégration de l’étude des modes au cycle2.1 de l’ESCC et ce, en apportant des modifications minimales aux procédures régulières de collecte. Il importe de souligner qu’il ne s’agissait pas d’un véritable plan expérimental visant à mesurer les effets de mode purs, puisque tous les facteurs n’étaient pas contrôlés dans le plan (par exemple, les intervieweurs ne pouvaient pas être affectés au hasard à l’un ou l’autre mode de collecte). Toutefois, cette étude utilise un plan expérimental à panels partagés, c’est–à–dire un plan de sondage stratifié à plusieurs degrés où les unités d’échantillonnage secondaires sont affectées au hasard à l’échantillon de l’un ou l’autre mode de collecte.

2.1. Taille et répartition de l’échantillon

L’échantillon de chaque mode de collecte devait comprendre au moins 2500 répondants afin de permettre de détecter les différences significatives entre les estimations ponctuelles à un certain niveau α. Ces tailles d’échantillon, compte tenu de l’effet de plan de l’étude, permettent de détecter au niveau α=5% un écart de 2% pour une prévalence de 10% et un écart de 3% pour une prévalence de 25%.

Pour faciliter la mise en œuvre du plan de l’étude tout en perturbant le moins possible les procédures de collecte régulières de l’ESCC, il a été décidé de mener l’étude dans un nombre limité de sites (régions sociosanitaires) au Canada. Les diverses régions du Canada (Est, Québec, Ontario, Prairies et Colombie–Britannique) étaient bien représentées dans les 11sites choisis aux fins de l’étude. Les régions sociosanitaires rurales à très faible densité de population n’ont pas été prises en compte aux fins de cette étude en raison du coût de collecte des données.

L’échantillon de chaque mode a été réparti entre les sites de l’étude proportionnellement aux tailles des échantillons du cycle 2.1 de l’ESCC. Le tableau 2 montre la répartition détaillée des échantillons de l’étude des modes selon le site.

Tableau 2. Tailles des échantillons de l’étude des modes
Région sociosanitaire IPAO ITAO
St.John’s, Terre–Neuve–et–Labrador 135 100
Cape Breton, Nouvelle–Écosse. 125 100
Halifax, Nouvelle–Écosse 200 150
Chaudière–Appalaches, Québec. 230 215
Montérégie, Québec. 405 390
Niagara, Ontario 235 230
Waterloo, Ontario 235 230
Winnipeg, Manitoba 320 320
Calgary, Alberta 350 290
Edmonton, Alberta 335 290
South Fraser, Colombie–Britannique 240 240
Total 2810 2555

Des unités d’échantillonnage supplémentaires ont été attribuées à l’IPAO en prévision d’interviews téléphoniques éventuelles (p.ex., l’intervieweur doit mettre fin à un cas par téléphone pour diverses raisons); ces cas ont été exclus par la suite. On a augmenté ces tailles d’échantillons avant la collecte des données afin de tenir compte des logements hors du champ de l’enquête, des logements inoccupés et de la non–réponse prévue.

2.2. Base de sondage, sélection et randomisation

Dans les sites sélectionnés, on a utilisé pour le cycle 2.1 de l’ESCC deux bases de sondage chevauchantes, soit une base aréolaire et une base liste de numéros de téléphone. Toutefois, dans le but d’éliminer toute source possible de bruit durant l’analyse des données, il a été décidé de sélectionner l’échantillon de l’étude des modes à partir d’une seule base de sondage. Afin de réduire au minimum les modifications apportées aux procédures régulières de collecte de données de l’ESCC, il a été décidé de sélectionner l’échantillon à partir de la base téléphonique et d’attribuer ensuite la méthode de collecte; cette façon de procéder entraînant moins de modifications aux procédures de collecte que la sélection de l’échantillon à partir de la base aréolaire.

La base liste de numéros de téléphone utilisée pour le cycle 2.1 de l’ESCC est créée par couplage de l’annuaire téléphonique du Canada, un disque compact disponible sur le marché contenant les noms, adresses et numéros de téléphone répertoriés dans les annuaires de téléphone au Canada, à des fichiers internes administratifs de conversion de Statistique Canada afin d’obtenir les codes postaux. On a ensuite fait correspondre les numéros de téléphone assortis d’adresses complètes aux régions sociosanitaires de manière à créer des listes stratifiées de numéros de téléphone.

Comme nous l’avons mentionné précédemment, l’étude des modes est fondée sur un plan d’échantillonnage stratifié à deux degrés. Les 11sites représentent les strates du plan de l’étude. Les unités du premier degré sont les subdivisions de recensement (SDR), tandis que les numéros de téléphone sont les unités du deuxième degré. Dans chaque site, l’échantillon de numéros de téléphone a été sélectionné comme suit:

  1. Premier degré: sélection des SDR avec probabilité proportionnelle à la taille (PPT);
  2. Répartition de l’échantillon total (IPAO + ITAO) à un site donné aux SDR échantillonnées proportionnellement à leurs tailles;
  3. Deuxième degré: sélection aléatoire des numéros de téléphone dans chaque SDR.

Une fois l’échantillon de numéros de téléphone sélectionné, les cas pour lesquels une adresse valide n’était pas disponible ont été retirés et ajoutés à l’échantillon ITAO régulier du cycle 2.1 de l’ESCC. Ces numéros de téléphone, qui représentaient environ 7% de tous les numéros, auraient entraîné des modifications importantes des procédures suivies par les intervieweurs sur le terrain (méthode de collecte par IPAO) pour mener les interviews en personne; on a donc décidé de les exclure des échantillons de l’un et l’autre mode.

Enfin, et tout en contrôlant selon la SDR dans chaque site de l’étude, on a attribué de façon aléatoire une méthode de collecte (IPAO ou ITAO) aux numéros de téléphone pour lesquels il existait une adresse valide de manière à créer les échantillons pour les deux modes.

3. Collecte de données

La collecte de données pour le cycle 2.1 de l’ESCC a commencé en janvier 2003 et s’est terminée en décembre 2003. Les unités échantillonnées sélectionnées à partir de la base de sondage aréolaire et de la base téléphonique ont été envoyées aux bureaux régionaux ou aux centres d’appels sur une base mensuelle pour une période de collecte de deux mois (il y a avait un chevauchement d’un mois entre deux périodes de collecte consécutives). Deux semaines avant le début d’une période de collecte, des lettres d’introduction décrivant l’importance de la participation à l’enquête ont été envoyées à tous les cas (bases de sondage aréolaire et téléphonique) pour lesquels une adresse postale valide était disponible.
Pour les cas réguliers de la base de sondage aréolaire, les intervieweurs en personne devaient trouver l’adresse du logement, déterminer le statut du logement (dans le champ d’enquête ou hors de celui–ci) et énumérer tous les membres du ménage pour permettre la sélection aléatoire d’une personne de 12 ans ou plus. Si la personne sélectionnée était présente, alors l’intervieweur procédait à une interview personnelle. Si non, l’intervieweur pouvait soit revenir plus tard pour mener une interview personnelle, soit compléter l’interview par téléphone (dans le cycle 2.1 de l’ESCC, dans 40% des cas de la base de sondage aléatoire, l’interview a été complétée au téléphone).

Pour les cas de la base de numéros de téléphone, les intervieweurs dans les centres d’appels devaient déterminer le statut des numéros de téléphone (l’application électronique comprend des questions précises), énumérer tous les membres du ménage et procéder à une interview auprès de la personne sélectionnée immédiatement ou à une date ultérieure.

La collecte de données pour l’étude des modes s’est déroulée entre juillet et le début de novembre 2003. Pour l’échantillon du mode IPAO, seulement un sous–ensemble d’intervieweurs en personne (expérimentés et non expérimentés) a été désigné dans chaque site pour recueillir les données auprès des cas faisant partie de l’étude des modes, afin de faciliter le contrôle des opérations. Au début de juillet, les intervieweurs ont reçu les cas faisant partie de l’étude des modes (entre 20 et 60) sous forme d’une tâche distincte de leurs tâches dans le cadre de l’ESCC afin que ces cas soient identifiés clairement puisque les intervieweurs ne devaient mener auprès d’eux que des interviews personnelles (IPAO). Pour assurer un maximum de souplesse aux intervieweurs, la période de collecte pour les cas faisant partie de l’étude des modes a été prolongée à trois mois.

Les cas de l’échantillon du mode ITAO ont été divisés en trois et simplement ajoutés aux échantillons ITAO mensuels de l’ESCC (juillet, août et septembre) pour une période de collecte de deux mois. L’échantillon ITAO de l’étude des modes était complètement transparent pour les intervieweurs dans les centres d’appels. Ces cas n’étaient connus que du bureau central.

3.1. Taux de réponse

Au total et après le retrait des unités hors du champ de l’enquête, 3317 ménages ont été sélectionnés pour faire partie de l’échantillon du mode IPAO. Une réponse a été obtenue pour 2788 de ces ménages sélectionnés, ce qui a donné un taux de réponse à l’échelle du ménage de 84,1%. Parmi ces ménages répondants, 2788 personnes (une par ménage) ont été sélectionnées dont 2410 ont répondu, donnant un taux de réponse à l’échelle de la personne de 86,4%. Le taux de réponse combiné observé pour l’échantillon du mode IPAO est de 72,7%.

Pour l’échantillon du mode ITAO, 3460 ménages dans le champ de l’enquête ont été sélectionnés pour participer à l’étude. Une réponse a été obtenue pour 2966 de ces ménages sélectionnés, donnant un taux de réponse à l’échelle du ménage de 85,7%. Parmi ces ménages répondants, 2966 personnes (une par ménage) ont été sélectionnées dont 2598 ont fourni une réponse, donnant un taux de réponse à l’échelle de la personne de 87,6%. Le taux de réponse combiné observé pour l’échantillon du mode ITAO est de 75,1%.

Comme prévu, les taux de réponses observés dans l’étude des modes (particulièrement pour l’ITAO) sont inférieurs aux taux de réponses du cycle 2.1 de l’ESCC parce que les méthodes exhaustives de suivi de la non–réponse mises en place pour l’enquête principale, pour des raisons opérationnelles, n’étaient pas pleinement mises en œuvre pour les cas de l’étude des modes de collecte.

4. Traitement des données, pondération et estimation

Comme l’étude des modes était pleinement intégrée au cycle 2.1 de l’ESCC, on a traité les données recueillies pour les cas visés par l’étude au moyen du système de traitement de données de l’ESCC en même temps que le reste de l’échantillon de l’ESCC. Outre le poids d’échantillonnage principal, on a attribué aux participants à l’étude des modes un poids d’échantillonnage distinct et particulier à l’étude, de manière à bien représenter la population ciblée dans les 11 sites sélectionnés. Il convient de signaler au lecteur que les données sur les cas de l’étude des modes figuraient également dans le fichier de données principal du cycle 2.1 de l’ESCC.

Deux stratégies de pondération comportant divers ajustements ont été appliquées en parallèle (l’une pour l’IPAO et l’autre pour l’ITAO). La stratégie de pondération appliquée à l’échantillon de chaque mode était déterminée par divers facteurs clés, y compris:

  • l’utilisation d’un plan de sondage stratifié à plusieurs degrés comprenant l’échant-illonnage PPT des unités primaires d’échantillonnage et l’échantillonnage aléatoire simple des numéros de téléphone;
  • la non–réponse à l’échelle du ménage;
  • la sélection aléatoire d’une personne selon la composition du ménage ;
  • la non–réponse à l’échelle de la personne.

On a étalonné les poids d’échantillonnage de l’échantillon de chaque mode en ayant recours à une stratification à posteriori unidimensionnelle de dix post–strates âge–sexe (c.–à–d. par croisement des groupes d’âge 12–19, 20–29, 30–44, 45–64 et 65+ et des deux sexes).

Comme dans le cas de l’échantillon courant de l’ESCC et étant donné la complexité du plan de l’étude, on a calculé l’erreur d’échantillonnage pour l’étude des modes par la méthode de rééchantillonnage bootstrap en utilisant 500 répliques (Rust et Rao, 1996). Tous les résultats exposés dans ce document ont été pondérés avec les poids d’échantillonnage de l’étude des modes.

5. Analyse univariée

L’objectif principal de l’étude des modes était de comparer les indicateurs de la santé établis à partir des données recueillies en personne (IPAO) et celles recueillies par téléphone (ITAO). Cette section présente les résultats d’analyses univariées comparant les deux modes de collecte. En premier lieu, on a utilisé des tests d’association du Khi-carré pour comparer les échantillons des deux modes sur le plan des caractéristiques sociodémographiques. Dans tous les cas, on a comparé des distributions pondérées et utilisé un niveau de signification de 5% pour les tests d’association du Khi-carré rajustés. Nous présentons ensuite des comparaisons directes de plusieurs indicateurs de la santé entre les deux modes. Pour ces comparaisons, on a appliqué des tests Z pour déterminer s’il y a une différence significative entre les estimations. Des poids bootstrap ont été utilisés pour calculer les écarts–types. Comme les échantillons des deux modes n’étaient pas indépendants, on a calculé l’écart–type de la différence entre les estimations en mesurant la dispersion des 500 différences entre les estimations au moyen des 500 répliques bootstrap. Pour tous les indicateurs de la santé, la non–réponse partielle est exclue de toute analyse, sauf indication contraire. On suppose donc que la non–réponse partielle est répartie de façon similaire à la réponse partielle, ce qui n’est peut–être pas entièrement vrai. Toutefois, il convient de souligner que la non–réponse partielle est très faible pour l’un et l’autre mode. On présente également une comparaison des non–répondants au niveau du ménage et au niveau de la personne dans les deux échantillons des modes.

5.1. Comparaisons des caractéristiques sociodémographiques et du ménage

Même si les échantillons de l’un et l’autre mode sont représentatifs de la population cible et que les poids d’échantillonnage ont été calibrés selon les groupes âge–sexe, on observe néanmoins des différences sur le plan d’autres caractéristiques sociodémographiques ou du ménage. Pour évaluer ces différences éventuelles, on a procédé à une série de tests d’association du Khi-carré.

Les résultats des tests peuvent être répartis en deux groupes, soit les caractéristiques pour lesquelles aucune différence statistique n’est observée entre les échantillons des deux modes et celles pour lesquelles on relève des différences. On ne constate pas de différences sur le plan des distributions entre les caractéristiques suivantes: dispositions de vie, taille du ménage, niveau de scolarité du répondant, race, immigration et situation du point de vue de l’emploi. On observe cependant des différences statistiquement significatives pour les caractéristiques suivantes: état matrimonial, langue de l’interview, le niveau plus élevé de scolarité dans le ménage et mode d’occupation du logement. Les principales différences peuvent se résumer comme suit:

  • plus de personnes seules dans l’échantillon ITAO que dans l’échantillon IPAO (31% par rapport à 29%);
  • plus de propriétaires–occupants dans l’échantillon ITAO (82,7% par rapport à 79,5%);
  • plus de ménages dans l’échantillon ITAO où le plus haut niveau de scolarité est un diplôme d’études postsecondaires (74,4% par rapport à 71%);
  • plus d’interviews menées dans une langue autre que l’anglais dans le cas de l’échantillon ITAO (27% par rapport à 25,7%).

Pour les variables de revenu, le taux de non–réponse partielle est trop élevé pour permettre des comparaisons valables.

5.2. Comparaisons d’indicateurs de la santé

On a effectué des tests Z pour déterminer si les différences sont statistiquement significatives. Un examen d’environ 70 indicateurs de la santé pour divers domaines d’intérêt âge–sexe révèle des différences significatives pour 15indicateurs. Le tableau 3 montre des estimations ponctuelles de certains indicateurs à l’échelle nationale (11 sites) selon le mode.

L’indicateur de plus important pour lequel on observe des différences significatives est la catégorie «obèse» selon l’indice de masse corporelle (IMC). Le cycle 2.1 de l’ESCC a recueilli des données autodéclarées sur le poids et la taille sur lesquels on s’est fondé pour calculer un IMC. Selon l’Organisation mondiale de la santé, une personne est considérée comme obèse si son IMC est égal ou supérieur à 30. Le taux d’obésité calculé pour les répondants de 18 ans et plus qui ont participé à l’étude des modes est significativement plus élevé pour l’échantillon IPAO (17,9%) que pour l’échantillon ITAO (13,2%). On observe des différences encore plus grandes dans le cas du groupe d’âge de 30 à 44 ans (18,1% pour l’échantillon IPAO et 11,4% pour l’échantillon ITAO) ainsi que pour les hommes (20,4% et 14,7%).

L’indice de l’activité physique est un autre indicateur important pour lequel on observe des différences significatives. L’indice de l’activité physique est un indicateur qui indique la quantité d’activités physiques durant les loisirs faites par une personne au cours des trois derniers mois. Il est calculé à partir des réponses à une série de questions qui demandent aux répondants combien de fois et pendant combien de temps ils se sont adonnés à l’une de 20 activités différentes. L’échantillon IPAO comprend un nombre significativement plus élevé de personnes inactives (42,3%) que l’échantillon ITAO (34,4%).

Pour l’indicateur d’usage du tabac (fumeur quotidien ou occasionnel), le taux est de 2% plus élevé pour l’échantillon IPAO (23,6%) que pour l’échantillon ITAO (21,7%), mais il n’est pas statistiquement différent au niveau de signification de 5%. Toutefois, on observe une différence significative pour le groupe d’âge de 20 à 29 ans (37,7% pour l’échantillon IPAO et 28,2% pour l’échantillon ITAO). D’autres résultats montrent que la proportion de personnes déclarant avoir consulté un médecin et un spécialiste est plus élevée dans le cas de l’échantillon interviewé en personne. Toutefois, la comparaison des consultations de médecins ventilées selon le sexe révèlent des résultats intéressants, soit des différences significatives dans le cas des hommes (80,3% pour l’échantillon IPAO par rapport à 72,5% pour l’échantillon ITAO) mais non dans le cas des femmes (86,7% pour l’échantillon IPAO par rapport à 84,1% pour l’échantillon ITAO). En outre, le taux d’autodéclaration de besoins non satisfaits de soins de santé est sensiblement plus élevé dans le cas de l’échantillon IPAO (13,9%) que dans le cas de l’échantillon ITAO (10,7%).

5.3. Comparaison des non–répondants

La non–réponse totale au cycle 2.1 de l’ESCC et de l’étude des modes peut être divisée en deux catégories, selon qu’il s’agit de non–réponse à l’échelle du ménage et de non–réponse à l’échelle de la personne.

Tableau 3. Comparaison des indicateurs de la santé entre l’échantillon IPAO et l’échantillon ITAO(* = p<0,05, ** = p<0,01)
Indicateur de la santé IPAO ITAO Différence
% I.C. à 95% % I.C. à 95% %
Obésité (taille et poids autodéclarés) 17,9 15,9-19,9 13,2 11,4-15,1 4,7**
Inactivité physique 42,3 39,5-45,1 34,4 31,8-36,9 7,9**
Fumeur quotidien ou occasionnel – tous les âges 23,6 20,7-26,5 21,7 19,8-25,4 1,9
Fumeur quotidien ou occasionnel – 20 à 29 ans 37,7 31,4-44,0 28,2 21,-34,8 9,5*
Consomme de l’alcool 80,7 78,0-82,5 78,8 76,8-80,8 1,9
A au moins un problème de santé chronique 69,5 66,5-72,5 68,5 66,2-70,8 1,0
Limitation des activités 25,4 22,9-27,8 26,8 24,0-29,5 -1,4
Auto–évaluation de la santé comme passable ou mauvaise 9,3 7,9-10,7 9,9 8,6-11,1 -0,6
Auto–évaluation de la santé mentale comme passable ou mauvaise 4,0 2,8-5,2 3,9 2,9-4,9 0,1
Consultation d’un médecin au cours des 12 derniers mois 83,5 81,5-85,6 78,4 76,2-80,6 5,1**
Consultation d’un spécialiste au cours des 12 derniers mois 31,1 28,4-33,8 24,9 22,3-27,5 6,2**
Autodéclaration de besoins non satisfaits de soins de santé 13.9 12,0-15,8 10,7 9,0-12,3 3,2*
A conduit un véhicule moteur après avoir consommé 2verres d’alcool 13,5 11,3-15,7 7,2 5,1-9,3 6,3**
A–t–il (elle) déjà eu des rapports sexuels 90,2 88,5-91,9 87,3 85,1-89,5 2,9*

5.4. Comparaison des non–répondants

La non–réponse totale au cycle 2.1 de l’ESCC et de l’étude des modes peut être divisée en deux catégories, selon qu’il s’agit de non–réponse à l’échelle du ménage et de non–réponse à l’échelle de la personne. Très peu de renseignements sont disponibles sur les 529 ménages non répondants dans l’échantillon IPAO et les 494 ménages non répondants dans l’échantillon ITAO, mais une comparaison des raisons pour lesquelles ces ménages n’ont pas répondu ne révèle pas de différences importantes entre les deux modes. Pour la catégorie «personne à la maison/pas de contact», le taux pour l’échantillon IPAO est de 3,6% et pour celui de l’ITAO, de 2,1%. Les taux de «refus» sont également similaires, soit de 8,7% pour l’IPAO par rapport à 10,4% pour l’ITAO. La non–réponse à l’échelle de la personne s’observe que lorsque les intervieweurs réussissent à compléter la première étape (liste complète des personnes vivant dans le ménage et l’âge, le sexe, l’état matrimonial et le plus haut niveau de scolarité de tous les membres du ménage) mais non la deuxième étape, soit l’interview de l’ESCC auprès du répondant sélectionné. On trouvera au tableau4 une comparaison des taux de non-réponse selon le groupe d’âge des non–répondants (à l’échelle de la personne) dans les échantillons IPAO et ITAO. Il est intéressant de noter les différences à l’une et l’autre extrémité des groupes d’âge. Il est beaucoup plus difficile d’obtenir une réponse d’une personne âgée (65 ans et plus) par téléphone (taux de non–réponse de 13,9%) que en personne (8,9%), tandis qu’on observe l’inverse pour le groupe d’âge le plus jeune (12 à 19 ans). Même si la variable «âge» est utilisée pour créer des classes de propension à répondre pour la repondération pour la non–réponse à l’échelle de la personne, le biais de non–réponse pourrait être non négligeable pour certaines caractéristiques. On pourrait croire que les personnes âgées qui ont un problème physique ont peut–être de la difficulté à se rendre au téléphone. Ce pourrait également être le cas des adolescents où ceux qui sont plus actifs physiquement pourraient être à la maison moins souvent et donc être moins disponibles pour participer à une interview personnelle. Toutefois, il faudrait procéder à d’autres recherches pour vérifier cette hypothèse.

Tableau 4. Taux de non–réponse à l’échelle de la personne (%)
Mode Total 12-19 20-29 30-44 45-64 65+
IPAO 13,6 17,6 15,7 15,1 12,4 8,9
ITAO 12,4 11,9 16,9 12,0 10,1 13,9

6. Analyses multivariées

On a procédé à une série de régressions logistiques multiples pour mieux comprendre les différences observées et pour s’assurer que les effets de mode révélés par les comparaisons des indicateurs ne sont pas simplement attribuables à des divergences dans les caractéristiques sociodémographiques entre les échantillons des deux modes. Cette analyse évalue l’effet du mode de collecte sur la prévalence de plusieurs indicateurs de la santé lorsque les variables sociodémographiques et du ménage sont prises en compte. L’effet de mode est traité dans le modèle comme une variable confondue. Les variables sociodémographiques sont les autres variables confondues. Les termes d’interaction entre le mode de collecte et les variables sociodémographiques ont tous été testés dans le modèle.

Le tableau5 montre, pour certains indicateurs de la santé, la cote exprimant la possibilité de la présence d’un état ou d’un déterminant de la santé dans le cas des personnes interviewées par téléphone en comparaison des personnes interviewées en personne.

Le premier résultat présenté est celui pour l’indicateur de l’usage du tabac. Les résultats présentés à la section 5.2 n’ont pas montré un effet de mode significatif à l’échelle nationale pour cette variable. La présente analyse montre que la cote exprimant le risque de déclarer être un fumeur quotidien ou occasionnel est d’environ 1,8 fois (1/0,56 = 1,79) plus faible chez les personnes de race blanche de 12 à 29 ans lorsqu’elles sont interviewées par téléphone que lorsqu’elles sont interviewées en personne (ce résultat est significativement différent au niveau de 1%). Pour les personnes de race blanche de 30ans et plus, la cote exprimant le risque est la même (1,00) dans le cas de l’ITAO et de l’IPAO. La cote exprimant le risque de déclarer être un fumeur quotidien ou occasionnel est d’environ 1,5fois (1,49) plus élevée chez les non-Blancs lorsqu’ils sont interviewés en personne, mais ce résultat n’est pas significatif au niveau de 5%.

Comme nous l’avons montré à la section 5.2, la cote exprimant le risque de déclarer être obèse est plus faible chez les personnes interviewées par téléphone que chez celles interviewées en personne. Cette cote est encore plus faible en Alberta (0,48); ailleurs au Canada, elle est de 0,79. Pour l’indice de l’activité physique (inactif), on n’observe pas d’interaction entre le mode de collecte et les variables sociodémographiques. Dans l’ensemble, la cote exprimant le risque de déclarer être inactif est d’environ 1,5fois (1/0,65 = 1,54) plus faible chez les personnes interviewées par téléphone que chez celles interviewées en personne.

Pour les indicateurs de la consommation d’alcool, l’origine ethnique, le niveau de scolarité et le groupe d’âge sont les caractéristiques pour lesquelles on observe un effet de mode. Les non–immigrants de race blanche sont moins susceptibles de déclarer être des consommateurs d’alcool lorsqu’ils sont interviewés par téléphone (cote = 0,7), tandis que l’inverse est vrai pour les non–Blancs ou immigrants (cote = 1,71). De même, pour les non–Blancs, la cote exprimant le risque de déclarer avoir consommé au moins cinq verres d’alcool en une occasion au moins une fois par mois est d’environ 2,5 fois plus élevée chez ceux interviewés par téléphone que chez ceux interviewés en personne. On observe l’effet de mode opposé chez les personnes de race blanche dans la catégorie de capacité de revenu inférieure ou la plus faible (cote = 0,45).

Pour les caractéristiques associées à la conduite en état d’ivresse, on observe un effet de mode dans le groupe des 20 à 44 ans. Pour ces personnes, la cote exprimant le risque de déclarer avoir conduit en état d’ivresse est d’environ 3,4 fois (1/0,29) plus faible chez les personnes interviewées par téléphone que chez celles interviewées en personne.

Un autre résultat montre que les personnes qui ne se situent pas dans la catégorie supérieure de capacité du revenu et qui n’ont pas de diplôme d’études postsecondaires sont moins susceptibles de déclarer des besoins non satisfaits de soins de santé lorsqu’elles sont interviewées par téléphone.

7. Interprétation des résultats

Les résultats de l’étude des modes diffèrent considérablement. On n’observe presque aucune différence entre l’IPAO et l’ITAO dans les estimations ponctuelles pour la vaste majorité des indicateurs de la santé mesurés par l’ESCC comme l’usage du tabac (tous les âges), les problèmes de santé chroniques, les limitations des activités ou la consommation des fruits et légumes entre autres. Cela signifie que le nombre accru d’ITAO dans le deuxième cycle n’a pas d’effet sur la comparabilité des indicateurs de la santé pour les deux premiers cycles de l’ESCC.

Cependant, on observe des différences significatives entre l’IPAO et l’ITAO dans le cas de certains indicateurs de la santé, notamment, la taille et le poids autodéclarés, l’indice de l’activité physique, la consultation de médecins et l’autodéclaration de besoins non satisfaits de soins de santé. Même si l’analyse multivariée atténue quelque peu l’incidence des effets de mode lorsque les caractéristiques sociodémographiques sont prises en compte, on croit que toute comparaison des indicateurs ci–dessus au cours des deux cycles doit prendre en compte le nombre accru d’ITAO dans le deuxième cycle. Il importe de mentionner que, dans toute comparaison des indicateurs d’enquête au fil du temps, il faut toujours prendre en considération d’autres aspects méthodologiques (taille des échantillons, période de référence, questionnaire, etc.) et contextuels (modifications des normes, changement réel, etc.).

De nombreux ouvrages publiés portent sur des comparaisons de techniques d’interview téléphonique et en personne et l’on relève de nombreuses incohérences dans les résultats, les chercheurs faisant état d’effets de mode de diverses ampleurs. Selon Scherpenzeel (2001), l’incohérence des résultats est probablement attribuable à des différences en ce qui concerne le plan des études. L’étude des modes de collecte de données menée dans le cadre du cycle 2.1 de l’ESCC ne fait pas exception, puisqu’on ne peut trouver d’études comparables. Toutefois, il y a unanimité quant à la présence d’effets de mode pour certaines variables et de biais non négligeables dans les estimations d’enquête.

Selon les auteurs de ce document, les différences observées dans l’étude des effets du mode de collecte de l’Enquête sur la santé dans les collectivités canadiennes entre l’IPAO et l’ITAO sont attribuables principalement à deux facteurs confondants, soit la désirabilité sociale et la variabilité des intervieweurs. Le biais dans les réponses dû à la désirabilité sociale, qui a été largement documenté, tient aux mesures prises par les gens pour bien se faire voir des autres. Il pourrait se produire à différents niveaux et pour différents sujets tant pour l’IPAO que pour l’ITAO et il est très difficile de quantifier l’ampleur des biais de mesure étant donné l’absence de «normes repères» pour de nombreuses variables. De plus, l’ampleur du biais diffèrerait selon le profil sociodémographique et pourrait même varier au fil du temps. Parmi tous les indicateurs de la santé évalués dans cette étude, la taille et le poids autodéclarés sont de bons exemples de variables pour lesquelles l’ampleur du biais dans les réponses dû à la désirabilité sociale diffère selon qu’il s’agit de l’IPAO ou de l’ITAO. Les données provisoires de l’Enquête sur la nutrition au Canada de 2004 menée par Statistique Canada, qui permet de recueillir des mesures exactes de la taille et du poids auprès d’un grand échantillon, donnent à penser que le taux d’obésité chez les Canadiens de tout âge est significativement plus élevé que ceux calculés à l’aide des mesures autodéclarées de l’étude des modes menée dans le cadre du cycle 2.1 de l’ESCC (IPAO et ITAO). Le biais de mesure est manifestement plus important dans l’ITAO que dans l’IPAO, mais dans l’un et l’autre cas il est loin de la «norme repère» établie d’après l’enquête sur la nutrition. Il convient de signaler au lecteur que les résultats de l’Enquête sur la nutrition au Canada de 2004 seront disponibles à l’automne de 2005.

Tableau 5. Rapport de cotes pour l’état de santé pour l’ITAO par rapport à l’IPAO (* = p<0,05, ** = p<0,01)
Indicateur de la santé Facteur Rapport de cotes
Usage du tabac Blanc 12-29 0,56**
Blanc 30+ 1,00
Non-Blanc 1,49
Obésité (autodéclarée) Alberta 0,48**
Ailleurs 0,79*
Inactivité physique Tous 0,65**
Vaccination contre la grippe 12-15 4,48**
16-19 1,78
20+ 1,10
Consommateur d’alcool Blanc non–immigrant 0,70**
Non-blanc ou immigrant 1,71**
5 verres ou plus à une même occasion Blanc et revenu inférieur ou moyen–inférieur 0,45*
Blanc et revenu supérieur ou moyen-supérieur 0,97
Non-blanc 2,45*
Besoins insatisfaits (autodéclarés) Capacité de revenu la plus élevée 1,11
Pas la capacité de revenu la plus élevée mais avec un diplôme postsecondaire 0,81
Pas la capacité de revenu la plus élevée et sans diplôme postsecondaire 0,46**
Conduite en état d’ivresse 12-19 1,23
20-44 0,29**
45-64 0,97
65+ 0,60
A-t–il(elle) déjà eu des rapports sexuels Femme 15-24 0,43*
Autres 1,02

La variabilité des intervieweurs est l’expression utilisée pour décrire les erreurs qui sont attribuables aux intervieweurs. La variabilité des intervieweurs est inévitable dans les grandes enquêtes menées par les organismes de statistique nationaux. À Statistique Canada, le personnel préposé aux interviews personnelles se compose de plus 650 intervieweurs et 250 intervieweurs travaillent dans les centres d’appels. Malgré tous les efforts déployés pour normaliser la formation de tous les intervieweurs, certains aspects du milieu de travail (p. ex., la supervision) des deux méthodes de collecte sont tellement différents qu’il est raisonnable de supposer que les comportements des intervieweurs peuvent l’être également, ce qui pourrait introduire des biais dus à la variabilité des intervieweurs. Pour l’étude des modes, les renseignements supplémentaires fournis par les systèmes d’application informatique (IPAO et ITAO), comme la durée de chaque question, ont permis de faire des constatations intéressantes. Le module sur l’activité physique du questionnaire de l’ESCC qui a servi au calcul de l’indice de l’activité physique a pris sensiblement moins de temps à administrer par IPAO que par ITAO, ce qui donne à penser que certaines activités (comprises dans la liste de 20 activités lues par l’intervieweur), pour diverses raisons, n’ont peut–être pas été mentionnées clairement à certains répondants auprès desquels on a mené une IPAO. Parallèlement, les procédures de contrôle de la qualité mises en œuvre dans les centres d’appels n’ont pas détecté pareils comportements chez les intervieweurs ITAO. Selon les auteurs, la variabilité des intervieweurs explique une grande partie des différences observées dans l’étude des modes sur le plan de l’indice de l’activité physique, mais l’absence d’une norme repère pour cette variable ne permet pas d’évaluer le véritable biais de mesure (IPAO ou ITAO).

8. Conclusion

L’étude des modes a été intégrée au cycle 2.1 de l’ESCC pour permettre de mieux comprendre les différences éventuelles entre les estimations d’enquête attribuables aux deux méthodes de collecte utilisées aux fins de l’ESCC, soit l’IPAO et l’ITAO. On s’attendait à ce que l’augmentation du nombre d’ITAO dans le cycle 2.1 comparativement au cycle 1.1 ait un effet sur la comparabilité de certains indicateurs de la santé clés au cours des deux cycles, soit en amplifiant artificiellement ou en masquant un véritable changement de comportement.

Aux fins de l’étude des modes, on a utilisé une base de sondage unique où les unités d’échantillonnage secondaires ont été attribuées de façon aléatoire à l’IPAO ou à l’ITAO. L’étude a été menée de juillet à novembre 2003 dans 11sites choisis de manière à ce que toutes les régions du Canada soient bien représentées. Les taux de réponse sont acceptables pour l’un et l’autre mode de collecte et, malgré des différences mineures observées entre les profils sociodémographiques, les échantillons des deux modes sont représentatifs de la population cible et sont comparables. Des points d’échantillonnage spéciaux ont été calculés et calibrés pour dix post–strates pour les groupes d’âge–sexe pour l’échantillon de l’un et l’autre mode. Il importe de signaler qu’il ne s’agissait pas d’un véritable plan expérimental visant à déterminer l’effet de mode pur. Toutefois, l’étude des modes a été conçue afin de permettre des comparaisons valables des méthodes de collecte de l’IPAO et ITAO utilisées par Statistique Canada.

Les résultats de l’étude des modes sont très utiles pour permettre de mieux comprendre les différences entre l’IPAO et l’ITAO et plus particulièrement l’incidence du nombre accru d’ITAO dans le cycle 2.1 comparativement au cycle1.1. En outre, à la lumière des résultats observés, une série de recommandations a été formulée pour les cycles futurs de l’ESCC. En premier lieu, il a été décidé de mettre en œuvre pour le cycle 3.1 de l’ESCC prévu pour janvier 2005 le même plan d’échantillonnage que celui utilisé pour le cycle 2.1 (bases aréolaire/téléphonique et ratios IPAO/ITAO). À compter du cycle 3.1 de l’ESCC, des données exactes sur la taille et le poids seront recueillies auprès d’un sous–échantillon de personnes pour permettre de produire des estimations nationales pour des catégories de l’IMC pour des groupes âge–sexe particuliers. En outre, on renforcera les méthodes de formation des intervieweurs de manière à assurer une plus grande normalisation des procédures de collecte selon les deux méthodes.

Ces améliorations devraient donc améliorer la qualité des données de l’ESCC de manière à fournir aux décideurs et aux professionnels de la santé une base d’information solide leur permettant de mieux suivre les changements au fil du temps et de prendre les mesures voulues pour régler les diverses questions relatives à la santé des Canadiens.

9. Remerciements

Les auteurs tiennent à remercier tous leurs collègues à Statistique Canada qui ont participé à l’élaboration et à la réalisation de la présente étude. Ils sont également reconnaissants à VincentDale, JohaneDufour et Jean–LouisTambay de leurs observations éclairées.

10. Références

Pierre, F. et Béland, Y. (2002). Étude sur quelques erreurs de réponse dans le cadre de l’Enquête sur la santé dans les collectivités canadiennes. 2002 Proceedings of the Survey Methods Section, Statistical Society of Canada.
Rust, K.F. et Rao, J.N.K (1996). “Variance estimation for complex surveys using replication techniques”, Statistical Methods in Medical Research, 5, p. 281-310.
Scherpenzeel, A. (2001). Mode effects in panel surveys: A comparison of CAPI and CATI. Bases statistiques et vues d’ensemble. Neuchâtel: Bundesamt, für Statistik, Office fédéral de la statistique (http://www.unine.ch/psm).

Statistique Canada (2003). ESCC Cycle 1.1, 2000-2001, Fichier de micro-données à grande diffusion. Numéro de catalogue 82M0013GPE.

Interprétation des estimations de l’Enquête sur la santé dans les collectivités canadiennes (ESCC) remaniée

Par Steven Thomas, méthodologiste principal, ESCC
et Sylvain Tremblay, analyste principal, ESCC

Résumé

Afin de pouvoir répondre aux besoins des utilisateurs et de mieux utiliser les ressources consacrées aux interviews, la composante régionale de l’Enquête sur la santé dans les collectivités canadiennes, ou le cycle.1 de l’enquête, a été remaniée, en vue d’inclure divers éléments de contenu et de recueillir des données sur une base continue au fil du temps. Ce changement de structure permet la collecte et la diffusion de divers types de données pour diverses périodes, en vue de l’estimation à divers niveaux géographiques et sociodémographiques. Pour l’utilisateur, cela signifie que plusieurs produits différents seront disponibles pour plusieurs périodes différentes. L’interprétation appropriée des résultats revêt plus d’importance que jamais auparavant, l’utilisateur ayant le choix du produit qu’il utilisera pour l’analyse. Le choix du produit sera fondé sur les caractéristiques à étudier et sur le niveau de détail requis dans les estimations. Le présent document vise à préciser les répercussions que le remaniement aura sur les utilisateurs et à contribuer à l’interprétation appropriée des estimations en résultant.

1. Remaniement de l’ESCC

Après la diffusion des données de la composante régionale de 2005 de l’Enquête sur la santé dans les collectivité canadiennes (ESCC cycle 3.1), l’ESCC a été remaniée en vue de donner suite à deux points principaux: mieux répondre aux besoins des utilisateurs et mieux utiliser les ressources affectées à la collecte1. La mise en œuvre d’une technique de collecte continue a constitué une étape clé de cette démarche. Parallèlement, on a adopté une structure de contenu souple, afin de permettre la collecte de données différentes pour diverses périodes. Ces changements ont des répercussions sur la stratégie de diffusion, du point de vue des types de contenu qui peuvent être diffusés, ainsi que de la fréquence des diffusions. Une fois ces changements en place, il a été décidé qu’il était temps de mettre en œuvre certaines améliorations méthodologiques, y compris un processus plus efficace sur le plan du temps.

1.1 Modifications de la collecte

La modification qui a eu les répercussions les plus importantes sur les utilisateurs est la modification de l’approche de collecte des données de l’ESCC. Par le passé, la composante régionale de l’ESCC servait à recueillir des données auprès d’environ 130000 répondants, sur une période de 12 mois, tous les 2 ans. Depuis janvier 2007, des données sont recueillies sur une base continue auprès d’environ 65000 répondants, tout au long de l’année, chaque année. Afin d’assurer la continuité de la collecte, des données sont recueillies auprès d’un nouvel échantillon d’environ 11000 répondants, tous les deux mois, chacun étant représentatif de la région sociosanitaire pour la période donnée. Les échantillons recueillis pour les territoires sont représentatifs de la population après 12mois.

1.2 Modifications du contenu

Du fait de la nouvelle approche de collecte continue, il est maintenant possible de recueillir divers types de données (ou contenu) pour diverses périodes. La durée de la collecte dépend des caractéristiques voulues et de la taille de l’échantillon requise. Dans le cas des caractéristiques prévalentes et des domaines généraux, les données doivent être recueillies uniquement pendant une courte période pour que l’on dispose d’un nombre suffisant de répondants pour produire des estimations de qualité. Dans le cas des caractéristiques moins prévalentes et des domaines plus détaillés, les données sont recueillies sur une période prolongée, en vue d’obtenir un échantillon approprié de répondants.

Les principales composantes du contenu de l’ESCC se répartissent toujours entre le contenu commun et le contenu optionnel, même si le contenu commun est maintenant fractionné en deux sous–composantes: de base et thématique. Même si les deux sous–composantes sont utilisées pour tous les répondants de l’ESCC, le contenu de base est destiné à demeurer relativement stable au fil du temps, et le contenu thématique fait l’objet d’une collecte pendant 12 à 24 mois et peut être repris dans l’enquête, après 2, 4 ou 6 ans. La composante de contenu optionnel offre aux régions sociosanitaires de choisir du contenu qui répond aux priorités provinciales et régionales en matière de santé publique. Il est recueilli pendant un ou deux ans avant d’être révisé à nouveau.

Une nouvelle composante de réponse rapide est aussi disponible et permet la collecte de données sur les enjeux émergents en matière de santé, auprès d’un petit échantillon de répondants, sur une période de deux mois (environ 11000 répondants). Cette composante d’une durée maximale de 2 minutes est offerte aux clients des projets à frais recouvrables qui ont un besoin immédiat de données au niveau national.

1.3 Modifications de la diffusion

Les modifications de la collecte et de la structure du contenu de l’ESCC ont des répercussions sur la stratégie de diffusion. Par le passé, les données étaient diffusées tous les deux ans, après la collecte auprès de tous les répondants de l’enquête. Les fichiers de données (principal, de partage, FMGD) sont disponibles pour les années de référence 2000–2001 (cycle 1.1), 2003 (cycle 2.1) et 2005 (cycle 3.1). Un fichier de sixmois (permettant le calcul d’estimations pour 65000 répondants) a été produit à partir des données du cycle 3.1 recueillies de janvier2005 à juin2005

À partir de juin 2008, par suite de la diffusion des données recueillies au cours de la période de collecte de 2007, les fichiers principal et de partage seront diffusés tous les ans. Ces fichiers de données annuels comprendront environ 65000 répondants, soit la moitié de l’échantillon disponible dans les fichiers de données précédents de l’ESCC. Ils engloberont le contenu de base, le contenu thématique et le contenu optionnel recueillis tout au long de l’année.

En juin 2009, deux fichiers principaux seront disponibles: un fichier principal de données fondé sur la période de collecte de 2008, qui s’apparentera au fichier de données de 2007, ainsi qu’un fichier de données fondé sur la période de collecte de 2007–2008. Le fichier principal de 2007–2008 sera de la même taille que les fichiers des cycles précédents (environ 130000 répondants). Il comprendra le contenu de base, le contenu optionnel et le contenu thématique recueillis au cours de la période de deuxans. Les thèmes touchant une année ne seront pas disponibles dans le fichier de données de deuxans. Par ailleurs, les modules thématiques collectés auprès d’un sous-échantillon de la population continueront d’être diffusés dans des fichiers séparés. Ces derniers incluent le contenu de base et le contenu des modules thématiques collectés auprès d’un sous-échantillon de répondants. Le tableau 4.2 fournit des précisions concernant ce qui sera disponible avec les diffusions de 2007 et 2008.

Tableau1. Composantes de contenu comprises dans les fichiers de données de 2007 et 2008

Fichiers Contenu de base Contenu thématique de 20071 Contenu thématique de 20082 Contenu thématique de 2007–2008 Contenu optionnel3
2007 Principal Oui Non S/O Oui Oui
Sous-échantillon Oui Oui S/O Non Non
2008 Principal Oui S/O Oui4 Oui Oui
Sous-échantillon Oui S/O Oui5 Non Non
2007–2008 Principal Oui Non Non Oui Oui
1 Le thème de 2007 était composé de 3 modules (Satisfaction des patients, Accèes aux services de santé et Temps d’attentes) qui ont été posés à un sous-échantillon de répondants.
2 Le thème de 2008 comprend un groupe de modules reliés à la détection des maladies chroniques ainsi qu’un module sur le poids et la taille mesurés. Ce dernier est demandé à un sous–échantillon de répondants.
3 Selon le principe que le contenu optionnel demeurera le même pendant deux ans. Autrement, il sera inclus uniquement dans le fichier pour l’année pendant laquelle il a été recueilli.
4 Détection des maladies chroniques
5 Poids et taille mesurées

Outre les fichiers courants, des fichiers de la composante de réponse rapide seront produits pour les clients des projets à frais recouvrables. Ces fichiers seront mis à la disposition d’autres utilisateurs sur demande et comprendront le contenu de la composante de réponse rapide ainsi que le contenu de base pour une période de deuxmois.

Les fichiers de microdonnées à grande diffusion (FMGD) seront diffusés tous les deuxans, sur la base de deux années de collecte. Le premier FMGD sera diffusé à l’été 2009, pour la période de collecte de 2007–2008. On ne disposera pas de FMGD pour des années uniques.

1.4 Modifications des méthodes d’enquête

Par suite des modifications de la collecte, du contenu et des stratégies de diffusion, certains changements ont été apportés aux méthodes utilisées pour le calcul des poids d’enquête. Le remaniement a signifié que des poids devaient être produits plus fréquemment et qu’une méthodologie conforme à la collecte continue était requise. Cette évolution a aussi été perçue comme une occasion d’apporter certaines améliorations aux ajustements des poids qui sont utilisés dans le processus2.

1.4.1 Pondération selon la période

Les poids sont contrôlés, dans la plus large mesure possible, afin que chaque période de collecte soit représentée également et que les répondants visés par la pondération représentent la population moyenne pour la période prolongée de la diffusion particulière. Les estimations représentent la moyenne pour la période.

1.4.2 Modifications de l’intégration

L’ESCC utilise une méthode à base double, des répondants étant échantillonnés à partir d’une liste téléphonique et d’une base aréolaire. Les poids sont corrigés/intégrés, afin de veiller à ce que la population soit représentée une fois seulement. Par le passé, les poids de la liste téléphonique ont été ajustés pour tenir compte du sous–dénombrement (sans téléphone à fil, numéros de téléphone non publiés, etc.), avant l’intégration dans la base aréolaire, afin que la base aréolaire et la liste téléphonique couvrent la même population. Cela reposait sur l’hypothèse que les personnes non comprises dans la base téléphonique étaient les mêmes que celles qui y figuraient.

Étant donné que l’on sait que les caractéristiques des répondants par téléphone peuvent différer de celles des répondants non compris dans la liste téléphonique, la méthode d’intégration a été mise à jour3. À l’heure actuelle, les répondants de la liste téléphonique sont intégrés uniquement aux unités de la base aréolaire qui figurent aussi dans la liste téléphonique. Les poids des répondants de la base aréolaire qui ne sont pas dans la liste téléphonique ne sont pas ajustés. Cela signifie que pour les variables touchées par le mode de collecte, les estimations produites devraient être plus représentatives de la population réelle.

1.4.3 Modifications de l’étalonnage

La dernière étape de la méthode de pondération vise à faire en sorte que les poids correspondent aux totaux de population connus, grâce à un processus appelé étalonnage. Les totaux connus se situent habituellement au niveau de la région sociosanitaire, selon le groupe d’âge et le sexe. Il est généralement reconnu qu’en étalonnant les poids, les estimations des totaux sont plus précises que celles qui ne sont pas étalonnées. Toutefois, afin de procéder à un ajustement d’étalonnage approprié, il est suggéré de recueillir au moins 20 observations pour le domaine. Cela ne devrait pas poser de problème dans le cas du fichier de deuxans, mais pour le fichier d’unan, il ne sera pas possible d’assurer la stratification aposteriori dans tous les domaines, en raison du nombre réduit de répondants. Les utilisateurs obtiendront une liste des données stratifiées aposteriori comportant moins de 20 observations, et les cellules correspondantes seront supprimées des tableaux produits par Statistique Canada.

2. Répercussions sur les utilisateurs

2.1 Plus de données, plus souvent

À partir des diffusions des données de 2008 et de 2007–2008, en juin 2009, les utilisateurs auront le choix d’utiliser les fichiers d’un an ou de deux ans. Les utilisateurs pourront combiner ces fichiers normalisés pour produire, par exemple, des fichiers de trois ans ou de quatre ans.

2.2 Estimation de la période

Peu importe si un fichier pluriannuel, un fichier de deux ans ou un fichier d’un an est utilisé, on incite les utilisateurs à considérer les données de l’ESCC comme comportant une estimation de période, les interviews correspondant à une période étant combinées et un poids d’échantillonnage mis à jour étant calculé. Une estimation annuelle de caractéristiques données rend compte des caractéristiques moyennes de la population moyenne pour la période. Dans le cas du fichier de 2007, les estimations rendent compte de la moyenne de janvier à décembre 2007. Le résultat correspond à une estimation de période, qui diffère de l’instantané qui est souvent présenté dans la plupart des enquêtes transversales. Techniquement, cela est vrai uniquement dans le cas du recensement, dont les estimations représentent un point précis dans le temps.

L’idée de l’estimation de période constitue simplement un prolongement des méthodes utilisées pour les cycles précédents de l’ESCC, c’est–à–dire la combinaison d’un ensemble d’interviews menées sur une période de 12 mois. De même, les techniques utilisées pour les ensembles combinés de données uniformisées pour unan ou pour deuxans, en vue de créer des estimations de période personnalisées, seront très similaires à celles utilisées pour la combinaison des cycles 1.1, 2.1 et 3.1 de l’enquête4.

Les décisions concernant la période à utiliser pour une analyse donnée devraient être guidées par le niveau de détail et de qualité requis. Dans le cas d’un fichier d’unan, les estimations ne seront pas toujours disponibles en raison de la qualité liée à la taille limitée de l’échantillon. Dans le cadre de l’ESCC, il est recommandé d’utiliser un coefficient de variation de moins de 33% et de compter au moins dix répondants qui affichent les caractéristiques dans le domaine, avant de publier une estimation. Cela ne sera pas possible dans le cas des caractéristiques rares et des domaines détaillés pour les fichiers d’unan. Les utilisateurs devront plutôt se fier aux fichiers de deuxans ou aux fichiers pluriannuels.

Lorsque l’utilisation d’un fichier d’unan ou de deuxans est possible, l’utilisateur devrait envisager un compromis entre l’exactitude et l’actualité. S’il est important de rendre compte des caractéristiques courantes d’une population le plus précisément possible, le fichier d’unan sera préférable. Dans le cas des fichiers de deuxans, les tendances d’une année à l’autre seront masquées, tout comme les tendances saisonnières sont masquées dans un fichier d’unan. Toutefois, du fait de l’augmentation de la taille de l’échantillon, des estimations et des analyses plus détaillées peuvent être effectuées.

2.3 Répercussions sur la convention de désignation des variables

La convention de désignation des variables a été modifiée légèrement, afin de rendre compte du fait que la même variable est recueillie chaque année. Par le passé, une lettre désignant les cycles était incluse dans le nom de la variable. Par exemple, le «e» dans «ccce_101» signifiait qu’il s’agissait des données recueillies dans le cadre du cycle 3.1. À partir de maintenant, la variable sera étiquetée «ccc_101». Afin d’aider les utilisateurs qui souhaitent combiner deux fichiers de données ou plus, une nouvelle variable montrant la période de référence «REFPER» a été ajoutée. Cette variable utilise le format AAAAMMAAAAMM (année et mois du début de la collecte–année et mois de la fin de la collecte).

2.4 Différences dans les estimations par rapport au passé

Les utilisateurs devraient être conscients que les modifications de l’échantillonnage et la production des poids d’échantillonnage adoptés en 2007 expliquent en partie les différences par rapport aux cycles précédents. Du point de vue de l’échantillonnage, l’échantillon est contrôlé, afin de compter à peu près le même nombre de répondants tout au long de l’année et que chaque moitié de l’échantillon provienne de chacune des deux bases de sondage. Il ne s’agit pas d’un changement marqué par rapport aux diffusions précédentes, dans lesquelles l’échantillon était divisé entre les périodes de collecte mensuelles. Du point de vue de la production des poids, les changements apportés au processus d’intégration des listes téléphoniques et des bases aréolaires pourraient avoir pour effet d’influencer les caractéristiques qui comportent une corrélation étroite avec le fait d’avoir un numéro de téléphone publié5. D’autres études de cette possibilité sont prévues.

Faits saillants

  • À partir du 18 juin 2008, les fichiers de données principaux et de partages seront diffusés chaque année. Ces fichiers annuels comprendront des données sur environ 65000 répondants, soit la moitié de la taille de l’échantillon des fichiers de données précédents. Des fichiers fondés sur deux années de données continueront d’être produits et seront de la même taille que les fichiers des cycles précédents (~130000 répondants).
  • Dans le cadre du remaniement de l’ESCC, on a adopté un contenu thématique. Les questions s’y rapportant sont posées à tous les répondants de l’ESCC, et les données sont recueillies pour une ou deux années seulement.
  • Les fichiers d’échantillons annuels comprendront le contenu de base, le contenu thématique annuel et le thème de deux années, ainsi que le contenu optionnel recueilli cette année–là. Les fichiers de deuxans comprendront le contenu de base, le thème de deuxannées et tout le contenu optionnel recueilli pour les deuxans.
  • À partir de juin 2009, les utilisateurs auront le ch oix entre les fichiers d’unan ou les fichiers de deuxans.
  • Grâce aux estimations pour une année, on peut calculer des tendances d’une année à l’autre. Dans le contexte de la collecte continue, chaque estimation annuelle rend compte des caractéristiques moyennes de la population moyenne pour la période.
  • Dans le cas de l’estimation des caractéristiques plus rares dans des domaines plus détaillés, l’utilisation des fichiers de deuxans, ou même des fichiers pluriannuels, sera nécessaire pour assurer la qualité des données (c.v. de 33% et minimum de dixrépondants comportant les caractéristiques).
  • La convention de désignation des variables de l’ESCC a été modifiée légèrement, afin de rendre compte du fait que la même variable est recueillie. La lettre désignant le cycle (p.ex., «e» pour le cycle 3.1) a été supprimée du nom de la variable.

Nota

1. BélandY., DaleV., DufourJ., HamelM. The Canadian Community Health Survey: Building on the Success from the Past. 2005 Proceedings of the American Statistical Association Meeting, Survey Research Methods. American Statistical Association, 2005.

2. Sarafin C., Simard M., Thomas S. (2007). A Review of the Weighting Strategy for the Canadian Community Health Survey. Recueil du Groupe des méthodes d’enquête, Congrès annuel de 2007 de la Société statistique du Canada.

3. Skinner, C.J. et Rao, J.N.K. (1996). «Estimation in Dual Frame Surveys with Complex Designs». Journal of the American Statistical Association, 91, 349-356.

4. Thomas S. La combinaison de cycles de l’Enquête sur la santé dans les collectivités canadiennes. Recueil du Symposium de Statistique Canada (Statistique Canada, no11–522–XIF au catalogue), 2006.

5. St–Pierre M, Béland Y. Mode effects in the Canadian Community Health Survey: a comparison of CAPI and CATI. 2004 Proceedings of the American Statistical Association Meeting, Survey Research Methods. Toronto: American Statistical Association, 2004.

Enquête sur la santé dans les collectivités canadiennes (ESCC)

Fichier Partagé – 2009 – Tableaux de la variabilité d’échantillonnage approximative

Juin 2010

Table des matières

Données d'entrée des tableaux de la variabilité d'échantillonnage
Provinces, territoires et Canada
Canada par groupe d'âge
Régions socio-sanitaires

Tableaux de la variabilité d'échantillonnage approximative
Canada
Canada par groupe d'âge
Groupe d'âge 12 à 19
Groupe d'âge 20 à 29
Groupe d'âge 30 à 44
Groupe d'âge 45 à 64
Groupe d'âge 65+
Provinces et territoires
Terre-Neuve
Île-du-Prince-Édouard
Nouvelle-Écosse
Nouveau-Brunswick
Québec
Ontario
Manitoba
Saskatchewan
Alberta
Colombie-Britannique
Territoire du Yukon
Territoires du Nord-Ouest
Nunavut
Régions socio-sanitaires
Terre-Neuve : Eastern Regional Integrated Health Authority (1011)
Terre-Neuve : Central Regional Integrated Health Authority (1012)
Terre-Neuve : Western Regional Integrated Health Authority (1013)
Terre-Neuve : Labrador-Grenfell Regional Integrated Health Authority (1014)
Île-du-Prince-Édouard : Kings County (1101)
Île-du-Prince-Édouard : Queens County (1102)
Île-du-Prince-Édouard : Prince County (1103)
Nouvelle-Écosse: Zone 1 (1201)
Nouvelle-Écosse: Zone 2 (1202)
Nouvelle-Écosse: Zone 3 (1203)
Nouvelle-Écosse: Zone 4 (1204)
Nouvelle-Écosse: Zone 5 (1205)
Nouvelle-Écosse: Zone 6 (1206)
Nouveau-Brunswick : Région 1 (1301)
Nouveau-Brunswick : Région 2 (1302)
Nouveau-Brunswick : Région 3 (1303)
Nouveau-Brunswick : Région 4 (1304)
Nouveau-Brunswick : Région 5 (1305)
Nouveau-Brunswick : Région 6 (1306)
Nouveau-Brunswick : Région 7 (1307)
Québec : Région du Bas-Saint-Laurent (2401)
Québec : Région du Saguenay–Lac-Saint-Jean (2402)
Québec : Région de la Capitale-Nationale (2403)
Québec : Région de la Mauricie et du Centre-du-Québec (2404)
Québec : Région de l'Estrie (2405)
Québec : Région de Montréal (2406)
Québec : Région de l'Outaouais (2407)
Québec : Région de l'Abitibi-Témiscamingue (2408)
Québec : Région de la Côte-Nord (2409)
Québec : Région du Nord-du-Québec (2410)
Québec : Région de la Gaspésie–Îles-de-la-Madeleine (2411)
Québec : Région de la Chaudière-Appalaches (2412)
Québec : Région de Laval (2413)
Québec : Région de Lanaudière (2414)
Québec : Région des Laurentides (2415)
Québec : Région de la Montérégie (2416)
Ontario : Circonscription sanitaire du district d'Algoma (3526)
Ontario : Circonscription sanitaire du comté de Brant (3527)
Ontario : Circonscription sanitaire régionale de Durham (3530) 7
Ontario : Circonscription sanitaire d'Elgin-St. Thomas (3531)
Ontario : Circonscription sanitaire de Grey Bruce (3533)
Ontario : Circonscription sanitaire de Haldimand-Norfolk (3534)
Ontario : Circonscription sanitaire du district de Haliburton, Kawartha et Pine Ridge (3535)
Ontario : Circonscription sanitaire régionale de Halton (3536)
Ontario : Circonscription sanitaire de la cité de Hamilton (3537)
Ontario : Circonscription sanitaire des comtés de Hastings et Prince Edward (3538)
Ontario : Circonscription sanitaire du comté de Huron (3539)
Ontario : Circonscription sanitaire de Chatham-Kent (3540)
Ontario : Circonscription sanitaire de Kingston, Frontenac et Lennox et Addington (3541)
Ontario : Circonscription sanitaire de Lambton (3542)
Ontario : Circonscription sanitaire du district de Leeds, Grenville et Lanark (3543)
Ontario : Circonscription sanitaire de Middlesex-London (3544)
Ontario : Circonscription sanitaire régionale de Niagara (3546)
Ontario : Circonscription sanitaire du district de North Bay Parry Sound (3547)
Ontario : Circonscription sanitaire du Nord-Ouest (3549)
Ontario : Circonscription sanitaire de la cité d'Ottawa (3551)
Ontario : Circonscription sanitaire du comté d'Oxford (3552)
Ontario : Circonscription sanitaire régionale de Peel (3553)
Ontario : Circonscription sanitaire du district de Perth (3554)
Ontario : Circonscription sanitaire du comté et de la cité de Peterborough (3555)
Ontario : Circonscription sanitaire de Porcupine (3556)
Ontario : Circonscription sanitaire du comté et du district de Renfrew (3557)
Ontario : Circonscription sanitaire de l'Est de l'Ontario (3558)
Ontario : Circonscription sanitaire du district de Simcoe Muskoka (3560)
Ontario : Circonscription sanitaire de Sudbury et son district (3561)
Ontario : Circonscription sanitaire du district de Thunder Bay (3562)
Ontario : Circonscription sanitaire de Timiskaming (3563)
Ontario : Circonscription sanitaire de Waterloo (3565)
Ontario : Circonscription sanitaire de Wellington-Dufferin-Guelph (3566)
Ontario : Circonscription sanitaire de Windsor-comté d'Essex (3568)
Ontario : Circonscription sanitaire régionale de York (3570)
Ontario : Circonscription sanitaire de la cité de Toronto (3595)
Manitoba : Winnipeg Regional Health Authority (4610)
Manitoba : Brandon Regional Health Authority (4615)
Manitoba : North Eastman Regional Health Authority (4620)
Manitoba : South Eastman Regional Health Authority (4625)
Manitoba : Interlake Regional Health Authority (4630)
Manitoba : Central Regional Health Authority (4640)
Manitoba : Assiniboine Regional Health Authority (4645)
Manitoba : Parkland Regional Health Authority (4660)
Manitoba : Norman Regional Health Authority (4670)
Manitoba : Burntwood/Churchill (4685)
Saskatchewan : Sun Country Regional Health Authority (4701)
Saskatchewan : Five Hills Regional Health Authority/td> (4702)
Saskatchewan : Cypress Regional Health Authority (4703)
Saskatchewan : Regina Qu'Appelle Regional Health Authority (4704)
Saskatchewan : Sunrise Regional Health Authority (4705)
Saskatchewan : Saskatoon Regional Health Authority (4706)
Saskatchewan : Heartland Regional Health Authority (4707)
Saskatchewan : Kelsey Trail Regional Health Authority (4708)
Saskatchewan : Prince Albert Parkland Regional Health Authority (4709)
Saskatchewan : Prairie North Regional Health Authority (4710)
Saskatchewan : Mamawetan/Keewatin/Athabasca (4714)
Alberta : Chinook Regional Health Authority (4821)
Alberta : Palliser Health Region (4822)
Alberta : Calgary Health Region (4823)
Alberta : David Thompson Regional Health Authority (4824)
Alberta : East Central Health (4825)
Alberta : Capital Health (4826)
Alberta : Aspen Regional Health Authority (4827)
Alberta : Peace Country Health (4828)
Alberta : Northern Lights Health Region (4829)
Colombie-Britannique : East Kootenay (5911)
Colombie-Britannique : Kootenay-Boundary (5912)
Colombie-Britannique : Okanagan (5913)
Colombie-Britannique : Thompson/Cariboo (5914)
Colombie-Britannique : Fraser East (5921)
Colombie-Britannique : Fraser North (5922)
Colombie-Britannique : Fraser South (5923)
Colombie-Britannique : Richmond (5931)
Colombie-Britannique : Vancouver (5932)
Colombie-Britannique : North Shore/Coast Garibaldi (5933)
Colombie-Britannique : South Vancouver Island (5941)
Colombie-Britannique : Central Vancouver Island (5942)
Colombie-Britannique : North Vancouver Island (5943)
Colombie-Britannique : Northwest (5951)
Colombie-Britannique : Northern Interior (5952)
Colombie-Britannique : Northeast (5953)
Territoire du Yukon : Territoire du Yukon (6001)
Territoires du Nord-Ouest : Territoires du Nord-Ouest (6101)
Nunavut : Nunavut (6201)

Pour obtenir le document intégral en format PDF, veuillez communiquez avec Services à la clientèle au 613-951-1746 hd-ds@statcan.gc.ca), division de la statistique de la santé