Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.1. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.2. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2007. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le
Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.
Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subit que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles. Tableau
Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1
Fractions de réponse pondérées par SCIAN et pour toutes les provinces et territoires, octobre 2010
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada
Marchands de véhicules automobiles et de leurs pièces 93,4 94,5 60,6
Marchands d'automobiles 95,9 96,2 62,2
Marchands d'automobiles neuves 97,1 97,1  
Marchands d'automobiles d'occasion 78,1 81,2 62,2
Marchands d'autres véhicules automobiles 71,4 72,4 68,5
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 81,7 86 45,5
Magasins de meubles et d'accessoires de maison 85,6 90 50
Magasins de meubles 89,7 91,1 61,1
Magasins d'accessoires de maison 78 87,3 45,5
Magasin d'appareils électroniques et ménagers 88,8 90,3 58,7
Marchands de matériaux de construction et de matériel et fournitures de jardinage. 88,3 89,8 77,3
Magasins d'alimentation 80,1 85,3 27,2
Épiceries 81,6 87,9 22
Supermarché et autre épicerie, sauf dépanneur 83,4 89,8 18,1
Dépanneurs 59,7 62,4 46,2
Magasins d'alimentation spécialisés 67,3 73,5 44,8
Magasins de bière, de vin et de spiritueux 77,1 77,5 64,9
Magasins de produits de santé et de soins personnels 90,3 91,8 77
Stations-service 85,7 87,5 61,3
Magasins de vêtements et d'accessoires vestimentaires 88,3 90,6 34,5
Magasins de vêtements 88,1 90,4 31,3
Magasins de chaussures 92,2 93,1 58,6
Bijouteries et magasins de bagages et de maroquinerie 84,4 88 38,2
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 82,4 88,8 29,4
Magasins de fournitures de tout genre 98,5 99,3 22,6
Magasins de détail divers 77,8 80,9 52
Totale 88,2 90,8 49,5
Régions
Terre-Neuve-et-Labrador 92,7 93,4 68,7
Île-du-Prince-Édouard 90,2 90,9 54,6
Nouvelle Écosse 92,5 93,3 74,3
Nouveau-Brunswick 84,2 86,2 59,2
Québec 88,4 92,3 44,7
Ontario 88,3 91 47,6
Manitoba 86,2 86,2 86,5
Saskatchewan 84,1 86,4 39,4
Alberta 86,8 88,1 66,4
Colombie Britannique 89,9 93,3 37,7
Territoire du Yukon 85,8 85,8  
Territoires du Nord-Ouest 87,7 87,7  
Nunavut 68,2 68,2  
1. Il n'y a pas d'utilisation de données administratives pour les concessionnaires d'automobiles neuves.

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

Les méthodes d'imputation fondées sur des données administratives sont sélectionnées automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant. La source de données administratives (ventes annuelles assujetties à la TPS) est le fondement de ces méthodes. Les ventes annuelles assujetties à la TPS sont utilisées pour deux types de méthode. L'une est une tendance générale que l'on utilise pour les structures simples, comme les entreprises ne comptant qu'un seul établissement et l'autre, appelée méthode de la médiane-moyenne, est utilisée pour les unités dont la structure est plus complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Des révisions des données brutes doivent être effectuées pour corriger les erreurs non dues à l'échantillonnage qui sont décelées. Ceci comporte généralement le remplacement de données imputées par des données déclarées, la correction de données déclarées précédemment, et de procéder à des estimations pour les nouvelles entreprises créées dont on ne connaissait pas l'existence au moment des estimations originales.

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans.

Les séries temporelles ou chronologiques comportent les éléments essentiels à la description, l'explication et la prévision du comportement d'un phénomène économique. « Ce sont des dossiers statistiques de l'évolution des processus économiques dans le temps1 ». Les séries temporelles socio-économiques comme celles de l’Enquête mensuelle sur le commerce de gros peuvent habituellement être décomposées en cinq composantes principales : la tendance-cycle, la saisonnalité, l’effet des jours ouvrables, l’effet de la fête de Pâques et la composante irrégulière.

La tendance représente l’évolution à long terme de la série, tandis que le cycle représente un mouvement lisse, quasi périodique, autour de la tendance qui met en évidence une succession de phases de croissance et de décroissance (ex. le cycle des affaires). Les deux composantes tendance et cycle sont estimées ensemble et la tendance-cycle reflète l'évolution fondamentale de la série. Les autres composantes traduisent des mouvements passagers à court terme. La composante saisonnière représente des fluctuations infra-annuelles, mensuelles ou trimestrielles, qui se répètent plus ou moins régulièrement d'une année à l'autre. Les variations saisonnières sont le produit des effets directs et indirects des saisons climatiques et d’éléments de type institutionnel (attribuable aux conventions sociales ou aux règles administratives, Noël par exemple).

L’effet des jours ouvrables provient du fait que l'importance relative des jours varie systématiquement à l'intérieur de la semaine et que le nombre de chacun des jours dans un mois donné varie d'une année à l'autre. Cet effet est présent lorsque l’activité change en fonction du jour de la semaine. Par exemple, dimanche connaît typiquement moins d'activité que les autres jours, et le nombre de dimanches, lundis, etc., dans un mois donné change d'année en année.
1 La désaisonnalisation des séries temporelles économiques : quelques remarques; tiré de la Revue statistique du Canada , août 1974
2 Pour plus de renseignements, voir X-12-ARIMA Reference Manual Version 0.3 (2007), U.S. Census Bureau.
3 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

L’effet de la fête de Pâques est la variation due au déplacement d’une partie de l’activité d’avril vers mars quand Pâques tombe en mars plutôt qu’en avril.

Enfin, la composante irrégulière regroupe toutes les autres fluctuations plus ou moins erratiques non prises en compte dans les composantes précédentes. Elle représente un résidu qui incorpore, entre autres, les erreurs de mesure sur la variable elle-même ainsi que des événements inhabituels (ex. grèves, sécheresse, inondations, panne d’électricité majeure ou d'autres variations inattendues dans les activités des répondants).

Ainsi, les composantes saisonnière et irrégulière, l’effet des jours ouvrables et l’effet de la fête de Pâques masquent la composante fondamentale de la série, qui est la tendance-cycle. La désaisonnalisation (correction des variations saisonnières) consiste à retirer de la série la composante saisonnière, l’effet des jours ouvrables et l’effet de la fête de Pâques. Elle contribue donc à révéler la tendance-cycle. Bien que la désaisonnalisation permette de mieux comprendre la tendance-cycle fondamentale d'une série, la série désaisonnalisée n'en contient pas moins une composante irrégulière. De légères variations d'un mois à l'autre dans la série désaisonnalisée peuvent n'être que de simples mouvements irréguliers. Pour avoir une meilleure idée de la tendance fondamentale, les utilisateurs doivent donc examiner les séries désaisonnalisées sur un certain nombre de mois.

Depuis avril 2008, l’Enquête mensuelle sur le commerce de gros utilise le logiciel X-12-ARIMA2 pour la désaisonnalisation. La technique utilisée consiste essentiellement, dans un premier temps, à corriger la série initiale de toute sorte d’effets indésirables, tels l’effet des jours ouvrables et l’effet de Pâques, par un module appelé regARIMA. L’estimation de ces effets se fait grâce à l’utilisation de modèles de régression à erreurs ARIMA (modèles autorégressifs à moyennes mobiles intégrées). On peut également extrapoler la série d'au moins une année à l'aide du modèle. Dans un deuxième temps, la série brute, pré-ajustée et extrapolée s’il y a lieu, est désaisonnalisée par la méthode X-11.

La méthode X-11, qui permet d’analyser des séries mensuelles et trimestrielles, repose sur un principe itératif d’estimation des différentes composantes, cette estimation étant faite à chaque étape grâce à des moyennes mobiles adéquates3. Les moyennes mobiles utilisées pour estimer les principales composantes, la tendance et la saisonnalité, sont avant tout des outils de lissage conçus pour éliminer une composante indésirable de la série. Puisque les moyennes mobiles réagissent mal à la présence de valeurs atypiques, la méthode X-11 incorpore un outil de détection et de correction des points atypiques utilisé pour nettoyer la série au cours de la désaisonnalisation. Les valeurs atypiques peuvent également être détectées et corrigées d’avance, à l’aide du module regARIMA.

Finalement, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes. Malheureusement, la désaisonnalisation supprime l’additivité infra-annuelle d’un système de séries; de légères différences peuvent alors être observées entre la somme de séries désaisonnalisées et la désaisonnalisation directe de leur total. Afin d’assurer ou de rétablir l’additivité d’un système de séries, un processus de réconciliation est appliqué ou une désaisonnalisation indirecte est employée, c.-à-d. la désaisonnalisation d’un total est obtenu en faisant la somme des séries désaisonnalisées individuellement.

1 Pour plus de renseignements, voir X-12-ARIMA Référence Manuel Version 0.3 (2007), U.S. Census Bureau. .
2 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100%
X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.1. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.2. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2007. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le
Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.
Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subit que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles. Tableau
Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1
Fractions de réponse pondérées par SCIAN et pour toutes les provinces et territoires, septembre 2010
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada
Marchands de véhicules automobiles et de leurs pièces 94 94,8 57,3
Marchands d'automobiles 96,6 97 51,9
Marchands d'automobiles neuves 97,7 97,7  
Marchands d'automobiles d'occasion 80,6 85,3 51,9
Marchands d'autres véhicules automobiles 68,7 67,6 77
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 81,3 86,2 41,9
Magasins de meubles et d'accessoires de maison 85,7 91,5 29,5
Magasins de meubles 92,4 94,6 29,3
Magasins d'accessoires de maison 72 83,6 29,5
Magasin d'appareils électroniques et ménagers 90,1 91,3 60,9
Marchands de matériaux de construction et de matériel et fournitures de jardinage. 83,2 86,6 46
Magasins d'alimentation 83,1 89,7 11,3
Épiceries 82,3 89,4 9,4
Supermarché et autre épicerie, sauf dépanneur 84,4 91,1 8,1
Dépanneurs 58,2 67,1 16,3
Magasins d'alimentation spécialisés 67,2 77,9 26,3
Magasins de bière, de vin et de spiritueux 90,7 93,2 9,3
Magasins de produits de santé et de soins personnels 90,2 92,5 70,3
Stations-service 83,8 86,7 44,3
Magasins de vêtements et d'accessoires vestimentaires 88,3 90,5 32
Magasins de vêtements 88,5 90,7 31,5
Magasins de chaussures 90 91,4 37,2
Bijouteries et magasins de bagages et de maroquinerie 82,6 86,1 31,5
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 82,2 87,5 34,4
Magasins de fournitures de tout genre 98,3 98,9 13,5
Magasins de détail divers 83,7 89 25,1
Totale 88,7 91,9 34,8
Régions
Terre-Neuve-et-Labrador 88,6 89,9 37,1
Île-du-Prince-Édouard 88,5 89,8 13,8
Nouvelle Écosse 92,1 94,3 45,6
Nouveau-Brunswick 86,1 90,5 31,2
Québec 86,9 91,6 20,2
Ontario 90,2 93,3 40,5
Manitoba 89,2 90,7 32,4
Saskatchewan 86,1 88,9 21,2
Alberta 86,5 88,8 44,4
Colombie Britannique 89,9 92,9 40,9
Territoire du Yukon 91,9 91,9  
Territoires du Nord-Ouest 89,4 89,4  
Nunavut 94,5 94,5  
... n'ayant pas lieu de figurer
1. Il n'y a pas d'utilisation de données administratives pour les concessionnaires d'automobiles neuves.

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

Les méthodes d'imputation fondées sur des données administratives sont sélectionnées automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant. La source de données administratives (ventes annuelles assujetties à la TPS) est le fondement de ces méthodes. Les ventes annuelles assujetties à la TPS sont utilisées pour deux types de méthode. L'une est une tendance générale que l'on utilise pour les structures simples, comme les entreprises ne comptant qu'un seul établissement et l'autre, appelée méthode de la médiane-moyenne, est utilisée pour les unités dont la structure est plus complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Des révisions des données brutes doivent être effectuées pour corriger les erreurs non dues à l'échantillonnage qui sont décelées. Ceci comporte généralement le remplacement de données imputées par des données déclarées, la correction de données déclarées précédemment, et de procéder à des estimations pour les nouvelles entreprises créées dont on ne connaissait pas l'existence au moment des estimations originales.

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans.

Les séries temporelles ou chronologiques comportent les éléments essentiels à la description, l'explication et la prévision du comportement d'un phénomène économique. « Ce sont des dossiers statistiques de l'évolution des processus économiques dans le temps1 ». Les séries temporelles socio-économiques comme celles de l’Enquête mensuelle sur le commerce de gros peuvent habituellement être décomposées en cinq composantes principales : la tendance-cycle, la saisonnalité, l’effet des jours ouvrables, l’effet de la fête de Pâques et la composante irrégulière.

La tendance représente l’évolution à long terme de la série, tandis que le cycle représente un mouvement lisse, quasi périodique, autour de la tendance qui met en évidence une succession de phases de croissance et de décroissance (ex. le cycle des affaires). Les deux composantes tendance et cycle sont estimées ensemble et la tendance-cycle reflète l'évolution fondamentale de la série. Les autres composantes traduisent des mouvements passagers à court terme. La composante saisonnière représente des fluctuations infra-annuelles, mensuelles ou trimestrielles, qui se répètent plus ou moins régulièrement d'une année à l'autre. Les variations saisonnières sont le produit des effets directs et indirects des saisons climatiques et d’éléments de type institutionnel (attribuable aux conventions sociales ou aux règles administratives, Noël par exemple).

L’effet des jours ouvrables provient du fait que l'importance relative des jours varie systématiquement à l'intérieur de la semaine et que le nombre de chacun des jours dans un mois donné varie d'une année à l'autre. Cet effet est présent lorsque l’activité change en fonction du jour de la semaine. Par exemple, dimanche connaît typiquement moins d'activité que les autres jours, et le nombre de dimanches, lundis, etc., dans un mois donné change d'année en année.
1 La désaisonnalisation des séries temporelles économiques : quelques remarques; tiré de la Revue statistique du Canada , août 1974
2 Pour plus de renseignements, voir X-12-ARIMA Reference Manual Version 0.3 (2007), U.S. Census Bureau.
3 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

L’effet de la fête de Pâques est la variation due au déplacement d’une partie de l’activité d’avril vers mars quand Pâques tombe en mars plutôt qu’en avril.

Enfin, la composante irrégulière regroupe toutes les autres fluctuations plus ou moins erratiques non prises en compte dans les composantes précédentes. Elle représente un résidu qui incorpore, entre autres, les erreurs de mesure sur la variable elle-même ainsi que des événements inhabituels (ex. grèves, sécheresse, inondations, panne d’électricité majeure ou d'autres variations inattendues dans les activités des répondants).

Ainsi, les composantes saisonnière et irrégulière, l’effet des jours ouvrables et l’effet de la fête de Pâques masquent la composante fondamentale de la série, qui est la tendance-cycle. La désaisonnalisation (correction des variations saisonnières) consiste à retirer de la série la composante saisonnière, l’effet des jours ouvrables et l’effet de la fête de Pâques. Elle contribue donc à révéler la tendance-cycle. Bien que la désaisonnalisation permette de mieux comprendre la tendance-cycle fondamentale d'une série, la série désaisonnalisée n'en contient pas moins une composante irrégulière. De légères variations d'un mois à l'autre dans la série désaisonnalisée peuvent n'être que de simples mouvements irréguliers. Pour avoir une meilleure idée de la tendance fondamentale, les utilisateurs doivent donc examiner les séries désaisonnalisées sur un certain nombre de mois.

Depuis avril 2008, l’Enquête mensuelle sur le commerce de gros utilise le logiciel X-12-ARIMA2 pour la désaisonnalisation. La technique utilisée consiste essentiellement, dans un premier temps, à corriger la série initiale de toute sorte d’effets indésirables, tels l’effet des jours ouvrables et l’effet de Pâques, par un module appelé regARIMA. L’estimation de ces effets se fait grâce à l’utilisation de modèles de régression à erreurs ARIMA (modèles autorégressifs à moyennes mobiles intégrées). On peut également extrapoler la série d'au moins une année à l'aide du modèle. Dans un deuxième temps, la série brute, pré-ajustée et extrapolée s’il y a lieu, est désaisonnalisée par la méthode X-11.

La méthode X-11, qui permet d’analyser des séries mensuelles et trimestrielles, repose sur un principe itératif d’estimation des différentes composantes, cette estimation étant faite à chaque étape grâce à des moyennes mobiles adéquates3. Les moyennes mobiles utilisées pour estimer les principales composantes, la tendance et la saisonnalité, sont avant tout des outils de lissage conçus pour éliminer une composante indésirable de la série. Puisque les moyennes mobiles réagissent mal à la présence de valeurs atypiques, la méthode X-11 incorpore un outil de détection et de correction des points atypiques utilisé pour nettoyer la série au cours de la désaisonnalisation. Les valeurs atypiques peuvent également être détectées et corrigées d’avance, à l’aide du module regARIMA.

Finalement, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes. Malheureusement, la désaisonnalisation supprime l’additivité infra-annuelle d’un système de séries; de légères différences peuvent alors être observées entre la somme de séries désaisonnalisées et la désaisonnalisation directe de leur total. Afin d’assurer ou de rétablir l’additivité d’un système de séries, un processus de réconciliation est appliqué ou une désaisonnalisation indirecte est employée, c.-à-d. la désaisonnalisation d’un total est obtenu en faisant la somme des séries désaisonnalisées individuellement.

1 Pour plus de renseignements, voir X-12-ARIMA Référence Manuel Version 0.3 (2007), U.S. Census Bureau. .
2 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100%
X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.1. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.2. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2007. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le
Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.
Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subit que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles. Tableau
Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1
Fractions de réponse pondérées par SCIAN et pour toutes les provinces et territoires, août 2010
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada
Marchands de véhicules automobiles et de leurs pièces 90,9 90,9  
Marchands d'automobiles 65,4 69,1 43,3
Marchands d'automobiles neuves 75,1 82,2 20,3
Marchands d'automobiles d'occasion 79,2 83,1 38,5
Marchands d'autres véhicules automobiles 85,2 87,3 43,8
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 86,8 88,7 11,7
Magasins de meubles et d'accessoires de maison 79,2 84,9 30
Magasins de meubles 98,6 98,7 77,7
Magasins d'accessoires de maison 67,4 73,6 35,3
Magasin d'appareils électroniques et ménagers 83,5 86 13,3
Marchands de matériaux de construction et de matériel et fournitures de jardinage. 80,1 82,7 45,1
Magasins d'alimentation 84,2 85,4 44,7
Épiceries 84,7 85,4 54,1
Supermarché et autre épicerie, sauf dépanneur 49,4 56,2 17,9
Dépanneurs 86,8 87,9 45,1
Magasins d'alimentation spécialisés 89,3 89,7 43,3
Magasins de bière, de vin et de spiritueux 57,9 63,9 32,4
Magasins de produits de santé et de soins personnels 75,1 76,1 66
Stations-service 77,8 81,1 32,4
Magasins de vêtements et d'accessoires vestimentaires 81 87,2 26,6
Magasins de vêtements 79,6 84,8 19,6
Magasins de chaussures 77,6 83,3 17,9
Bijouteries et magasins de bagages et de maroquinerie 80,3 85,6 17,9
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 64,7 65,8 59,3
Magasins de fournitures de tout genre 82,1 84,8 54,3
Magasins de détail divers 92,5 94,3 19,8
Totale 83,9 86,7 38,2
Régions
Terre-Neuve-et-Labrador 83,3 84,5 36
Île-du-Prince-Édouard 85,3 86,6 7,4
Nouvelle Écosse 85,6 87,5 46,2
Nouveau-Brunswick 76,4 78,4 51,3
Québec 77,5 80,7 32
Ontario 87,2 90,1 40,7
Manitoba 85,7 86,6 34
Saskatchewan 85,6 88,5 28,5
Alberta 83,6 85,8 45,4
Colombie Britannique 86,5 89,6 34,4
Territoire du Yukon 90,5 90,5  
Territoires du Nord-Ouest 86 86  
Nunavut 68,5 68,5  
... n'ayant pas lieu de figurer
1. Il n'y a pas d'utilisation de données administratives pour les concessionnaires d'automobiles neuves.

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

Les méthodes d'imputation fondées sur des données administratives sont sélectionnées automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant. La source de données administratives (ventes annuelles assujetties à la TPS) est le fondement de ces méthodes. Les ventes annuelles assujetties à la TPS sont utilisées pour deux types de méthode. L'une est une tendance générale que l'on utilise pour les structures simples, comme les entreprises ne comptant qu'un seul établissement et l'autre, appelée méthode de la médiane-moyenne, est utilisée pour les unités dont la structure est plus complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Des révisions des données brutes doivent être effectuées pour corriger les erreurs non dues à l'échantillonnage qui sont décelées. Ceci comporte généralement le remplacement de données imputées par des données déclarées, la correction de données déclarées précédemment, et de procéder à des estimations pour les nouvelles entreprises créées dont on ne connaissait pas l'existence au moment des estimations originales.

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans.

Les séries temporelles ou chronologiques comportent les éléments essentiels à la description, l'explication et la prévision du comportement d'un phénomène économique. « Ce sont des dossiers statistiques de l'évolution des processus économiques dans le temps1 ». Les séries temporelles socio-économiques comme celles de l’Enquête mensuelle sur le commerce de gros peuvent habituellement être décomposées en cinq composantes principales : la tendance-cycle, la saisonnalité, l’effet des jours ouvrables, l’effet de la fête de Pâques et la composante irrégulière.

La tendance représente l’évolution à long terme de la série, tandis que le cycle représente un mouvement lisse, quasi périodique, autour de la tendance qui met en évidence une succession de phases de croissance et de décroissance (ex. le cycle des affaires). Les deux composantes tendance et cycle sont estimées ensemble et la tendance-cycle reflète l'évolution fondamentale de la série. Les autres composantes traduisent des mouvements passagers à court terme. La composante saisonnière représente des fluctuations infra-annuelles, mensuelles ou trimestrielles, qui se répètent plus ou moins régulièrement d'une année à l'autre. Les variations saisonnières sont le produit des effets directs et indirects des saisons climatiques et d’éléments de type institutionnel (attribuable aux conventions sociales ou aux règles administratives, Noël par exemple).

L’effet des jours ouvrables provient du fait que l'importance relative des jours varie systématiquement à l'intérieur de la semaine et que le nombre de chacun des jours dans un mois donné varie d'une année à l'autre. Cet effet est présent lorsque l’activité change en fonction du jour de la semaine. Par exemple, dimanche connaît typiquement moins d'activité que les autres jours, et le nombre de dimanches, lundis, etc., dans un mois donné change d'année en année.
1 La désaisonnalisation des séries temporelles économiques : quelques remarques; tiré de la Revue statistique du Canada , août 1974
2 Pour plus de renseignements, voir X-12-ARIMA Reference Manual Version 0.3 (2007), U.S. Census Bureau.
3 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

L’effet de la fête de Pâques est la variation due au déplacement d’une partie de l’activité d’avril vers mars quand Pâques tombe en mars plutôt qu’en avril.

Enfin, la composante irrégulière regroupe toutes les autres fluctuations plus ou moins erratiques non prises en compte dans les composantes précédentes. Elle représente un résidu qui incorpore, entre autres, les erreurs de mesure sur la variable elle-même ainsi que des événements inhabituels (ex. grèves, sécheresse, inondations, panne d’électricité majeure ou d'autres variations inattendues dans les activités des répondants).

Ainsi, les composantes saisonnière et irrégulière, l’effet des jours ouvrables et l’effet de la fête de Pâques masquent la composante fondamentale de la série, qui est la tendance-cycle. La désaisonnalisation (correction des variations saisonnières) consiste à retirer de la série la composante saisonnière, l’effet des jours ouvrables et l’effet de la fête de Pâques. Elle contribue donc à révéler la tendance-cycle. Bien que la désaisonnalisation permette de mieux comprendre la tendance-cycle fondamentale d'une série, la série désaisonnalisée n'en contient pas moins une composante irrégulière. De légères variations d'un mois à l'autre dans la série désaisonnalisée peuvent n'être que de simples mouvements irréguliers. Pour avoir une meilleure idée de la tendance fondamentale, les utilisateurs doivent donc examiner les séries désaisonnalisées sur un certain nombre de mois.

Depuis avril 2008, l’Enquête mensuelle sur le commerce de gros utilise le logiciel X-12-ARIMA2 pour la désaisonnalisation. La technique utilisée consiste essentiellement, dans un premier temps, à corriger la série initiale de toute sorte d’effets indésirables, tels l’effet des jours ouvrables et l’effet de Pâques, par un module appelé regARIMA. L’estimation de ces effets se fait grâce à l’utilisation de modèles de régression à erreurs ARIMA (modèles autorégressifs à moyennes mobiles intégrées). On peut également extrapoler la série d'au moins une année à l'aide du modèle. Dans un deuxième temps, la série brute, pré-ajustée et extrapolée s’il y a lieu, est désaisonnalisée par la méthode X-11.

La méthode X-11, qui permet d’analyser des séries mensuelles et trimestrielles, repose sur un principe itératif d’estimation des différentes composantes, cette estimation étant faite à chaque étape grâce à des moyennes mobiles adéquates3. Les moyennes mobiles utilisées pour estimer les principales composantes, la tendance et la saisonnalité, sont avant tout des outils de lissage conçus pour éliminer une composante indésirable de la série. Puisque les moyennes mobiles réagissent mal à la présence de valeurs atypiques, la méthode X-11 incorpore un outil de détection et de correction des points atypiques utilisé pour nettoyer la série au cours de la désaisonnalisation. Les valeurs atypiques peuvent également être détectées et corrigées d’avance, à l’aide du module regARIMA.

Finalement, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes. Malheureusement, la désaisonnalisation supprime l’additivité infra-annuelle d’un système de séries; de légères différences peuvent alors être observées entre la somme de séries désaisonnalisées et la désaisonnalisation directe de leur total. Afin d’assurer ou de rétablir l’additivité d’un système de séries, un processus de réconciliation est appliqué ou une désaisonnalisation indirecte est employée, c.-à-d. la désaisonnalisation d’un total est obtenu en faisant la somme des séries désaisonnalisées individuellement.

1 Pour plus de renseignements, voir X-12-ARIMA Référence Manuel Version 0.3 (2007), U.S. Census Bureau. .
2 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100%
X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.1. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.2. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2007. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le
Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.
Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subit que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles. Tableau
Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1
Fractions de réponse pondérées par SCIAN et pour toutes les provinces et territoires, juillet 2010
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada
Marchands de véhicules automobiles et de leurs pièces 91,4 92,1 64,2
Marchands d'automobiles 94,1 94,4 46,7
Marchands d'automobiles neuves 95,4 95,4  
Marchands d'automobiles d'occasion 74,2 77,6 46,7
Marchands d'autres véhicules automobiles 70,5 68,2 82,3
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 83 89 34,7
Magasins de meubles et d'accessoires de maison 76,2 79,4 45,6
Magasins de meubles 78,3 79,8 46,8
Magasins d'accessoires de maison 71,7 78,4 45
Magasin d'appareils électroniques et ménagers 88,5 89,7 59,3
Marchands de matériaux de construction et de matériel et fournitures de jardinage. 84,9 86,7 68
Magasins d'alimentation 80,4 84,8 29,6
Épiceries 81,9 87,5 23,9
Supermarché et autre épicerie, sauf dépanneur 84 89,7 19,1
Dépanneurs 58,8 60,1 51,8
Magasins d'alimentation spécialisés 64 67,1 50,6
Magasins de bière, de vin et de spiritueux 78 78,4 64,6
Magasins de produits de santé et de soins personnels 85,4 87,1 71,1
Stations-service 81,8 83,4 63,1
Magasins de vêtements et d'accessoires vestimentaires 86,8 88,8 42,4
Magasins de vêtements 89,4 91,5 42,7
Magasins de chaussures 84,7 85,5 56,8
Bijouteries et magasins de bagages et de maroquinerie 68 70,8 35,6
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 80,2 85,7 29
Magasins de fournitures de tout genre 98,4 99,1 6,6
Magasins de détail divers 76,9 79,7 46,9
Totale 86,3 88,7 48,9
Régions
Terre-Neuve-et-Labrador 81,8 82,4 50,1
Île-du-Prince-Édouard 88,9 89,5 52
Nouvelle Écosse 90,1 91,6 58
Nouveau-Brunswick 85,2 87,2 57,2
Québec 87,9 91,1 47,7
Ontario 86,4 88,7 50,6
Manitoba 85,9 86 80,6
Saskatchewan 80,8 82,8 28,2
Alberta 84,6 86,3 58,1
Colombie Britannique 86,8 89,9 31,6
Territoire du Yukon 86,6 86,6  
Territoires du Nord-Ouest 84,6 84,6  
Nunavut 70,6 70,6  
1. Il n'y a pas d'utilisation de données administratives pour les concessionnaires d'automobiles neuves

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

Les méthodes d'imputation fondées sur des données administratives sont sélectionnées automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant. La source de données administratives (ventes annuelles assujetties à la TPS) est le fondement de ces méthodes. Les ventes annuelles assujetties à la TPS sont utilisées pour deux types de méthode. L'une est une tendance générale que l'on utilise pour les structures simples, comme les entreprises ne comptant qu'un seul établissement et l'autre, appelée méthode de la médiane-moyenne, est utilisée pour les unités dont la structure est plus complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Des révisions des données brutes doivent être effectuées pour corriger les erreurs non dues à l'échantillonnage qui sont décelées. Ceci comporte généralement le remplacement de données imputées par des données déclarées, la correction de données déclarées précédemment, et de procéder à des estimations pour les nouvelles entreprises créées dont on ne connaissait pas l'existence au moment des estimations originales.

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans.

Les séries temporelles ou chronologiques comportent les éléments essentiels à la description, l'explication et la prévision du comportement d'un phénomène économique. « Ce sont des dossiers statistiques de l'évolution des processus économiques dans le temps1 ». Les séries temporelles socio-économiques comme celles de l’Enquête mensuelle sur le commerce de gros peuvent habituellement être décomposées en cinq composantes principales : la tendance-cycle, la saisonnalité, l’effet des jours ouvrables, l’effet de la fête de Pâques et la composante irrégulière.

La tendance représente l’évolution à long terme de la série, tandis que le cycle représente un mouvement lisse, quasi périodique, autour de la tendance qui met en évidence une succession de phases de croissance et de décroissance (ex. le cycle des affaires). Les deux composantes tendance et cycle sont estimées ensemble et la tendance-cycle reflète l'évolution fondamentale de la série. Les autres composantes traduisent des mouvements passagers à court terme. La composante saisonnière représente des fluctuations infra-annuelles, mensuelles ou trimestrielles, qui se répètent plus ou moins régulièrement d'une année à l'autre. Les variations saisonnières sont le produit des effets directs et indirects des saisons climatiques et d’éléments de type institutionnel (attribuable aux conventions sociales ou aux règles administratives, Noël par exemple).

L’effet des jours ouvrables provient du fait que l'importance relative des jours varie systématiquement à l'intérieur de la semaine et que le nombre de chacun des jours dans un mois donné varie d'une année à l'autre. Cet effet est présent lorsque l’activité change en fonction du jour de la semaine. Par exemple, dimanche connaît typiquement moins d'activité que les autres jours, et le nombre de dimanches, lundis, etc., dans un mois donné change d'année en année.
1 La désaisonnalisation des séries temporelles économiques : quelques remarques; tiré de la Revue statistique du Canada , août 1974
2 Pour plus de renseignements, voir X-12-ARIMA Reference Manual Version 0.3 (2007), U.S. Census Bureau.
3 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

L’effet de la fête de Pâques est la variation due au déplacement d’une partie de l’activité d’avril vers mars quand Pâques tombe en mars plutôt qu’en avril.

Enfin, la composante irrégulière regroupe toutes les autres fluctuations plus ou moins erratiques non prises en compte dans les composantes précédentes. Elle représente un résidu qui incorpore, entre autres, les erreurs de mesure sur la variable elle-même ainsi que des événements inhabituels (ex. grèves, sécheresse, inondations, panne d’électricité majeure ou d'autres variations inattendues dans les activités des répondants).

Ainsi, les composantes saisonnière et irrégulière, l’effet des jours ouvrables et l’effet de la fête de Pâques masquent la composante fondamentale de la série, qui est la tendance-cycle. La désaisonnalisation (correction des variations saisonnières) consiste à retirer de la série la composante saisonnière, l’effet des jours ouvrables et l’effet de la fête de Pâques. Elle contribue donc à révéler la tendance-cycle. Bien que la désaisonnalisation permette de mieux comprendre la tendance-cycle fondamentale d'une série, la série désaisonnalisée n'en contient pas moins une composante irrégulière. De légères variations d'un mois à l'autre dans la série désaisonnalisée peuvent n'être que de simples mouvements irréguliers. Pour avoir une meilleure idée de la tendance fondamentale, les utilisateurs doivent donc examiner les séries désaisonnalisées sur un certain nombre de mois.

Depuis avril 2008, l’Enquête mensuelle sur le commerce de gros utilise le logiciel X-12-ARIMA2 pour la désaisonnalisation. La technique utilisée consiste essentiellement, dans un premier temps, à corriger la série initiale de toute sorte d’effets indésirables, tels l’effet des jours ouvrables et l’effet de Pâques, par un module appelé regARIMA. L’estimation de ces effets se fait grâce à l’utilisation de modèles de régression à erreurs ARIMA (modèles autorégressifs à moyennes mobiles intégrées). On peut également extrapoler la série d'au moins une année à l'aide du modèle. Dans un deuxième temps, la série brute, pré-ajustée et extrapolée s’il y a lieu, est désaisonnalisée par la méthode X-11.

La méthode X-11, qui permet d’analyser des séries mensuelles et trimestrielles, repose sur un principe itératif d’estimation des différentes composantes, cette estimation étant faite à chaque étape grâce à des moyennes mobiles adéquates3. Les moyennes mobiles utilisées pour estimer les principales composantes, la tendance et la saisonnalité, sont avant tout des outils de lissage conçus pour éliminer une composante indésirable de la série. Puisque les moyennes mobiles réagissent mal à la présence de valeurs atypiques, la méthode X-11 incorpore un outil de détection et de correction des points atypiques utilisé pour nettoyer la série au cours de la désaisonnalisation. Les valeurs atypiques peuvent également être détectées et corrigées d’avance, à l’aide du module regARIMA.

Finalement, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes. Malheureusement, la désaisonnalisation supprime l’additivité infra-annuelle d’un système de séries; de légères différences peuvent alors être observées entre la somme de séries désaisonnalisées et la désaisonnalisation directe de leur total. Afin d’assurer ou de rétablir l’additivité d’un système de séries, un processus de réconciliation est appliqué ou une désaisonnalisation indirecte est employée, c.-à-d. la désaisonnalisation d’un total est obtenu en faisant la somme des séries désaisonnalisées individuellement.

1 Pour plus de renseignements, voir X-12-ARIMA Référence Manuel Version 0.3 (2007), U.S. Census Bureau. .
2 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100%
X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.1. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.2. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2007. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le
Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.
Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subit que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles. Tableau
Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1
Fractions de réponse pondérées par SCIAN et pour toutes les provinces et territoires, juin 2010
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada
Marchands de véhicules automobiles et de leurs pièces 93 94,2 35,5
Marchands d'automobiles 96,3 96,8 27,5
Marchands d'automobiles neuves 98 98  
Marchands d'automobiles d'occasion 71,6 77 27,5
Marchands d'autres véhicules automobiles 67,4 70,5 41,3
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 81 86,5 33,8
Magasins de meubles et d'accessoires de maison 80,8 88,1 16,5
Magasins de meubles 88,4 91,4 27
Magasins d'accessoires de maison 68 81,6 12,1
Magasin d'appareils électroniques et ménagers 90,8 92,7 49,8
Marchands de matériaux de construction et de matériel et fournitures de jardinage. 83,1 87,3 30,8
Magasins d'alimentation 78,1 84,2 16,3
Épiceries 82,9 90,1 15,6
Supermarché et autre épicerie, sauf dépanneur 85,2 92 16,8
Dépanneurs 57,4 67 7,7
Magasins d'alimentation spécialisés 65,5 75,5 24,3
Magasins de bière, de vin et de spiritueux 61,8 63,4 14,3
Magasins de produits de santé et de soins personnels 89,7 92,4 66,8
Stations-service 84,4 87,9 34,4
Magasins de vêtements et d'accessoires vestimentaires 83 84,9 31,4
Magasins de vêtements 82 83,8 34,6
Magasins de chaussures 92,7 94,1 13,4
Bijouteries et magasins de bagages et de maroquinerie 80 83,5 21,4
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 83,7 89,8 31,8
Magasins de fournitures de tout genre 92,7 93,3 29
Magasins de détail divers 81,7 87,7 27,2
Totale 86,3 89,7 30,2
Régions
Terre-Neuve-et-Labrador 82,7 83,9 26,3
Île-du-Prince-Édouard 87,6 88,5 22,4
Nouvelle Écosse 90,2 92,3 39,4
Nouveau-Brunswick 85 88,6 34
Québec 87 91,6 28,8
Ontario 86 89,2 31,7
Manitoba 89,5 91,4 33,9
Saskatchewan 90,9 93,2 36,8
Alberta 86,5 89,9 24,3
Colombie Britannique 83,4 86,5 31,1
Territoire du Yukon 87,2 87,2  
Territoires du Nord-Ouest 86 86  
Nunavut 94,1 94,1  
1. Il n'y a pas d'utilisation de données administratives pour les concessionnaires d'automobiles neuves

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

Les méthodes d'imputation fondées sur des données administratives sont sélectionnées automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant. La source de données administratives (ventes annuelles assujetties à la TPS) est le fondement de ces méthodes. Les ventes annuelles assujetties à la TPS sont utilisées pour deux types de méthode. L'une est une tendance générale que l'on utilise pour les structures simples, comme les entreprises ne comptant qu'un seul établissement et l'autre, appelée méthode de la médiane-moyenne, est utilisée pour les unités dont la structure est plus complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Des révisions des données brutes doivent être effectuées pour corriger les erreurs non dues à l'échantillonnage qui sont décelées. Ceci comporte généralement le remplacement de données imputées par des données déclarées, la correction de données déclarées précédemment, et de procéder à des estimations pour les nouvelles entreprises créées dont on ne connaissait pas l'existence au moment des estimations originales.

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans.

Les séries temporelles ou chronologiques comportent les éléments essentiels à la description, l'explication et la prévision du comportement d'un phénomène économique. « Ce sont des dossiers statistiques de l'évolution des processus économiques dans le temps1 ». Les séries temporelles socio-économiques comme celles de l’Enquête mensuelle sur le commerce de gros peuvent habituellement être décomposées en cinq composantes principales : la tendance-cycle, la saisonnalité, l’effet des jours ouvrables, l’effet de la fête de Pâques et la composante irrégulière.

La tendance représente l’évolution à long terme de la série, tandis que le cycle représente un mouvement lisse, quasi périodique, autour de la tendance qui met en évidence une succession de phases de croissance et de décroissance (ex. le cycle des affaires). Les deux composantes tendance et cycle sont estimées ensemble et la tendance-cycle reflète l'évolution fondamentale de la série. Les autres composantes traduisent des mouvements passagers à court terme. La composante saisonnière représente des fluctuations infra-annuelles, mensuelles ou trimestrielles, qui se répètent plus ou moins régulièrement d'une année à l'autre. Les variations saisonnières sont le produit des effets directs et indirects des saisons climatiques et d’éléments de type institutionnel (attribuable aux conventions sociales ou aux règles administratives, Noël par exemple).

L’effet des jours ouvrables provient du fait que l'importance relative des jours varie systématiquement à l'intérieur de la semaine et que le nombre de chacun des jours dans un mois donné varie d'une année à l'autre. Cet effet est présent lorsque l’activité change en fonction du jour de la semaine. Par exemple, dimanche connaît typiquement moins d'activité que les autres jours, et le nombre de dimanches, lundis, etc., dans un mois donné change d'année en année.
1 La désaisonnalisation des séries temporelles économiques : quelques remarques; tiré de la Revue statistique du Canada , août 1974
2 Pour plus de renseignements, voir X-12-ARIMA Reference Manual Version 0.3 (2007), U.S. Census Bureau.
3 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

L’effet de la fête de Pâques est la variation due au déplacement d’une partie de l’activité d’avril vers mars quand Pâques tombe en mars plutôt qu’en avril.

Enfin, la composante irrégulière regroupe toutes les autres fluctuations plus ou moins erratiques non prises en compte dans les composantes précédentes. Elle représente un résidu qui incorpore, entre autres, les erreurs de mesure sur la variable elle-même ainsi que des événements inhabituels (ex. grèves, sécheresse, inondations, panne d’électricité majeure ou d'autres variations inattendues dans les activités des répondants).

Ainsi, les composantes saisonnière et irrégulière, l’effet des jours ouvrables et l’effet de la fête de Pâques masquent la composante fondamentale de la série, qui est la tendance-cycle. La désaisonnalisation (correction des variations saisonnières) consiste à retirer de la série la composante saisonnière, l’effet des jours ouvrables et l’effet de la fête de Pâques. Elle contribue donc à révéler la tendance-cycle. Bien que la désaisonnalisation permette de mieux comprendre la tendance-cycle fondamentale d'une série, la série désaisonnalisée n'en contient pas moins une composante irrégulière. De légères variations d'un mois à l'autre dans la série désaisonnalisée peuvent n'être que de simples mouvements irréguliers. Pour avoir une meilleure idée de la tendance fondamentale, les utilisateurs doivent donc examiner les séries désaisonnalisées sur un certain nombre de mois.

Depuis avril 2008, l’Enquête mensuelle sur le commerce de gros utilise le logiciel X-12-ARIMA2 pour la désaisonnalisation. La technique utilisée consiste essentiellement, dans un premier temps, à corriger la série initiale de toute sorte d’effets indésirables, tels l’effet des jours ouvrables et l’effet de Pâques, par un module appelé regARIMA. L’estimation de ces effets se fait grâce à l’utilisation de modèles de régression à erreurs ARIMA (modèles autorégressifs à moyennes mobiles intégrées). On peut également extrapoler la série d'au moins une année à l'aide du modèle. Dans un deuxième temps, la série brute, pré-ajustée et extrapolée s’il y a lieu, est désaisonnalisée par la méthode X-11.

La méthode X-11, qui permet d’analyser des séries mensuelles et trimestrielles, repose sur un principe itératif d’estimation des différentes composantes, cette estimation étant faite à chaque étape grâce à des moyennes mobiles adéquates3. Les moyennes mobiles utilisées pour estimer les principales composantes, la tendance et la saisonnalité, sont avant tout des outils de lissage conçus pour éliminer une composante indésirable de la série. Puisque les moyennes mobiles réagissent mal à la présence de valeurs atypiques, la méthode X-11 incorpore un outil de détection et de correction des points atypiques utilisé pour nettoyer la série au cours de la désaisonnalisation. Les valeurs atypiques peuvent également être détectées et corrigées d’avance, à l’aide du module regARIMA.

Finalement, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes. Malheureusement, la désaisonnalisation supprime l’additivité infra-annuelle d’un système de séries; de légères différences peuvent alors être observées entre la somme de séries désaisonnalisées et la désaisonnalisation directe de leur total. Afin d’assurer ou de rétablir l’additivité d’un système de séries, un processus de réconciliation est appliqué ou une désaisonnalisation indirecte est employée, c.-à-d. la désaisonnalisation d’un total est obtenu en faisant la somme des séries désaisonnalisées individuellement.

1 Pour plus de renseignements, voir X-12-ARIMA Référence Manuel Version 0.3 (2007), U.S. Census Bureau. .
2 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100%
X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.1. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.2. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2007. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le
Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.
Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subit que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles. Tableau
Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1
Fractions de réponse pondérées par SCIAN et pour toutes les provinces et territoires, mai 2010
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada
Marchands de véhicules automobiles et de leurs pièces 92,9 93,8 52,1
Marchands d'automobiles 96,1 96,5 41,5
Marchands d'automobiles neuves 97,5 97,5  
Marchands d'automobiles d'occasion 74,5 79,2 41,5
Marchands d'autres véhicules automobiles 68,9 69,8 60,5
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 84,4 88,9 51,1
Magasins de meubles et d'accessoires de maison 86,4 92,1 40
Magasins de meubles 92,8 95,4 38,8
Magasins d'accessoires de maison 74,8 84,7 40,4
Magasin d'appareils électroniques et ménagers 86,2 88,8 38,7
Marchands de matériaux de construction et de matériel et fournitures de jardinage. 85,7 88,5 45,7
Magasins d'alimentation 86,1 93 17,2
Épiceries 85,7 93,3 15,3
Supermarché et autre épicerie, sauf dépanneur 88,1 95,6 14
Dépanneurs 58 64,7 23,7
Magasins d'alimentation spécialisés 64,5 73,4 29,6
Magasins de bière, de vin et de spiritueux 93,5 96,2 21,8
Magasins de produits de santé et de soins personnels 90,2 93,6 61,2
Stations-service 85,9 88,8 44,3
Magasins de vêtements et d'accessoires vestimentaires 85,1 87,4 34,3
Magasins de vêtements 85,2 87 41,9
Magasins de chaussures 87,7 90,5  
Bijouteries et magasins de bagages et de maroquinerie 81,5 86,3 16,4
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 79,1 85,6 14,2
Magasins de fournitures de tout genre 98,5 99,3 4,5
Magasins de détail divers 80,5 87,9 26,6
Totale 89,2 92,6 33,9
Régions
Terre-Neuve-et-Labrador 86,7 88,1 28
Île-du-Prince-Édouard 87,2 88,4 8,5
Nouvelle Écosse 94 95,7 53,8
Nouveau-Brunswick 88,6 91,2 49,4
Québec 88,3 93,2 24,3
Ontario 90,2 93,2 39,8
Manitoba 91,3 92,4 53,4
Saskatchewan 91,2 93 37,8
Alberta 87,6 90,9 33,4
Colombie Britannique 88,4 92,1 30,9
Territoire du Yukon 91,3 91,3  
Territoires du Nord-Ouest 85,8 85,8  
Nunavut 75,9 75,9  
1. Il n'y a pas d'utilisation de données administratives pour les concessionnaires d'automobiles neuves

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

Les méthodes d'imputation fondées sur des données administratives sont sélectionnées automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant. La source de données administratives (ventes annuelles assujetties à la TPS) est le fondement de ces méthodes. Les ventes annuelles assujetties à la TPS sont utilisées pour deux types de méthode. L'une est une tendance générale que l'on utilise pour les structures simples, comme les entreprises ne comptant qu'un seul établissement et l'autre, appelée méthode de la médiane-moyenne, est utilisée pour les unités dont la structure est plus complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Des révisions des données brutes doivent être effectuées pour corriger les erreurs non dues à l'échantillonnage qui sont décelées. Ceci comporte généralement le remplacement de données imputées par des données déclarées, la correction de données déclarées précédemment, et de procéder à des estimations pour les nouvelles entreprises créées dont on ne connaissait pas l'existence au moment des estimations originales.

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans.

Les séries temporelles ou chronologiques comportent les éléments essentiels à la description, l'explication et la prévision du comportement d'un phénomène économique. « Ce sont des dossiers statistiques de l'évolution des processus économiques dans le temps1 ». Les séries temporelles socio-économiques comme celles de l’Enquête mensuelle sur le commerce de gros peuvent habituellement être décomposées en cinq composantes principales : la tendance-cycle, la saisonnalité, l’effet des jours ouvrables, l’effet de la fête de Pâques et la composante irrégulière.

La tendance représente l’évolution à long terme de la série, tandis que le cycle représente un mouvement lisse, quasi périodique, autour de la tendance qui met en évidence une succession de phases de croissance et de décroissance (ex. le cycle des affaires). Les deux composantes tendance et cycle sont estimées ensemble et la tendance-cycle reflète l'évolution fondamentale de la série. Les autres composantes traduisent des mouvements passagers à court terme. La composante saisonnière représente des fluctuations infra-annuelles, mensuelles ou trimestrielles, qui se répètent plus ou moins régulièrement d'une année à l'autre. Les variations saisonnières sont le produit des effets directs et indirects des saisons climatiques et d’éléments de type institutionnel (attribuable aux conventions sociales ou aux règles administratives, Noël par exemple).

L’effet des jours ouvrables provient du fait que l'importance relative des jours varie systématiquement à l'intérieur de la semaine et que le nombre de chacun des jours dans un mois donné varie d'une année à l'autre. Cet effet est présent lorsque l’activité change en fonction du jour de la semaine. Par exemple, dimanche connaît typiquement moins d'activité que les autres jours, et le nombre de dimanches, lundis, etc., dans un mois donné change d'année en année.
1 La désaisonnalisation des séries temporelles économiques : quelques remarques; tiré de la Revue statistique du Canada , août 1974
2 Pour plus de renseignements, voir X-12-ARIMA Reference Manual Version 0.3 (2007), U.S. Census Bureau.
3 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

L’effet de la fête de Pâques est la variation due au déplacement d’une partie de l’activité d’avril vers mars quand Pâques tombe en mars plutôt qu’en avril.

Enfin, la composante irrégulière regroupe toutes les autres fluctuations plus ou moins erratiques non prises en compte dans les composantes précédentes. Elle représente un résidu qui incorpore, entre autres, les erreurs de mesure sur la variable elle-même ainsi que des événements inhabituels (ex. grèves, sécheresse, inondations, panne d’électricité majeure ou d'autres variations inattendues dans les activités des répondants).

Ainsi, les composantes saisonnière et irrégulière, l’effet des jours ouvrables et l’effet de la fête de Pâques masquent la composante fondamentale de la série, qui est la tendance-cycle. La désaisonnalisation (correction des variations saisonnières) consiste à retirer de la série la composante saisonnière, l’effet des jours ouvrables et l’effet de la fête de Pâques. Elle contribue donc à révéler la tendance-cycle. Bien que la désaisonnalisation permette de mieux comprendre la tendance-cycle fondamentale d'une série, la série désaisonnalisée n'en contient pas moins une composante irrégulière. De légères variations d'un mois à l'autre dans la série désaisonnalisée peuvent n'être que de simples mouvements irréguliers. Pour avoir une meilleure idée de la tendance fondamentale, les utilisateurs doivent donc examiner les séries désaisonnalisées sur un certain nombre de mois.

Depuis avril 2008, l’Enquête mensuelle sur le commerce de gros utilise le logiciel X-12-ARIMA2 pour la désaisonnalisation. La technique utilisée consiste essentiellement, dans un premier temps, à corriger la série initiale de toute sorte d’effets indésirables, tels l’effet des jours ouvrables et l’effet de Pâques, par un module appelé regARIMA. L’estimation de ces effets se fait grâce à l’utilisation de modèles de régression à erreurs ARIMA (modèles autorégressifs à moyennes mobiles intégrées). On peut également extrapoler la série d'au moins une année à l'aide du modèle. Dans un deuxième temps, la série brute, pré-ajustée et extrapolée s’il y a lieu, est désaisonnalisée par la méthode X-11.

La méthode X-11, qui permet d’analyser des séries mensuelles et trimestrielles, repose sur un principe itératif d’estimation des différentes composantes, cette estimation étant faite à chaque étape grâce à des moyennes mobiles adéquates3. Les moyennes mobiles utilisées pour estimer les principales composantes, la tendance et la saisonnalité, sont avant tout des outils de lissage conçus pour éliminer une composante indésirable de la série. Puisque les moyennes mobiles réagissent mal à la présence de valeurs atypiques, la méthode X-11 incorpore un outil de détection et de correction des points atypiques utilisé pour nettoyer la série au cours de la désaisonnalisation. Les valeurs atypiques peuvent également être détectées et corrigées d’avance, à l’aide du module regARIMA.

Finalement, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes. Malheureusement, la désaisonnalisation supprime l’additivité infra-annuelle d’un système de séries; de légères différences peuvent alors être observées entre la somme de séries désaisonnalisées et la désaisonnalisation directe de leur total. Afin d’assurer ou de rétablir l’additivité d’un système de séries, un processus de réconciliation est appliqué ou une désaisonnalisation indirecte est employée, c.-à-d. la désaisonnalisation d’un total est obtenu en faisant la somme des séries désaisonnalisées individuellement.

1 Pour plus de renseignements, voir X-12-ARIMA Référence Manuel Version 0.3 (2007), U.S. Census Bureau. .
2 Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics #158.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100%
X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Toute demande de renseignements au sujet du présent guide ou au sujet de statistiques ou de services connexes doit être adressée à:

Statistique Canada
150 promenade Tunney’s Pasture
Ottawa, Ontario, K1A 0T6
Téléphone sans frais: 1-800-565-1685
Facsimile: 1-888-883-7999
Courriel: bdp.enquetes@statcan.gc.ca

Comment obtenir d’autres renseignements.

Pour obtenir des renseignements sur l’ensemble des données de Statistique Canada qui sont disponibles, veuillez composer l’un des numéros sans frais suivants. Vous pouvez également communiquer avec nous par courriel ou visiter notre site Web.

Service national de renseignements
1 800 263-1136

Service national d’appareils de télécommunications pour les malentendants
1 800 363-7629

Renseignements pour le Programme des bibliothèques de dépôt
1 800 700-1033

Télécopieur pour le Programme des bibliothèques de dépôt
1 800 889-9734

Renseignements par courriel
infostats@statcan.ca

Site Web
www.statcan.ca

Ce guide est aussi disponible sous forme électronique dans le site Internet de Statistique Canada. Les utilisateurs peuvent en obtenir un exemplaire en visitant notre site Web à www.statcan.ca et en choisissant la rubrique produits et services.

If you would prefer this guide in English, please telephone 1 (800) 565-1685.

Normes de service à la clientèle

Statistique Canada s’engage à fournir à ses clients des services rapides, fiables et courtois, et ce, dans la langue officielle de leur choix. À cet égard, notre organisme s’est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu’ils offrent des services à la clientèle. Pour obtenir une copie de ces normes de service, veuillez communiquer avec Statistique Canada au numéro sans frais 1 800 263-1136.

Table des Matières

Partie 1 : Généralités

  • Autorité
  • Confidentialité
  • But des enquêtes
  • Retour des déclarations
  • Méthodes comptables
  • Valeurs monétaires
  • Devises
  • Niveau du détail géographique

Parties 2 : Vue générale des questionnaires

  • Qui reçoit les questionnaires?
  • BP-QT : Investissements trimestriels entre le Canada et les autres pays
  • BP-21SF : Opérations internationales de services commerciaux (annuel)
  • BP-21SQF : Opérations internationales de services commerciaux (trimestriel)
  • BP-22F : Investissements effectués au Canada par des sociétés étrangères (trimestriel)
  • BP-22AF : Investment in Canada by Non-Canadian Corporations (Quarterly)
  • BP-FIC : Investissements étrangers au Canada (annuel)
  • BP-STRUC : Structure des sociétés canadiennes dans l'entreprise déclarante (annuel)
  • BP-CIA : Investissements canadiens à l'étranger (annuel)

Parties 3 : Guide détaillé de déclaration concernant les divers questionnaires

  • BP-QT : Investissements trimestriels entre le Canada et les autres pays
  • BP-21SF : Opérations internationales de services commerciaux (annuel)
  • BP-21SQF : Opérations internationales de services commerciaux (trimestriel)
  • BP-22F : Investissements effectués au Canada par des sociétés étrangères (annuel)
  • BP-22AF : Investissements effectués au Canada par des sociétésétrangères (trimestriel)
  • BP-FIC : Investissements étrangers au Canada (annuel)
  • BP-STRUC : Structure des sociétés canadiennes dans l'entreprise déclarante (annuel)
  • BP-CIA : Investissements canadiens à l'étranger (annuel)

Annexe A - Définitions

Annexe B - Liste des codes de pays

Partie 1 : Généralité

Autorité
Les enquêtes trimestrielles et annuelles de la Division de la balance des paiements sont menées en vertu de la Loi sur la statistique, Lois révisées du Canada, 1985, chapitre S19. en vertu de cette loi. il est obligatoire de remplir ces questionnaires.

But des enquêtes
Les données recueillies servent à préparer les états de la balance des paiements internationaux et du bilan des investissements internationaux du Canada. De tels états aident le gouvernement canadien à établir les politiques monétaires et celles des taux de change. D'autres utilisations se rapportent aux négociations sur le commerce international, la planification des entreprises, la commercialisation et la recherche.

Confidentialité
La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l’identité d’une personne, d’une entreprise ou d’un organisme sans leur permission ou sans en être autorisé par la loi. Les dispositions de confidentialité de la Loi sur la statistique ne sont pas touchées par la Loi sur l’accès à l’information ou toute autre loi. Ainsi, par exemple, l’Agence du revenu du Canada ne peut pas accéder à des données d’enquête identifiables de Statistique Canada. Les données de cette enquête serviront uniquement à des fins statistiques et seront publiées sous forme agrégée seulement.

Retour des déclarations
Les questionnaires trimestriels et annuels doivent être retournés dûment rempli dans les quatre semaines à compter de leur réception.
Votre coopération pour soumettre les questionnaires à temps est essentielle de façon à ne pas retarder la diffusion des statistiques.  Si vous avez besoin d'éclaircissements en remplissant les questionnaires, veuillez nous contacter au numéro de téléphone sans frais inscrit à la première page de chaque questionnaire, sous la rubrique ‘Renvoi du questionnaire’.

Méthodes comptables
Veuillez d éclarer les données selon les principes comptables généralement reconnus (PCGR) à moins autrement spécifié.

Valeurs monétaires
Veuillez déclarer toutes les sommes en milliers de dollars canadiens (CAD$’000). Si le montant est plus ou moins 500$, veuillez rapporter zéro(0).

Devises
Il faut utiliser la liste des codes qui figure au verso du questionnaire pour indiquer la devise de règlement dans le cas du passif.

Niveau du détail géographique
Il faut utiliser la liste des codes qui figure au verso du questionnaire au questionnaire pour indiquer le pays avec lequel les transactions ont été effectuées ou où se trouvent les actions ou le passif. S'il n'existe pas de données précises par pays, veuillez fournir une estimation. 

Parties 2 : Vue générale des questionnnaires

Le but des questionnaires de la Division de la balance des paiements est de rassembler les données sur les transactions internationales des entreprises au Canada. Ces questionnaires, sauf le BP-22F, s’adressent principalement aux sociétés constituées au Canada. Le questionnaire BP-22F porte sur les opérations et les investissements des sociétés étrangères au Canada (succursales).  Les questionnaires de la balance des paiements doivent être remplis selon le point de vue des sociétés canadiennes.

Qui reçoit les questionnaires?
Les grandes entreprises (multinationales) reçoivent la plupart des questionnaires du fait qu’elles effectuent généralement une multitude de transactions internationales. Le cadre d’identification des entreprises pour l’envoi des questionnaires est principalement réalisé à partir du registre centralisé de Statistique Canada.

Certaines entreprises reçoivent le questionnaire BP-FIC car une partie ou la totalité de leur capital-actions ou de leur dette à long terme est détenue à l'étranger. D'autres entreprises reçoivent le questionnaire BP-CIA car elles ont des investissements à l'étranger.

D'autres encore ne reçoivent que le BP-QT ou le BP-21SF.  Il s'agit de filiales dont la société-mère a pu faire état dans tous les autres questionnaires en se fondant sur ses comptes consolidés. Toutefois, comme certains détails de ces filiales peuvent difficilement être tirés des comptes consolidés, on demande à ces dernières de remplir un questionnaire séparément. Par ailleurs, certaines sociétés peuvent avoir fait des transactions internationales qui se limitent à l’actif et au passif à court terme (c.-à-d., effets commerciaux à payer à des non-résidents ou à recevoir de non-résidents ou paiements pour services rendus par des sociétés étrangères).

BP-QT : Investissements trimestriels entre le Canada et les autres pays
Ce questionnaire (anciennement BP21AF) sert à recueillir des données sur les transactions avec les non-résidents telles que l’investissement en capital-actions, les créances et dettes et les revenus de placements. Le questionnaire trimestriel est envoyé à un échantillon de grandes entreprises ayant d’importantes opérations internationales. 

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 4.

BP-21SF : Opérations internationales de services commerciaux (annuel)
Ce questionnaire sert à recueillir des données sur les revenus provenant de non-résidents et les sommes payées à des non-résidents au titre des services commerciaux.  La gamme de services et de frais pour lesquels il faut fournir de l’information figure au verso du questionnaire. 

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 11.

BP-21SQF : Opérations internationales de services commerciaux (annuel)
Ce questionnaire est une version trimestrielle abrégée du BP-21SF annuel. Il est envoyé à un échantillon de sociétés qui ont d’importantes opérations de services. Les opérations de services commerciaux dont il est fait état dans les déclarations trimestrielles doivent correspondre aux montants indiqués dans les questionnaires BP-21SF.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 12.

BP-22F : Investissements effectués au Canada par des sociétés étrangères (annuel)

BP-22AF : Investissements effectués au Canada par des sociétés étrangères (trimestriel)
Ces questionnaires portent sur les activités des entités étrangères au Canada qui ne sont pas constituées en personne morale par l’entremise de sociétés canadiennes.  Dans la plupart des cas, ce formulaire s’adresse aux succursales canadiennes de sociétés étrangères.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 13.

BP-FIC : Investissements étranger au Canada (annuel)
Cette enquête (anciennement BP-52) vise à mesurer les investissements étrangers dans les sociétés canadiennes ainsi que les engagements de ces dernières envers les non-résidents.

Ce questionnaire sert à recueillir des données sur le niveau d’investissement étranger dans les sociétés canadiennes ainsi que les engagements de ces dernières envers les non-résidents, incluant les obligations, les prêts bancaires et autres dettes à long terme.  Le questionnaire doit être rempli en se fondant sur les comptes consolidés et faire état des dettes à long terme et des capitaux propres de la société-mère et de ses filiales canadiennes.  Si, pour une raison quelconque, une consolidation complète des comptes n’est pas disponible, il se peut que les filiales canadiennes doivent remplir séparément un questionnaire.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 16.

BP-STRUC : Structure des sociétés canadiennes dans l'entreprise déclarante (annuel)
Ce questionnaire (anciennement BP-53) sert à déterminer les filiales canadiennes intégralement consolidées (partie 1) pour fins de déclaration dans le formulaire BP-FIC, de même que la valeur totale des investissements dans des filiales et sociétés affiliées canadiennes non intégralement consolidées (partie 2). Veuillez noter que ce questionnaire ne vise pas à établir un profil d’entreprise semblable à celui dressé par la Division du Registre des entreprises de Statistique Canada.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 20.

BP-CIA : Investissements canadiens à l’étranger (annuel)
Ce questionnaire (anciennement BP-59 et BP-59S) sert à recueillir des données sur les investissements de l'unité déclarante dans des filiales étrangères, sociétés affiliées étrangères et succursales ou entreprises conjointes étrangères.  Il faut y indiquer tous les investissements à l'étranger de la société déclarante et/ou de ses filiales canadiennes intégralement consolidées.

Pour chaque filiale, société affiliée, succursale ou entreprise conjointe étrangère, il faut fournir, les éléments financiers demandés tels qu’ils apparaissent dans les états financiers de l’entité à l’étranger.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 20.

Partie 3 : Guide détaillé de déclaration concernant les divers questionnaires

BP-QT : Investissements trimestriels entre le Canada et les autres pays
Le questionnaire (BP-QT) comprend toutes les opérations de votre entreprise avec des non-résidents, incluant celles avec les sociétés affiliés étrangères (filiales, sociétés associées et succursales), la société mère étrangère et les sociétés non-affiliées étrangères. Les transactions financières et les niveaux d’investissement sous forme de capital-actions, créances et dettes doivent être déclarés aux pages 2 et 3 du questionnaire.  Les revenus de placements et les dépenses avec des non-résidents doivent être déclarés aux pages 4 et 5.

Page couverture

Période de déclaration
Veuillez indiquer la période trimestrielle visée  selon le format suivant :  AAAA MM JJ

Attestation
Veuillez fournir des renseignements sur la personne chargée de remplir ce questionnaire.

Page 2

Section A – Investissements à l’étranger par l’entreprise déclarante canadienne
Cette section couvre tous les investissements ou placements de l’entité canadienne déclarante  dans les entités étrangères (participation sous forme de capital-actions et titres de créances), soient les sociétés affiliées étrangères (A1), les sociétés mères et les sociétés sœurs étrangères (A2) et les sociétés non affiliées étrangères (A3).

Si des données sur les transactions sont fournies à cette section, les augmentations ou diminutions de placements ne doivent inclure que les transactions financières et exclure les ajustements suivants : 1) les variations de taux de change ; 2) les changements dus aux mouvements des prix du marché ; 3) les radiations de compte, à la hausse ou à la baisse, etc. Tous ces ajustements devraient cependant être inclus dans les données de positions de début et de fin de trimestre. Si vous n’avez pas de transactions pendant le trimestre à déclarer, vous devez toutefois inscrire les positions au début et à la fin du trimestre.

Note : Si, pour un poste donné, vous manquez d’espace pour l’inscription de tous les codes de pays, veuillez joindre une feuille supplémentaire.

A1 – Investissements par l’entreprise déclarante canadienne dans des sociétés étrangères affiliées
Il faut fournir des renseignements à ce poste si l'unité déclarante possède une participation sous forme de capital-actions dans des sociétés affiliées étrangères (filiales, sociétés apparentées ou des succursales étrangères) ou encore si elle des créances (comptes à recevoir, prêts, avances, hypothèques et obligations)  auprès des sociétés affiliées étrangères.

  • (i) Actions dans les sociétés affiliées étrangères Il faut déclarer à ce poste la participation sous forme de capital-actions ordinaires et privilégiées ainsi que l’excédent de capital ou surplus d’apport dans des sociétés affiliés étrangères.
  • Exemple
    HIJ Canada Inc. investit 20 millions de dollars pour acquérir une part de 60 % dans une nouvelle société en participation au Costa Rica au cours du trimestre.  La valeur du capital-actions est de 5 millions de dollars;  les 15 millions de dollars restants représentent le surplus d'apport. 
    Au poste A1 (i), il faudrait inscrire 20000 $ (CAD$’000) à titre d'augmentation des placements (recettes), indiquer le code de pays CRI, et fournir la position à la fin du trimestre qui reflète notamment cette augmentation ainsi que d’autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.
  • (ii) Créances commerciales auprès des sociétés affiliées
    Il faut inscrire uniquement les créances commerciales auprès des entités affiliées étrangères. Les autres prêts et avances doivent être déclarés au poste A1 (iii).
  • Exemple
    HIJ Canada Inc. a consenti un prêt de 12 millions de dollars à une filiale en Espagne.  La filiale rembourse 50 % de son emprunt au cours du trimestre.  Au poste A1 (iii), il faudrait faire état d’une diminution des placements (recettes) de 6 000 $ (CAD$’000), inscrire le code du pays ESP et fournir la position à la fin du trimestre qui reflète notamment cette diminution ainsi que d’autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.

A2 – Investissements par l’entreprise déclarante canadienne dans des sociétés mères étrangères et dans des sociétés sœurs
Il faut fournir des renseignements à ce poste si l'unité déclarante a des créances  (comptes à recevoir, prêts, avances, hypothèques et obligations)  auprès des sociétés mères et des sociétés sœurs étrangères.

  • (i) Créances commerciales auprès des sociétés mères et des sociétés sœurs étrangères Il faut déclarer à ce poste que les créances commerciales auprès des sociétés mères et des sociétés sœurs étrangères. Les autres prêts et avances doivent être déclarés au poste A2 (ii).
  • Autres créances auprès des sociétés mères et des sociétés sœurs étrangères Ce poste sert à l’inscription d’autres créances de l’entité canadienne déclarante auprès des sociétés mères et des sociétés sœurs étrangères. Elles comprennent les prêts, avances, hypothèques et obligations.
  • Exemple
    La société mère de HIJ Canada Inc. en France lui doit 5 millions de dollars. La société mère a remboursé 50% du prêt au cours du trimestre. Au poste A2(ii), il s'agirait donc de faire état d’une diminution de placements (recettes) de 2500 $ (CAD$’000), indiquer le code de pays FRA et fournir la position à la fin du trimestre qui reflète notamment cette diminution ainsi que d’autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.

A3 Autres investissements à l’étranger par l’entreprise déclarante canadienne dans des sociétés non affiliées
Ce poste sert à l’inscription des créances de l’entité canadienne déclarante auprès des sociétés non affiliées étrangères. Elles incluent les créances commerciales, prêts, avances, prêts hypothécaires mais excluent les obligations.

  • Créances commerciales auprès des sociétés non affiliées étrangères
    Il s'agit d'inscrire à ce poste les créances commerciales auprès des sociétés non affiliées étrangères. Les autres prêts et les avances doivent être déclarés au poste A3 (ii)
  • (ii) Autres créances auprès des sociétés non affiliées étrangères
    Ce poste inclut les prêts, avances et hypothèques aux sociétés non affiliées étrangères mais exclut les obligations et autres titres obligataires.

Page 3

Section B – Investissements dans l’entreprise déclarante canadienne par des entités non résidentes
Ce section sert à déclarer les investissements ou placements effectuées par les non résidents dans l’unité déclarante canadienne. Figurent ici les investissements faits par : a) les sociétés mères et les sociétés sœurs étrangères (B1) ; b) les sociétés étrangères affiliées (B2) et 3) d’autres entités non résidentes (B3).

Si des données sur les transactions ou flux de capitaux sont fournis à ce poste, les augmentations ou diminutions de capitaux ne doivent inclure que les transactions financières et exclure les ajustements suivants : 1) les variations de taux de change ; 2) les changements dus aux mouvements des prix du marché ; 3) les radiations de compte, à la hausse ou à la baisse, etc. Tous ces ajustements devraient cependant être inclus dans les données de positions de début et de fin de trimestre. Si vous n’avez pas de transactions au cours du trimestre à déclarer, vous devez toutefois inscrire les positions au début et à la fin du trimestre.

Note : Si, pour un poste donné, vous manquez d’espaces pour l’inscription de tous les codes de pays, veuillez joindre une feuille supplémentaire.

B1 – Investissements par les sociétés mères et les sociétés sœurs étrangères dans l’entreprise canadienne déclarante
Il faut fournir des renseignements à ce poste si les sociétés mères et sœurs étrangères possèdent une participation sous forme de capital-actions dans l’entreprise canadienne déclarante. Cette section couvre également les dettes de l’entreprise canadienne déclarante (comptes à payer, prêts, découverts, hypothèques et obligations) envers des sociétés mères et des sociétés sœurs étrangères.

  • (i) Actions dans l’entreprise déclarante canadienne
    Il faut fournir des renseignements à ce poste si les sociétés mères et les sociétés sœurs étrangères ont des investissements sous forme de capital-actions ordinaires et privilégiés dans l’unité canadienne déclarante. Veuillez inclure également le surplus d’apport.
  • Exemple
    HIJ Canada Inc. émet des actions d'une valeur totale de 10 millions de dollars. Une entreprise canadienne et HIJ Allemagne Inc. achètent chacune pour 5 millions de dollars d’actions. Au poste B1(i), il s'agirait de faire état d’une augmentation de placements (recettes) de 5 000 $ (CAD$’000’), indiquer le code de pays DEU et fournir la position à la fin du trimestre qui reflète notamment cette augmentation ainsi que d’autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.
  • (ii) Dettes commerciales envers des sociétés mères étrangères et des sociétés sœurs Il s'agit d'inscrire uniquement à ce poste les dettes commerciales (comptes à payer) de l’unité déclarante canadienne envers des sociétés mères et des sociétés sœurs étrangères. Les autres dettes doivent être déclarées au poste B1 (iii).
  • (iii) Autres créances dues aux sociétés mères étrangères et aux sociétés soeurs
    Ce poste sert à l’inscription des autres créances dues aux sociétés mères et sœurs étrangères qui comprennent les prêts, découverts, hypothèques et obligations.
  • Exemple
    HIJ Canada Inc. doit 7 millions de dollars à sa société-mère, HIJ Italie Inc. HIJ Canada Inc. a remboursé l'emprunt durant le trimestre.  Il faut déclarer au poste B1 (iii) 7 000 $ (CAD$’000) à titre de diminution de placements (paiements), indiquer le code de pays ITA et fournir la position à la fin du trimestre qui reflète notamment cette diminution ainsi que d’autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.

B2 – Investissements par les sociétés étrangères affiliées dans l’entreprise canadienne déclarante

Ce poste sert à l’inscription des dettes de l’unité canadienne déclarante auprès des sociétés non affiliées étrangères, incluant les dettes commerciales (comptes à payer), prêts, découverts hypothèques mais excluant les obligations.

  • (i) Dettes commerciales auprès des sociétés étrangères affiliées
    Il s’agit d’inscrire uniquement à ce poste les dettes commerciales (comptes à payer) auprès des sociétés affiliées étrangères. Les autres dettes doivent être déclarées au poste B2 (ii).
  • (ii) Autres créances dues aux sociétés étrangères affiliées
    Ce poste sert à l’inscription des autres créances de l’entreprise déclarante canadienne aux sociétés affiliées
    étrangères qui comprennent les prêts, découverts,  hypothèques et obligations.
  • Exemple
    HIJ Canada Inc. doit 5 millions de dollars à une société affiliée au Mexique.  La société affiliée rembourse 50 % de son emprunt pendant le trimestre.  Dans la section B2 (ii), il faudrait faire état d’une diminution des investissements (paiements) de 2500$ (CAD$’000), inscrire le code du pays MEX et fournir la position à la fin du trimestre qui reflète notamment cette diminution ainsi que d’autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.

B3 – Investissements par des sociétés non affiliées étrangères dans l’entreprise canadienne déclarante

Ce poste sert à l’inscription des dettes de l’unité canadienne déclarante auprès des sociétés non affiliées étrangères, incluant les dettes commerciales (comptes à payer), prêts, découverts hypothèques mais excluant les obligations.

  • (i) Dettes commerciales auprès des sociétés non affiliées étrangères
    Il faut inscrire uniquement sous ce poste toutes les dettes commerciales (comptes à payer) de l’unité déclarante envers des sociétés non affiliées étrangères. Les autres dettes doivent être déclarées au poste B3 (ii).
  • (ii) Autres créances dues aux sociétés non affiliées
    Ce poste inclut les prêts, découverts, crédit-bail et hypothèques mais exclut les obligations et autres titres obligataires.
  • Exemple
    HIJ Canada Inc. doit 2 millions de dollars à une banque au Japon qui arrive à échéance durant le trimestre. HIJ Canada Inc. rembourse le prêt durant le trimestre. Au poste B3 (ii), il faut déclarer 2000$ (CAD$’000) à titre de diminution de placements (paiements), inscrire le code du pays JAP et fournir la position à la fin du trimestre qui reflète notamment cette diminution ainsi que d’autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.

Page 4

Section C – Certaines opérations avec des non-résidents au titre de l’état des résultats et des bénéfices non répartis de l’entreprise déclarante canadienne (recettes)

Cette section porte sur les revenus de dividendes et d’intérêts l’entreprise déclarante canadienne provenant des sociétés affiliées et des sociétés mères et sociétés sœurs étrangères payées ou accumulées pendant la période.

Les montants reçus ou imputés aux postes mentionnés ci-dessus doivent être déclarés bruts avant la déduction faite des retenues fiscales.

C1 – Recettes de l’entreprise déclarante canadienne provenant des sociétés étrangères affiliéeset des sociétés mères et sociétés sœurs étrangères

  • (i) Dividendes en provenance des sociétés affiliées étrangères
    Il faut faire état à ce poste des dividendes reçus ou déclarés des sociétés affiliées étrangères pendant le trimestre. Ne faites état que de la part des dividendes revenant à l’entreprise déclarante canadienne et non le montant total des dividendes déclaré (à moins que l’entreprise déclarante canadienne détienne 100% du capital actions).
  • Exemple
    HIJ Canada Inc. reçoit un paiement de dividendes d’une filiale en propriété exclusive en Espagne durant le trimestre. Il faut déclarer sous le poste C1(i) le montant brut de dividendes reçus et inscrire le code pays ESP.
  • (ii) Revenu d’intérêt des créances commerciales et autres créances auprès des sociétés affiliées étrangères
    Il s’agit d’indiquer ici les revenus d’intérêts reçus ou courus sur les créances auprès des sociétés affiliées étrangères pendant le trimestre, par exemple ceux liés aux prêts, avances, hypothèques, obligations et créances commerciales.
  • (iii) Revenu d'intérêt des créances commerciales et autres créances auprès des sociétés mères et sociétés sœurs étrangères
    Il faut déclarer à ce poste les revenus d’intérêts reçus ou courus sur des créances auprès des sociétés mères et des sociétés sœurs étrangères pendant le trimestre, par exemple ceux liés aux prêts, avances, hypothèques, obligations et créances commerciales.

C2 –Recettes de l’entreprise déclarante canadienne provenant des sociétés non affiliées étrangères

  • (i) Revenu d'intérêt en provenance d'autres entités non affiliées étrangères
    Report interest received or accrued from debt claims on foreign non-affiliates during the quarter, including trade receivables, loans, advances and mortgages, but exclude interest received from holdings of foreign bonds and other foreign debt securities. Dividends received from holdings of foreign equities must also be excluded.

C3 – Revenu (perte) net(te) des sociétés affiliées étrangères
Il faut déclarer à ce poste le montant total du revenu net (perte) après impôtset non uniquement la part de l’entreprise déclarante canadienne dans le profit net après impôts.

Page 5

Section D – Certaines opérations avec des non-résidents au titre de l’état des résultats et des bénéfices non répartis de l’entreprise déclarante canadienne avec les non résidents (paiements)
Cette section porte sur les paiements de dividendes et d’intérêts de l’entreprise déclarante canadienne aux sociétés étrangères affiliées et aux sociétés mères et sociétés sœurs étrangères payées ou courus pendant la période.

Les montants payés ou courus aux postes mentionnés ci-dessus doivent être déclarés bruts avant la déduction faite des retenues fiscales.

D1 – Paiements de l’entreprise déclarante canadienne à des sociétés mères et sociétés sœurs étrangères et des sociétés étrangères affiliées

  • (i) Dividendes déclarés aux sociétés mères et sociétés sœurs Il faut déclarer à ce poste les montants de dividendes versés ou déclarés aux sociétés mères étrangères et aux sociétés sœurs pendant le trimestre.
  • Exemple
    HIJ Canada Inc. verse un dividende de 1 million de dollars à la société-mère en Allemagne. Il s'agit dans ce cas de déclarer sous D1(i) le montant brut de dividende de 1000$ (CAD$’000) et d’inscrire le code de pays (DEU).
  • (ii) Frais d’intérêts sur des dettes commerciales et autres dettes à l’égard des sociétés mères et sociétés sœurs étrangères
    Il faut déclarer les intérêts payés ou courus sur des dettes à l’égard des sociétés mères et des sociétés sœurs étrangères pendant le trimestre, par exemple ceux liés aux dettes commerciales (comptes à payer) et autres types d’engagements tels que les prêts, découverts, hypothèques et obligations.
  • (iii) Frais d’intérêts sur des dettes commerciales et autres dettes à l’égard des sociétés affiliées étrangères
    Il faut déclarer ici les intérêts payés ou courus sur des engagements à l’égard des sociétés affiliées étrangères pendant le trimestre, par exemple ceux liés aux dettes commerciales, prêts, découverts, hypothèques et obligations.

D2 – Paiement d’intérêts de l’entreprise déclarante canadienne à des sociétés non affiliées étrangères

  • (i) Frais d'intérêt sur des dettes commerciales et autres dettes à l'égard des sociétés non affiliées étrangères
    Ce poste couvre les intérêts payés ou courus sur les dettes envers des sociétés étrangères non affiliées pendant le trimestre, par exemple ceux liés aux dettes commerciales (comptes à payer), prêts, découverts et hypothèques. Il faut exclure les intérêts payés ou courus sur les obligations et autres titres d’emprunt. Les dividendes payés aux actionnaires de portefeuille étrangers doivent être aussi être exclues.

BP-21SF : Opérations internationales de services commerciaux (annuels)

Page couverture

  • Période observée
    Veuillez inscrire la date (jour, mois et année) de clôture de la période de 12 mois sur laquelle portent les renseignements fournis. Si l’exercice en question ne prend pas fin en décembre, veuillez fournir les données pour l’exercice le plus proche.
  • Champ
    Déclarez toutes les opérations de services, y compris celles financées par le gouvernement du Canada (notamment par l’Agence canadienne de développement international) ou d’autres sources au Canada. Voir la page 4 de ce questionnaire pour une description détaillée des types de services mentionnés aux pages 2 et 3. Veuillez utiliser la liste des codes géographiques pour identifier le pays.

Pages 2 et 3

Revenus et dépenses internationaux

  • Annexe A - Exportations des services commerciaux
    Veuillez indiquer la valeur des services vendus à des clients à l’étranger (recettes) durant une période de 12 mois. Déclarez les recettes, nettes de retenues fiscales, en milliers de dollars canadiens. Veuillez, au besoin, ajouter une feuille séparée pour les recettes provenant de plus de quatre pays.
  • Annexe B - Importations des services commerciaux
    Veuillez indiquer la valeur des services achetés auprès de fournisseurs à l’étranger (dépenses) durant une période de 12 mois. Déclarez les dépenses payées ou à payer à des non-résidents, nettes de retenues fiscales, en milliers de dollars canadiens. Veuillez, au besoin, ajouter une feuille séparée si ces dépenses ont été engagées dans plus de quatre pays.
  • Code de pays : Veuillez vous référer à la liste de codes de pays ci-joint.
  • Les entités apparentées comprennent les sociétés-mères étrangères, les investisseurs directs étrangers et les filiales, succursales et autres affiliées, y compris les sociétés étrangères, qui sont contrôlées en grande partie par les mêmes actionnaires ou le même groupe d’actionnaires.

BP-21SQF : Opérations internationales de services commerciaux (trimestriel)

Trimestre civil se terminant le
La déclaration porte sur le trimestre se terminant le mois indiqué.

Champ
Déclarez toutes les opérations de services, y compris celles financées par le gouvernement (notamment par l’Agence canadienne de développement international) ou par d’autres sources au Canada. Voir le guide traitant de ce questionnaire pour une description détaillée des types de services visés. Veuillez utiliser la liste des codes géographiques pour identifier le pays.

Revenus totaux
Veuillez indiquer la valeur des services vendus à des clients à l’étranger (revenus) au cours du trimestre. Le montant indiqué ne doit pas inclure les retenues fiscales et doit être exprimé en milliers de dollars canadiens. Veuillez, au besoin, ajouter une feuille séparée si les revenus proviennent de nombreux pays.

Dépenses totales
Veuillez déclarer la valeur des services achetés auprès de fournisseurs à l’étranger (dépenses) au cours du trimestre. Le montant indiqué ne doit pas inclure les retenues fiscales et doit être exprimé en milliers de dollars canadiens. Veuillez, au besoin, ajouter une page séparée si les dépenses ont été engagées dans de nombreux pays.

Définitions de catégories de services

Redevances : figurent ici les charges se rattachant à l'utilisation exclusive de ressources, aux droits de production et de vente de marchandises ayant une ou plusieurs caractéristiques uniques, de même qu'à l'utilisation d'une œuvre littéraire, artistique, dramatique ou musicale originale ou de toute marque commerciale distincte obtenue par enregistrement légal.

Concessions et droits semblables : figurent ici les privilèges contractuels accordés par une personne ou une société à une autre autorisant la vente d'un produit, l'utilisation d'une marque commerciale ou la prestation d'un service à l'intérieur d'un territoire et/ou d'une manière déterminés.

Services informatiques : figurent ici les services consultatifs, l'utilisation des installations informatiques, l'achat et la mise au point de logiciels, l'analyse organique, l'installation, la mise au point et l'entretien courant, la documentation et la formation.

Services d'administration et de gestion : figurent ici les charges pour les services d'administration et de gestion fournis par un particulier ou une entreprise.  

Recherche scientifique et développement : figurent ici les charges se rattachant à des études systématiques faites au moyen d'expériences ou d'analyses pour la réalisation d'une innovation scientifique ou commerciale pour ou par la création de produits ou de procédés nouveaux ou sensiblement améliorés.

Services de consultation et autres services spécialisés figurent ici les services de consultation et autres services professionnels dans des domaines tels que le génie, l'architecture, le droit, la comptabilité, la commercialisation, la planification, la fiscalité, les finances, le forage et la mise en valeur des ressources naturelles et humaines.

Primes d'assurance et sinistres (réglés) : figurent ici: a) les primes d'assurance et/ou de réassurance versées directement au répondant par des personnes et/ou des sociétés non résidentes et les primes payées directement aux assureurs non résidents pour tous les types de risques; b) les sinistres réglés au répondant par les assureurs non résidents et les sinistres réglés par le répondant aux personnes et/ou aux sociétés non résidentes aux termes de tout contrat d'assurance conclu directement entre les deux parties concernées.

Commissions : figurent ici les commissions de financement, les commissions allant aux grossistes, aux agents, aux courtiers et aux succursales de vente des fabricants et tous les autres types de commission commerciale. Les honoraires et les commissions pour les émissions d'actions, nouvelles ou en cours, ne doivent pas figurer dans cette catégorie.

Publicité et promotion des ventes : figurent ici la publicité dans les journaux et les revues, à la radio, télévision et autres médias, la participation à des foires commerciales et le coté de compagnes de promotion des ventes.

Location de matériel : figurent ici les locations de machines, de plate-formes de forage et de navires de ravitaillement, d'instruments, de véhicules, d'aéronefs, d'ordinateurs et d'autre matériel semblable. Exclure tout contrat de crédit-bail financier.

BP-22F : Investissements effectués au Canada par des sociétés étrangères (annuel)

BP-22AF : Investissements effectués au Canada par des sociétés étrangères (trimestriel)

Page couverture

Veuillez indiquer dans la case prévue le numéro correspondant à la principale activité de la société.  Inscrivez également la date où prend fin la période sur laquelle portent les renseignements fournis.  Enfin, indiquez la date à laquelle la société a été constituée.

Opérations avec des non-résidents touchant les investissements au Canada par des sociétés étrangères

Section 1

Accroissement des investissements

  1. Investissements en espèces, en marchandises ou en services faits par le siège social
    Il s'agit de déclarer uniquement les augmentations des placements faits par le siège social à l’étranger. Pour ce qui est des diminutions, il faut les inscrire au poste 5 et non entre parenthèses. N'oubliez pas d'indiquer le code de pays.
  2. Bénéfices non-répartis au compte de contrôle du siège social
    Il s'agit d'indiquer uniquement la part du bénéfice de la période qui n'a pas été versée au siège social à l’étranger.  La part du bénéfice versée à ce dernier doit figurer au poste 27.  Veuillez prendre soin, dans l'un et l'autre cas, d’indiquer le bon code de pays. Les pertes inscrites au compte de contrôle du siège social doivent être inscrites au poste 6 et non entre parenthèses à ce poste.
  3. Emprunts contractés auprès d'autres non-résidents
    Ce poste sert à l'inscription des emprunts contractés auprès de banques et d'autres établissements étrangers.  Il ne s'agit pas d'indiquer l'encours des emprunts, mais bien l'accroissement total des emprunts durant l'année.  Pour ce qui est de la diminution totale des emprunts, il faut en inscrire le montant au poste 7 et non pas la soustraire de l'accroissement total.
  4. Autres accroissements des investissements
    Veuillez donner toutes les précisions utiles de manière à ce qu'il ne soit pas nécessaire de communiquer à nouveau avec vous.

Section 2

Diminution des investissements

  1. Diminution des investissements faits par le siège social
    Il faut faire état uniquement de la diminution des investissements.  L'augmentation des investissements doit être déclarée au poste 1.  N’oubliez pas d’indiquer le code de pays.
  2. Pertes imputées au compte de contrôle du siège social
    Il faut faire état uniquement des pertes de l’exercice en cours. Les bénéfices portés au compte de contrôle du siège social doivent être déclarés au poste 2.
  3. Remboursements de dettes à d'autres non-résidents
    On doit distinguer les dettes contractées auprès de banques des autres dettes. Il ne s'agit pas d'indiquer l'encours des emprunts, mais bien le montant de la diminution totale des emprunts durant l'année. Pour ce qui est de l'accroissement total des emprunts, il faut en inscrire le montant au poste 3 et non le soustraire de la diminution totale.
  4. Autres diminutions des investissements
    Veuillez donner toutes les précisions utiles de manière à ce qu'il ne soit pas nécessaire de communiquer à nouveau avec vous.

Section 3

Bilan de la succursale ou de la division canadienne

  • 9. à 22.
    Inscrivez, en milliers de dollars canadiens, les chiffres figurant dans les états financiers de la succursale ou de la division canadienne pour la période en cours et la période précédente.  N'oubliez pas d'indiquer les codes de pays aux postes 10ii, 19, 20 et 21.

Section 4

Certaines opérations avec des non-résidents au titre de l’état des résultats

  • 23. à 27.
    Inscrivez le montant net et le montant des retenues fiscales.  N'oubliez pas d'inscrire les codes de pays appropriés.  Les bénéfices nets pour l’exercice courant (poste 27) ne doivent comprendre que les bénéfices versés au siège social.  Les bénéfices non répartis au compte de contrôle du siège social pour l’exercice courant doivent figurer à la ligne 2 de la section 1.

Section 5

Investissements dans les sociétés en commandite et dans les entreprises en participation au Canada

Questions destinées aux sociétés en activité dans les industries minière, du pétrole et du gaz naturel au Canada

  1. Inscrivez les montants investis par des commanditaires ne résidant pas au Canada dans une société en commandite dans laquelle l’unité déclarante est le commandité. Il s’agit de déclarer ici le capital investi au Canada par l’entremise de sociétés en commandite par des non-résidents (particuliers, entreprises en participation, sociétés, successions, fiducies, fonds de placement, des fonds de pension, etc.). Les sorties de capitaux, représentant un désinvestissement ou un retour de capital en faveur de non-résidents, doivent également être déclarées. Une sortie nette de capitaux du Canada doit être inscrite entre parenthèses
  2. Inscrivez les montants investis par des non-résidents dans les entreprises en participation (joint-ventures) dont l’unité déclarante est l’exploitant. Ces investissements dans des entreprises en participation dans les domaines des mines, du pétrole, etc. au Canada peuvent être faits par des entités non résidentes (particuliers, sociétés, successions, fiducies, fonds de placement, etc.). Les sorties de capitaux, représentant un désinvestissement ou un retour de capital en faveur de non-résidents, doivent également être déclarées. Une sortie nette de capitaux du Canada doit être inscrite entre parenthèses.
  3. Ce poste comprend les paiements au titre de la production et des recettes à des non-résidents qui ont trait à leurs investissements dans des sociétés en commandite ou dans des entreprises en participation où l’unité déclarante est, respectivement, le commandité et l’exploitant. Ces paiements représentent le rendement sur le capital investi dans les sociétés en commandite ou les entreprises en participation en question.

BP-FIC : Investissements étrangers au Canada

Page couverture

Période de déclaration
Les données fournies doivent porter sur l’année civile se terminant le 31 décembre. Lorsqu’il est impossible de remplir le questionnaire pour l’année civile, choisissez la clôture d’exercice qui est la plus proche du 31 décembre.

Attestation
Veuillez fournir des renseignements sur la personne chargée de compléter le questionnaire.

Page 2

Section A – Participation étrangère dans l’entreprise déclarante canadienne
Cette section porte sur la participation des investisseurs directs étrangers et autres investisseurs étrangers dans l’entreprise déclarante canadienne.
Les investisseurs directs sont définis comme étant des sociétés étrangères ou des particuliers qui détiennent au moins 10 % des actions avec droit de vote de l’entreprise déclarante canadienne et qui ont une influence notable sur les décisions touchant l’exploitation de l’entreprise. Les autres investisseurs sont souvent appelés investisseurs de portefeuille et sont considérés comme des investisseurs passifs et détiennent moins de 10% des actions avec droit de vote.

Énumérer chaque investisseur direct étranger, leur pays de résidence et le pourcentage d’actions ordinaires et privilégiées détenues. Pour les autres investisseurs, il faut fournir uniquement le pourcentage d’actions ordinaires et privilégiées détenues par pays. Veuillez noter qu’il se peut que vous ayez à vous enquérir auprès de votre agent de transfert des pays de résidence des autres investisseurs.

For foreign direct investors, list the name of each investor (e.g. parent company name), their country of residence and the percentage of common and preferred shares held. For other foreign investors, only the total percentage of shares held in each country is required. Note that it may necessary to obtain the country of ownership information for other foreign investors from your transfer agent.

  • Exemple
    La société mère de l'unité déclarante, qui est en Grande-Bretagne (GBR), détient 400 actions ordinaires.  Dans ce cas, il s'agirait d'inscrire au poste A1-A3, (Par des investisseurs directs), le nom de la société mère suivi du code de pays (GBR) et le pourcentage du nombre d'actions ordinaires détenues (100%).

Section B – Capitaux propres
Cette section porte sur la valeur totale de l’avoir des actionnaires de l’entreprise déclarante canadienne. Les données doivent être déclarées en fonction d’une consolidation canadienne, c’est à dire des données s’appliquant à l’entreprise déclarante canadienne et à toutes ses filiales et sociétés affiliées canadiennes.
L’avoir des actionnaires des filiales et sociétés affiliées étrangères doit être exclu.

B1 – Capital-actions
Indiquez la valeur du capital d’actions ordinaires et privilégiées.

B2 – Capital des détenteurs d’unités
Indiquez les investissements des propriétaires sous forme d’unités de fiducies ou de fonds, ou sous toutes autres formes.

B3 – Surplus d’apport
Il faut inclure la partie du capital d’apport représentée par :

  • La prime à l’émission d’actions avec valeur nominale
  • La partie du produit d’une émission d’actions sans valeur nominale que l’on ne porte pas au crédit du capital-actions
  • Le produit de la vente d’actions remises à la société à titre gratuit
  • Le gain sur des actions confisquées
  • L’excédent du prix de vente d’actions rachetées sur leur prix de rachat
  • Les dons de capital

B4 – Cumul des autres éléments du résultat étendu
Ce poste sert à déclarer les changements ayant influé sur le solde des actifs nets de l’entreprise déclarante canadienne qui proviennent des opérations, événements et circonstances non attribuables aux contributions des actionnaires de l’entreprise déclarante. Il s’agit d’éléments qui ne sont pas habituellement considérés dans le calcul du bénéfice net tels que :

  • Gains (pertes) non réalisés sur instruments dérivés
  • Gains ou pertes non réalisés sur conversion d’éléments monétaires en devises étrangères
  • Plus/moins value de réévaluation des actifs financiers à la valeur au marché

B5 – État des bénéfices non répartis
Veuillez fournir l’état des bénéfices non répartis de l’exercice sur une base consolidée mondialement.

Inscrivez les bénéfices (pertes) nets après impôts.

Indiquez le solde d’ouverture, les changements ayant influé sur le solde du compte durant la période de déclaration et le solde de fermeture.

Pages 3, 4 et 5

Section C – Passif envers les entités non résidentes

Cette section couvre les engagements à long terme de l’unité déclarante canadienne envers les non résidents. Elle en composée de trois parties : obligations (C1) ; emprunts bancaires (C2) et autres passifs à long terme (C3).
Les engagements à long terme inscrits à la section (C) doivent être fournis sur une base consolidée canadienne, c'est-à-dire en tenant compte des engagements à long terme de l’unité déclarante canadienne et de ses filiales canadiennes intégralement consolidées. Indiquez chaque type d’engagements sur une base individuelle. Pour chaque émission, indiquer le pays de détention et si l’émission est détenue par des investisseurs canadiens, des investisseurs directs étrangers ou d’autres investisseurs étrangers.

Les engagements des filiales et des sociétés affiliées étrangères doivent être exclus.

C1 – Obligations
Ce poste sert à déclarer les obligations, garanties ou non, dettes à long terme, effets à payer et autres dettes similaires émis par l’entreprise déclarante canadienne qui comportent une date d'émission, une date d'échéance et un taux d'intérêt fixe ou variable. Pour chaque émission, veuillez  indiquer le numéro de CUSIP/ISIN s’il est disponible.

C2 – Emprunts bancaires
En général, un prêt bancaire provient d’une banque unique dans un pays étranger. Dans ces cas, la distribution du prêt sera attribuée à 100 % à un seul pays étranger. Dans le cas de prêts consentis par des syndicats de banques, il faut inscrire tous les pays en cause et non pas seulement les pays des principales banques. Ces renseignements devraient se trouver dans les ententes de prêts.

C3 – Autres passifs à long terme
Ce poste inclut les comptes débiteurs inter-sociétés, les emprunts à long terme auprès de sociétés non apparentées, les emprunts hypothécaires et les contrats de location-acquisition (exclure les dépenses de location non-capitalisées et autres prêts en provenance des investisseurs étrangers)

Section C – Directives générales

Numéro de CUSIP/ISIN
CUSIP est l’acronyme anglais désignant le « Committee on Uniform Securities Identification Procedures » (comité d’immatriculation des valeurs mobilières). Le numéro CUSIP, qui comporte neuf caractères alphanumériques, désigne de façon unique la plupart des titres, notamment les actions de toutes les entreprises américaines et canadiennes enregistrées et les titres gouvernementaux américains et canadiens. Les numéros CUSIP sont attribués aux titres en vue de faciliter les procédures d’acquittement et de règlement.

Le numéro international d’identification des valeurs mobilières dont l’acronyme est ISIN est un code alphanumérique à douze chiffres utilisé à l’échelle mondiale pour identifier des valeurs mobilières spécifiques comme les obligations,  les actions (ordinaires et privilégiées), les opérations à terme, les garanties, les droits de souscription, les fiducies, les effets commerciaux et les options. Les numéros ISIN sont attribués aux titres afin de faciliter les procédures d’acquittement et de règlement. Au Canada et aux États-Unis, les numéros ISIN sont une version prolongée du numéro CUSIP (immatriculation des valeurs mobilières) à neuf caractères.

Date d'émission et d’échéance
Dans le cas des obligations pour lesquelles les données sont fournies, veuillez indiquer la date d’émission et d’échéance de la façon suivante : année, mois, jour.

Taux d'intérêt
Indiquez le taux d'intérêt de la façon suivante :
13 % devient 13,00
12 3/8 % devient 12,375
11 1/4 % devient 11,25

Si le taux d’intérêt est variable, veuillez l’indiquer de la façon suivante :
LIBOR + 1/2 % devient LIBOR + 0,5)
Taux de base + 1 1/4 % devient Taux de base + 1,25
Taux préférentiel + 3/8 % devient Taux préférentiel + 0,375

Devise de l’émission
Indiquez, à l’aide de la liste de codes de pays fournie, dans quelle devise le titre de créance a été émis. Même si la devise originale a fait l’objet d’un swap de devises, veuillez continuer d’indiquer les montants en fonction de la devise originale d’émission.

Solde des prêts
Indiquez les soldes des prêts en milliers de dollars canadiens à la fin de l'exercice. Les montants inscrits doivent être nets des remboursements en série ou des versements à un fonds d'amortissement.

Veuillez vous assurer que les chiffres inscrits dans les colonnes sont exacts, on se basera sur les différences dans les soldes des prêts entre deux périodes, en tenant compte des fluctuations du taux de change, pour vérifier et calculer la réduction ou le remboursement de la dette. Inclure les dettes venant à échéance dans les douze mois et qui ont pu être reclassifiées des comptes de long à court terme.

Répartition géographique des soldes de prêts
Indiquez les instruments d’emprunt (obligations, emprunts bancaires et autres passifs à long terme) détenues par des investisseurs au Canada ou à l'étranger.  Dans le cas des créances détenues par des investisseurs étrangers, veuillez préciser s’il s’agit de créances détenues par des investisseurs directs ou par d’autres investisseurs.

L'information sur la répartition géographique est cruciale aux fins de la balance des paiements.  Utilisez la liste des codes de pays pour identifier les pays où résident les investisseurs étrangers.  Il se peut que vous ayez à vous enquérir auprès de votre fiduciaire des pays de résidence de ces investisseurs.

BP-STRUC : Structure des sociétés canadiennes dans l'entreprise déclarante

Page couverture

Période de déclaration
Les données fournies doivent porter sur l’année civile se terminant le 31 décembre. Lorsqu’il est impossible de remplir le questionnaire pour l’année civile, choisissez la clôture d’exercice qui est la plus proche du 31 décembre.

Attestation
Veuillez fournir des renseignements sur la personne chargée de compléter le questionnaire.

Page 2

Partie 1.  Filiales canadiennes intégralement consolidées pour fins de déclaration sur les autres formules (BP) de la balance des paiements

Veuillez énumérer toutes les filiales comprises dans la consolidation à partir de laquelle a été rempli le formulaire d'enquête BP-FIC (Investissements étrangers au Canada). Indiquez le niveau de l'entreprise, le nom de la filiale et le pourcentage des actions privilégiées et des actions ordinaires détenues. 

Partie 2.  Filiales et sociétés affiliées canadiennes non intégralement consolidées pour fins de déclaration sur les autres formules (BP) de la balance des paiements

Veuillez indiquer le niveau de l'entreprise, le nom de la filiale ou de la société affiliée, le pourcentage des actions privilégiées et des actions ordinaires détenues ainsi que la valeur totale de la participation de l’unité déclarante dans des sociétés canadiennes qui ne sont pas intégralement consolidées pour fins de déclaration sur d’autres formulaires (BP) de la balance des paiements tel que BP-FIC (Investissements étrangers au Canada). La valeur de la participation doit être la valeur comptable inscrite dans les livres de l'unité déclarante.  Les autres valeurs mobilières et les avances doivent comprendre uniquement les investissements à long terme.

BP-CIA : Investissements canadiens à l’étranger

Page couverture

Période de déclaration
Les données fournies doivent porter sur l’année civile se terminant le 31 décembre. Lorsqu’il est impossible de remplir le questionnaire pour l’année civile, choisissez la clôture d’exercice qui est la plus proche du 31 décembre.

Attestation
Veuillez fournir des renseignements sur la personne chargée de compléter le questionnaire.

Page 2

Cette partie sert à identifier les filiales étrangères qui doivent être rapportées dans le questionnaire BP-CIA. Veuillez prendre note que ce questionnaire a été conçu pour pouvoir accommoder la majorité des répondants qui possèdent, dans la plupart des cas, cinq filiales étrangères ou moins. Si vous détenez plus de cinq filiales, veuillez photocopier les pages 11 et 12 de ce questionnaire pour chacune des filiales additionnelles qui doivent être déclarées.

Page 3

Section A – Identité de la société étrangère affiliée

Nom de la filiale étrangère
Veuillez indiquer le pays dans lequel se situe l’investissement de la filiale étrangère (voir le code de pays à la page 14 du questionnaire).

Pays de la filiale étrangère
Veuillez indiquer le pays dans lequel se situe l’investissement de la filiale étrangère (voir le code de pays à la page 14 du questionnaire)

Principale activité industrielle de la société étrangère affiliée
Veuillez indiquer l’activité industrielle principale de la filiale étrangère en consultant la liste de codes à la page 15 du questionnaire. Si le code industriel de l’activité de la filiale n’est pas sur la liste, veuillez utiliser le code le plus proche de son activité.

Section B– Participation dans cette société étrangère affiliée
Veuillez fournir sous ce poste, le pourcentage des actions ordinaires et privilégiées détenu par l’entreprise canadienne déclarante et ses sociétés affiliées canadiennes dans la société étrangère affiliée à la fin de la période de déclaration :

Section C– Éléments des capitaux propres et de l’état des résultats (À partir des états financiers de la société étrangère affiliée)

Veuillez vous assurer que les chiffres inscrits dans cette section sont tirés des livres de la société affiliée étrangère. Veuillez indiquer la valeur totale de chacun des éléments tels qu’ils apparaissent dans les états financiers de la société affiliée à l’étranger.

Si les valeurs de la société affiliée à l’étranger sont libellées en devises étrangères, elles doivent être converties en dollars canadiens. Si les valeurs de la société affiliée à l’étranger ont été converties à partir d’une devise étrangère, veuillez indiquer à la question C1, la devise utilisée à partir de laquelle la conversion a été effectuée. Référez-vous à la page 14 du questionnaire pour les codes de pays.

Si vous avez à convertir les éléments de l’avoir et de l’état des bénéfices non répartis, veuillez utiliser le taux de clôture de la période de déclaration. Par contre, pour les éléments de l’état des résultats tels le revenu (perte) ainsi que les dividendes, utilisez les taux appropriés (i.e. taux moyen à midi ou taux de transaction quotidien).

Total du capital-actions (actions ordinaires et privilégiées)
Pour chacun des éléments, veuillez indiquer la valeur totale et non pas uniquement la part détenue par l’unité déclarante canadienne et de ses filiales canadiennes..

Surplus d’apport
Il faut inclure la partie du capital d’apport représentée par :

  • La prime à l’émission d’actions avec valeur nominale
  • La partie du produit d’une émission d’actions sans valeur nominale que l’on ne porte pas au crédit du capital-actions
  • Le produit de la vente d’actions remises à la société à titre gratuit
  • Le gain sur des actions confisquées
  • L’excédent du prix de vente d’actions rachetées sur leur prix de rachat
  • Les dons de capital

Cumul des autres éléments du résultat étendu
Ce poste sert à déclarer les changements ayant influé sur le solde des actifs nets de la société affiliée étrangère qui proviennent des opérations, événements et circonstances non attribuables aux contributions des actionnaires. Il s’agit d’éléments qui ne sont pas habituellement considérés dans le calcul du bénéfice net tels que :

  • Gains (pertes) non réalisés sur instruments dérivés
  • Gains ou pertes non réalisés sur conversion d’éléments monétaires en devises étrangères
  • Plus/moins value de réévaluation des actifs financiers à la valeur du marché

État des bénéfices non répartis
Veuillez fournir l’état des bénéfices non répartis de l’exercice.

Le montant déclaré doit correspondre à celui qui apparaît dans le bilan de la société affiliée étrangère, converti en dollars canadiens au taux de clôture de la période de déclaration.

Revenu (perte) net(te)
Inscrivez le revenu (perte) nets après impôts. Les gains/pertes extraordinaires doivent être exclus. Inscrivez une perte nette (valeur négative) entre parenthèses. Le montant inscrit doit correspondre au montant au bénéfice (perte) net qui apparaît dans l’état des revenus et dépenses des sociétés affiliées étrangères, converti en dollars canadien au taux de change moyen de la période.

Dividendes déclarés
Ce poste sert à l’inscription de tous les dividendes déclarés par la société affiliée étrangère.

Section D– Solde des dettes

Dettes inter entreprises
Ce poste sert à l’inscription des dettes inter-compagnies entre l’entreprise déclarante canadienne et sa société affiliée étrangère, incluant les dettes commerciales et non commerciales telles que les prêts, avances, découverts, hypothèques, obligations et toutes autres dettes.

Intérêts courus
Veuillez inscrire les revenus et les dépenses d’intérêts sur les dettes commerciales et non commerciales, les prêts, avances, découverts, prêts hypothécaires, obligations et toutes autres dettes entre la société déclarante canadienne et sa société affiliée étrangère.

Section E– Valeur comptable de l’investissement à long terme

Ce poste sert à l'inscription de la valeur comptable de l'investissement à long terme dans la filiale étrangère telle qu’elle figure au bilan de l’entreprise déclarante canadienne à la fin de la période de déclaration.

Section F– Statistiques sur les sociétés affiliées à participation majoritaire (incluant les succursales à l’étranger)
Fournir des statistiques sur les sociétés affiliées à l’étranger qui sont contrôlées et détenues majoritairement à plus de 50% des actions avec droits de vote par l’unité déclarante canadienne.

Nombre total des employés
Indiquer le nombre total d’employés à temps plein au sein de la société affiliée étrangère à la fin de la période de déclaration. S’il vous est impossible de trouver le nombre exact, veuillez fournir votre meilleure estimation.

Ventes totales ou revenu d’exploitation brut
Déclarer les ventes de biens et de services (en excluant les rendus et rabais ainsi que la taxe de vente et la taxe d’accise) ou les revenus bruts d’exploitation tels qu’ils apparaissent dans l’état des résultats de la société affiliée étrangère.

Les revenus de placement et les gains ou pertes en capital réalisés ou non réalisés doivent être exclus.

Nota :

  • Banques
    Les revenus bruts d’exploitation comprennent le revenu brut d’intérêts ainsi que d’autres revenus d’exploitation, tels que les droits, commissions et autres éléments similaires, qui figurent dans les états des résultats des entités étrangères.
    Les revenus de placements et les gains ou pertes en capital non réalisés doivent être exclus.
  • Compagnies d’assurance
    Les ventes de services comprennent le revenu en primes, le capital constitutif de rente et les recettes relatives à d’autres éléments de nature similaire tels qu’ils figurent dans les états des résultats des entités étrangères.
    Les revenus de placement et les gains ou pertes en capital non réalisés doivent être exclus.
  • Sociétés de portefeuille
    Il s’agit d’inscrire ici le revenu total qui figure dans les états des résultats des entités étrangères. Une société de portefeuille est une entreprise dont le revenu total est attribuable en majeure partie à sa part du bénéfice net des sociétés affiliées; règle générale, une société de portefeuille a investi dans les sociétés qu’elle détient une partie appréciable (habituellement au moins 50 %) de son actif total.

Actif total
Veuillez déclarer l’actif total tel qu’inscrit dans les états financiers des sociétés étrangères. Ce montant devrait correspondre à l’actif total figurant au bilan de ces sociétés même si celles-ci ne sont pas nécessairement détenues en entier par l’entreprise déclarante.

Passif total (excluant l’avoir des actionnaires)
Veuillez déclarer le passif total tel qu’indiqué dans les états financiers des sociétés étrangères en excluant l’avoir propre de l’entreprise déclarante dans les sociétés étrangères. Ce montant devrait correspondre au passif total figurant dans le bilan de ces sociétés même si celles-ci ne sont pas nécessairement détenues en entier par l’unité déclarante.

Répartition des ventes
Les montants des ventes déclarés au poste F2 doivent être répartis selon le pourcentage des ventes sur le marché national, canadien et autre.

S’il n’existe pas de données précises relatives à la répartition en pourcentage des ventes, veuillez fournir la meilleure estimation possible.

  • Ventes– marché national
    Déclarer le total des ventes de la filiale étrangère à l’intérieur de son pays de résidence.
  • Exportations - marché canadien
    Déclarer le total des ventes à la société mère canadienne et à toutes les sociétés au Canada qui y sont apparentées ou non.
  • Exportations - marchés autre que canadien
    Déclarer le total des ventes à d’autres pays que le Canada ainsi que le pays de résidence de la filiale étrangère.

Section G– Valeur de l’actif et éléments de revenu de la succursale étrangère

Actif net ou valeur nette des investissements
Ce poste sert à l’inscription de la valeur de l’actif net des succursales étrangères. Le montant de l’actif net déclaré comprend l’actif total à l’extérieur du Canada moins le total des dettes envers des résidents des pays étrangers, autres que le Canada.

Revenu (perte) net(te) de la succursale étrangère
Inscrivez le revenu (perte) nets après impôts. Les gains/pertes extraordinaires doivent être exclus. Inscrivez une perte nette (valeur négative) entre parenthèses. Le montant inscrit doit correspondre au montant au bénéfice (perte) net qui apparaît dans l’état des revenus et dépenses de la société affiliée étrangère, converti en dollars canadien au taux de change moyen de la période.

Annexe A – Définitions

Unité déclarante
L’entreprise déclarante canadienne doit fournir une déclaration consolidée s'appliquant à elle-même et à toutes ses filiales canadiennes, le cas échéant. Si l’unité déclarante est priée de remplir le questionnaire BP-STRUC, elle doit y expliquer la méthode comptable utilisée pour déclarer ses placements dans les filiales et les sociétés affiliées.

Sociétés mères étrangères/ actionnaires détenant le contrôle
Il s’agit des actionnaires qui sont capables d'exercer le contrôle de la société déclarante grâce aux valeurs qu'ils possèdent ou grâce à d'autres moyens. Il faut inclure des sociétés associées étrangères qui sont contrôlées dans une large mesure par les mêmes actionnaires ou le même groupe d'actionnaires.

Sociétés apparentées (sœurs)
Une autre société apparentée est une société qui a la même société-mère que l'unité déclarante, mais dans laquelle l'unité déclarante ne détient pas d’intérêt direct (moins de 10% de l’avoir).  Une société mère peut avoir une ou plus sociétés affiliées et elles sont appelées des sociétés sœurs.

Sociétés affiliées étrangères (Filiales, sociétés affiliées étrangères et succursales)
Il s’agit des sociétés dans lesquelles l’entreprise déclarante canadienne détient (directement et/ou indirectement par l'intermédiaire de ses filiales) une participation d'au moins 10 % des actions avec droit de vote. Une filiale est une société dans laquelle la société déclarante détient la majorité des actions (plus de 50%) avec droit de vote. Une société affiliée est une société dans laquelle la société déclarante détient de 10 % à 50 % des droits de vote. Une succursale n’est pas une entité légale autonome mais est autorisée à faire des affaires dans un pays étranger et peut englober des opérations liées à une division, une mine ou un projet de construction.

Investisseurs directs
Les investisseurs directs sont des actionnaires qui peuvent être résidents du Canada et des non-résidents qui détiennent 10% ou plus du capital-actions de l’entreprise. Ces actionnaires peuvent être des individus ou des entreprises publiques ou privées dont l’ampleur des investissements dans la société leur permet d’exercer une influence sur la gestion de celle-ci. En général, les investisseurs directs sont les sociétés-mères ou encore les actionnaires qui détiennent le contrôle de la société.  

Investissements directs étrangers
Il s’agit des investissements effectués par des étrangers qui détiennent 10% ou plus de l’avoir des actionnaires de l’entreprise ou dont l’intérêt dans l’entreprise est suffisant pour leur permettre d’influer sur la gestion de celle-ci. Ces investisseurs, appelés investisseurs directs étrangers, sont des investisseurs d’autres pays tels que des entreprises, des entités sans personnalité morale ou des particuliers ; on les associe aux sociétés mères ou aux actionnaires qui détiennent le contrôle de la société.

Investisseurs de portefeuille et sociétés non apparentées
Il s’agit des investisseurs ou détenteurs de titres de créance de la société dont l’intérêt dans l’entreprise n’est pas suffisant pour une participation active à la gestion de la société. Les investisseurs de portefeuille et l’entreprise ne sont pas affiliés ni contrôlés dans une large mesure par les mêmes actionnaires ou par le même groupe d’actionnaires. Les investissements faits par ce type d’investisseurs se retrouveront sous la rubrique ‘Autres investisseurs non résidents’ dans le questionnaire BP-FIC alors qu’ils seront sous la rubrique ‘Sociétés étrangères non affiliées’ dans le cas du questionnaire BP-QT.

Investissements de portefeuilles étrangers
Ce type d’investissement est fait par des investisseurs étrangers (des particuliers ou sociétés) qui sont des investisseurs passifs dans l’entreprise (détiennent moins de 10% de l’avoir). Leur participation au capital-actions ou les titres de créances qu’ils détiennent ne leur permettent pas d’influer sur la gestion de l’entreprise. Ces investisseurs sont généralement investisseurs de portefeuilles étrangers. Ils peuvent détenir des actions ordinaires ou privilégiés de l’entreprise ou encore fournir du capital sous forme de prêts ou par l’achat de titres de créance. Il peut s’agir de banques étrangères, de fonds de pension, de fonds de placement, d’institutions financières.

Placements à long terme
Doivent être considérés comme à long terme tous les placements destinés à demeurer en cours durant plus d'un an après la date de placement, ou qui le demeureront probablement. Si des opérations qui se sont traduites par une augmentation et une diminution des créances avec un pays particulier ont été effectuées pendant l'année, il faut indiquer chacune d’elles et non un montant net.

Annexe B - Liste des codes de pays

Veuillez utiliser les codes suivants pour identifier le pays dans lequel les actions ou les passifs sont détenus, ainsi que la devise d’émission pour les passifs :

Nota : Pour la devise euro veuillez coder “EUR”.

Annexe B – Liste des codes de pays
Sommaire du tableau
Le tableau montre les résultats de table1. Les données sont présentées selon code (titres de rangée) et pays(figurant comme en-tête de colonne).
CODE PAYS
AFG Afghanistan
ZAF Afrique du Sud, République d’
ALB Albanie
DZA Algérie
DEU Allemagne
AND Andorre
AGO Angola
AIA Anguilla
ATG Antigua et Barbuda
SAU Arabie Saoudite
ARG Argentine
ARM Arménie
ABW Aruba
AUS Australie
AUT Autriche
AZE Azerbaïdjan
BHS Bahamas
BHR Bahrein
BGD Bangladesh
BRB Barbade
BLR Bélarus
BEL Belgique
BLZ Belize
BEN Bénin
BMU Bermudes
BTN Bhoutan
MMR Birmanie (Myanmar)
BOL Bolivie
BIH Bosnie et Herzégovine
BWA Botswana
BRA Brésil
BRN Brunéi Darussalam
BGR Bulgarie
BFA Burkina Faso
BDI Burundi
CYM Caïmanes. Îles
KHM Cambodge
CMR Cameroun
CAN Canada
CPV Cap-Vert
CAF Centrafricaine, République
CHL Chili
CHN Chine
CYP Chypre
COM Comores
COD Congo, République démocratique du
COG Congo, République du
COK Cook, Îles
PRK Corée du Nord
KOR Corée du Sud
CRI Costa Rica
CIV Côte D’Ivoire
HRV Croatie
CUB Cuba
DNK Danemark
DJI Djibouti
DOM Dominicaine (République)
DMA Dominique
EGY Egypte
SLV El Salvador
ARE Émirats Arabes Unis
ECU Equateur
ERI Érythrée
ESP Espagne
EST Estonie
USA États-Unis
ETH Ethiopie
FLK Falkland, Îles (Malvinas)
FRO Féroé, Îles
FJI Fodji
FIN Finlande
FRA France
GAB Gabon
GMB Gambie
GEO Géorgie
GHA Ghana
GIB Gibraltar
GRC Grèce
GRD Grenade
GRL Groenland
GLP Guadeloupe
GTM Guatémala
GGY Guernesey
GIN Guinée
GNQ Guinée Equatoriale
GNB Guinée-Bissau
GUY Guyana
GUF Guyane Française
HTI Haiti
HND Honduras
HKG Hong Kong, region administrative spéciale
HUN Hongrie
IMN Îles de man
IND Inde
IDN Indonésie
IRN Iran
IRQ Iraq
IRL Irlande, République d’
ISL Islande
ISR Israël
ITA Italie
JAM Jamaïque
JPN Japon
JEY Jersey
JOR Jordanie
KAZ Kazakhstan
KEN Kenya
KGZ Kirghizistan
KIR Kiribati
XKO Kosovo
KWT Koweit
LAO Laos
LSO Lesotho
LVA Lettonie
LBN Liban
LBR Libéria
LBY Libye
LIE Liechtenstein
LTU Lithuanie
LUX Luxembourg
MAC Macao region administrative spéciale
MKD Macédoine, République de
MDG Madagascar
MYS Malaisie
MWI Malawi
MDV Maldives
MLI Mali
MLT Malte
MAR Maroc
MHL Marshall, ïles
MUS Maurice
MYT Mayotte
MEX Mexique
MDA Moldova
MCO Monaco
MNG Mongolie
MNE Monténégro
MAM Namibie
TZA Tanzanie
TCD Tchad
CZE Tchèque, République
THA Thaïlande
TLS Timor-Leste
TGO Togo
NPL Népal
NIC Nicaragua
NER Niger
NGA Nigéria
NOR Norvège
NCL Nouvelle-Calédonie
NZL Nouvelle Zélande
IOT Océan Indien, Territoire britannique de
OMN Oman
UGA Ouganda
UZB Ouzbékistan
PAK Pakistan
PAN Panama
PNG Papouasie-Nouvelle-Guinée
PRY Paraguay
NLD Pays-Bas
PER Pérou
PHL Philippines
POL Pologne
PYF Polynésie française
PRI Porto Rico
PRT Portugal
QAT Qatar
ROU Roumanie
GBR Royaume-Uni
RUS Russie, Fédération de
RWA Rwanda
LCA Sainte Lucie
SPM Saint-Pierre-et-Miquelon
WSM Samoa
SEN Sénégal
SRB Serbie
SYC Seychelles
SLE Sierra Leone
SGP Singapour
SVK Slovaquie
SVN Slovénie
SOM Somalie
SDN Soudan
LKA Sri Lanka
SWE Suède
CHE Suisse
SUR Surinam
SWZ Swaziland
SYR Syrie
TJK Tadjikistan
TWN Taiwan
TUR Turquie
UKR Ukraine
URY Uruguay
VEN Vénézuela
VNM Viet Nam
YUG Yougoslavie
TTO Trinité-et-Tobago
TUN Tunisie
TKM Turkménistan
ZMB Zambie
ZWE Zimbabwe
Source :

Enquête Mensuelle sur le Commerce de Gros (EMCG) Énoncé de la qualité des données

1. Objectifs, utilisations et utilisateurs

1.1. Objectifs

L'Enquête mensuelle sur le commerce de gros (EMCG) fournit des renseignements sur la performance du secteur du commerce de gros et constitue un important indicateur de la santé de l'économie canadienne. Le milieu des affaires utilise aussi les données pour analyser le comportement du marché.

1.2 Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de gros. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes et des stocks des marchands en gros. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes de gros et de la performance du secteur.

1.3 Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information.
Les grossistes utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de grossistes peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de gros. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux grossistes un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des grossistes dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de gros étant une industrie importante dans l'économie canadienne (de 5 % à 6 % du produit intérieur brut, selon l'année), les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le commerce de gros est généralement l'étape intermédiaire dans la distribution des marchandises. Le secteur comprend les établissements dont l'activité principale consiste à acheter et à vendre des marchandises et à fournir des services connexes de logistique, de marketing et de soutien.

Les grossistes sont organisés pour vendre des marchandises en grande quantité à des détaillants, à des entreprises et à une clientèle institutionnelle. Cependant, certains grossistes, notamment ceux qui fournissent des biens d'équipement qui ne sont pas de grande consommation, vendent des marchandises à la pièce aux utilisateurs finals. Le secteur comprend deux grands types de grossistes, soient, d'une part, les marchands en gros et, d'autre part, les agents et les courtiers en gros.

Les marchands en gros achètent et vendent des marchandises pour leur propre compte; autrement dit, ils s'approprient les marchandises qu'ils vendent. Ils travaillent habituellement à partir d'entrepôts ou de bureaux et ils peuvent expédier les  marchandises qu'ils ont en stock, ou les faire expédier directement du fournisseur au client.  En plus de vendre des marchandises, ils peuvent assurer ou faire le nécessaire pour que soient assurés des services de logistiques, de marketing et de soutien, tels que l'emballage et l'étiquetage, la gestion des stocks, l'expédition, le traitement des réclamations au titre de la garantie, la promotion interne ou la promotion coop et la formation requise par le produit.  Entrent aussi dans cette catégorie les négociants en machines et en matériel, comme les négociants en machines agricoles et en poids lourds. Les établissements de ce secteur sont connus sous diverses appellations selon les liens  qu'ils entretiennent avec les fournisseurs ou les clients, ou selon la méthode de distribution qu'ils emploient.

Ils peuvent se faire appeler, par exemple, grossistes, distributeurs en gros, intermédiaires en gros, concessionnaires de rayon, marchands d'import-export, groupes d'acheteurs, coopératives de marchands et grossistes d'une bannière particulière. Aux fins de la classification des branches d’activité, les marchands en gros sont classés d'après les principales gammes de marchandises vendues. La description de chaque groupe de commerce inclus dans les données statistiques d'accompagnement figure à l'annexe IV. Comme la plupart des entreprises vendent plusieurs types de marchandises, la classification attribuée reflète généralement la marchandise unique ou le groupe de marchandises qui est la source principale des recettes de l'établissement, ou un ensemble de marchandises qui caractérise l'activité de l'établissement.

Les agents et courtiers en gros achètent et vendent des marchandises pour le compte de tiers moyennant le versement d'honoraire ou d'une commission. Ils ne deviennent pas propriétaires de ces marchandises, et ils travaillent habituellement à partir d'un bureau. Les agents et les courtiers en gros sont connus sous diverses appellations, dont agents d'import-export, agents en gros à la commission, courtiers en gros et agents commerciaux.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont incluses les pièces qui sont à l'origine des revenus d'entretien et de réparation, les revenus de main-d'oeuvre pour l'entretien et la réparation, les ventes de biens fabriqués par le grossiste à titre d'activité secondaire, et les recettes provenant de la location ou de la location à bail de locaux à bureaux, d'autres biens immobiliers, et de biens et d'équipement. Sont également incluses les recettes sous forme de commissions et d'honoraires résultant de l'achat et de la vente de marchandises par des marchands en gros pour le compte de tiers.

Sont exclues les autres recettes d'exploitation, comme les subventions d'exploitation, ainsi que les recettes provenant de l'expédition, de la manutention et du stockage de biens pour des tiers.

Les stocks sont définis comme étant la valeur comptable, c'est-à-dire la valeur inscrite dans les livres comptables, de tous les stocks possédés par un établissement à la fin du mois et destinés à la revente. Sont inclus les stocks détenus dans les points de vente, les entrepôts, en transit ou en consignation par des tiers. Sont également inclus les stocks possédés au Canada et à l'étranger.

Sont exclus les stocks détenus en consignation pour des tiers (non possédés), ainsi que les fournitures de magasin et de bureau et tout autre type de fournitures non destinées à la vente. L'emplacement d'affaires comprend le ou les emplacements physiques où a lieu l'activité commerciale dans chaque province et territoire, et dont les ventes sont créditées ou reconnues dans les états financiers de la compagnie. Pour les grossistes, il s'agit habituellement d'un centre de distribution.

Ventes en volume : La valeur du commerce de gros est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes de gros en dollars courants et la seconde, la valeur des ventes de gros en volume. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente de gros. Pour calculer l’estimation en volume, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant des indices de prix, puis additionner les valeurs résultantes.

2.3. Classifications

L'Enquête mensuelle sur le commerce de gros est fondée sur la définition du commerce de gros adoptée dans le SCIAN (Système de classification des industries de l'Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L'accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l'offre, en ce sens que les établissements sont regroupés par industrie d'après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 24 groupes fondés sur le Système de classification des industries de l'Amérique du Nord (SCIAN) de 2007. Les 24 groupes sont en outre agrégés en sept sous-secteurs qui correspondent exactement aux codes à trois chiffres du SCIAN pour les classes du secteur du commerce de gros, à l'exception des agents et courtiers en gros, et des grossistes-distributeurs de pétrole, et de graines oléagineuses et de céréales.

Du point de vue géographique, les estimations des ventes sont produites pour le Canada et pour chaque province et territoire. Les estimations des stocks sont produites uniquement pour le Canada dans son ensemble.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de gros (EMCG) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statist ique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCG comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de gros d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 90 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de gros varie de 410000 à 419999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 41112 (graines oléagineuses et céréales)
  • 412 (produits pétroliers)
  • 419 (agents et courtiers du commerce de gros)

4. Échantillonnage

L'échantillon de l'EMCG est formé de 7 500 groupes d'établissements (grappes) classés dans le secteur du commerce de gros et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCG est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCG est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCG, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de gros (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCG. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de grossistes des données sur les ventes en gros, sur le nombre d'emplacements d’affaires par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, à part l'inclusion du Nunavut, la plupart des questionnaires n'ont subit que des changements de présentation. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs des données pour s'assurer de leur pertinence.

6. Réponse et non réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCG, un certain degré de non-réponse a lieu.

Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de nonréponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCG, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux.

Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

- Taux de réponse des unités faisant partie de l'échantillon (estimation) = Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

- Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

- Taux de réponse total (estimation) = Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

- Taux de réponse des unités faisant partie de l'échantillon (collecte) = Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

- Taux de réponse des unités modélisées à partir de données administratives (extraction) = Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

- Taux de résultat de la collecte = Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

- Taux de résultat de l'extraction = Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCG a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Les stocks des entreprises dont les ventes sont tirées du fichier de la TPS sont imputés par le système d’imputation de l’EMCG. L’imputation se rapporte aux chiffres du mois précédent, aux variations de mois en mois et d’année en année, pour des entreprises enquêtées de même taille.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de gros : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête. Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des donnéees

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.
Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCG, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCG, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCG a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCG, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

Les méthodes d'imputation fondées sur des données administratives sont sélectionnées automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant. La source de données administratives (ventes annuelles assujetties à la TPS) est le fondement de ces méthodes. Les ventes annuelles assujetties à la TPS sont utilisées pour deux types de méthode. L'une est une tendance générale que l'on utilise pour les structures simples, comme les entreprises ne comptant qu'un seul établissement et l'autre, appelée méthode de la médiane-moyenne, est utilisée pour les unités dont la structure est plus complexe.

En dernier lieu, on doit noter que les stocks des entreprises dont les ventes sont tirées des fichiers administratifs, sont également imputés par le système d’imputation de l’EMCG. Les valeurs imputées sont calculées par le même système d’imputation qui existe pour remplacer les données manquantes dues à la non-réponse.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des marchands en gros, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, de groupe de commerce ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour les stocks des marchands en gros, on se sert de l'échantillon sélectionné pour estimer les ventes pour calculer l'estimation au moyen d'un estimateur d'Horvitz-Thompson pour la partie observée de la population. Puis, on utilise un ratio fondé sur l'échantillon pour produire l'estimation pour la partie non observée et on obtient l'estimation du total des stocks en additionnant les estimations obtenues pour les parties observée et non observée.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de gros : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCG pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Des révisions des données brutes doivent être effectuées pour corriger les erreurs non dues à l'échantillonnage qui sont décelées. Ceci comporte généralement le remplacement de données imputées par des données déclarées, la correction de données déclarées précédemment, et de procéder à des estimations pour les nouvelles entreprises créées dont on ne connaissait pas l'existence au moment des estimations originales.

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans.

Les séries temporelles ou chronologiques comportent les éléments essentiels à la description, l'explication et la prévision du comportement d'un phénomène économique. « Ce sont des dossiers statistiques de l'évolution des processus économiques dans le temps1 ». Les séries temporelles socio-économiques comme celles de l’Enquête mensuelle sur le commerce de gros peuvent habituellement être décomposées en cinq composantes principales : la tendance-cycle, la saisonnalité, l’effet des jours ouvrables, l’effet de la fête de Pâques et la composante irrégulière.

La tendance représente l’évolution à long terme de la série, tandis que le cycle représente un mouvement lisse, quasi périodique, autour de la tendance qui met en évidence une succession de phases de croissance et de décroissance (ex. le cycle des affaires). Les deux composantes tendance et cycle sont estimées ensemble et la tendance-cycle reflète l'évolution fondamentale de la série. Les autres composantes traduisent des mouvements passagers à court terme.

La composante saisonnière représente des fluctuations infra-annuelles, mensuelles ou trimestrielles, qui se répètent plus ou moins régulièrement d'une année à l'autre. Les variations saisonnières sont le produit des effets directs et indirects des saisons climatiques et d’éléments de type institutionnel (attribuable aux conventions sociales ou aux règles administratives, Noël par exemple).

L’effet des jours ouvrables provient du fait que l'importance relative des jours varie systématiquement à l'intérieur de la semaine et que le nombre de chacun des jours dans un mois donné varie d'une année à l'autre. Cet effet est présent lorsque l’activité change en fonction du jour de la semaine. Par exemple, dimanche connaît typiquement moins d'activité que les autres jours, et le nombre de dimanches, lundis, etc., dans un mois donné change d'année en année.

L’effet de la fête de Pâques est la variation due au déplacement d’une partie de l’activité d’avril vers mars quand Pâques tombe en mars plutôt qu’en avril.

Enfin, la composante irrégulière regroupe toutes les autres fluctuations plus ou moins erratiques non prises en compte dans les composantes précédentes. Elle représente un résidu qui incorpore, entre autres, les erreurs de mesure sur la variable elle-même ainsi que des événements inhabituels (ex. grèves, sécheresse, inondations, panne d’électricité majeure ou d'autres variations inattendues dans les activités des répondants).

Ainsi, les composantes saisonnière et irrégulière, l’effet des jours ouvrables et l’effet de la fête de Pâques masquent la composante fondamentale de la série, qui est la tendance-cycle. La désaisonnalisation (correction des variations saisonnières) consiste à retirer de la série la composante saisonnière, l’effet des jours ouvrables et l’effet de la fête de Pâques. Elle contribue donc à révéler la tendance-cycle. Bien que la désaisonnalisation permette de mieux comprendre la tendance-cycle fondamentale d'une série, la série désaisonnalisée n'en contient pas moins une composante irrégulière. De légères variations d'un mois à l'autre dans la série désaisonnalisée peuvent n'être que de simples mouvements irréguliers. Pour avoir une meilleure idée de la tendance fondamentale, les utilisateurs doivent donc examiner les séries désaisonnalisées sur un certain nombre de mois.

Depuis avril 2008, l’Enquête mensuelle sur le commerce de gros utilise le logiciel X-12-ARIMA2 pour la désaisonnalisation. La technique utilisée consiste essentiellement, dans un premier temps, à corriger la série initiale de toute sorte d’effets indésirables, tels l’effet des jours ouvrables et l’effet de Pâques, par un module appelé regARIMA. L’estimation de ces effets se fait grâce à l’utilisation de modèles de régression à erreurs ARIMA (modèles autorégressifs à moyennes mobiles intégrées). On peut également extrapoler la série d'au moins une année à l'aide du modèle. Dans un deuxième temps, la série brute, pré-ajustée et extrapolée s’il y a lieu, est désaisonnalisée par la méthode X-11.

La méthode X-11, qui permet d’analyser des séries mensuelles et trimestrielles, repose sur un principe itératif d’estimation des différentes composantes, cette estimation étant faite à chaque étape grâce à des moyennes mobiles adéquates3. Les moyennes mobiles utilisées pour estimer les principales composantes, la tendance et la saisonnalité, sont avant tout des outils de lissage conçus pour éliminer une composante indésirable de la série. Puisque les moyennes mobiles réagissent mal à la présence de valeurs atypiques, la méthode X-11 incorpore un outil de détection et de correction des points atypiques utilisé pour nettoyer la série au cours de la désaisonnalisation. Les valeurs atypiques peuvent également être détectées et corrigées d’avance, à l’aide du module regARIMA.

Finalement, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes. Malheureusement, la désaisonnalisation supprime l’additivité infra-annuelle d’un système de séries; de légères différences peuvent alors être observées entre la somme de séries désaisonnalisées et la désaisonnalisation directe de leur total. Afin d’assurer ou de rétablir l’additivité d’un système de séries, un processus de réconciliation est appliqué ou une désaisonnalisation indirecte est employée, c.-à-d. la désaisonnalisation d’un total est obtenu en faisant la somme des séries désaisonnalisées individuellement.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes.

L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV(X) = (S(X) / X) x 100%

où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Notes :

  1. La désaisonnalisation des séries temporelles économiques : quelques remarques; tiré de la Revue statistique du Canada , août 1974.

  2. Pour plus de renseignements, voir X-12-ARIMA Référence Manuel Version 0.3 (2007), U.S. Census Bureau.

  3. Ladiray, D. and Quenneville, B. (2001). Seasonal Adjustment with the X-11 Method. New York: Springer-Verlag, Lecture Notes in Statistics no158.

Guide de déclaration pour le Rapport sur les prix des Services professionnels en informatique

Statistique Canada – Division des prix à la production – 2009-2010

Le présent guide a pour but de vous aider à remplir le Rapport sur les prix des Services professionnels en informatique de 2009-2010. Si vous désirez de plus amples information, s'il vous plaît communiquer avec la ligne d'information de Statistique Canada au numéro que vous trouverez à la dernière page du guide.

Les renseignements recueillis nous aideront à produire un indice des prix pour les Services professionnels en informatique.

Un indice des prix est une mesure statistique qui résume en un chiffre la variation de prix d'un ensemble de biens ou de Services pour une période de base.

Utilisations des indices de prix :

  1. Évaluer le rendement des entreprises : comparer son entreprise avec les autres de l'industrie.
  2. Indexation des contrats : apparier la valeur du contrat à l'indice pour se protéger contre la hausse des coûts.
  3. Mesurer le rendement économique : mesurer le PIB.

Section B : Activité commerciale

Les industries des Services professionnels en informatique incluses dans la présente enquête sont définies au moyen du Système de classification des industries de l'Amérique du Nord (SCIAN). Le SCIAN fait partie d'un cadre international pour permettre la comparaison du rendement industriel de différents pays.

Les quatre industries incluses dans le rapport sur les prix sont les suivantes :

  • Éditeurs de logiciels
  • Traitement de données, hébergement de données et Services connexes
  • Édition et radiodiffusion par Internet et sites portails de recherche
  • Conception de systèmes informatiques et Services connexes

Pour vous aider à choisir la catégorie qui décrit le mieux l'activité de votre entreprise, nous avons ajouté une définition officielle des inclusions et des exclusions de chaque catégorie ci-dessous. Si vous avez besoin d'aide supplémentaire sur cette question, ou si vous croyez faire partie d'une autre industrie du SCIAN, veuillez communiquer avec notre ligne d'assistance téléphonique.

Éditeurs de logiciels

Cette classe canadienne comprend les établissements dont l'activité principale est l'édition de logiciels, habituellement pour de nombreux clients et habituellement désignés par l'expression logiciels de série. Les établissements de cette classe exécutent les opérations nécessaires à la production et à la distribution de logiciels telles que la conception, la fourniture de la documentation, l'assistance en matière d'installation et la prestation de Services de soutien aux acheteurs de logiciels. Ces établissements peuvent se livrer à la conception et à l'édition, ou se consacrer uniquement à l'édition.

Inclure :

  • L'édition de progiciels (y compris la conception et le développement);
  • Les progiciels, tous formats, les éditeurs;
  • Les jeux et progiciels, les éditeurs;
  • Les éditeurs et progiciels, tous formats.

Exclure :

  • Reproduction en série de logiciels;
  • Revente de logiciels de série;
  • Édition de logiciels exclusivement sur Internet;
  • Accès à des logiciels pour les clients à partir d'un site hôte central;
  • Conception sur demande de logiciels adaptés aux besoins d'utilisateurs particuliers;

Traitement de données, hébergement de données et Services connexes

Cette classe canadienne comprend les établissements dont l'activité principale consiste à offrir des Services d'hébergement ou de traitement des données. Les établissements d'hébergement peuvent offrir des activités d'hébergement spécialisées, comme des Services d'hébergement de sites Web, des Services de diffusion audio et vidéo en continue, des Services d'hébergement d'applications et des Services d'application, ou encore offrir à leurs clients des Services informatiques généraux à temps partagé sur gros ordinateurs. Les établissements de traitement des données peuvent offrir des Services complets de traitement et de préparation de rapports à partir des données fournies par le client, et des Services spécialisés, comme la saisie automatisée des données, ou offrir à leurs clients des ressources de traitement des données sur une base horaire ou en temps partagé.

Inclure :

  • Conversion de disques magnétiques et disques souples, service
  • Hébergement d'applications
  • Hébergement de sites Web
  • Imagerie et d'enregistrement de microfilms, service d'
  • Informatique à façon, centre de traitement
  • Lecture en transit de fichiers sonores et visuels, Services
  • Lecture optique de données, Services
  • Location de temps d'ordinateur
  • Location de temps machine
  • Ordinateur, Services préparatifs d'entrées pour l'
  • Préparation d'entrée de données d'ordinateurs, service de
  • Saisie de données, Services
  • Services de temps partagé, d'ordinateur
  • Temps d'ordinateur, location
  • Traitement de données, Services
  • Traitement de données, Services d'ordinateur
  • Traitement par ordinateur
  • Traitement par ordinateur, Services de
  • Traitements automatiques de données, Services d'ordinateur

Exclure :

  • Traitement de transactions financières;
  • Gestion des installations informatiques;
  • Services de saisie de données au clavier, de traitement de texte ou d'éditique;
  • Accès à des micro-ordinateurs et à de l'équipement de bureau, à partir d'un commerce de détail;

Édition et radiodiffusion par Internet et sites portails de recherche

Cette classe canadienne comprend les établissements dont la seule activité consiste en l'édition et/ou la radiodiffusion de contenu par Internet ou l'exploitation de sites Web, appelés sites portails de recherche, qui font appel à un moteur de recherche pour générer et entretenir d'importantes bases de données d'adresses et de contenu Internet dans une forme qui se prête aisément à des recherches. Les établissements d'édition et de radiodiffusion par Internet offrent un contenu sous forme de textes ou de signaux audio et/ou vidéo d'intérêt général ou particulier. Les établissements n'offrent pas de version classique (hors Internet) du contenu qu'ils éditent ou radiodiffusent. Des établissements appelés « sites portails de recherche » offrent souvent des Services Internet supplémentaires, par exemple le courriel, des connexions à d'autres sites Web, des ventes aux enchères, de l'information et d'autre contenu limité, et ils servent fréquemment de port d'attache aux utilisateurs d'Internet.

Inclure :

  • Édition de journaux par Internet
  • Édition de livres par Internet
  • Édition de livres techniques, (exclusivement sur Internet)
  • Édition de logiciels par Internet
  • Édition de périodiques par Internet
  • Édition de répertoires par Internet
  • Édition, cartes, plans de villes et atlas (exclusivement sur Internet)
  • Journaux, édition (exclusivement sur Internet)
  • Radiodiffusion par Internet
  • Sites de divertissement sur Internet
  • Sites de jeux sur Internet
  • Sites portails de recherche

Conception de systèmes informatiques et Services connexes

Cette classe canadienne comprend les établissements dont l'activité principale consiste à fournir une expertise dans le domaine des technologies de l'information. Ces établissements peuvent notamment : concevoir, modifier, tester et prendre en charge des logiciels pour répondre aux besoins d'un client, y compris créer des pages d'accueil Internet; planifier et concevoir des systèmes informatiques intégrant la technologie du matériel, celle des logiciels et celle des communications; gérer et exploiter sur place les installations d'informatique et de traitement des données de clients; donner des conseils dans le domaine des technologies de l'information; fournir d'autres Services professionnels et techniques de nature informatique.

Inclure :

  • Analyse des exigences, matériel d'ordinateur
  • Analyse et concepts de système, logiciels d'ordinateur
  • Analyse et concepts de système, Services informatiques
  • Analyse et concepts de systèmes de logiciel, sur demande
  • Analyse et concepts de systèmes de logiciels, fabriqué sur demande
  • Analyse et concepts de systèmes, Services informatiques (logiciel)
  • Bureautique, intégration du système d'ordinateur
  • Conception de page Internet, service de, faite sur demande conception des systèmes (intégration des systèmes)
  • Concepts de système, Services de consultation
  • Consultation de logiciel d'ordinateur, Services de consultation d'ordinateur, Services de consultation pour la conception de système d'information de gestion
  • Désastre informatique, Services de récupération
  • Développement de page Web
  • Élaboration de programmes d'ordinateurs ou logiciel d'exploitation, fabriqués sur demande
  • Gestion des installations, ordinateurs, Services de
  • Gestion d'installations informatiques, Services de
  • Gestion d'installations pour le traitement des données, Services de
  • Informatiques pour la conception de système de gestion d'information,
  • Services Intégrateurs de système d'ordinateur
  • Intégrateurs de système pour réseau de zone locale
  • Intégration de systèmes, ordinateurs
  • Logiciel d'ordinateur fabriqué sur demande
  • Logiciels, Services d'installation
  • Matériel informatique, Services de consultation
  • Ordinateurs, sur demande, Services de programmation d'
  • Programmation de logiciel d'application, fabriquée sur demande,
  • Services de Programmation de logiciel, sur demande
  • Programmation d'ordinateur, sur demande, Services de
  • Services de conception et analyse de systèmes informatiques (logiciel)
  • Soutien informatique, Services de Système de CAO/FAO,
  • Services de Système de conception assisté par ordinateur (CAO),
  • Services de Système d'ingénierie assisté par ordinateur (IAO),
  • Services de Système IAO (ingénierie assistée par ordinateur) Services de

Exclure :

  • Vendre au détail du matériel informatique et des logiciels et fournir des Services de soutien;
  • Publier des logiciels de série;
  • Fournir des Services de traitement des données;

Merci encore une fois de prendre le temps de compléter ce questionnaire. Si vous avez des questions additionnelles ou commentaires, n'hésitez surtout pas à nous contacter au 1-877-604-7828 entre 8h et 23h, heure des Rocheuses, ou postez le tout à :

Statistique Canada,
Division des opérations et de l'intégration,
150 Promenade Tunney's Pasture,
Ottawa (Ontario) K1A 0T6

Indices des prix de vente de l’énergie électrique, non-résidentielle, (1997=100)

Les indices des prix de vente de l’énergie électrique sont publiés, par région et par province, pour deux grandes catégories de clients industriels, soit les factures de moins de 5000 kW et les factures de 5000 kW et plus. Les prix sont déclarés par les services publics d’électricité pour des contrats d’énergie non susceptible d’être interrompue, conclus avec des manufacturiers, des services et d'autres clients industriels canadiens. Les prix mensuels sont relevés trois fois par année auprès de tous les grands services de production et de distribution d’énergie. Les indices établis, accompagnant d'autres indices mensuels des prix de l'industrie, sont diffusés chaque année aux mois d'avril, d’août et de décembre. Les indices ont comme période de référence 1997, et les pondérations sont fondées sur les recettes au titre des ventes qu'ont touchées les entreprises en 1992, telles que recueillies par la Division des prix.

Le calcul des indices des prix de vente de l’énergie électrique se fait à l'aide d'une formule d'indice à pondération fixe, identique à celle décrite dans l'explication des méthodes utilisées pour les Indices des prix des produits industriels, 1997=100. Les indices sont disponibles par l'entremise de CANSIM sur le tableau 329-0050. Les indices de la présente année et de l’année précédente sont sujets a révision.

Pour obtenir plus de renseignements ou pour en savoir davantage sur les concepts, les méthodes et la qualité des données, communiquez avec les Services à la clientèle au 613-951-4550 ou composez sans frais le 1-888-951-4550 (ppd-info-dpp@statcan.gc.ca), Division des prix à la production. Télécopieur : 613-951-3117.