Enquête sur les personnes ayant des problèmes neurologiques au Canada

Errata

Date : Juin 2014

À : Tous les utilisateurs du fichier couplé de l'Enquête sur les personnes ayant des problèmes neurologiques au Canada et l’Enquête sur la santé dans les collectivités canadiennes

Objet : Erreur de logique à CCCDDIA

Produit(s) touché(s) :
Le fichier couplé de l'Enquête sur les personnes ayant des problèmes neurologiques auCanada et l’Enquête sur la santé dans les collectivités canadiennes

Année(s) touchée(s) : 2011
Description du (des) problème(s) :
La variable dérivée relative au type de diabète (CCCDDIA) comporte un défaut de logique. Par conséquent, les répondants qui auraient dû être classés dans la catégorie « diabète gestationnel » ont été classés dans les catégories « diabète de type 2 » ou « non déclaré ». Les répondantes qui ont répondu CCC_10A=1 et CCC_10B=2 auraient dû être classées dans la catégorie « diabète gestationnel ». Cependant, plusieurs cas répondaient aussi au critère des catégories « diabète de type 2 » ou « non déclaré ». Étant donné que ces catégories ont été dérivées en premier, ces cas ont été codés de cette façon, avant que l’on procède à la vérification pour le diabète gestationnel.

De plus, tous les cas auxquels le code « 4 » a été attribué pourraient, en fait, être correctement classés dans la catégorie « diabète de type 2 ». En raison de la logique défectueuse, ces cas ne répondaient à aucun des critères et n’ont pas été codés. Il s’agit probablement de la raison de la création de la catégorie 4.

Correction(s) suggérée(s) :
Selon l’algorithme de Ng-Dasgupta-Johnson sur lequel la CCCDDIA se fonde, le diabète gestationnel devrait être dérivé en premier. Cependant, en pratique, on énumère habituellement les types de code de VD en ordre croissant après avoir dérivé les codes de traitement.

Pour préserver l’ordre des codes de VD et régler le problème, les critères des catégories « non déclaré » et « diabète de type 2 » ont été reformulés de sorte qu’ils comportent un critère additionnel qui évite tout chevauchement avec le diabète gestationnel. La nouvelle règle pour le diabète de type 2 vise désormais tous les cas qui auraient été autrement laissés sans code ou auxquels on aurait attribué la valeur de 4 – « impossible àdéterminer ». Le nouveau code de VD classifie désormais correctement tous les répondants et élimine la nécessité de ce code polyvalent. Le code corrigé pour la variable dérivée est :

Sommaire du tableau
Le tableau montre les résultats de Titre du tableau. Les données sont présentées selon Value (titres de rangée) et Condition(s), Description et Notes (figurant comme en-tête de colonne).
Value Condition(s) Description Notes
6 CCC_101 > 1 Population exclue NA
9 (CCC_10A en (7,8,9) ou
CCC_10B in (7,8,9) ou
CCC_10C en (97,98,99) ou
CCC_101 en (7,8,9) ou
CCC_102 en (997,998,999) ou
CCC_105 en (7,8,9) ou
CCC_106 en (7,8,9)) et (CCC_10A en (2,6,7,8,9) ou
CCC_10B en (1,6,7,8,9))
Le répondant n’a pas répondu
(ne sait pas, refus, non déclaré) à au moins une question nécessaire.
Dérivation impossible du diabète gestationnel.
ND
1 (DHH_SEX = 1 et CCC_101 = 1 et CCC_105 = 1 et CCC_106 = 2 et (CCC_10C <=3 et (DHH_AGE < 30 ou
CCC_102 < 30))) ou
(DHH_sex = 2 et CCC_101 = 1 et CCC_10B en (1,6) et CCC_105 = 1 et CCC_106 = 2 et(CCC_10C <=3 et (DHH_AGE < 30 ou
CCC_102 < 30)))
Diabète type 1  
2 CCC_101 = 1 et (CCC_105 = 2 ou
CCC_102 >= 30 ou
CCC_10C > 3 ou
CCC_106 = 1 ou
(CCC_105 = 1 et (CCC_102 >= 30 ou
CCC_10C > 3))) et(CCC_10A en (2,6,7,8,9) ou
CCC_10B en(1,6,7,8,9))
Diabète type 2  
3 CCC_101 = 1 et DHH_SEX = 2 et CCC_10A = 1 et CCC_10B = 2 Diabète gestationnel  

Des « fichiers de correction » ont été créés pour tous les fichiers touchés. Ces fichiers renferment tous les enregistrements dotés d’identificateurs uniques d’enregistrement, ainsi que la CCCDDIA correctement dérivée. Ces fichiers de correction peuvent être utilisés pour remplacer la CCCDDIA dans les fichiers touchés au moyen d’une fusion avec le ou les identificateurs d’enregistrement.

Étapes de correction : Des fichiers corrigés sont disponibles et devraient être fusionnés avec les fichiers originaux si la variable CCCDDIA est utilisée dans les analyses.

Contactez-nous :

Nous regrettons tout inconvénient que cela a pu vous causer à vous ou à votre organisme et nous vous remercions de votre compréhension.
Si vous avez des questions, n’hésitez pas à communiquer avec nous : Division de la statistique de la santé
613-951-1746
Courrier électronique : hd-ds@statcan.gc.ca

Traitement des images satellites à Statistique Canada pour le Programme d’évaluation de l’état des cultures (PEEC)

Pour: La base de métadonnées intégrée à Statistique Canada

Écrit par: Frédéric Bédard

Révisé par: Richard Dobbins, Gordon Reichert

Télédétection et analyse géospatiale (TAG)
Division de l’agriculture
Statistique Canada

Avril 2010

 

Historique
Étapes de traitement des données
Temps requis pour la mise à jour de l’application
Références

 

1. Historique

Interactif et disponible gratuitement sur Internet (http://www26.statcan.ca/ccap-peec), le Programme d’évaluation de l’état des cultures (PEEC) utilise des données d’images satellites durant la saison de croissance pour suivre le changement des conditions de végétation pour l’ensemble des régions agricoles du Canada ainsi que pour la portion nord des Etats-Unis.

La source principale des données du PEEC est l’imagerie brute par satellite.  L’application peut être lancée en utilisant 2 différentes sources de données satellites.  L’application originale utilise des données à un kilomètre de résolution obtenues du Advanced Very High Resolution Radiometer (AVHRR), de la série de satellites d’observation de la Terre (OT) de la National Oceanographic and Atmospheric Administration (NOAA).  Une nouvelle application lancée en 2010 utilise des données satellites à une résolution de 250 mètres obtenue du Spectroradiomètre imageur à résolution moyenne (MODIS) à bord du satellite expérimental TERRA.

Ce document décrit les étapes de traitement des données effectuées à Statistique Canada pour la publication de données par le PEEC.  Au préalable, des images composites de 7 jours sont construites à l’aide d’images satellites brutes quotidiennes par nos partenaires.  Les données composites hebdomadaires de 7 jours de NOAA-AVHRR sont créées à l’aide d’un logiciel développé par le Centre canadien de télédétection (CCT) de Ressources Naturelles Canada (RNCan).  La méthodologie des étapes générales de traitement des données est décrite dans Latifovic et al. (2005).  Les images composites de TERRA-MODIS sont construites par une équipe du groupe des services agro-environnementaux d’Agriculture et agroalimentaire Canada (AAC) (Davidson et al, 2009).

 

2. Étapes de traitement des données

2.1. Traitement des données satellites composites hebdomadaires

2.1.1. Données d’entrée – AVHRR

Ces données sont reçues par Statistique Canada par un téléchargement FTP sous forme d’un ensemble de fichiers compressés qui contient les fichiers suivants:

Nom du fichier: CISYYwkWW.zip, où YY est l’année (deux derniers chiffres) et WW est le numéro de la semaine julienne.

Fichiers individuels:

  • B01_retoa.img: données du canal 1, réflectance au sommet de l’atmosphère
  • B02_retoa.img: données du canal 2, réflectance au sommet de l’atmosphère
  • Ndvi_retoa.img: Données de l’Indice de végétation par différence normalisée (IVDN), à partir de données de réflectance au sommet de l’atmosphère
  • Comp.log: métadonnées sur le produit de l’étape de création du composite

Ces images sont reçues en format binaire brut avec des données entières et positives.  Pendant la création du composite, les valeurs IVDN sont rééchantillonnées de l’intervalle [-1; 1] à [0; 20 000] en utilisation la formule suivante:

IVDN_rééchantillonné = (IVDN_original * 10 000) + 10 000

Le rééchantillonnage permet de sauvegarder les images en valeurs entières plutôt que réelles, dans le but d’utiliser moins d’espace disque et d’accélérer les traitements ultérieurs.

Pour les étapes suivantes, seules les données du canal IVDN sont utilisées.  Les fichiers b01 et b02 sont les canaux de données utilisées pour créer le rapport IVDN (canaux 1 et 2).

Le composite reçu à Statistique Canada utilise les paramètres de projection suivants:

  • Type de projection: Conique conforme de Lambert
  • Méridien central: 95° ouest
  • Latitude de référence: 0°
  • 1er parallèle standard: 49° nord
  • 2ème parallèle standard: 77° ouest
  • Abscisse fictive: 0
  • Ordonnée fictive: 0
  • Modèle de Terre: 1980 Geodetic reference system (GRS80)

Les images et cartes produites utilisent également ces paramètres de projection, donc aucune reprojection géographique n’est effectuée sur les images d’entrée.  La couverture des images d’entrée est la suivante (en coordonnées de projection Conique conforme de Lambert):

  • Coin nord-ouest: -2 600 000 Est, 10 500 000 Nord
  • Coin sud-est: 3 100 000 Est, 5 700 000 Nord
  • Résolution spatiale (X et Y): 1 000 mètres
  • Nombre de pixels: 5 700 colonnes, 4 800 lignes

L’image en entier est traitée pour les étapes suivantes.

 

Image brute IVDN de AVHRR pour la semaine julienne 30, 2009

Image brute IVDN de AVHRR pour la semaine julienne 30, 2009

 

2.1.2. Données d’entrée – MODIS

Ces données sont reçues par Statistique Canada par un téléchargement FTP sous forme d’un ensemble de fichiers compressés qui contient les fichiers suivants:

Nom du fichier : ncomYYYYDDDtoddd.zip, où YYYY est l’année, DDD et ddd sont les premiers et derniers jours juliens de la période du composite.

Fichiers:

  • ncomYYYYDDDtoddd.tif : données image en format GeoTIFF
  • ncomYYYYDDDtoddd.rrd : images sommaires de l’image GeoTIFF (pour accélérer la visualisation de l’image à petite échelle)
  • ncomYYYYDDDtoddd.aux : fichier auxiliaire de l’image GeoTIFF
  • ncomYYYYDDDtoddd.tif.xml : métadonnées de l’image GeoTIFF

Les valeurs IVDN sont entreposées en format réel, avec des valeurs de -1 à 1.

Les données composites sont reçues à Statistique Canada selon la projection et paramètres suivants :

  • Type de projection : sinusoïdale
  • Modèle de Terre : sphère, rayon de 6 371 007,181 mètres

La couverture et la résolution de l’image composite d’entrée sont les suivantes :

  • Coin nord-ouest : -10 007 554,700 Est; 6 671 703,120 Nord
  • Coin sud-est : -3 335 851,590 Est; 4 447 802,083 Nord
  • Résolution spatiale (X et Y) : 231,656 mètres
  • Nombre de pixels : 28 800 colonnes, 9 600 lignes

 

Image brute IVDN de MODIS, semaine julienne 34, 2009

Image brute IDVN de MODIS, semaine julienne 34, 2009

 

2.2 Reprojection et découpage – images MODIS

La reprojection et le découpage géographique des images sont requis uniquement pour les composites MODIS.  La projection sinusoïdale des données d’entrée est utilisée pour l’entreposage des images MODIS au Land Processes Distributed Active Archive Center (LP-DAAC) aux États-Unis.  Cette projection n’est pas appropriée pour l’affichage des images pour le Canada.  Les données composites doivent donc être reprojetées.

Afin d’assurer une cohérence avec l’application NOAA-AVHRR, les images de MODIS sont reprojetées en utilisant la même projection géographique que pour les images AVHRR (paramètres de projection décrits à la section 2.1.1).  Ceci permet l’affichage de cartes et d’images qui sont comparables en les superposant ou en les visualisant côte-à-côte.

Pour réduire la taille des fichiers, les images sont découpées pour ne conserver que la portion agricole canadienne (au sud du 60ième parallèle).

Après la reprojection, les images sont réduites à la couverture suivante (en coordonnées de projection Conique conforme de Lambert)

  • Coin nord-ouest: -2 350 000 Est, 8 200 000 Nord
  • Coin sud-est: 3 020 040 Est, 5 755 100 Nord
  • Résolution spatiale (X et Y): 230 mètres (originalement 250 mètres en moyenne durant l’acquisition, livrée à 231,656 mètres, rééchantillonnée à 230 mètres)
  • Nombre de pixels: 23 348 colonnes, 10 630 lignes

Les images sont rééchantillonnées à des valeurs entières positives de 16 bits afin d’utiliser moins d’espace disque et d’accélérer les traitements ultérieurs.  Pour sauvegarder les valeurs réelles en valeurs entières, la formule suivante est utilisée pour chaque pixel de l’image:

IVDN_rééchantillonné = (IVDN_original * 10 000) + 10 000

En utilisant ce procédé, la taille individuelle des images composites est réduite de 947 à 473 mégaoctets, tout en maintenant la qualité et la précision des données.  Avant la reprojection et le découpage, les images originales avaient une taille de 1.1 gigaoctet par image composite.

Pour visualiser les graphiques et les tableaux dans l’application web, les valeurs de l’IVDN sont tout de même affichées en valeurs réelles entre -1 et 1.

 

Image IVDN de MODIS reprojetée et découpée, semaine julienne 34, 2009

Image IVDN de MODIS reprojetée et découpée, semaine julienne 34, 2009

 

2.3 Détection et suppression des nuages

Pour les images composites de AVHRR et MODIS, Statistique Canada effectue la détection des nuages et autres contaminants atmosphériques résiduels.  Pour cette étape, une application maison développée par la section Télédétection et analyse géospatiale (TAG), qui utilise Visual Studio .Net 2005 et le langage de programmation EASI associé au logiciel Geomatica de PCI, version 10.1.

Les valeurs d’indice de végétation suivent normalement des variations progressives, et montrent une augmentation en début de saison, pour atteindre un plateau au milieu de l’été, pour enfin décroître à la fin de la saison de croissance.  Chaque pixel (élément de l’image) de l’image AVHRR couvre un kilomètre carré.  Puisque la taille moyenne des champs au Canada est souvent inférieure à un kilomètre, chaque pixel décrit la moyenne de la vigueur de la végétation pour tous les champs couverts par ce pixel.  Par ailleurs, les données MODIS ont une résolution de 250 mètres, ce qui fait qu’un pixel de MODIS peut ne couvrir qu’un seul champ ou un type de culture.  La variation de l’IVDN sera normalement progressive, puisque même si un champ est coupé durant une semaine, les autres champs du pixel influenceront aussi la valeur résultante de l’IVDN, ce qui donnera une moyenne qui ne variera pas brusquement.  Dans le même ordre d’idées, un champ verdira sur plusieurs semaines, ce qui fait que la variation sera également progressive en début de saison.

Conséquemment, un pixel sera considéré contaminé si une baisse soudaine est immédiatement suivie d’une hausse soudaine la semaine suivante.

Pour ne pas avoir à attendre la semaine suivante pour effectuer des corrections, une détection préliminaire est effectuée en comparant les valeurs de la semaine actuelle avec la semaine précédente.  Le pixel sera corrigé en lui attribuant la valeur de la semaine précédente si la valeur de l’IVDN décroît de plus de 0.05 pour les semaines 15 à 28 (où les valeurs devraient normalement s’accroître ou demeurer stables), et plus de 0.20 pour les semaines 29 jusqu’à la fin de la saison.  Le seuil est plus élevé après avoir atteint le sommet des valeurs de l’IVDN puisqu’à cette époque il est normal d’observer une décroissance des valeurs car les cultures annuelles mûrissent et les champs sont récoltés.

Après la réception de l’image de la semaine suivante, la détection et la correction pour les nuages s’effectue de nouveau sur les valeurs originales.  Le pixel est identifié comme contaminé si la valeur de l’IVDN décroît de plus de 0.01 pour par la suite s’accroître de plus de 0.01.

Pour le moment, aucune correction n’est appliquée si la contamination atmosphérique est observée durant deux semaines consécutives ou plus, puisque le traitement nécessiterait un minimum de quatre semaines de données, ce qui serait difficile à opérer en temps quasi-réel.

Une imputation statistique est effectuée lorsqu’un pixel est identifié comme étant contaminé. La procédure d’imputation s’effectue de la façon suivante:

  • Lorsque les données de la semaine suivante ne sont pas disponibles, la valeur des pixels est temporairement remplacée par la valeur de l’IVDN de la semaine précédente;
  • Lorsque les données de la semaine suivante sont disponibles, la valeur contaminée est remplacée par la moyenne de l’IVDN des semaines précédentes et suivantes.

 

Image entière brute reprojetée de l’IVDN de MODIS, semaine julienne 34, 2009

Image entière brute reprojetée de l’ IVDN de MODIS, semaine julienne 34, 2009

 

Image entière reprojetée de l’IVDN avec nuages supprimés, semaine 34, 2009

Image entière reprojetée de l’ IVDN avec nuages supprimés, semaine 34, 2009

 

Image brute reprojetée de l’IVDN de MODIS au-dessus des régions d’Ottawa et Montréal, semaine julienne 34, 2009

Image brute reprojetée de l’ IVDN de MODIS au-dessus des régions d’Ottawa et Montréal, semaine julienne 34, 2009

 

Image reprojetée de l’IVDN pour les régions d’Ottawa et Montréal avec nuages supprimés, semaine 34, 2009

Image reprojetée de l’ IVDN pour les régions d’Ottawa et Montréal avec nuages supprimés, semaine 34, 2009

 

2.4. Calcul des statistiques par région

Pour les cartes thématiques, des statistiques préliminaires sont calculées et entreposées dans une base de données relationnelle pour chaque nouvelle semaine reçue, et pour chaque niveau de géographie disponible

Les couches géographiques disponibles sur le PEEC sont:

  • Les régions agricoles de recensement (RAR);
  • Les Divisions de recensement (DR);
  • Les Subdivisions de recensement unifiées (SRU) – municipalités;
  • Les cantons (Prairies seulement);
  • Les comtés (pour la portion des États-Unis seulement).

Seuls les pixels identifiés comme étant à vocation majoritairement agricole sont utilisés pour les calculs.  Ceci permet de présenter les variations de l’IVDN dans la condition des cultures et les pâturages seulement, en éliminant la contribution d’autres types de couverts sur l’IVDN qui peuvent influencer l’IVDN de manière différente (par exemple, les forêts, les plans d’eau ou les zones urbaines).

Une base de données des couvertures des terres pour l’ensemble de la zone agricole du Canada a été construite par Agriculture et Agroalimentaire Canada, en utilisant 2000 comme année de référence.  Cette base de données a été créée en utilisant des données satellites à résolution moyenne (Landsat).  Ce produit, ainsi que les métadonnées, sont disponibles au http://www.geobase.ca/geobase/fr/data/landcover/index.html

Trois différents filtres ou masques sont disponibles sur l’application du PEEC.  Le filtre agricole a été construit en sélectionnant les pixels de 1 kilomètre carré (application AVHRR) ou de 250 mètres de côté (application MODIS) qui sont couverts par un minimum de 50% de la somme des classes 110 (prairies naturelles), 120 (terres cultivées), 121 (cultures annuelles) et 122 (cultures fourragères et pâturages), tel que défini par la classification des terres mentionnée précédemment.

Le filtre des cultures a été bâti de la même façon mais en utilisant uniquement la somme des classes 121 et 122.  Le filtre des prairies ou pâturages naturels utilise la classe 110.  Pâturage dans ce cas évoque des pâturages ou des prairies non entretenus ou ensemencés.  Puisque ce dernier type de couvert est très rarement présent dans l’est du Canada (de l’Ontario à Terre-Neuve-et-Labrador) et dans l’est des États-Unis, seul le filtre « agriculture » a été construit pour ces régions.  Au Canada, les couvertures de cultures et de pâturages ne sont disponibles que pour les provinces de Colombie-Britannique, Alberta, Saskatchewan et Manitoba.

Pour la portion des États-Unis, les données de couverture des terres du « National Land Cover Database », disponibles au http://www.mrlc.gov, sont utilisées.  Cette base de données a été construite à l’aide de données satellites à résolution moyenne.  L’année de référence pour cette base de données est de 2001.  Les masques ont été créés de la même façon que pour la portion canadienne.  Le masque des cultures est construit en utilisant des pixels où la somme des classes 81 (pâturage ou foin) et 82 (cultures) couvre plus de 50% de la surface du pixel.  Le masque des prairies ou pâturages naturels est construit à l’aide de pixels couverts par plus de 50% par la classe 71 (prairies et herbacés). Le masque agricole a été construit par des pixels où la combinaison des trois classes mentionnées couvre plus de 50% du pixel.  À l’est des Grandes Plaines, seul le masque de l’agriculture est utilisé.

Pour les Prairies canadiennes et les Grandes Plaines américaines, trois moyennes de l’IVDN sont calculés par semaine pour chaque type de couvert terrestre: total de l’agriculture, cultures seulement, et prairies ou pâturages naturels seulement.  Pour le reste du territoire, les moyennes sont calculées seulement pour le filtre agricole.

Une fois les valeurs moyennes de l’IVDN sont calculées, elles sont exportées vers une base de données relationnelle.  L’application Web crée un lien en direct avec cette base de données, et ses valeurs sont extraites en temps réel pour créer en direct les cartes thématiques, les graphiques et les tableaux de données.

 

Exemple d’une carte thématique: moyenne de l’IVDN de AVHRR par municipalité (SDR) pour la semaine julienne 27, 2009 pour les Prairies canadiennes

Exemple d’une carte thématique: moyenne de l’ IVDN de AVHRR par municipalité (SDR) pour la semaine julienne 27, 2009 pour les Prairies canadiennes

 

Exemple de graphique: Données de l’année en cours de l’IVDN de AVHRR comparées à la normale Flagstaff, Alberta (SDR 4807031)

Exemple de graphique : Données de l’année en cours de l’ IVDN de AVHRR comparées à la normale Flagstaff, Alberta (SDR 4807031)

 

Tableau
Exemple d’un tableau de données: IVDN de l’AVHRR de 2009 comparé à la normale Flagstaff, Alberta (CCS 4807031)

Semaines juliennes

2009

2009 Dates

normale

2009 - normale

15

0.1592

6 au 12 avril 2009

0.1127

0.0465

16

0.1602

13 au 19 avril 2009

0.1394

0.0208

17

0.1764

20 au 26 avril 2009

0.1537

0.0226

18

0.2005

27 avril au 3 mai 2009

0.1736

0.0269

19

0.175

4 au 10 mai 2009

0.1953

-0.0203

20

0.1894

11 au 17 mai 2009

0.2215

-0.0321

21

0.2232

18 au 24 mai 2009

0.253

-0.0298

22

0.2504

25 au 31 mai 2009

0.2847

-0.0342

23

0.2605

1er au 7 juin 2009

0.3227

-0.0622

24

0.2449

8 au 14 juin 2009

0.3783

-0.1334

25

0.2695

15 au 21 juin 2009

0.4443

-0.1747

26

0.3359

22 au 28 juin 2009

0.509

-0.1731

27

0.3775

29 juin au 5 juillet 2009

0.5545

-0.177

28

0.4475

6 au 12 juillet 2009

0.5727

-0.1252

29

0.5312

13 au 19 juillet 2009

0.5837

-0.0525

30

0.5135

20 au 26 juillet 2009

0.5752

-0.0617

31

0.4957

27 juillet au 2 août 2009

0.5385

-0.0428

32

0.454

3 au 9 août 2009

0.4915

-0.0375

33

0.4638

10 au 16 août 2009

0.4378

0.026

34

0.4846

17 au 23 août 2009

0.3968

0.0877

35

0.465

24 au 30 août 2009

0.3544

0.1105

36

0.4376

31 août au 6 septembre 2009

0.3241

0.1135

37

0.4081

7 au 13 septembre 2009

0.2973

0.1109

38

0.344

14 au 20 septembre 2009

0.2719

0.0721

39

0.3127

21 au 27 septembre 2009

0.244

0.0687

40

0.2777

28 septembre au 4 octobre 2009

0.218

0.0597

41

0.1804

5 au 11 octobre 2009

0.1906

-0.0102

 

Une fois la semaine suivante disponible, de nouvelles moyennes de l’IVDN sont calculées pour la semaine de référence, puisqu’une détection plus précise des nuages est effectuée pour accroître la précision des données de l’IVDN, tel qu’expliqué dans la section 2.3.

2.5. Création de produits images

Le PEEC ne montre pas d’images composites brutes de l’IVDN sur l’application.  Les données brutes de l’IVDN n’ont qu’une utilisation très limitée, à moins que leurs valeurs ne soient comparées à d’autres valeurs.

Lorsqu’affichées sur l’application web, les images et les cartes sont groupées en cinq classes distinctes:

 

Classes pour les images et les cartes

Classes pour les images et les cartes

 

Pour chaque produit particulier décrit dans les sous-sections suivantes, des seuils (limites de classes) ont été établis. Ces seuils sont établis selon comment une certaine valeur diffère d’une autre pour laquelle on effectue une comparaison. L’analyse est basée sur une distribution normale des différences de valeur. Le tableau suivant spécifie les seuils pour chaque produit.

Tableau
Seuils pour la définition des classes des images et cartes à valeur ajoutée
  Comparé à la normale Comparé à l'an dernier
Classe minimum maximum minimum maximum
Beaucoup plus élevé --- -0.0876 --- -0.3283
Plus élevé -0.0875 -0.0292 -0.3282 -0.1095
Similaire -0.0291 0.0291 -0.1094 0.1094
Moins élevé 0.0292 0.0875 0.1095 0.3283
Beaucoup moins élevé 0.0876 --- 0.3284 ---
Tableau
Seuils pour la définition des classes des images et cartes à valeur ajoutée
  Comparé à la semaine dernière Comparé à la valeur maximale de la normale
Classe minimum maximum minimum maximum
Beaucoup plus élevé --- -0.2783 --- -0.1323
Plus élevé -0.2782 -0.0928 -0.1322 -0.0441
Similaire -0.0927 0.0927 -0.0440 0.0440
Moins élevé 0.0928 0.2782 0.0441 0.1322
Beaucoup moins élevé 0.2783 --- -0.1323 ---

 

Le PEEC fournit les comparaisons à partir des 4 images de référence suivantes:

2.5.1. Comparaison des valeurs actuelles de l’IVDN par rapport aux données historiques normales

La base de données de AVHRR comprend des données composites de 7 jours de l’IVDN de 1987 jusqu’à l’année actuelle.  La base de données MODIS a été bâtie à partir d’images de 2000 jusqu’à l’année actuelle.  Une image de la normale est créée pixel par pixel pour chaque semaine disponible dans l’application (15 à 41 pour AVHRR, 15 à 37 pour MODIS). 

À la fin d’une saison de croissance, les images normales sont mises à jour en ajoutant les données de l’année la plus récente, normales qui seront utilisées pour la saison de croissance suivante.  De nouvelles moyennes normales par région géographique sont également recalculées pour mettre à jour la base de données.

Lorsqu’un utilisateur produit comme requête une comparaison des valeurs actuelles de l’IVDN avec la normale, l’opération s’effectue par une simple soustraction, ce qui génère le Produit image 1:

Produit image 1 (comparaison avec la normale) = IVDN_semaineWW_AnnéeActuelle – IVDN_semaineWW_normale (où WW est la semaine julienne de l’image)

 

Exemple avec la semaine 34 de 2009(IVDN de AVHRR)

Exemple avec la semaine 34 de 2009(IVDN de AVHRR)

 

2.5.2. Comparaison avec l’année précédente

Le deuxième produit image compare les valeurs de l’IVDN d’une semaine spécifique avec la même semaine de l’année précédente.

Produit image 2 (comparaison avec l’année précédente) = IVDN_semaineWW_AnnéeActuelle – IVDN_semaineWW_AnnéePrécédente (où WW est la semaine julienne de l’image)

 

Exemple avec la semaine 34 de 2009 (IVDN de l’AVHRR)

Exemple avec la semaine 34 de 2009 (IVDN de l’AVHRR)

 

2.5.3. Comparaison avec la semaine précédente

Le troisième produit image compare l’IVDN d’une semaine spécifique avec les valeurs de la semaine précédente (même année).

Produit image 3 (comparaisoné avec la semaine précédente) = IVDN_semaineWW – IVDN_semaineWW-1 (où WW est la semaine julienne de l’image)

 

Exemple avec la semaine 34, 2009 (IVDN de l’AVHRR)

Exemple avec la semaine 34, 2009 (IVDN de l’AVHRR)

 

2.5.4. Comparaison avec la valeur la plus élevée de la normale

Le quatrième produit image permet la comparaison des valeurs de l’IVDN d’une semaine spécifique avec la valeur normale la plus élevée de l’IVDN pour une région donnée.  Ces valeurs les plus élevées de l’IVDN sont normalement atteintes au milieu de l’été, au sommet de la saison de croissance.  Puisque le sommet de l’IVDN peut ne pas être atteint la même semaine chaque année, ce produit permet aux utilisateurs de comparer des valeurs de n’importe quelle semaine avec le sommet des valeurs normales historiques.

Lorsque les valeurs et images de la normale sont mises à jour, les valeurs maximales de la normale sont également mises à jour, pixel par pixel.  Une moyenne du maximum de l’IVDN par région est recalculée et entreposée dans la base de données une fois les nouvelles données normales recalculées.

Produit image 4 (comparaison à la valeur maximale de la normale) = IVDN_semaineWW – IVDN_ValeurNormaleMaximale (où WW est la semaine julienne de l’image)

 

Exemple avec la semaine 34, 2009 (IVDN de l’AVHRR)

Exemple avec la semaine 34, 2009 (IVDN de l’AVHRR)

 

2.5.5. Comparaison avec une semaine quelconque

En ce qui concerne les cartes thématiques du PEEC, les valeurs de l’IVDN d’une semaine et d’une année spécifiques peuvent être comparées avec n’importe quelle semaine de n’importe quelle année.  Les valeurs de l’IVDN de deux périodes spécifiées sont soustraites et classifiées.

 

Carte thématique, comparaison avec une semaine quelconque d’une année quelconque
Semaine 31, 2003, comparée à la semaine 31, 1988 (IVDN de l’AVHRR)

Carte thématique, comparaison avec une semaine quelconque d’une année quelconque Semaine 31, 2003, comparée à la semaine 31, 1988 (IVDN de l’AVHRR)

 

2.6. Mise à jour de l’application

Une fois le traitement des données complété, l’application Web est temporairement hors d’usage pendant quelques minutes.  Les opérations qui doivent avoir lieu pendant cette période d’entretien sont:

  • La mise à jour de la base de données;
  • L’ajout de nouvelles images
  • La mise à jour d’un fichier de paramètres.  Ce fichier informe l’application de la disponibilité des données lorsque l’application démarre.  Par défaut, l’application montre toujours les données de l’IVDN les plus récentes, comparées à la normale
 

3. Temps requis pour la mise à jour de l’application

Le tableau suivant montre les étapes de traitement des données ainsi que le temps requis pour leur réalisation.

Tableau
Liste des étapes de traitement avec le temps requis pour chaque type de données

Étape

IVDN de l’AVHRR

IVDN de MODIS

Création du composite (accompli à l’extérieur de Statistique Canada)

0.5 jour après la fin de la période du composite (lundi après-midi)

4 - 5 jours après la fin de la période du composite (Jeudi en fin de journée ou vendredi)

Téléchargement de l’image composite par FTP

1 heure

2 heures

Reprojection, découpage et rééchantillonnage de l’image

Non nécessaire

1h15min.

Détection et suppression des nuages

5 min.

20 min.

Calcul des statistiques par région et mise à jour de la base de données

10 min.

25 min.

Création des produits images

5 min.

2 heures

Contrôle de la qualité

30 min.

1 heure

Transfert des fichiers et mise à jour du serveur

15 min.
(non disponibilité du serveur = 3 min.)

1 heure
(non disponibilité du serveur = 5 à 10 min.)

Temps total

0.7 jour après la fin de la période du composite

4 à 7 jours après la fin de la période du composite

Moment de la mise à jour (au plus tôt)

Lundi 14:00 (Heure de l’est)

Vendredi 16:00 (Heure de l’est), mais le plus souvent le lundi suivant

 

4. Références

(anglais seulement)
Davidson A., Howard A., Sun, K., Pregitzer M., Rollin, P., Aly Z. (2009)  A National Crop Monitoring System prototype (NCMS-P) using MODIS data: Near-Real-Time Agricultural Assessment from Space. Agriculture and Agri-food Canada, National Land and Water Information Service, 41 p.

(anglais seulement)
Latifovic, R., Trishchenko, A. P., Chen J., Park W.B., Khlopenkov, K. V., Fernandes, R., Pouliot, D.,  Ungureanu, C., Luo, Y., Wang, S., Davidson, A., Cihlar, J. (2005) Generating historical AVHRR 1 km baseline satellite data records over Canada suitable for climate change studies.  Canadian Journal of Remote Sensing, vol. 31, no 5, pp 324-346.

 

Statistiques de finances publiques : rajustements conceptuels

Il existe des différences entre le SCNC (Système de comptabilité national du Canada) et les statistiques pures des SFP(tatistiques de finances publiques). Comme il est noté précédemment, les données du SCNC sur les administrations publiques proviennent des données des comptes publics. Ces dernières sont adaptées à la structure du SCNC et sont intégrées dans des produits comme les comptes des revenus et des dépenses, les flux financiers, le bilan national et les tableaux d’entrées-sorties. Enfin, une mise en correspondance entre le SCNC et les SFP est assurée, afin de produire des estimations trimestrielles. Pendant la mise en correspondance avec les SFP, certains rajustements conceptuels sont apportés aux données du SCNC (il convient de souligner qu’une fois que les SFP seront mis en oeuvre, les données correspondront à celles du Système de comptabilité nationale du Canada, et les différences conceptuelles entre les deux disparaîtront).

  1. Le cadre des SFP exige que les recettes, les dépenses, les actifs et les passifs des régimes de retraite non provisionnés du secteur public, au niveau des administrations fédérale (centrale) et provinciales (États fédérés), soient inclus dans la situation des opérations des administrations publiques et le compte de patrimoine des SFP. En ce qui a trait aux données trimestrielles des SFP mis en correspondance avec le SCNC, les recettes et les dépenses de ces régimes de retraite ne sont pas incluses. Dans le SCNC, les passifs de ces régimes de retraite sont traités comme des passifs du secteur des administrations publiques et des actifs du secteur des ménages, tandis que les recettes et les dépenses de ces régimes de retraite sont saisies dans les comptes du secteur des ménages.
  2. Le cadre des SFP exige l’élimination de toutes les opérations intergouvernementales et intragouvernementales des composantes des administrations publiques, afin d’éviter la duplication. Ces opérations sur recettes et dépenses comprennent les transferts, les flux d’intérêt, les impôts versés et reçus, et les achats et ventes de biens et de services. Dans le SCNC, tous les transferts intergouvernementaux et intragouvernementaux sont éliminés au moment du calcul des recettes et des dépenses totales des administrations publiques. En outre, les transactions (flux d’intérêt, impôts versés et reçus, achats et ventes de biens et services et transferts) entre les opérations budgétaires (ministères/ministères provinciaux) et les fonds spéciaux sont éliminées. Les nouvelles données trimestrielles des SFP correspondent à la présentation du SCNC. Les flux d’intérêt, les impôts versés et reçus, les achats et les ventes de biens et de services entre les administrations publiques ne sont pas éliminés au moment du calcul des recettes et des dépenses totales du secteur des administrations publiques, les données nécessaires à cette fin, particulièrement sur une base trimestrielle, n’étant pas disponibles.
  3. Pour les flux financiers et le compte de patrimoine, les transactions intergouvernementales et intragouvernementales ne sont pas éliminées dans le SCNC, sauf celles entre les opérations budgétaires et les fonds spéciaux. Dans le cas de ces données trimestrielles des SFP, les transactions intergouvernementales et intragouvernementales (pour l’ensemble des administrations publiques) sont éliminées dans le cas des bons du Trésor et des obligations seulement. Par conséquent, les séries des SFP différeront des séries correspondantes dans le SCNC.
  4. Dans le compte de patrimoine du SCNC, l’évaluation des structures résidentielles et non résidentielles, ainsi que des machines et du matériel, est dépréciée au coût de remplacement. Les estimations des stocks correspondent aux estimations de l’accumulation de la valeur de la variation matérielle pour l’administration fédérale (centrale) dans les comptes des revenus et des dépenses (à l’heure actuelle, le SCNC ne calcule pas la valeur de la variation matérielle pour les autres sous-secteurs des administrations publiques). Les estimations des terrains sont calculées à partir des ratios terrain/ouvrages.
  5. Les données du compte de patrimoine des SFP mises en correspondance avec le SCNC sont présentées selon la valeur marchande. Les estimations de la valeur comptable et de la valeur marchande des actifs et des passifs financiers sont les mêmes, sauf pour les obligations, les actions et les investissements étrangers. Les estimations de la valeur marchande de ces catégories sont calculées au moyen de facteurs cours-valeur comptable tirés de diverses sources. La base d’évaluation marchande sert aussi à la présentation des comptes financiers annuels du SCNC à l’OCDE (Organisation de coopération et développement économique).
  6. Pour la plupart des catégories financières du compte de patrimoine, la variation de la valeur du bilan entre deux périodes ne sera pas égale aux estimations des flux financiers de la période. La mesure de cette différence est attribuable à de nombreux facteurs, y compris les variations du taux de change et les réévaluations marchandes, les allocations et les radiations, ainsi que des données additionnelles. On les appelle les autres flux économiques et, comme il est noté précédemment, le SCNC ne compile actuellement pas de compte des autres changements d’actifs.

Statistiques de finances publiques : Nomenclature

Le cadre des SFP exige que les données soient produites pour tous les niveaux des administrations publiques, ainsi que pour une catégorie regroupée de l’administration publique. Les données trimestrielles des SFP mises en correspondance avec le SCNC sont produites pour les administrations fédérale, provinciales, territoriales et locales, ainsi que pour le Régime de pensions du Canada et le Régime de rentes du Québec. Ces catégories correspondent à la nomenclature suivante des SFP :

Niveaux de l'administration publique
SFP SCNC
Administration centrale Administration fédérale (F)
Administrations d’État fédérés Administrations provinciales/territoriales (P)
Administrations locales Administrations locales (L)
Sécurité sociale Régime de pensions du Canada et Régime de rentes du Québec (SS)
Administration publique ΣF+P+L+SS moins opérations intersectorielles

Statistiques de finances publiques : description des quatre états financiers

Le cadre analytique des SFP s’articule autour de quatre états financiers. Ces états comprennent : 1) la situation des opérations des administrations publiques; 2) la situation des autres flux économiques et 3) le compte de patrimoine. Le cadre comprend en outre la situation des opérations de trésorerie, qui fournit des renseignements clés sur la liquidité. Chacune de ces situations est décrite ci-après :

  1. La situation des opérations des administrations publiques résume toutes les opérations et permet de produire des bilans analytiques importants à partir de ces données. Les recettes moins les dépenses correspondent au solde net de gestion, qui représente une mesure sommaire de l’effet des opérations des administrations publiques sur la valeur nette. La déduction subséquente de l’acquisition nette d’actifs non financiers du solde net de gestion produit un solde appelé prêt/emprunt net, qui détermine la mesure dans laquelle l’administration publique fournit des ressources financières à d’autres secteurs de l’économie et au reste du monde (prêt net), ou utilise des ressources financières produites par les autres secteurs (emprunt net). Le prêt/l’emprunt net est aussi équivalent aux besoins de financement des administrations publiques, soit le solde net des opérations sur actifs et passifs financiers. Il s’agit d’une mesure de l’impact financier de l’activité des administrations publiques sur le reste de l’économie.
  2. La situation des autres flux économiques présente des données sur les changements dans la valeur nette qui découlent de flux autres que les opérations. Ces flux sont classés comme des changements dans la valeur (réévaluations ou gains ou pertes de détention) des actifs et des passifs ou dans leur volume. Le solde comptable de cette situation est la variation de la valeur nette résultant des autres flux économiques.
  3. Le compte de patrimoine présente les stocks d’actifs et de passifs, ainsi que la valeur nette à la fin de la période comptable. La valeur nette des administrations publiques est définie comme la différence entre le total des actifs et le total des passifs. Parmi les autres soldes comptables pouvant être produits à partir du bilan figure la valeur financière nette, qui est définie comme le total des actifs financiers moins le total des passifs.
  4. La situation des opérations de trésorerie montre les montants de trésorerie produits et utilisés dans les opérations de gestion, les opérations sur actifs non financiers et les opérations faisant intervenir des actifs et des passifs financiers, à l’exclusion de la trésorerie proprement dite. Le solde de gestion, c’est-à-dire la variation nette de trésorerie, correspond à la somme de la trésorerie nette issue de ces trois sources.

À l’heure actuelle, les données trimestrielles des SFP mises en correspondance avec le SCNC comprennent des estimations de la situation des opérations et du compte de patrimoine des administrations publiques. Le Système de comptabilité nationale du Canada ne comprend pas de réévaluations et d’autres variations du compte d’actifs, ce qui fait que la mise en correspondance avec la situation des autres flux économiques des SFP n’a pas été possible. Des données pour la situation des opérations de trésorerie seront élaborées à une date ultérieure.

Enquête annuelle sur les industries manufacturières et l’exploitation forestière, 2015

Contenu Supplémentaire

IMPORTANT: VEUILLEZ LIRE LE PRÉSENT GUIDE AVANT DE REMPLIR LES FORMULAIRES CI-JOINTS

Le présent guide renferme des renseignements additionnels qui vous aideront à répondre aux questions. Les instructions fournies vous permettront de déterminer les questions qui s'appliquent à votre entreprise et les seules auxquelles vous devriez répondre.

Si vous avez besoin d'autres renseignements, veuillez nous appeler. Un employé de Statistique Canada sera heureux de vous aider.

Assistance téléphonique : 1-800-858-7921

Renseignements généraux

Des renseignements sur les exigences légales, la confidentialité, le partage des données et la divulgation autorisée se trouvent à la fin du questionnaire.

Étape 1

Parmi les produits ci-dessous visés par l'Accord sur le bois d'œuvre résineux entre le gouvernement du Canada et le gouvernement des États Unis de 2006, veuillez sélectionnez ceux que votre entreprise fabrique à partir de billes et billons de résineux comme matière première.

* Veuillez noter que les données sur les billes et les billons achetés et revendus dans le même état (c.-à-d. qui n'ont pas été transformés ou modifiés) doivent être déclarées à la section 3.

  1. Bois de conifères sciés ou dédossés longitudinalement, tranchés ou déroulés, même rabotés, poncés ou aboutés/collés par assemblage en bout, d'une épaisseur excédant 6 millimètres
  2. Bois de conifères pour parquets (y compris les lames et frises à parquet, non assemblées) profilés (languetés, rainés, feuillurés, chanfreinés, joints en V, moulés, bouvetés, arrondis ou similaires) tout au long d'une ou de plusieurs rives ou faces, même rabotés, poncés ou aboutés/collés par assemblage en bout
  3. Bois de conifères pour parements (y compris les lames et frises à parquet, non assemblées) profilés (languetés, rainés, feuillurés, chanfreinés, joints en V, moulés, bouvetés, arrondis ou similaires) tout au long d'une ou de plusieurs rives ou faces même rabotés, poncés ou aboutés/collés par assemblage en bout
  4. Autres bois de conifères (y compris les lames et frises à parquet, non assemblées) profilés (languetés, rainés, feuillurés, chanfreinés, joints en V, moulés, bouvetés, arrondis ou similaires) tout au long d'une ou de plusieurs rives ou faces, même rabotés, poncés ou aboutés /collés par assemblage en bout (autres que moulures et chevilles de bois)
  5. Bois profilés à l'un des bouts, même profilés également tout au long d'une ou de plusieurs rives, faces ou bouts, même rabotés, poncés ou aboutés/collés par assemblage en bout
  6. Bois de conifères prépercés à encoches et bois en pièces angulaires

Si vous avez sélectionné au moins un produit, vous devez remplir la section 1 (tableaux 1A à 1C), puis passer à l'étape 2.
Autrement, passez à l'étape 2.

Étape 2

Votre entreprise fabrique-t-elle d'autres produits au moyen de billes et billons de résineux comme matière première?

* Veuillez noter que les données sur les billes et les billons achetés et revendus dans le même état (c.-à-d. qui n'ont pas été transformés ou modifiés) doivent être déclarées à la section 3.

  1. Oui - veuillez remplir la section 2 (tableaux 2A à 2C), uis passer à l'étape 3
  2. Non - assez à l'étape 3

Étape 3

Votre entreprise vend-elle des billes et billons de résineux qui ont été achetés et revendus dans le même état (c.-à-d. sans autre transformation ou modification dans votre unité commerciale)?

  1. Oui - veuillez remplir la section 3 (le tableau3), uis passer à la section 4
  2. Non - passez à la section 4

Étape 4

Votre entreprise fabrique-t-elle des produits à partir de bois d'œuvre résineux comme matière première?

  1. Oui - veuillez remplir la section 4 (tableaux 4A à4C), uis passer à la section commentaires
  2. Non - passez à la section commentaires

Instructions de déclaration pour toutes les sections

  • Déclarez tous les en milliers de dollars canadiens (‘000) (p. ex.55 417,40 $ serait 55).
  • Déclarez les quantités dans l'unité de mesure indiquée. Vous trouverez des facteurs de conversion communs au tableau de l'annexe A. Si le facteur de conversion souhaité n'est pas fourni, veuillez utiliser le facteur qui est le plus approprié ou courant dans votre industrie
  • Lorsque vous ne disposez pas de chiffres exacts, veuillez fournir vos estimations les plus justes

Instructions de déclaration pour les valeurs d'achat et de récolte

Tableaux: 1A, 2A, 3, 4A

Veuillez déclarer le coût d'achat (« franco à bord à la sortie de l'usine », mais exclure la TPS) pour tous les composants et les matières premières achetés pour votre processus de fabrication. Aux sections 1, 2 et 4, ne pas inclure les biens achetés pour la revente, comme les billes et les billons achetés et revendus dans le même état (c.-à-d. qui n'ont pas été transformés ou modifiés).

Instructions de déclaration pour les valeurs des ventes

Tableaux: 1B, 1C, 2B, 2C, 3, 4B, 4C

Aux sections 1, 2et 4, ne pas inclure les biens achetés pour la revente, comme les billes et les billons achetés et revendus dans le même état (c.-à-d. qui n'ont pas été transformés ou modifiés).

Les ventes devraient être déclarées « franco à bord à la sortie de l'usine » : excluant les taxes d'accise et les taxes de ventes provinciales et territoriales, les TVH et TPS, les escomptes, les rabais sur vente, les retours et les frais d'expédition par les transporteurs généraux et les transporteurs à forfait. (Nota: « franco à bord à la sortie de l'usine » signifie à la sortie du camion si le manufacturier ou l'exploitant forestier utilise son camion et son conducteur.) Les ventes libellées en devises étrangères devraient être converties en dollars canadiens selon le taux de change du jour de la transaction.

  • Si votre établissement est une entreprise à unité commerciale unique, les ventes doivent être déclarées selon votre prix de vente final;
  • Si votre établissement fait partie d'une entreprise à unités commerciales multiples:
    1. Les ventes effectuées aux unités commerciales de votre entreprise, qui n'appartiennent pas au secteur de la fabrication, doivent être déclarées selon votre prix de vente final;
    2. les ventes effectuées à d'autres unités commerciales du secteur de la fabrication, succursales de vente, entrepôts de vente ou sièges sociaux de votre entreprise doivent être déclarées selon la valeur inscrite dans les livres comptables de votre établissement (c.-à-d. la valeur de l'écriture comptable).

Annexe A : Facteurs de conversion:

Multipliez les valeurs de l'unité de mesure de « Convertir de » par le « Facteur de conversion » pour obtenir les valeurs de l'unité de mesure « Convertir à ».

Convertir de

  1. Mètres cubes (bois d'oeuvre)*
  2. Tonnes anhydre
  3. Unités anhydres
  4. Pieds carrés
  5. Mètres carrés
  6. Millions d'unités thermales britanniques

Convertir à

  1. Milliers de pieds mesure de planche, MPMP (bois d'oeuvre)*
  2. Tonnes métriques anhydre
  3. Tonnes métriques anhydre
  4. Mètres carrés
  5. Pieds carrés
  6. Gigajoules

Facteur de conversion

  1. 0,4238
  2. 0,9072
  3. 1,0886
  4. 0,0929
  5. 10,7639
  6. 1,0551

* Déclarer le bois d'oeuvre en dimensions nominales

Liens:
Lien vers l'Accord sur le bois d'oeuvre résineux entre le gouvernement du Canada et le gouvernement des États-Unis d'Amérique de 2006, en précisant l'annexe 1A

Les produits visés par l'Accord sur le bois d'oeuvre résineux entre le gouvernement du Canada et le gouvernement des États-Unis d'Amérique figurent à l'annexe 1A de l'accord.

http://www.treaty-accord.gc.ca/text-texte.aspx?id=105072

Merci d'avoir rempli ce questionnaire Veuillez garder une copie pour vos dossiers. Consultez notre site Web

Enquête annuelle sur les distributeurs secondaires de produits pétroliers raffinés - Lettre de présentation

Madame, Monsieur,

Statistique Canada mène présentement l’Enquête annuelle sur les distributeurs secondaires de produits pétroliers raffinés. Cette enquête sera réalisée chaque année, et le questionnaire devrait être rempli par votre siège social.

Cette enquête améliorera les statistiques sur l’écoulement de produits pétroliers raffinés publiées dans le Bulletin sur la disponibilité et l’écoulement d’énergie au Canada (BDEE) qui donne une description détaillée de la disponibilité et de l’écoulement de l’énergie au Canada, par secteur clé de l’économie et par province et territoire. Cette publication de Statistique Canada est utilisée par tous les paliers de gouvernement pour établir des politiques éclairées en vue d’encourager l’utilisation efficiente de l’énergie et de surveiller les émissions d’agents polluants dans l’atmosphère.

Les statistiques sur la demande énergétique publiées dans le BDEE sont obtenues auprès des grandes raffineries du pays. Étant donné que les fournisseurs d’énergie dépendent de plus en plus des revendeurs de combustibles indépendants pour distribuer leurs produits, votre participation à cette enquête est très importante pour mieux refléter la demande énergétique actuelle.  

En vertu de la Loi sur la statistique il est obligatoire de participer à cette enquête et en vertu de cette même loi, tous les renseignements que vous fournirez demeureront confidentiels.

Vous trouverez ci-joint un questionnaire, un guide de déclaration et une enveloppe-réponse. Veuillez remplir et retourner le questionnaire dans les 30 jours suivant la réception du questionnaire. Si vous avez besoin d’aide ou si vous avez des questions, veuillez composer le 1‑866-445-4323.

Merci beaucoup de votre collaboration et veuillez recevoir, Madame, Monsieur, mes sincères salutations.

La Directrice
Région de l’Ouest et Territoires du Nord,
Lise Rivais

Enquête annuelle sur les distributeurs secondaires de produits pétroliers raffinésGuide de déclaration

1. Instructions de déclaration

Vous trouverez ci-dessous des renseignements qui vous aideront à remplir l'Enquête annuelle sur les distributeurs secondaires de produits pétroliers raffinés.

  • Il y a quatre tableaux de produits distincts : essence à moteurs, carburant diesel, mazout de chauffage et mazout lourd.
  • Pour chaque produit, veuillez déclarer le nombre total de litres vendus du 1er janvier au 31 décembre 2014 au Canada, par province ou territoire et selon le type de consommateur indiqué aux lignes 3 à 26 du questionnaire.
  • Si le nombre exact de litres vendus n'est pas disponible, veuillez nous fournir vos meilleures estimations.
  • Veuillez conserver une copie du questionnaire pour vos dossiers.

2. Définitions

Essence à moteur : Tous les carburants de type « essence » utilisés pour les moteurs à combustion interne, y compris l'éthanol/méthanol et autres additifs similaires.

Carburant diesel : Toutes les catégories de distillats pour moteurs diesel utilisé en transport routier, hors route, maritime et ferroviaire, quelque soit le traitement fiscal du diesel vendu (diesel coloré ou décoloré) y compris tout biodiesel rajouté au diesel.

Mazout de chauffage : Tous les combustibles de type distillat pour brûleurs à mélange surpressé. Comprend le mazout no.1, mazout no.2, le mazout no.3, mazout pour poêles, le mazout de chauffage, le gasoil et les carburants industriels légers, y compris tout biodiesel rajouté au mazout de chauffage.

Mazout lourd : Toutes les catégories de mazout de type résiduel, y compris les combustibles à faible teneur en soufre servant à la génération de vapeur, à la production d'énergie électrique ainsi qu'à l'alimentation de moteurs vapeurs et de moteurs diesels installés à bord de navires maritimes. Comprend les mazouts nos 4, 5 et 6. Également connu sous le nom de combustible de soute B ou C.

3. Section A

Note: Si vous avez vendu des produits pétroliers raffinés mélangés à des biocarburants à vos clients, veuillez cocher le cercle approprié dans la colonne fournie à cet effet sur chaque page du questionnaire.

Distribution du nombre de litres de carburant vendus par type de client (y compris les biocarburants)

Les définitions suivantes se rapportent aux lignes 1 à 27 du questionnaire et fournissent des instructions pour la déclaration de vos ventes selon le type de client.

Ligne 1 - Total, nombre de litres utilisé pour votre propre consommation
Déclarez toutes les quantités de produits pétroliers raffinés que vous avez achetées et que la compagnie a utilisées. (Par exemple, carburant utilisé pour vos véhicules ou mazout de chauffage).

Ligne 2 - Total, nombre de litres vendus (y compris les biocarburants)
Déclarez le nombre total de litres de produits pétroliers raffinés disponible pour la revente. Ce nombre exclut les produits pétroliers raffinés que vous avez achetés et qui ont été utilisés pour le fonctionnement de vos opérations, tel que le chauffage et le carburant pour vos véhicules, et le carburant que vous avez transporté pour une tierce personne.

Ligne 3 - Résidences
Déclarez toutes les ventes destinées aux résidences privées, y compris les maisons unifamiliales, les blocs-appartements, les hôtels-résidences et les condominiums.

Ligne 4 - Ventes aux grossistes et marchands de produits pétroliers raffinés
Déclarez toutes les ventes aux compagnies dont l'activité principale est la vente en gros ou la vente directe (livraisons à domicile) de produits pétroliers raffinés.

Ligne 5 - Stations-service (nombre total de litres vendus à vos stations-service et à celles qui appartiennent à d'autres)
Déclarez toutes les ventes aux compagnies dont l'activité principale est la vente au détail de carburants à moteurs, que les stations-services soient exploitées ou non conjointement avec un dépanneur, un atelier de réparation automobile, un restaurant ou un autre commerce. Les compagnies qui exploitent des stations-service pour le compte de leurs propriétaires et qui perçoivent une commission sur les carburants vendus sont aussi incluses. Exclure les ventes aux marinas - les inclure à la ligne 26, « Autres clients commerciaux et institutionnels ».

Ligne 6 - Transporteurs ferroviaires et activités de soutien
Déclarez toutes les ventes aux compagnies dont l'activité principale est l'exploitation de chemins de fer. Les ventes aux établissements dont l'activité principale consiste à fournir des services de transport ferroviaire de longue distance ou sur ligne principale, de courte distance, des services de transport ferroviaire de voyageurs et des services spécialisés au secteur du transport ferroviaire doivent également être incluses à la ligne 6.

Ligne 7 - Compagnies de transport routier et activités de soutien
Déclarez toutes les ventes aux compagnies dont l'activité principale consiste à fournir des services de transport de marchandises par camion, de transport en commun et de transport terrestre de voyageurs (y compris les services urbains de transport en commun, les compagnies de transport interurbain et rural par autocar, les services de taxis et limousines, les compagnies de transport scolaire et transport d'employés par autobus, les services d'autocars nolisés, les services de taxi et de limousine en direction et en provenance des aérogares et gares, services de navette et compagnies de transport pour passagers aux besoins spéciaux), de transport terrestre de tourisme et d'agrément et les compagnies dont l'activité principale consiste à fournir des services spécialisés aux compagnies de camionnage, aux exploitants d'autobus et à d'autres établissements utilisant le réseau routier (exemples : service de dépanneuse/remorqueuse, service de déneigement)

Ligne 8 - Transporteurs maritimes - navires maritimes canadiens
Déclarez toutes les ventes faites au Canada aux compagnies dont l'activité principale est le transport par eau de passagers et de marchandises par des navires immatriculés au Canada (battant pavillon canadien).

Ligne 9 - Transporteurs maritimes -  navires maritimes étrangers
Déclarez toutes les ventes faites au Canada aux compagnies dont l'activité principale est le transport par eau de passagers et de marchandises par des navires immatriculés à l'étranger (battant pavillon étranger).

Ligne 10 - Fabricants de produits alimentaires
Déclarez toutes les ventes aux compagnies dont l'activité principale est la production d'aliments destinés à la consommation humaine ou animale. En général, ces établissements vendent leurs produits à des grossistes ou à des détaillants en vue de leur distribution finale aux consommateurs.

Ligne 11 - Fabricants de papier 
Déclarez toutes les ventes aux compagnies dont l'activité principale est la fabrication de pâte à papier, de papier et de produits du papier.

Ligne 12 - Fabricants de produits de fer et d'acier
Déclarez toutes les ventes aux compagnies dont l'activité principale consiste à fondre du minerai de fer et des débris d'acier pour produire du fer en gueuse sous forme liquide ou solide et à transformer du fer de première fonte en acier après avoir retiré le carbone qu'il contient par combustion dans des fours. Inclure également à la ligne 12 toutes les ventes aux compagnies dont l'activité principale consiste à fabriquer des tuyaux et des tubes en fer ou en acier, à fabriquer par étirage du fil en acier, et à laminer à froid des formes en acier à partir d'acier acheté et les ventes aux fonderies de fer et d'acier.

Ligne 13 - Compagnies de production et de transformation d'aluminium et de métaux non ferreux
Déclarez toutes les ventes aux compagnies dont l'activité principale est la fabrication d'aluminium ou dont l'activité principale consiste à fondre, raffiner, laminer, étirer et extruder des métaux non ferreux. Inclure également à la ligne 13 toutes les ventes aux fonderies de métaux non ferreux.

Ligne 14 - Fabricants de ciment
Déclarez toutes les ventes aux compagnies dont l'activité principale consiste à produire du ciment de mâchefer puis à le broyer à sec ou par voie humide.
Ne pas inclure les ventes aux fabricants de béton préparé et de produits en béton; ces ventes devraient être déclarées à la ligne 17 « Autres activités diverses de fabrication ».

Ligne 15 - Fabricants de produits du pétrole et du charbon
Déclarez toutes les ventes aux compagnies dont l'activité principale est la transformation du pétrole et du charbon brut en produits intermédiaires et finis. Le procédé principal est le raffinage du pétrole, qui exige la séparation du pétrole brut en sous-produits à l'aide de techniques comme le craquage et la distillation.

Ligne 16 - Fabricants de produits chimiques et d'engrais
Déclarez toutes les ventes aux compagnies dont l'activité principale est la fabrication de produits et de préparations chimiques à partir de matières premières organiques et inorganiques.

Ligne 17 - Autres activités diverses de fabrication
Déclarez toutes les ventes aux compagnies non visées aux lignes 10 à 16. Cette catégorie comprend les compagnies dont l'activité principale est la fabrication des produits suivants :

  • Fabrication de boissons et de produits du tabac
  • Usines de textiles
  • Usines de produits textiles
  • Fabrication de vêtements
  • Fabrication de produits en cuir et de produits analogues
  • Fabrication de produit en bois
  • Impression et activités connexes de soutien
  • Fabrication de produits en plastique et en caoutchouc
  • Fabrication de produits en argile et produits réfractaires
  • Fabrication de verre et de produits en verre
  • Fabrication de béton préparé;
  • Fabrication de tuyaux, briques et blocs en béton et fabrication d'autres produits en béton
  • Fabrication de chaux et de produits en gypse
  • Fabrication de produits abrasifs
  • Fabrication de produits métalliques (inclues toutes les ventes aux compagnies de type suivant : Forgeage et estampage; Fabrication de coutellerie et d'outils à main; Fabrication de produits d'architecture et d'éléments de charpentes métalliques; Fabrication de chaudières, de réservoirs et de contenants d'expédition; Fabrication d'articles de quincaillerie; Fabrication de ressorts et de produits en fil métallique; Ateliers d'usinage, Fabrication de produits tournés, de vis, d'écrous et de boulons; Revêtement, gravure, traitement thermique et activités analogues; Fabrication d'autres produits métalliques)
  • Fabrication de machines
  • Fabrication de produits informatiques et électroniques
  • Fabrication de matériel, d'appareils et de composants électriques
  • Fabrication de matériel de transport
  • Fabrication de meubles et de produits connexes
  • Activités diverses de fabrication

Ligne 18 - Mines de fer
Déclarez toutes les ventes aux établissements qui s'occupent principalement de l'extraction, de l'enrichissement et des autres modes de préparation du minerai de fer.

Ligne 19 - Extraction de pétrole et de gaz naturel et activités de soutien à l'extraction de pétrole et de gaz naturel
Déclarez toutes les ventes aux compagnies dont l'activité principale est l'exploration ou la production du pétrole brut et du gaz naturel, selon des méthodes classiques ou non classiques (par exemple extraction de sables bitumineux) et à celles dont l'activité principale est la prestation, en vertu d'ententes contractuelles ou contre rémunération, de services de soutien requis pour l'extraction de pétrole et de gaz. (y compris le forage pétrolier et gazier et le forage en mer).

Ligne 20 - Autres mines et activités de soutien
Déclarez toutes les ventes aux compagnies dont l'activité principale est l'extraction minière, à l'exclusion des mines de fer et aux compagnies dont l'activité principale est la prestation, en vertu d'ententes contractuelles ou contre rémunération, des services de soutien requis par l'extraction minière et l'extraction en carrière de minéraux. Cette catégorie comprend les mines de charbon, de minerais métalliques (à l'exclusion des ventes aux mines de fer déclarées à la ligne 18), de minerais non-métalliques.

Exemples : extraction de charbon, d'or, d'argent, de plomb/zinc, de granite, d'amiante, de potasse et de diamants; extraction de sable, de gravier, d'argile, de céramique et de minerais réfractaires; drainage ou pompage minier, à forfait

Ligne 21 - Foresterie, exploitation forestière, pêche et activités de soutien
Déclarez toutes les ventes aux compagnies dont l'activité principale est la production et la récolte du bois caractérisé par un long cycle de croissance (dix ans ou plus); la prise ou la capture, à des fins commerciales, de poissons, de mollusques et crustacés et d'autres animaux aquatiques, dans leur habitat naturel; et l'offre des services de soutien essentiels à la production forestière et à la pêche.

Exclusion : Aquaculture (veuillez déclarer les ventes aux compagnies d'aquaculture à la ligne 22).

Ligne 22 - Agriculteurs, chasseurs, piégeurs et activités de soutien
Déclarez toutes les ventes aux compagnies dont l'activité principale est la culture agricole, la culture de plantes, de plantes grimpantes, d'arbres et de leurs semences; la production de produits d'origine animale et l'engraissement des animaux; la chasse et le piégeage à des fins commerciales de même que l'exploitation et la gestion de parcs commerciaux à gibier; et l'offre de services de soutien essentiels à la production agricole et forestière.

Exemples : Culture de plantes oléagineuses et de céréales; culture de légumes, de fruits et de noix; culture en serre et en pépinière et floriculture; culture du tabac et coton; élevage de bovins; élevage de porcs; élevage de volailles et production d'oeufs; élevage de moutons et de chèvres; aquaculture; apiculture; service de moissonnage des récoltes; plantation de cultures; service de reproduction d'animaux; service de reboisement.

Ligne 23 - Compagnies de construction et activités connexes
Déclarez toutes les ventes aux compagnies dont l'activité principale est la construction, la réparation et la rénovation d'immeubles et d'ouvrages de génie civil, et le lotissement et l'aménagement de terrain; cette catégorie comprend aussi les compagnies dont l'activité première consiste à effectuer des travaux habituellement requis pour la construction des bâtiments et des structures, comme la maçonnerie, la peinture ou l'électricité.

Exemples : Construction de bâtiments (construction résidentielle et non résidentielle); travaux de génie civil (construction d'installations de services publics, de routes, de rues et de ponts et lotissement de terrains); entrepreneurs en travaux de fondations, de structure, et d'extérieur de bâtiment (ex. entrepreneurs en charpenterie, en travaux de maçonnerie, en travaux de vitrage et de vitrerie, en travaux de toiture, en travaux de parements, etc.); entrepreneurs en installations d'équipements techniques (ex. entrepreneurs en travaux d'électricité et en installation de câblage et en plomberie, chauffage et climatisation); entrepreneurs en travaux de finition de bâtiments (ex. entrepreneurs en installation de cloisons sèches et travaux d'isolation, en peinture et tapisserie, en travaux de revêtements de sol, en pose de carreaux et coulage de terrazzo et en travaux de finition de bâtiment); autres entrepreneurs spécialisés telle que la location de grues avec conducteur, et les compagnies dont l'activité principale consiste à effectuer des activités de préparation du terrain, comme l'excavation, le nivellement et la démolition de bâtiments.

Ligne 24 - Administrations publiques
Déclarez toutes les ventes aux organismes dont l'activité principale est de nature gouvernementale : promulgation et interprétation judiciaire des lois et de leurs règlements d'application et administration des programmes établis sous le régime de ces lois et règlements d'application.

Exemples : administrations publiques fédérales, provinciales/territoriales, locales, municipales et régionales; sociétés de la Couronne; tribunaux fédéraux, provinciaux et municipaux; services d'immigration; Gendarmerie royale du Canada, services de police provinciaux et municipaux; services correctionnels fédéraux, provinciaux et municipaux; services provinciaux et municipaux de lutte contre les incendies; services fédéraux et provinciaux relatifs à la main-d'œuvre et à l'emploi; services de réglementation fédéraux et provinciaux (ex. service d'administration du gouvernement fédéral sur la santé et la sécurité au travail, commissions de contrôle des alcools); administrations publiques autochtones; etc.

Ligne 25 - Compagnies de production d'électricité
Déclarez toutes les ventes aux compagnies dont l'activité principale consiste à produire de l'électricité en bloc à partir de l'énergie hydraulique, des combustibles fossiles, des combustibles nucléaires ou d'autres processus. Les ventes aux compagnies de transport et distribution d'électricité doivent être déclarées dans la catégorie « Autres ventes commerciales et institutionnelles » (ligne 26).

Ligne 26 - Autres clients commerciaux et institutionnels
Déclarez à la ligne 26, toutes les ventes (nombre total de litres vendus) aux compagnies non incluses aux lignes 3 à 25 du questionnaire.

La catégorie ‘Autres clients commerciaux et institutionnels' comprend les compagnies dont l'activité principale est une des suivantes:

  • Transport et distribution d'électricité
  • Distribution de gaz naturel
  • Réseaux d'aqueduc et d'égout et autres systèmes
  • Commerce de gros (à l'exclusion des grossistes en produits pétroliers)
  • Commerce de détail (à l'exclusion des stations-service)
  • Transport aérien et activités de soutien au transport aérien
  • Transport par pipeline
  • Services postaux
  • Messageries et services de messagers
  • Entreposage
  • Industrie de l'information et industrie culturelle (éditeurs de logiciels, radiodiffusion et télévision, télécommunications par fil)
  • Finances et assurances (banque centrale, sociétés d'assurance, caisses de retraite)
  • Services immobiliers et services de location et de location à bail (bailleurs de biens immobiliers, activités liées à l'immobilier, location de biens de consommation)
  • Services professionnels, scientifiques et techniques (services juridiques, services de comptabilité, de préparation des déclarations de revenus, de tenue de livres et de paye)
  • Gestion de sociétés et d'entreprises
  • Services administratifs, services de soutien, services de gestion, des déchets et services d'assainissement (services emploi, services de soutien d'entreprises, collecte des déchets)
  • Services d'enseignement (p. ex., écoles primaires et secondaires, collèges communautaires, universités)
  • Soins de santé et assistance sociale (p. ex., services de soins ambulatoires, hôpitaux, établissements de soins infirmiers et des soins pour bénéficiaires internes)
  • Industries d'arts, spectacles et loisirs (p. ex., compagnies d'arts d'interprétations, établissement du patrimoine, parcs d'attractions, centres de ski, marinas et salles de jeux électroniques)
  • Hébergement et services de restauration (hébergement des voyageurs, maisons de chambres et pensions de famille, restaurant à service complet)
  • Autres services (sauf les administrations publiques), par exemple réparation et entretien, organismes religieux, services funéraires

Exemple : Si votre compagnie a vendu du carburant diesel à des marinas, hôpitaux, universités et des compagnies de services immobiliers, veuillez calculer le nombre total de litres de diesel vendus à ces compagnies et le déclarer à la ligne 26.

Ligne 27 - Total, nombre de litres vendu, y compris les biocarburants
Déclarez le nombre total de litres de carburant, y compris le nombre total de litres de biocarburant rajouté aux carburants, vendus au cours de l'année civile. La ligne 27 est la somme des lignes 3 à 26.Veuillez noter que le nombre déclaré à la ligne 27 doit être égal à celui déclaré à la ligne 2.

4. Section B: Biocarburants

Essence à moteur

Si vous rajoutez de l'éthanol ou achetez de l'essence déjà mélangée à de l'éthanol, veuillez déclarer le nombre total de litres d'éthanol vendus aux lignes 1a et/ou 1b. Ne déclarez pas les ventes d'éthanol non mélangé à de l'essence.

Ligne 1a – Total, nombre de litres d'éthanol vendus (que vous avez vous-même mélangé à l'essence)

Si vous avez acheté de l'essence à moteur qui ne contenait pas d'éthanol, veuillez déclarer le nombre total de litres d'éthanol que vous avez vous-même mélangé à l'essence que vous avez vendue.

Ligne 1b – Veuillez indiquer ci-dessous la ou les sources d'éthanol utilisées; cochez toutes les sources qui s'appliquent
Cochez la case appropriée pour indiquer la source de l'éthanol utilisée. Cochez toutes les sources qui s'appliquent.
Si la source n'est pas le blé ou le maïs, veuillez cocher la case « Autre » et préciser la source dans la case réservée à cet effet.

Ligne 2a - Total, nombre de litres d'éthanol vendus (achetés prémélangés)
Si vous avez acheté de l'essence déjà mélangée à de l'éthanol, veuillez déclarer le nombre total de litres d'éthanol contenus dans l'essence que vous avez vendue.

Ligne 2b – Veuillez indiquer ci-dessous la ou les sources d'éthanol utilisées; cochez toutes les sources qui s'appliquent
Cochez la case appropriée pour indiquer la source de l'éthanol utilisée. Cochez toutes les sources qui s'appliquent.
Si la source n'est pas le blé ou le maïs, veuillez cocher la case « Autre » et préciser la source dans la case réservée à cet effet.

Carburant diesel et mazout de chauffage

Les instructions suivantes se rapportent aux biocarburants que vous avez mélangés au carburant diesel et au mazout de chauffage que vous avez vendus. Ne déclarez pas les ventes de biodiesel non mélangé à du diesel ou à du mazout de chauffage.

Ligne 1 - Total, nombre de litres du biodiesel vendus
Si vous vendez du carburant diesel ou du mazout de chauffage mélangé à du biodiesel, veuillez indiquer le nombre de litres de biodiesel vendus.

Ligne 2 – Veuillez indiquer ci-dessous la ou les sources de biodiesel utilisées; cochez toutes les sources qui s'appliquent
Cochez tous les cercles qui s'appliquent.

Si la source du biodiesel utilisée n'est pas contenue dans la liste fournie, veuillez cocher la case « Autre » et préciser la source dans la case réservée à cet effet.

Un aperçu de la méthodologie d’échantillonnage du Programme intégré de la statistique des entreprises

José Gaudet et John Stardom,
Division des méthodes d'enquête auprès des entreprises, Statistique Canada

Introduction

L'initiative de l'Architecture opérationnelle du Bureau (AOB) de Statistique Canada met en œuvre des mesures destinées à réduire les coûts de fonctionnement et à améliorer l'assurance de la qualité et l'exécution de nouveaux programmes statistiques. L'élaboration proposée du Programme intégré de la statistique des entreprises (PISE) représente pour les programmes de la statistique des entreprises de Statistique Canada un moyen d'atteindre ces objectifs. Le PISE vise à transformer la plateforme existante de l'Enquête unifiée auprès des entreprises (EUE) en un modèle généralisé conforme à l'AOB en vue de produire des statistiques sur les entreprises. Ce modèle englobera toutes les étapes d'une enquête, de la base de sondage à la diffusion des données, en passant par l'échantillonnage. L'objectif consistait initialement à appliquer le modèle du PISE à tous les programmes liés aux entreprises, sauf le programme des prix et celui du commerce international. La proposition concernant le PISE repose sur six piliers qui donneront lieu aux gains d'efficacité escomptés, à savoir :

  • la pleine utilisation du Registre des entreprises (RE) comme base de sondage pour toutes les enquêtes auprès des entreprises;
  • le recours à la collecte électronique des données comme mode principal de collecte;
  • l'adoption d'une stratégie commune pour la vérification automatisée et manuelle;
  • l'avancement de la date de clôture de la collecte active;
  • l'utilisation des données fiscales pour l'estimation des données financières;
  • l'amélioration de la gouvernance dans tous les secteurs qui participent à la production de données statistiques, en particulier le renforcement de la gestion du changement.

Les fondements du PISE sont décrits en détail dans un document de la Division de la statistique des entreprises (DSE, 2009). Selon ce document, le PISE doit être suffisamment unifié, harmonisé et flexible pour :

  • intégrer de nouvelles enquêtes;
  • réaliser des enquêtes axées sur l'industrie ainsi que des enquêtes axées sur les activités;
  • avoir le choix entre l'entreprise, l'établissement et l'emplacement comme unité d'échantillonnage.

Le présent document résume la méthodologie d'échantillonnage adoptée pour le PISE. Il contient une description détaillée des étapes principales de l'échantillonnage et une discussion de la méthodologie mise en œuvre.

Échantillonnage à deux phases

Dans le cas de certaines enquêtes qui seront intégrées dans le PISE, il existe des situations où l'information disponible dans le RE n'est pas à jour ou ne suffit pas aux besoins de l'enquête. Par exemple, il arrive que la classification selon l'industrie qui figure dans le RE ne soit pas systématiquement à jour pour toutes les unités visées par l'enquête ou que des renseignements supplémentaires, tels que les biens ou services produits par les entreprises, soient nécessaires pour rendre le processus d'échantillonnage plus efficace.

Afin de faire face à ces situations, le PISE offre aux programmes d'enquête la possibilité d'utiliser une stratégie d'échantillonnage à deux phases. Les enquêtes qui optent pour l'échantillonnage à deux phases sont encouragées à se joindre à la première phase principale, qu'on appelle l'Enquête sur l'activité économique, les dépenses et les produits (EAEDP). Certaines enquêtes pour lesquelles un plan d'échantillonnage à deux phases ne convient pas auront la possibilité d'utiliser une stratégie d'échantillonnage à une seule phase. Les objectifs de toute enquête de deuxième phase doivent être connus afin de s'assurer que l'échantillon de première phase (dont dépendent les enquêtes de deuxième phase) sera suffisamment grand pour satisfaire aux exigences de ces enquêtes. La taille de l'échantillon de première phase est aussi assez importante pour des raisons de coordination négative à la deuxième phase.

Base de sondage

En ce qui concerne l'information contenue dans la base de sondage, l'une des hypothèses fondamentales du PISE soutient que toute l'information nécessaire provenant du RE ou de données d'enquête est accessible et à jour au moment de l'échantillonnage de première phase. Aucune mise à jour de l'information contenue dans la base de sondage n'est permise durant le processus d'échantillonnage.

Utilisation d'information supplémentaire

Pour créer la base de sondage d'une enquête, le recours à l'information provenant des cycles d'enquête antérieurs ou celle provenant de la première phase de l'enquête peut s'avérer utile. Cela s'applique, par exemple, aux enquêtes de deuxième phase qui utilisent l'EAEDP en tant que première phase. Au moment de la création de la base de sondage pour ces enquêtes de deuxième phase, les unités d'échantillonnage qui doivent être incluses seront celles sélectionnées dans l'échantillon de l'EAEDP.

En outre, il pourrait être nécessaire d'avoir accès aux fichiers des échantillons d'autres enquêtes pour gérer la coordination des échantillons entre les enquêtes et ainsi contrôler le fardeau de réponse. Il pourrait également être utile d'avoir accès aux fichiers des échantillons provenant d'éditions antérieures d'une même enquête pour gérer le renouvellement de l'échantillon entre les éditions de cette enquête. De surcroît, pour toutes les enquêtes de deuxième phase, de l'information provenant de l'enquête de première phase sera nécessaire en vue de définir la base de sondage.

Hiérarchie et taille des unités

Dans le RE, la structure des entreprises comprend quatre niveaux d'entité statistique, à savoir l'entreprise, la compagnie, l'établissement et l'emplacement. Pour chaque enquête, il faut définir le niveau auquel les proportions de la taille totale qui provient de l'unité (contributions) seront considérées au moment de l'échantillonnage (niveau de l'entité d'exploitation ciblée), ainsi que le niveau de l'unité qui sera sélectionnée au moment de l'échantillonnage (niveau de l'unité d'échantillonnage) et auquel sera effectuée l'estimation.

Entités d'exploitation ciblées et unités d'échantillonnage

Les niveaux de l'entité d'exploitation ciblée et de l'unité d'échantillonnage sont indiqués dans les métadonnées et peuvent correspondre à n'importe quel niveau d'entité statistique dans le RE. La seule contrainte est que le niveau de l'unité d'échantillonnage ne peut pas être inférieur dans la hiérarchie au niveau de l'entité d'exploitation ciblée.

Mesures de taille des entités d'exploitation ciblées pour l'échantillonnage

Pour les entités d'exploitation ciblées, la mesure de taille par défaut est fondée sur le revenu. D'autres concepts de taille que le revenu peuvent aussi être utilisés et provenir directement du RE ou être dérivés en se fondant sur des variables présentes dans le RE. L'utilisateur pourrait également mettre en place une fonction de taille fondée sur le revenu différente de la fonction par défaut. Il est également possible d'utiliser une combinaison de différents concepts de taille, comme le revenu et l'actif, le revenu et la capacité, ou le nombre de bovins et le nombre de porcs pour les enquêtes agricoles (voir la section « Utilisation de concepts de taille multiples » du présent document).

Cellules d'échantillonnage

Pour chaque enquête, le niveau de stratification de base, ou cellule, est habituellement défini par le domaine ayant le niveau de détail le plus fin pour lequel des estimations sont requises. L'objectif est de s'assurer de pouvoir produire des estimations de bonne qualité en tenant compte de cette information à l'étape de la stratification.

La cellule comprend habituellement des dimensions relatives à l'industrie et à la géographie (où la dimension géographique correspond ordinairement à la province). Le niveau d'industrie varie selon l'enquête. Des dimensions supplémentaires peuvent être prises en considération, comme le pays de contrôle ou le statut à but lucratif ou à but non lucratif de l'entité.

Les entités d'exploitation ciblées sont classées naturellement dans des cellules en fonction de l'information de classification disponible dans le RE pour l'entité en question.

Facteurs d'importance

Une fois que la mesure de taille est établie pour toutes les entités d'exploitation ciblées, on peut déterminer un facteur d'importance pour chaque cellule d'échantillonnage j. La principale application de ces facteurs d'importance consiste à mieux contrôler la répartition de l'échantillon entre les cellules et à mettre l'accent sur la production de données de haute qualité dans les cellules importantes. La présente section est axée sur la définition de l'importance des cellules grâce à la construction de facteurs d'importance; les détails de la répartition de l'échantillon sont exposés dans une section ultérieure.

L'un des choix du facteur d'importance (ωj) pour la cellule d'échantillonnage j sous de simples conditions est ωj= tˆ1/2xj . Autrement dit, le facteur d'importance équivaut à la racine carrée de la taille totale estimée à l'intérieur de la cellule, ce qui est décrit dans Bankier (1988). Dans le cas du PISE, un niveau de qualité semblable est requis aux niveaux de l'industrie et de la province en vue de mieux répartir les impôts au niveau du Canada entre les provinces. Afin de tenir compte des multiples dimensions des domaines (c. à d. provinces et industrie), les facteurs d'importance doivent être définis d'une façon différente.

Le facteur d'importance ωj est fondé sur le produit de l'importance donnée à chacune de ses dimensions. Autrement dit, on définit des dimensions primaire, secondaire, tertiaire, etc., et chaque dimension sera conditionnelle aux dimensions qui précèdent dans la hiérarchie. Dans le cas du PISE, la géographie est la dimension primaire. Si les cellules d'échantillonnage étaient fondées uniquement sur la géographie et non sur la classification selon l'industrie, le facteur d'importance de la cellule j serait

ω=ωj=txj/j=1Jtxjp          (1)

Ici, le numérateur est le montant total des revenus dans la province j et le dénominateur est le montant total des revenus sur l'ensemble des provinces (à l'échelle nationale). L'exposant p est utilisé pour insister sur le rôle des facteurs d'importance ωj parmi l'ensemble des domaines. Une explication de l'interaction entre les facteurs d'importance et la fonction objective utilisée pour la répartition est donnée à la section sur la répartition de l'échantillon du présent document.

Pour le PISE, la géographie n'est pas la seule dimension d'intérêt; la classification selon l'industrie est également importante. Si nous ajoutons la classification selon l'industrie comme dimension secondaire, nous obtenons

ωj1=txj1/j1=1J1txj1p1 ,   ωj2=txj1j2/j2=1J2txj1j2p2  et  ωj=ωj1×ωj2            (2)

L'indice j1 indique que la première composante, ωj1 est le facteur primaire. Ce facteur est construit par rapport à une certaine province j1 comme il est décrit plus haut à la présente section. La composante secondaire, ωj2, est conditionnelle à la première. Autrement dit, le numérateur est le montant total des revenus dans l'industrie j2 dans la province j1, et le dénominateur est le montant total des revenus sur toutes les industries, mais à l'intérieur de la province j1. Une cellule d'échantillonnage comprenant un plus grand nombre de dimensions possède un plus grand nombre de composantes, toutes conditionnelles à la géographie et à l'industrie, comme il est décrit ici.

Stratification par cellule

L'un des principaux aspects du plan d'échantillonnage du PISE est la volonté qu'il soit centré sur l'entreprise. C'est à dire que, dans le cadre d'une enquête particulière du PISE, il est important d'échantillonner toutes les entités d'exploitation ciblées admissibles à l'intérieur d'une entreprise ou de n'en échantillonner aucune. En veillant à ce que toutes les entités d'exploitation ciblées associées à une entreprise soient regroupées dans une seule unité d'échantillonnage, il est à la fois plus facile de coordonner les échantillons entre les enquêtes et de tirer des échantillons centrés sur l'entreprise sans devoir faire appel à l'approche de l'échantillonnage en réseau de l'EUE, laquelle est un processus qui complique considérablement l'estimation. Dans le cas des entreprises simples ne comptant qu'un seul établissement, il existe une relation de type un à un entre l'unité d'échantillonnage de l'entreprise et une cellule d'échantillonnage. Cependant, pour les entreprises complexes, cette relation est de type un à plusieurs et, par conséquent, il n'est pas simple de définir à quelle cellule d'échantillonnage chaque unité d'échantillonnage doit être affectée.

Dans les enquêtes auprès des entreprises, pour lesquelles la distribution des revenus entre les unités de la population a tendance à être fortement asymétrique (les revenus étant une quantité corrélée à de nombreuses estimations clés), la sélection des grandes unités dans l'échantillon avec une plus grande probabilité augmente à la fois la qualité des estimations et l'efficacité de l'échantillon. En gardant cela à l'esprit, le choix de la cellule d'échantillonnage à laquelle l'unité d'échantillonnage d'une entreprise complexe doit être affectée par stratification est considéré comme une fonction de la proportion des revenus dans chaque cellule d'échantillonnage qui peut être attribuée à l'entreprise, ainsi que des facteurs d'importance des cellules d'échantillonnage.

Pour le PISE, la mesure de taille de l'unité d'échantillonnage iest définie comme étant

zi=jω2jt2xjx2ji         (3)

  • ωj représente le facteur d'importance de la cellule d'échantillonnage (du domaine) j;
  • xji est la part de la taille totale de la cellule d'échantillonnage j correspondant à la totalité des entités d'exploitation ciblées dans l'unité d'échantillonnage i;
  • txj représente la taille totale de la cellule d'échantillonnage j.

Le terme

(ωjtxjxji)              (4)

est appelé contribution de l'unité d'échantillonnage i à la cellule d'échantillonnage j. La cellule d'échantillonnage j pour laquelle la contribution de l'unité d'échantillonnage i dans (4) est un maximum est la cellule à laquelle l'unité d'échantillonnage doit être affectée lors de la stratification.

La fonction appliquée à la contribution (4) fait en sorte que la taille totale de l'unité d'échantillonnage i soit dictée principalement par sa plus grande contribution à une cellule, mais aussi qu'un poids additionnel soit ajouté en raison des autres contributions de l'unité. Notons que cette fonction convertit les tailles des entités d'exploitation ciblées (exprimées en dollars) en une valeur décimale sans unité qu'il est difficile d'interpréter.

Étant donné que la portée et le champ d'observation des enquêtes du PISE varient d'une phase d'échantillonnage à l'autre, il est nécessaire de réévaluer la stratification des unités d'échantillonnage complexes à chaque phase d'échantillonnage pour s'assurer que les grandes unités soient traitées de la façon la plus avantageuse possible.

Utilisation de concepts de taille multiples

Certains programmes d'enquête requièrent l'utilisation de plus d'un concept pour définir la taille des unités dans leur population. Ainsi, pour l'Enquête annuelle sur les centrales d'énergie électrique, on utilise les revenus ainsi que la capacité électrique comme mesures de taille, tandis que pour l'Enquête sur le bétail, on utilise les nombres de bovins, de moutons et de porcs. Afin de réussir à intégrer ces programmes dans le PISE, il est nécessaire de permettre l'utilisation de multiples concepts de taille pour déterminer la taille globale d'une unité.

Le système d'échantillonnage courant n'est pas suffisamment souple pour permettre de multiples passages à travers les processus d'échantillonnage. En outre, la mise en correspondance d'une mesure de taille multivariée avec une mesure de taille unique pour les besoins de la stratification et de l'échantillonnage pose certaines difficultés. Pour contourner ces problèmes, on a été décidé de considérer chaque concept de taille comme un autre niveau de la stratification en cellules. Le processus global proprement dit ne sera pas perturbé car, par défaut, les sous-routines décrites plus loin dans le présent document (telles que la définition du seuil de tirage nul et la stratification par taille) sont exécutées dans une cellule d'échantillonnage à la fois.

Par exemple, considérons une entité d'exploitation ciblée de la classe SCIAN 111111 et province P qui élève des bovins et des porcs. Cette entité serait représentée par une entité placée dans la cellule 111111×P×Bovins avec une taille fondée sur le nombre de bovins uniquement et une deuxième entité serait placée dans la cellule 111111×P×Porcs avec une taille fondée sur le nombre de porcs. Les mesures de taille sont normalisées afin d'éviter des différences d'échelle entre les différents concepts. Les contributions d'appartenance aux cellules de chaque entité d'exploitation (ainsi que celles d'autres entités d'exploitation ciblées dans l'unité d'échantillonnage, s'il y a lieu) sont calculées pour déterminer la cellule d'échantillonnage à laquelle l'unité d'échantillonnage doit être affectée. Les deux avantages de cette classification sont que les unités d'échantillonnage sont classées conformément à leur combinaison industrie/géographie dominante et que, comme une composante de concept de taille différente est associée à chaque cellule, les unités d'échantillonnage sont classées conformément à leur concept de taille dominant. La standardisation et la normalisation des tailles permettent d'utiliser une mesure de taille unique durant le processus d'échantillonnage.

Toutes les étapes suivantes du processus d'échantillonnage décrites ci-après se poursuivent comme dans le cas univarié. Il faut toutefois veiller à restructurer les fichiers des échantillons finaux afin d'éviter le double compte des entités d'exploitation (une pour chaque mesure de taille). Les mesures de taille supplémentaires peuvent figurer dans chaque enregistrement, mais le cas échéant, elles apparaissent comme différentes variables de taille qui ont été utilisées dans le processus.

Tirage nul

L'algorithme de Royce-Maranda décrit dans Royce et Maranda (1998) est la méthode utilisée par le PISE pour réduire le fardeau de réponse des petites unités en les excluant de l'échantillon. Cette méthode est intégrée dans le nouveau Système généralisé d'échantillonnage (G-Éch) de Statistique Canada. L'utilisateur doit fournir une liste contenant les seuils d'exclusion et G-Éch détermine le seuil d'exclusion approprié pour chaque cellule.

La première étape du processus consiste à déterminer quelles entités d'exploitation ciblées doivent faire l'objet d'un tirage nul. Pour cela, dans chaque cellule, les entités d'exploitation ciblées sont triées par ordre décroissant de revenus. Un seuil est choisi de façon à garder au moins 90 % des revenus dans chaque cellule, à moins que le seuil minimal élimine plus de 10 % des revenus de la cellule. Le niveau d'exclusion peut être contrôlé, mais on suppose qu'il est de 10 % pour toutes les enquêtes du PISE.

Une fois déterminé le statut de chaque entité d'exploitation ciblée de la population, le statut de l'unité d'échantillonnage dans son ensemble doit être évalué. Puisque les unités d'échantillonnage peuvent être constituées d'un mélange d'entités d'exploitation ciblées à tirage nul et d'entités admissibles, une règle est requise pour décider ce qu'il convient de faire dans de tels cas. Afin de maintenir le taux d'exclusion inférieur au niveau cible de 10 %, la régle consiste à n'exclure l'unité d'échantillonnage que si toutes les entités d'exploitation ciblées qui lui appartiennent sont à tirage nul en fonction de l'évaluation précédente.

L'évaluation du tirage nul n'est pas refaite au moment du traitement d'une enquête de deuxième phase. Les entités d'exploitation ciblées gardent leur statut de tirage nul établi à la première phase et le statut de l'unité d'échantillonnage est déterminé de la même façon qu'il est décrit au paragraphe précédent. Si une unité d'échantillonnage devient à tirage nul à la deuxième phase, elle doit subir un traitement spécial. Aucune de ces unités ne recevra un questionnaire et les données financières seront obtenues au moyen des données fiscales, tandis que les données sur leurs caractéristiques seront fixées à zéro ou imputées.

Unités à tirage obligatoire

Étant donné le caractère asymétrique de la distribution des revenus dans les enquêtes économiques, il est essentiel que certaines unités influentes qui ne peuvent pas être représentées par d'autres unités de la population soient échantillonnées. De la sorte, il est certain que les données sur ces unités influentes seront incluses dans les estimations finales. Mises à part les estimations fondées sur les revenus, certaines petites unités sont tout aussi cruciales pour les estimations des caractéristiques. Dans les deux cas, un mécanisme permet d'échantillonner des unités particulières avec certitude. Les unités spécifiées sont placées dans une strate à tirage obligatoire dont toutes les unités sont sélectionnées dans l'échantillon.

Il existe d'autres situations où il est avantageux de placer les unités dans une strate à tirage obligatoire, par exemple pour effectuer un recensement dans une cellule ou une enquête, pour produire une estimation pour une cellule contenant un très petit nombre d'unités, ou pour indiquer qu'une unité est une valeur aberrante importante. En tout, une entité d'exploitation ciblée peut devenir une entité à tirage obligatoire de huit façons tout au long du processus d'échantillonnage du PISE :

  1. les spécialistes du domaine spécifient une unité directement;
  2. des critères de tirage obligatoire établis dans les métadonnées identifient l'unité (le critère par défaut vise les unités d'échantillonnage qui contribuent à au moins six cellules d'échantillonnage uniques);
  3. l'unité appartient à une unité d'échantillonnage dans laquelle une autre unité a été identifiée par l'une des deux méthodes susmentionnées;
  4. l'unité est un membre d'une cellule d'échantillonnage contenant moins de dix unités d'échantillonnage au-delà du seuil d'exclusion (voir la section sur les petites cellules);
  5. l'unité est un membre d'une strate comptant cinq unités d'échantillonnage ou moins;
  6. l'unité est une unité d'échantillonnage qui représente une grande valeur aberrante dans sa cellule d'échantillonnage;
  7. l'unité est dans une enquête par recensement;
  8. l'unité est dans un classement recoupé sur la base de sondage qui contient un total d'une ou deux unités et est donc critique à l'estimation.

Notons que, tel qu'illustré dans le troisième cas ci-haut, toutes les entités d'exploitation ciblées dans une unité d'échantillonnage dans laquelle une des entités d'exploitation ciblées est définie comme une valeur aberrante seront également marquées comme des unités à tirage obligatoire.

Unités spéciales

Certaines classes d'unités peuvent se trouver dans le champ d'observation de certaines enquêtes du PISE, mais ne pas devoir passer par chacune des étapes du processus d'échantillonnage. Ces « unités spéciales » sont soumises à des traitements spéciaux pour éviter qu'elles gênent le processus d'échantillonnage qui est appliqué aux autres unités.

Stratification par taille

Après avoir défini les ensembles d'unités à tirage nul, à tirage obligatoire et spéciales dans chaque cellule, les unités restantes forment l'ensemble d'unités admissibles à partir desquelles l'échantillon sera sélectionné. Cependant, si l'on tire l'échantillon dans chaque cellule telle quelle, les distributions asymétriques des revenus font en sorte qu'un nombre relativement grand d'unités devront être échantillonnées pour viser un niveau raisonnable de qualité dans chaque cellule. Afin d'accroître l'efficacité de l'échantillon, on commence par stratifier par taille les unités comprises dans les strates à tirage partiel afin de regrouper les unités de taille similaire. La sélection de l'échantillon dans chaque cellule est ensuite effectuée strate par strate.

La méthode classique de stratification utilisée pour l'EUE était celle de Lavallée-Hidiroglou (Lavallée et Hidiroglou, 1988). L'un des avantages de cette méthode de stratification est que la répartition de l'échantillon est effectuée simultanément. Cependant, une entrée nécessaire pour appliquer cette méthode est la connaissance a priori des niveaux cibles de qualité, et les données de sortie consistent en un ensemble de bornes de strate et de tailles d'échantillon de strate qui minimise la taille d'échantillon globale. Dans le PISE, les niveaux de qualité cibles ne sont pas des données d'entrée connues. C'est la taille d'échantillon cible qui est utilisée comme entrée et le niveau de qualité cible devient une sortie. Par conséquent, d'autres méthodes sont nécessaires pour la stratification par taille et la répartition de l'échantillon.

La méthode géométrique de stratification (Gunning et Horgan, 2004) est une méthode très simple qui ne nécessite que la distribution des valeurs de taille et le nombre souhaité de strates pour fonctionner. Les bornes de strate sont déterminées avec l'intention d'égaliser le coefficient de variation (CV) de la taille dans chaque strate. Autrement dit, si dans la strate hSyh=Nhi=1YhiYhNh est l'écart-type de y, Yh=1NhNhi=1Yhi est la valeur moyenne de y et CVh=Syh/Yh est le CV de y alors les K bornes de strate sont choisies de façon que

Sy1Y1=Sy2Y2=Sy3Y3==SyKYK

La formule utilisée dans la méthode géométrique pour établir les bornes de strate est

Bornekj=taille min × (taille maxtaille min)(kK)            (5)

  • taille min et taille max sont les tailles minimale et maximale des unités d'échantillonnage, respectivement, dans la cellule j;
  • K est le nombre total de bornes qu'il faut calculer dans la cellule j;
  • k est l'indice de la borne (1,..., K).

Li (2012) a montré que la méthode géométrique était sensible aux petites ainsi qu'aux grandes valeurs aberrantes. Des valeurs extrêmes à l'une ou à l'autre extrémité de la distribution pourraient avoir des effets considérables sur les valeurs des bornes de strate. Par conséquent, on a élaboré une fonctionnalité de détection des valeurs aberrantes qui est exécutée avant la procédure de stratification. Des grandes et des petites valeurs aberrantes ont été décelées au moyen de la méthode de l'écart-sigma. Hellec (2013) a déterminé que la valeur du paramètre écart-sigma global λ doit être fixée à 60. Ce paramètre est appliqué sans distinction à toutes les cellules d'échantillonnage après l'élimination des unités déterminées préalablement comme étant à tirage obligatoire. Après l'exécution du processus de détection des valeurs aberrantes dans chaque cellule, les valeurs aberrantes des deux types sont écartées et la distribution restante est utilisée pour calculer les bornes de strate. Une fois que les bornes de strate sont calculées, les petites valeurs aberrantes sont replacées dans les strates des petites unités dans leurs cellules respectives, tandis que les grandes valeurs aberrantes sont affectées à la strate à tirage obligatoire.

Dans la plupart des cas, la valeur de K dans (5) est fixée à 3 afin de subdiviser chaque cellule en trois strates de taille contenant les petites, les moyennes et les grandes unités, respectivement. De nouveau, contrairement à la méthodologie appliquée pour l'EUE, la méthode géométrique ne repose pas sur l'hypothèse que la strate des grandes unités sera une strate à tirage obligatoire (fraction d'échantillonnage de 100 %). Chaque strate d'échantillonnage est plutôt traitée comme une strate à tirage partiel dans laquelle la fraction d'échantillonnage peut prendre toute valeur supérieure à 0 % (y compris éventuellement 100 %), à condition que les contraintes d'échantillonnage soient respectées. L'algorithme d'optimisation exécuté durant la répartition de l'échantillon dicte quelles strates à tirage partiel justifient l'application d'une fraction d'échantillonnage de 100 % (en fonction de la variabilité des tailles des unités d'échantillonnage).

Petites cellules

Statistique Canada a pour mandat de produire des estimations pour tous les classements recoupés des provinces et des variantes de la classification selon l'industrie qui sont définis comme des domaines d'estimation pour le PISE. Cependant, certaines cellules d'échantillonnage utilisées pour représenter ces domaines peuvent contenir très peu d'unités. Afin de produire des estimations raisonnables dans une cellule, il est nécessaire que celle ci contienne un nombre minimal d'unités répondantes. La subdivision de certaines cellules en trois strates de taille, l'échantillonnage de moins de 100 % des unités dans ces strates, puis l'existence de cas de non-réponse peuvent aboutir à des scénarios où il est impossible de produire des estimations de qualité raisonnable. Par conséquent, il a fallu élaborer des stratégies taillées sur mesure pour répartir les échantillons dans les cellules particulièrement petites. À la présente section, la discussion concernant les tailles des cellules s'appuie sur le nombre d'unités d'échantillonnage admissibles pour l'échantillonnage après la suppression des unités à tirage obligatoire.

Les entités d'exploitation ciblées dont la stratification se fait naturellement dans des cellules d'échantillonnage ne contenant qu'une ou deux unités d'échantillonnage seront toutes considérées comme des unités à tirage obligatoire. Faire partie d'un domaine d'estimation aussi petit a un effet négatif sur les résultats de la méthodologie de répartition de l'échantillon et, par conséquent, il est préférable de simplement exclure ces unités du processus en les considérant comme des unités à tirage obligatoire.

Dans les cellules contenant moins de 10 unités d'échantillonnage, toutes les unités doivent également être considérées comme étant à tirage obligatoire. Pour les enquêtes où les données peuvent être remplacées par des données fiscales, la collecte des données se fera pour les cellules importantes. Une cellule est jugée importante si son facteur d'importance est supérieur au 50e centile de l'ensemble des cellules dans la même province ou industrie. Pour les cellules moins importantes, aucune collecte ne sera effectuée et les données fiscales seront utilisées pour la partie financière du questionnaire. Dans ces cas, les données pour la partie des caractéristiques seront fixées à zéro ou imputées. Pour les enquêtes où le remplacement par des données fiscales ne peut pas avoir lieu, la collecte sera effectuée auprès de toutes les unités.

Dans les cellules contenant de 10 à 29 unités d'échantillonnage, le nombre de strates de taille sera réduit de 3 à 2 (méthode géométrique appliquée avec K= 2). La sélection de l'échantillon dans les cellules d'échantillonnage de ces deux strates se fera comme dans les cellules d'échantillonnage stratifiées ordinairement.

Répartition de l'échantillon

Dans le cadre du PISE, une entreprise peut faire partie de plusieurs industries et/ou provinces. Si nous considérons les contributions d'une entreprise à ces diverses cellules d'échantillonnage comme des valeurs variables, nous devons utiliser un plan de répartition multivarié pour répartir l'échantillon entre les strates de population. Nous utiliserons une méthode de répartition de puissance afin d'obtenir des estimations de bonne qualité au niveau de l'industrie ainsi que de la province. La méthode est décrite dans Bankier (1998), ainsi que dans Särndal, Swensson et Wretman (2003).

La répartition de puissance multivariée peut être configurée de deux façons. On peut chercher à :

  1. soit minimiser une fonction de coût sous des contraintes de précision pour chaque domaine et variable;
  2. soit minimiser une fonction de précision pour les domaines sous une contrainte de coût fixe.

Comme il est mentionné à la section sur la stratification par taille, les données d'entrée pour l'enquête seront les quantités de ressources disponibles plutôt que les cibles de qualité connues. Par conséquent, l'option 2 susmentionnée est l'approche adoptée. La fonction à minimiser est :

minπhj=1J(ωjCV(tˆxj))2           (6)

πh, ωj et tˆxj représentent la fraction d'échantillonnage dans la strate h, le facteur d'importance du domaine j et l'estimateur du total de la variable xj dans la population. La quantité CV(tˆxj) représente le CV de l'estimateur. Les seules quantités qui sont ajustées afin de minimiser la fonction sont les πh qui sont présentes dans CV(tˆxj)2.

Pour la première phase du PISE, les domaines j correspondent approximativement aux cellules d'échantillonnage. Comme il est mentionné à la section sur les facteurs d'importance, ωj est défini conditionnellement de manière que ωj=(ωj1)(ωj2) avec la dimension j2 conditionnelle à j1. Cela nous permet d'exprimer (6) comme il suit :

minπhj1=1J1ω2j1j1=1J2ω2j2(CV(tˆxj1j2))2           (7)

Dans les définitions de ωj1 et ωj2, les puissances p1 et p2 servent à contrôler les différences de qualité cible pour les domaines j1 et j2 . L'indicateur de qualité que les puissances contrôlent diffère de celui décrit dans Bankier (1988). Dans cet article, la qualité est exprimée en fonction du CV, tandis que pour l'échantillonnage du PISE, elle est plutôt représentée par une somme des carrés des CV comme dans (7). En remplaçant ωj1 par substitution, nous pouvons exprimer (7) sous la forme

minπhj1=1J1txj1/j1=1J1txj12p1j2=1J2ωjj2(CV(tˆxj1j2))2                 (8)

Considérons la puissance p1. Si p1 est fixée à 0, alors le même niveau de qualité est ciblé pour chaque domaine j1. Si, par contre, elle est fixée à 1, les cibles de qualité seront plus élevées pour les domaines j1 ayant de plus grandes valeurs de txj1 (les domaines « plus importants »).

Afin de s'assurer que les estimations pour toutes les cellules soient de qualité raisonnable, on peut établir une contrainte sur le coefficient de variation (CV) maximum permis. Il convient de souligner que les CV calculés à l'interne au moyen de G-Éch qui sont comparés à ces contraintes de qualité sont des CV conditionnels qui peuvent être passablement plus élevés que les CV effectifs calculés une fois que l'échantillon est réellement sélectionné.

En outre, pour s'assurer de sélectionner un nombre suffisant d'unités dans chaque strate et d'éviter l'effet négatif des unités ayant un poids très grand qui changent de strate entre l'échantillonnage et l'estimation, des contraintes peuvent être appliquées à l'étape de la répartition de l'échantillon. Les contraintes qui ont été mises en œuvre convertissent une borne supérieure sur les poids définie par l'utilisateur en un nombre minimal d'unités à affecter à chaque type de strate.

La mise en œuvre de l'un ou l'autre de ces types de contraintes écarte la solution de G-Éch de l'optimalité. Par conséquent, la répartition de l'échantillon sera d'abord exécutée sans utiliser les contraintes de CV ou de poids maximaux. Les CV et les poids seront ensuite évalués et, si des problèmes sont décelés, la répartition sera de nouveau exécutée en appliquant les contraintes. La seule exception concerne l'EAEDP (enquête de première phase), dans laquelle des contraintes de poids maximaux sont généralement établies à des niveaux fixes pour chacune des strates de taille possibles. Ces contraintes sont relâchées pour certains groupes d'industries (correspondant aux enquêtes de deuxième phase) pour lesquels la composition de la population empêche la convergence du programme de répartition de l'échantillon pour les valeurs par défaut des poids maximaux. Notons que ces contraintes peuvent être ajustées par l'utilisateur.

Une probabilité d'échantillonnage πh=1 est appliquée à toutes les unités affectées à la strate à tirage obligatoire. Ces probabilités sont entrées dans le module de sélection de l'échantillon pour s'assurer du tirage de toutes les unités présentes dans cette strate (recensement).

Sélection et coordination de l'échantillon

Dans le PISE, la méthode d'échantillonnage implicite est l'échantillonnage de Bernoulli. Cette méthode a été choisie parce qu'en plus de simplifier le calcul de la variance, elle simplifie la coordination des échantillons et permet leur combinaison. Dans certains cas, cependant, la sélection de Bernoulli peut produire un échantillon insuffisant dans une strate particulière. Pour atténuer ce risque, un échantillon aléatoire simple (EAS) est utilisé à la place de l'échantillon de Bernoulli quand le nombre d'unités sélectionnées devient inférieur au seuil spécifié de 2.

Grâce à l'utilisation de G-Éch, le PISE permettra la coordination des échantillons entre les éditions d'une enquête donnée, ainsi qu'entre les enquêtes du PISE. Comme il s'agit de la seule méthode de coordination des échantillons disponible dans G-Éch à l'heure actuelle, un échantillonnage séquentiel sera utilisé pour gérer la coordination des échantillons. Cette méthode comprend l'utilisation de nombres aléatoires permanents (NAP) pour sélectionner les échantillons. En choisissant différents points de départ, la méthode permet de procéder à différents types de coordination des échantillons.

En dernière analyse, il sera nécessaire de mettre en œuvre un certain renouvellement de l'échantillon. La stratégie envisagée à l'heure actuelle pour atteindre cet objectif consiste à décaler de la quantité souhaitée le début de la fenêtre d'échantillonnage pour la sélection de l'échantillon de l'EAEDP et à sélectionner les échantillons des enquêtes de deuxième phase de façon que le chevauchement soit maximum avec ceux des éditions précédentes. Cela donnera la quantité prévue de renouvellement à la deuxième phase comme il est montré dans Paulus (2014).

Traitement des unités disparues

Dans le cas du tirage d'un échantillon pour le deuxième cycle ou les cycles suivants d'une enquête répétée pour laquelle le chevauchement entre les cycles est contrôlé, il est possible que le taux d'unités disparues en dehors de la partie échantillonnée de la population soit sous-estimé comparativement au taux dans la partie échantillonnée (parce que la disparition d'un certain nombre d'unités n'est connue que grâce à des commentaires recueillis durant l'enquête). Afin de réduire les chances que cet échantillonnage répété aboutisse à une estimation biaisée, il est nécessaire de manipuler la base de sondage pour stabiliser les poids entre les éditions de l'enquête (ce qui équivaut à s'assurer que les taux de disparition d'unités soient constants dans les deux parties de la population pour les divers cycles). Cela pourrait nécessiter de réintroduire dans la base de sondage des unités échantillonnées antérieurement que l'on sait être disparues (en ne faisant toutefois jamais cela pour des unités dont la disparition a été confirmée par une source indépendante) ou à sélectionner des unités dans la partie non échantillonnée de la population et à les traiter comme des unités disparues. Notons qu'on entend ici par « disparition » tout type de changement subi par une unité faisant qu'elle se trouve dans le champ d'observation de l'enquête pendant un cycle, mais hors de ce champ au cycle suivant (y compris des changements de code du SCIAN, des changements de statut de l'entreprise ou des modifications des caractéristiques de la population). Les changements de code du SCIAN à la suite desquels l'unité demeure dans le champ d'observation de l'enquête ne sont pas considérés comme des disparitions d'unité.

Si la manipulation de la base de sondage nécessite la réintroduction dans celle-ci d'unités que l'on sait disparues, ces unités disparues pourront être échantillonnées comme n'importe quelle autre unité et pourront par conséquent posséder un poids, mais un questionnaire ne leur sera envoyé en aucune circonstance.

Bibliographie

Baillargeon, S., Rivest, L.-P. et Ferland, M. (2007). Stratification en enquêtes entreprises : une revue et quelques avancées. Recueil du Groupe des méthodes d'enquête, Société statistique du Canada.

Bankier, M. D. (1988). Power allocations: Determining Sample Sizes for Subnational Areas. The American Statistician.

Demnati, A. et Turmelle, C. (2011). Proposed Sampling and Estimation Methodology. Document interne de Statistique Canada.

DSE. (2009). « Integrated Business Statistics Program - Blueprint ». Document interne de Statistique Canada.

Gaudet, J. (2014). Contact Strategy for the RY2014 Business Activity, Expenditures and Output (BAEO) Survey. Document interne de Statistique Canada.

Gunning, P. et Horgan, J. M. (2004). Un nouvel algorithme pour la construction de bornes de stratification dans les populations asymétriques. Techniques d'enquête, 30, p. 177-185.

Hellec, S. (2013). Diagnostic et contribution à la méthodologie d'échantillonnage du PISE. Document interne de Statistique Canada.

Lavallée, P. et Hidiroglou, M. A. (1988). Sur la stratification de populations asymétriques. Techniques d'enquête, 14, p. 33-43.

Li, Y. (2012). Detection and treatment of outliers in the creation of the IBSP sampling frame. Document interne de Statistique Canada.

Paulus, P. (2014). Rotation et coordination des échantillons dans le cadre du Programme intégré de la statistique des entreprises. Document interne de Statistique Canada.

Royce, D. et Maranda, F. (1998). Groupe de travail sur l'acquisition des données auprès des entreprises. Document interne de Statistique Canada.

Särndal, C.-E., Swensson, B. et Wretman, J. (2003). Model Assisted Survey Sampling.

Le Programme intégré de la statistique des entreprises

Statistique Canada

Le 17 juin 2015

En 2010, Statistique Canada a lancé le Programme intégré de la statistique des entreprises (PISE) pour avoir un modèle plus efficient pour la production de statistiques économiques. L'objectif principal était d'améliorer le programme de la statistique économique pour qu'il demeure aussi solide et souple que possible tout en allégeant le fardeau des entreprises répondantes.

Le PISE englobe une soixantaine d'enquêtes réparties entre quatre grands secteurs : fabrication, commerce de gros et de détail, services (y compris la culture) et dépenses en immobilisations. En 2019-2020, le PISE comprendra environ 150 enquêtes économiques couvrant tous les secteurs de la statistique économique.

Les changements au programme permettront à Statistique Canada de continuer de produire un ensemble uniforme et cohérent de statistiques économiques. De même, les utilisateurs des données et les chercheurs pourront plus facilement combiner les données économiques avec des renseignements d'autres sources pour effectuer leurs analyses.

Le PISE utilise un cadre normalisé pour les enquêtes économiques menées à Statistique Canada. Ce cadre comporte :

  • l'utilisation d'un Registre des entreprises commun comme base de sondage unique
  • l'optimisation de l'utilisation des données administratives pour alléger le fardeau de réponse des entreprises
  • le recours à des questionnaires électroniques comme principal mode de collecte
  • l'harmonisation des concepts et du contenu des questionnaires
  • l'adoption de méthodes communes d'échantillonnage, de collecte et de traitement.

Quels sont quelques-uns des changements les plus importants?

  • Une nouvelle approche de l'échantillonnage permet de veiller à ce que l'on pose uniquement aux entreprises les questions qui se rapportent à leurs activités. Cela crée une situation gagnant-gagnant pour Statistique Canada et les répondants. Statistique Canada réduit ainsi l'effort de collecte et a de meilleures chances de recueillir l'information requise pour produire des statistiques officielles qui soient pertinentes pour les Canadiens. Il réduit du même coup le temps que les répondants dans les entreprises doivent passer à répondre à des questionnaires.
  • L'utilisation accrue des données administratives permet d'alléger le fardeau de réponse des entreprises. Les fichiers de données administratives (comme les fichiers d'impôt sur le revenu des sociétés) sont exploités à fond comme substituts directs d'un sous-ensemble d'unités échantillonnées et pour l'imputation en cas de non-réponse. Pendant la transition au modèle du PISE, on a adapté les méthodes d'imputation afin de tirer plein parti de la disponibilité des données administratives. Cela a permis d'alléger davantage le fardeau de réponse dans l'ensemble des programmes d'enquête. La majorité des entreprises échantillonnées ne sont plus tenues de fournir des données dans le cas des renseignements concernant leurs revenus et leurs dépenses qui sont disponibles dans les données fiscales. Les questionnaires du PISE servent à recueillir de l'information qui n'est pas disponible dans les fichiers de données administratives, comme des données sur les biens et services produits et les pratiques commerciales.
  • Une nouvelle approche cohérente pour produire des estimations provinciales et territoriales utilise les renseignements qui existent déjà dans le Registre des entreprises de Statistique Canada pour déterminer les parts de revenus, de dépenses et de valeur ajoutée des provinces et territoires. Cela permet une approche cohérente et normalisée qui est la même dans toutes les enquêtes du PISE. Auparavant, ces données s'obtenaient directement de chaque répondant, et cette façon de procéder contribuait au fardeau de réponse.
  • Les questionnaires électroniques constituent désormais le principal mode de collecte de données auprès des entreprises répondantes. Les entreprises répondent aux enquêtes en utilisant une application en ligne sécurisée. Ainsi, on obtient un processus de collecte plus efficace et de qualité supérieure. De plus, la qualité des statistiques de l'enquête peut être améliorée parce que les questionnaires électroniques sont assortis de contrôles intégrés conçus pour limiter les erreurs de déclaration qui peuvent se produire dans les questionnaires papier.
  • La couverture accrue de la population d'entreprises permet un ensemble plus complet de statistiques sur les entreprises. À compter de l'année de référence 2013, la population visée par la série de programmes annuels d'enquêtes économiques s'est élargie et englobe désormais toutes les entreprises, quelle que soit leur taille. Les années précédentes, les entreprises dont les ventes étaient relativement petites n'étaient pas incluses dans la base centrale des entreprises de Statistique Canada. Toutefois, grâce à la nouvelle technologie d'autocodage, il est maintenant possible de classer dans cette base centrale toutes les entreprises en activité dans l'économie canadienne, quelles que soient leurs ventes. Par conséquent, grâce à cet élargissement de couverture, les estimations fondées sur le PISE représenteront mieux la population des entreprises opérant au Canada.
  • Les questionnaires ont été mis à jour en fonction de la plus récente terminologie des entreprises et des plus récentes pratiques comptables des entreprises canadiennes. En outre, les questionnaires mettent en application les nouvelles classifications normalisées qu'utilise Statistique Canada, telles que le Système de classification des industries de l'Amérique du Nord et le Système de classification des produits de l'Amérique du Nord.

Ces changements auront-ils des répercussions sur la comparabilité des données dans le temps?

L'étendue des changements au programme des statistiques des entreprises qui font partie du PISE fera que certaines séries pourraient ne plus être compatibles avec les estimations de périodes précédentes. Par exemple, l'augmentation de la population d'entreprises à elle seule signifie que les estimations auront tendance à être plus élevées que celles précédemment publiées.

Pour certaines séries, les changements de 2013 seront minimes et les comparaisons avec les estimations de 2012 seront cohérentes. Dans d'autres cas, les répercussions pourraient être importantes, donnant lieu à des bris de continuité entre les estimations de 2012 et de 2013.

Reconnaissant l'importance de la continuité des données, Statistique Canada a analysé les estimations de 2013 en les comparant avec les données de 2012 pour déterminer s'il y a eu un bris de la continuité des séries. Parmi les techniques d'évaluation, on peut mentionner :

  • évaluation des estimations des enquêtes à tous les niveaux de détail (national, infranational, SCIAN);
  • comparaison des estimations obtenues des enquêtes infra-annuelles (là où il y a lieu);
  • comparaison des renseignements fiscaux;
  • analyse des résultats des répondants communs en 2012 et 2013;
  • comparaison des mouvements historiques par répondant et par l'industrie de façon générale.

On a constaté un bris de continuité de la série entre 2012 et 2013 lorsque la direction et l'ampleur du changement, pour une variable/province ou territoire/industrie, se trouvait à l'extérieur de la limite de tolérance particulière de l'enquête. On entend par « limite de tolérance » en partie la limite entre la plus forte augmentation et la plus forte diminution établie par un modèle de prévision. La limite de tolérance pourrait aussi subir l'influence de comparaisons avec des données de confrontation auxiliaires, comme celles signalées plus haut.

La détermination d'un bris de série met l'accent sur les principales variables agrégées seulement. Ces variables comprennent le revenu total, les revenus d'exploitation totaux, les dépenses totales, les dépenses d'exploitation totales, les salaires et traitements et l'amortissement. Compte tenu de la nature et de la portée des changements apportés au programme d'enquêtes, les bris de série pour les variables plus détaillées sont inévitables et ne seront pas analysées par l'organisme.

Dans tous les cas, les utilisateurs sont informés qu'il peut exister des bris de série et qu'ils devraient faire preuve de discernement dans les comparaisons avec les données de 2012.

Lorsque les estimations de l'année de référence 2014 seront disponibles, on procédera aux révisions des données de 2013, comme d'habitude. À ce moment-là, les estimations de 2012 pourront également être révisées, étant donné que de nouvelles données seront disponibles.

Qui utilisera les nouvelles estimations du PISE?

  • Les entreprises utilisent les estimations pour mieux comprendre leur rendement dans leur industrie donnée par rapport à la moyenne de l'industrie.
  • Les analystes de l'industrie utilisent les estimations du PISE pour analyser le rendement de certaines industries dans l'économie canadienne, sur le plan national et régional.

Les données du PISE sont le principal intrant dans le Système canadien des comptes macroéconomiques. Elles sont d'abord rajustées en fonction des concepts et des définitions de la comptabilité macroéconomique, puis intégrées dans les cadres de comptabilité macroéconomique. Cette intégration oblige à rajuster les données pour respecter les identités des comptes macroéconomiques et veiller à la cohérence dans le temps. Ces données forment les éléments de base de la mesure de référence de Statistique Canada pour ce qui est du produit intérieur brut et elles sont un intrant clé dans les estimations servant à déterminer les paiements de péréquation et la répartition des revenus de la taxe de vente harmonisée.

Périodiquement, Statistique Canada procède à des changements à grande échelle dans le cadre de son processus de renouvellement des enquêtes. Les nouvelles données du PISE seront intégrées aux comptes macroéconomiques. Les nouvelles données peuvent toujours entraîner certains changements ou certaines révisions aux comptes nationaux, mais le cadre du Système de comptabilité nationale donne la garantie que les estimations des comptes nationaux sont solides et cohérentes.

Calendrier de diffusion

Pour mettre en œuvre cette importante initiative, Statistique Canada prend toutes les mesures nécessaires pour effectuer les vérifications finales des données et des systèmes. Les statistiques économiques annuelles sont habituellement disponibles environ 15 mois après la période de référence, mais, à la suite de la transformation majeure amenée par le PISE, il n'a pas été possible de maintenir ce calendrier de diffusion. Statistique Canada est engagé à diffuser les données le plus tôt possible, une fois que toutes les vérifications d'assurance de qualité et de confidentialité auront été effectuées.

On prévoit que, à compter de l'année de référence 2014, le calendrier de diffusion reviendra à l'objectif de publication dans les 15 mois de la période de référence.

Pour plus d'information

Pour une explication plus détaillée des changements, prière de consulter l'Aperçu du programme intégré de la statistique économique dans le site Web de Statistique Canada.

On peut obtenir plus d'information sur les aspects techniques de l'échantillonnage et de l'estimation sur demande.


Pour plus d'information, communiquer avec les Relations avec les médias (613-951-4636; statcan.mediahotline-ligneinfomedias.statcan@statcan.gc.ca).
This document is also available in English.