Appendice III : Poids d'échantillonnage pour tenir compte du plan de sondage complexe de l'Enquête sur la population active

Warning Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

L'échantillon de l'Enquête sur la population active (EPA) est tiré d'une base aréolaire et est fondé sur un plan d'échantillonnage stratifié à plusieurs degrés qui utilise l'échantillonnage probabiliste. Tout d'abord, la population des provinces et des régions du Canada est répartie en strates. Plutôt que de sélectionner les logements dans les strates directement, un échantillon de petits secteurs bien définis appelés grappes est sélectionné dans chaque strate à la première étape de l'échantillonnage. On dresse une liste de tous les logements des grappes sélectionnées, et un échantillon de logements est choisi à partir de chaque liste à la deuxième étape de l'échantillonnage. Quelques strates à trois degrés sont créées au Québec, en Ontario, en Alberta et en Colombie-Britannique pour englober les centres urbains isolés.

Outre la prise en compte des probabilités différentes de sélection dans l'échantillon, ainsi que de la non-réponse et de la couverture, on devrait aussi contrôler la mise en grappes et la stratification du plan d'échantillonnage, afin d'obtenir l'erreur-type correcte. Même si la stratification augmente habituellement la précision des estimations de paramètres, la mise en grappes de l'échantillon la réduira habituellement. Deux poids sont particulièrement pertinents pour les estimations de la variance à partir d'une analyse descriptive et multidimensionnelle sur la base des fichiers de tabulations (TABS) de l'EPA : 1) sous-poids (SUBWT); et 2) poids finaux (FINALWT). Les poids finaux sont utilisés pour produire les estimations moyennes du groupe dans le document, afin que les chiffres soient produits sur la base des chiffres de population correspondant aux projections du recensement. Les poids finaux intègrent des données auxiliaires, comme les estimations de la population du recensement et l'échantillon commun à deux mois consécutifs de données d'enquête. Pour l'analyse multidimensionnelle dans le présent document, on utilise des sous-poids comme poids d'échantillonnage plutôt que des poids finaux. En fait, les sous-poids et les poids finaux peuvent être tous les deux utilisés dans les analyses multidimensionnelles. Ces deux types de poids tiennent compte du plan de sondage complexe de l'EPA. Toutefois, étant donné qu'il n'existe pas de solution explicite pour rajuster en fonction des erreurs-types grâce aux poids finaux lorsque l'on utilise un logiciel statistique général (comme STATA), on peut utiliser les sous-poids, compte tenu de la complexité que représente l'utilisation des poids finaux. L'utilisation de sous-poids dans l'analyse produirait en général des estimations plus conservatrices (c.-à-d. des erreurs-types plus grandes).

Les logiciels statistiques courants comme STATA peuvent produire des erreurs-types qui tiennent compte du plan de sondage complexe. À cette fin, on peut utiliser des commandes SVY au moment de la détermination des poids d'échantillonnage, de la stratification et de la mise en grappes. Depuis 1976, les données de l'EPA sont recueillies au moyen de quatre plans d'échantillonnage différents, à partir des données mises à jour des recensements décennaux. Ces plans d'échantillonnage différents englobent les périodes de 1975 à 1984, de 1985 à 1994, de 1995 à 2004 et de 2005 à aujourd'hui. Même si des identificateurs de plan d'échantillonnage sont disponibles dans les fichiers de données de l'EPA à partir de 1997, ils ne sont pas disponibles dans les fichiers antérieurs et doivent être calculés. Voir Chan (2011) pour un examen plus détaillé de la façon dont les erreurs-types appropriées peuvent être calculées à partir des données de l'EPA.

Suivant | Précédent

Date de modification :