Une mesure de l’effet de plan pour la pondération par calage dans les échantillons à un degré 1. IntroductionUne mesure de l’effet de plan pour la pondération par calage dans les échantillons à un degré 1. Introduction

Sous sa forme générale, l’effet de plan $(deff)$ mesure l’augmentation ou la diminution relative de la variance d’un estimateur attribuable aux écarts par rapport à l’échantillonnage aléatoire simple. Kish (1965) a présenté le $deff$ comme un moyen commode d’évaluer l’effet de la mise en grappes, ou groupement, sur l’estimateur d’une moyenne. Park et Lee (2004) offrent un historique partiel de la formulation et de l’utilisation du $deff .$ Les effets de plan sont particulièrement utiles lorsqu’on cherche à déterminer approximativement la taille totale d’échantillon nécessaire dans le cas d’un échantillonnage en grappes. La mise en grappes entraîne habituellement une certaine perte d’efficacité et la variance d’un échantillon aléatoire simple, qu’il est facile de calculer, peut être multipliée par un $deff$ pour donner une approximation de la variance que l’on obtiendrait à partir d’un échantillon en grappes. Cette approximation peut, à son tour, être utilisée pour déterminer la taille totale d’échantillon nécessaire dans le cas d’un échantillon en grappes pour obtenir un niveau de précision souhaité. Des travaux ultérieurs menés par Rao et Scott (1984) et d’autres ont montré que des versions plus compliquées du $deff$ étaient utiles pour ajuster les statistiques inférentielles calculées d’après les données d’une enquête complexe.

Une version spécialisée du $deff$ a été proposée dans Kish (1965), qui tenait uniquement compte de l’effet de l’utilisation de poids qui ne sont pas tous égaux. Kish a calculé l’« effet de plan dû à la pondération » dans une situation où des poids variables étaient utilisés pour d’autres raisons que l’efficacité statistique. Cependant, dans le cas de certains plans d’échantillonnage et estimateurs, l’utilisation de poids variables peut être relativement efficace. Une enquête sur les établissements où les variances de population des variables d’analyse diffèrent nettement d’une industrie à l’autre en est un exemple. Le calage sur des comptes de population peut aussi produire des poids de tailles différentes, mais il s’agit d’un outil essentiel pour essayer de corriger les erreurs de couverture dans certaines enquêtes, dont les enquêtes téléphoniques. Spencer (2000) a proposé une approche assistée par modèle simple pour estimer l’effet, sur la variance, de l’utilisation de poids variables dans une situation où une variable d’analyse dépend d’une seule covariable.

Les mesures de Kish et de Spencer, présentées à la section 2, n’offrent pas une mesure agrégée de l’effet des gains de précision qui peuvent résulter de l’échantillonnage avec probabilités variables et de l’utilisation d’un estimateur par calage, comme l’estimateur par la régression généralisée (GREG). Alors que les effets de plan de Kish visent à mesurer l’effet des poids variables, ils ne sont informatifs que dans des circonstances particulières, ne tiennent pas compte d’autres variables d’intérêt, et peuvent mesurer incorrectement l’effet de la pondération différentielle dans certaines circonstances, faits qui sont mentionnés dans Kish (1992). Les praticiens des sondages doivent être prudents lorsqu’ils appliquent cette mesure dans des scénarios d’échantillonnage informatif et d’estimation pour lesquels il existe une relation intentionnelle entre les poids et les variables d’intérêt. L’approche de Spencer tient sous échantillonnage à un degré avec remise dans le cas d’un estimateur très simple du total construit en prenant comme poids l’inverse des probabilités de sélection sans autre ajustement. Peu d’exemples empiriques visant à comparer ces mesures sont décrits dans la littérature.

Des ajustements par calage sont souvent appliqués pour réduire les variances et corriger le sous-dénombrement et la non-réponse dans les sondages (par exemple Särndal et Lundström 2005; Kott 2009). Quand les covariables de calage sont corrélées au mécanisme de couverture/réponse, les poids de calage peuvent améliorer l’erreur quadratique moyenne (EQM) d’un estimateur. Dans de nombreuses applications, puisque le calage comprend des ajustements au niveau de l’unité, les poids de calage peuvent varier plus que les poids de base ou la non-réponse par catégorie ou les ajustements par poststratification (Kalton et Flores-Cervantes 2003; Brick et Montaquila 2009). Donc, une mesure idéale de l’effet des poids de calage tient compte non seulement de la corrélation entre la variable d’intérêt $y$ et les poids, mais aussi de la corrélation entre $y$ et les covariables de calage $x$ afin d’éviter de « pénaliser » les poids pour la simple raison qu’ils varient.

À la section 3, nous présentons une nouvelle mesure de l’effet de plan qui tient compte de l’effet conjoint d’un plan d’échantillonnage avec probabilités de sélection non égales et d’ajustements des poids inégaux dans la classe plus générale des estimateurs par calage. Nous supposons qu’un plan d’échantillonnage probabiliste est utilisé et qu’il n’existe pas de problèmes de données manquantes qui induiraient une dépendance entre l’inclusion dans l’échantillon et les valeurs de $y .$ Notre mesure agrégée incorpore la variable étudiée, en utilisant une estimation de la variance par la régression généralisée pour refléter les multiples covariables de calage. À la section 4, nous appliquons les estimateurs dans une simulation en utilisant des variables similaires à celles pour lesquelles des données sont recueillies dans les enquêtes auprès des établissements et dans les enquêtes auprès des ménages réalisées par téléphone, et montrons empiriquement comment l’estimateur proposé donne de meilleurs résultats que les méthodes existantes en présence de poids de calage inégaux. La section 5 présente la conclusion.

Politique de rédaction

Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.

Présentation de textes pour la revue

Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).

Note de reconnaissance

Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.

Normes de service à la clientèle

Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.

Droit d'auteur

Publication autorisée par le ministre responsable de Statistique Canada.

L'utilisation de la présente publication est assujettie aux modalités de l'Entente de licence ouverte de Statistique Canada.

N^o 12-001-X au catalogue

Périodicité : Semi-annuel

Ottawa

Date de modification :: 2017-09-20

Sélection de la langue

Recherche et menus

Recherche

Une mesure de l’effet de plan pour la pondération par calage dans les échantillons à un degré 1. IntroductionUne mesure de l’effet de plan pour la pondération par calage dans les échantillons à un degré 1. Introduction