Estimateurs de la variance robustes pour estimateurs par la régression généralisée dans des échantillons en grappes
Section 1. Introduction

L’estimation par la régression généralisée (GREG) est une technique courante utilisée pour caler les estimations, réduire les erreurs d’échantillonnage et corriger les erreurs non dues à l’échantillonnage. Les enquêtes officielles auprès des ménages utilisent souvent la régression généralisée pour caler des estimations fondées sur les données d’échantillon aux contrôles de population, assurer des estimations convergentes des caractéristiques démographiques dans l’ensemble des enquêtes, et réduire les erreurs de non-réponse et de sous-dénombrement. L’estimation par la régression généralisée est également fréquemment utilisée parce qu’elle tire sa puissance des données auxiliaires, ce qui entraîne des erreurs d’échantillonnage plus petites que celles d’autres estimateurs fondés sur le plan.

Les techniques utilisées couramment pour estimer les erreurs d’échantillonnage des estimateurs calés à partir d’échantillons complexes soit nécessitent d’importantes ressources de calcul, soit tendent à sous-estimer les erreurs d’échantillonnage véritables, surtout en cas de taille d’échantillon petite ou moyenne. Deux des techniques courantes d’estimation de la variance d’échantillonnage des estimateurs GREG sont la linéarisation et le rééchantillonnage. Les estimateurs par la linéarisation (Särndal, Swensson et Wretman, 1989) ne convergent peut-être pas assez rapidement vers l’erreur d’échantillonnage véritable pour produire des résultats exacts dans des échantillons petits ou moyens. Särndal, Swensson et Wretman (1992, page 176) constatent que « pour des statistiques complexes comme un estimateur de variance de covariance ou de coefficient de corrélation pour la population, il se peut qu’il faille des échantillons assez grands pour que le biais soit négligeable ». Par ailleurs, d’autres techniques de rééchantillonnage comme le jackknife et le bootstrap qui produisent généralement des estimations de la variance plus importantes peuvent exiger d’importantes ressources de calcul.

Les estimateurs sandwich ajustés pour les effets de levier constituent une autre méthode d’estimation des erreurs d’échantillonnage fondées sur le plan de sondage ayant également des justifications fondées sur un modèle. Royall et Cumberland (1978) ont appliqué cette méthode pour concevoir des estimateurs de la variance de prédiction d’estimateurs des totaux de population finie. À partir d’un cadre fondé sur un modèle, Long et Ervin (2000) et MacKinnon et White (1985) ont montré comment l’estimateur sandwich pouvait servir à l’estimation de la variance pour des estimateurs de paramètres de régression, même lorsque la composante variance du modèle de travail était spécifiée de façon erronée. Valliant (2002) a adopté cette méthode pour estimer la variance fondée sur le plan d’estimateurs GREG à un degré d’échantillonnage. Le présent article prolonge le travail de Valliant en l’appliquant aux plans d’échantillonnage en grappes.

À la section 2, nous présentons l’estimateur GREG et plusieurs estimateurs de la variance de substitution. Tous les calculs sont en annexe. À la section 3, nous montrons les performances des nouveaux estimateurs de la variance dans plusieurs simulations. À la section 4, nous synthétisons nos constatations par une conclusion.


Date de modification :