Estimateurs de la variance robustes pour estimateurs par la régression généralisée dans des échantillons en grappes
Section 2. Résultats théoriques
Supposons une population ayant
grappes. Dans la grappe
il y a
éléments de sorte qu’il y a
éléments dans la population. L’univers
des grappes est exprimé par
et l’univers des éléments dans
la grappe
est
La variable d’analyse
est associée à l’élément
de la grappe
La population totale de
est
Chaque élément de population a
également un vecteur
de variables auxiliaires,
qui peut être utilisé dans l’estimation.
On sélectionne un échantillon à deux degrés sans remise aux premier et deuxième
degrés. La probabilité de sélection de la grappe
est
et
est la probabilité de sélection
conditionnelle de l’élément
dans la grappe
La probabilité globale de
sélection de l’élément
est
Soit
l’ensemble de grappes d’échantillon
et
l’ensemble d’éléments d’échantillon
dans la grappe
Le nombre de grappes d’échantillon
est
tandis que le nombre d’éléments
d’échantillon sélectionnés de la grappe d’échantillon
est
La taille de l’échantillon total
des éléments est
Dans le modèle de travail, supposons que
le vecteur
des variables d’analyse, suit le
modèle linéaire suivant :
où l’indice
désigne une espérance par
rapport à un modèle; est la matrice
des variables auxiliaires et
est la matrice
des variables auxiliaires pour
les éléments
dans la grappe
et
est un vecteur de paramètre de
longueur
On suppose que les éléments des
grappes sont corrélés tandis que les éléments des différentes grappes sont
indépendants selon le modèle. Ainsi, la matrice de covariance
est une matrice diagonale par
blocs
avec des matrices diagonales
Une des principales
caractéristiques des estimateurs de la variance que nous proposons est qu’il n’est
pas nécessaire de connaître la forme particulière de
pour construire les estimateurs
de la variance. Les estimateurs de la variance proposés seront convergents,
quelle que soit la forme de
Särndal et coll. (1992,
chapitre 8) examinent trois estimateurs GREG différents pouvant être
utilisés dans les échantillons en grappes. Tous trois dépendent des données
disponibles. Considérons leur cas B, qui se produit lorsque des données au
niveau de l’unité sont disponibles pour l’échantillon complet et que des totaux
de contrôle sont disponibles pour la population. Dans ce cas, l’estimateur GREG
est
où
est le vecteur
des
pour les éléments d’échantillon,
est l’estimateur
du total des
est le vecteur
des totaux de population des
est l’estimateur
de
et (si
est connu)
avec
la matrice des variables
auxiliaires de l’échantillon, et
est la partie de
associée aux éléments d’échantillon;
et
où
est un vecteur de
valeurs 1.
La composante du poids
de la grappe d’échantillon
est
étant la matrice
des variables auxiliaires pour
les éléments d’échantillon dans la grappe d’échantillon
est la partie
de
pour les éléments d’échantillon
dans la grappe d’échantillon
et
est un vecteur de
valeurs 1. Puisque
est généralement inconnu, une
valeur de substitution
peut être utilisée pour
est un choix courant. Plus bas,
nous supposons qu’une valeur générale
est utilisée dans l’estimation
par la régression généralisée plutôt que
2.1 Estimateurs de la variance actuels
Särndal et coll. (1992,
résultat 8.9.1) présentent un estimateur de la variance par rapport au
plan
qui comporte des probabilités de
sélection conjointe des grappes et des éléments des grappes. En cas d’échantillonnage
de Poisson, aux deux degrés, leur estimateur est
où
est la composante
du vecteur
et
Les calculs pour cet estimateur
sont plus simples que la formule générale qui utilise des probabilités de
sélection conjointe et peut avoir des performances satisfaisantes en cas de
plans
où l’on peut obtenir une
approximation de la variance des estimateurs par des formules qui supposent une
indépendance entre les sélections.
Voici un estimateur approprié si l’échantillonnage
au premier degré est sélectionné avec remise :
avec
et
L’estimateur par linéarisation
jackknife est (Yung et Rao, 1996)
où
et
étant la composante
du vecteur
La méthode jackknife est une autre
technique courante d’estimation de la variance. Krewski et Rao (1981)
présentent plusieurs façons asymptotiquement équivalentes d’exprimer le
jackknife. La forme suivante de l’estimateur jackknife constitue un point de
départ pratique pour les calculs qui suivent :
où
est la valeur de l’estimateur
GREG après suppression de la grappe
et
est la moyenne de toutes les
estimations
L’utilisation de (2.6) peut
exiger d’importantes ressources de calcul, car il faut calculer
estimations différentes de
Les estimateurs
et
sont tous convergents par
rapport au plan de sondage dans les conditions de Krewski et Rao (1981) et de
Yung et Rao (1996). L’une de leurs principales conditions était que les grappes
devaient être sélectionnées avec remise. Cette hypothèse simplifie les calculs
théoriques, mais elle est utilisée seulement par souci de commodité. En effet,
de nombreuses études empiriques ont démontré que les résultats théoriques
étaient de bons prédicteurs de la performance des estimateurs dans les plans
sans remise, tant que la fraction de sondage au premier degré est petite.
2.2 Nouveaux estimateurs de la variance
Nous utilisons le cadre fondé sur un
modèle pour construire de nouveaux estimateurs de la variance. En premier lieu,
nous calculons la variance fondée sur le modèle de
Supposons que le modèle (2.1) se
vérifie et que l’échantillonnage est ignorable, en ce sens que la probabilité
qu’une unité soit dans l’échantillon donné
et
dépend seulement de
(voir par exemple la discussion
dans Valliant, Dorfman et Royall, 2000, section 2.6.2 et les références
supplémentaires qui y sont citées). Ensuite, nous construisons des estimateurs
de la variance du modèle, au moyen d’ajustements de la matrice chapeau pour
tenir compte de l’hétérogénéité dans les données. Nous évaluons les propriétés
fondées sur le plan de sondage des nouveaux estimateurs de la variance dans une
simulation.
Pour calculer la variance du modèle de
soit
le vecteur de population des
variables d’analyse pour la grappe
et
le vecteur des éléments d’échantillon.
Comme le montre l’annexe A.2,
sous le modèle (2.1), la variance fondée sur le modèle de
est :
où
la partie de
associée à des éléments dans
et
et
sont des vecteurs de
et
1.
La variance de l’erreur fondée sur le
modèle de
nécessite de connaître
pour toute la population. En l’absence
de solides hypothèses établissant un lien entre les structures de covariance de
l’échantillon et hors de l’échantillon, les composantes de
associées aux valeurs non
échantillonnées ne peuvent pas être estimées à partir de l’échantillon.
Cependant, comme le montre l’annexe A.2,
dans certaines conditions raisonnables, les ordres des termes sont
et
de sorte que
domine la variance à mesure que le nombre de
grappes d’échantillon et de population augmente. Ainsi,
où
désigne la variance du modèle asymptotique
selon les hypothèses de l’annexe A.1. On peut former un estimateur robuste
du deuxième membre de (2.7) même si
est inconnu. En revanche, si le nombre de
grappes de population augmente au même taux que les grappes d’échantillon (c’est-à-dire
que
converge vers une constante non nulle), alors
et
peuvent tous contribuer de façon importante à
la variance asymptotique. Dans le présent article, nous examinerons uniquement
l’estimation de
À
moins que la vraie matrice de variance de
soit connue, il faut estimer
À l’annexe A.3, nous montrons que
dans les grands échantillons
où
avec
et
étant la matrice
des variables auxiliaires pour
les éléments d’échantillon dans la grappe d’échantillon
Si on substitue
à
dans (2.7), on obtient l’estimateur
sandwich
D’après les résultats présentés à l’annexe A.3,
est approximativement sans biais pour
dans les grands échantillons. Cet estimateur
sandwich est aussi étroitement lié à l’estimateur par grappe ultime fondé sur
le plan de sondage pour un plan dans lequel les grappes sont sélectionnées avec
remise, qui est, à son tour, semblable à
et
avec un échantillonnage avec remise. Par
conséquent,
possède des propriétés souhaitables fondées à
la fois sur le plan et sur le modèle.
Dans
les échantillons de taille petite à moyenne,
présente un biais par rapport au modèle et
sous-estime souvent la variance véritable. On peut ajuster la matrice chapeau
pour le corriger. Comme on le montre l’annexe A.3,
où
et
étant les parties
de
et
étant associé à la grappe d’échantillon
Comme dans Li et Valliant (2009) et Valliant
(2002), on peut recueillir
dans une matrice chapeau pondérée selon
l’enquête :
Selon les hypothèses de l’annexe A.1,
ce qui permet de conclure que
Les sous-matrices diagonales
sont des matrices analogues aux effets de
levier dans un échantillonnage à un degré. Dans une régression des moindres
carrés ordinaires, le vecteur des valeurs prédites peut s’écrire
avec
Les effets de levier sont des diagonales de la
matrice chapeau,
qui peuvent servir à corriger un petit biais
d’échantillon dans
comme estimateur de
Nous utilisons
de façon analogue ci-dessous.
Pour
tenir compte du fait que
présente un biais par rapport au modèle pour
les échantillons petits à moyens, nous apportons des ajustements de type levier
à
Si
et que l’échantillon est autopondéré (c’est-à-dire
pour certains
alors
(voir l’annexe A.3). Si on résout
et le substitue dans (2.8), on obtient l’estimateur
de la variance :
qui, dans ce cas particulier, est aussi approximativement sans biais
étant donné que
Une des caractéristiques indésirables de
est qu’il peut être négatif ou avoir des
contributions négatives de certaines grappes si
Pour ces grappes, le remplacement de
par
permet d’obtenir un estimateur de la variance
positif. Cet ajustement est utilisé dans la simulation de la section 3.
Aux
annexes A.4 et A.5, nous montrons que l’estimateur
de la variance jackknife peut être écrit exactement comme suit :
où
Cette forme de
réduit considérablement les
calculs, puisqu’une seule estimation GREG est nécessaire, au lieu de
estimations. (Il va de soi qu’il
peut être avantageux de recalculer l’estimation par l’estimation par la
régression généralisée GREG pour chaque réplique jackknife si un ajustement de
non-réponse élaboré influe sur la taille de la vraie variance.)
Dans les grands échantillons, on peut
établir approximativement
par :
ou par
Les estimateurs
et
sont des versions en grappes des
approximations à un degré du jackknife dans Valliant (2002, équations (3.5),
(3.6)).
Comme l’esquisse l’annexe A.6,
et
équivalent tous asymptotiquement à
Comme
et
sont convergents par rapport au plan de
sondage, on peut s’attendre à ce que les autres estimateurs ci-dessus donnent
de bons résultats sur des échantillons répétés quand la taille de l’échantillon
au premier degré est grande et que le modèle (2.1) est approximativement
correct. Il faut cependant garder en tête que la fraction d’échantillonnage des
grappes doit être petite pour que les estimateurs construits à partir d’un
échantillon au premier degré sans remise aient les mêmes performances que si l’échantillon
avait été sélectionné avec remise.
Aucun de ces estimateurs de type sandwich
ne comprend de facteurs de correction de la population finie. Ils peuvent par
conséquent avoir tendance à surestimer la variance d’échantillonnage quand une
grande proportion des grappes d’échantillon est sélectionnée. Pour tenir compte
de cela, nous pouvons rajuster davantage tous les estimateurs de la variance de
façon ponctuelle en multipliant les estimateurs de la variance par un facteur
de correction de population finie, noté
tel qu’il a été élaboré par Kott
(1988). Il en résulte les estimateurs ajustés suivants :
Quand un échantillon aléatoire simple
est sélectionné au premier degré,
D’après Kott (1988), une
correction appropriée quand le premier degré est sélectionné avec des
probabilités variables est
où
est la probabilité de tirage
unique pour la grappe
c’est-à-dire la probabilité que
la grappe
soit sélectionnée dans un
échantillon de taille 1.