3. Estimation de la variance de l’estimateur par calage en une étape
Phillip S. Kott et Dan Liao
Précédent | Suivant
À la présente section, nous posons que
est l’estimateur pondéré par calage de
où
quand
est le
poids de calage, et
est
défini de façon commode comme étant égal à 0 quand
La
fonction d’ajustement des poids
est
définie implicitement par l’équation (2.4), et
est de nouveau
choisi de façon que l’équation de calage (2.5) soit vérifiée pour
ou
Nous proposons l’estimateur suivant de
la variance de
où
est la
probabilité de sélection conjointe de
et
sous le
plan d’échantillonnage original,
quand
et 0
autrement,
et
Nous
montrerons que
dans
l’équation (3.1) peut être quasi sans biais dans un certain sens si soit un modèle de réponse (section 3.1) soit un modèle de prédiction est
vérifié (section 3.2).
L’estimateur de variance dans
l’équation (5.2) de Kott (2006) est identique à
dans l’équation (3.1) quand
L’estimateur de variance dans Kim et Haziza
(2014) est également similaire. Leur modèle de prédiction est plus général que
le modèle de prédiction linéaire considéré ici.
Cet estimateur de variance
présuppose que le plan d’échantillonnage
original est tel que chaque élément ne peut être tiré qu’une seule fois. À la
section 3.1, nous voyons que, quand les probabilités de réponse sont
indépendantes (Poisson), alors sous des hypothèses faibles,
est un estimateur quasi sans biais de l’erreur
quadratique moyenne de
sous le quasi-plan d’échantillonnage, que le
modèle de prédiction,
soit vérifié ou non.
À la section 3.2, nous montrons
que
est un estimateur quasi sans biais pour le
modèle de prédiction combiné à la variance sous le plan d’échantillonnage
original de
en tant qu’estimateur de
que le modèle de réponse donné par l’équation
(2.4) soit vérifié ou non. Donc,
peut être appelé un « estimateur
simultané des variances ».
3.1 Estimation de la
variance sous le modèle de réponse
Pour simplifier l’exposé, nous
supposerons que le modèle de réponse donné par l’équation (2.4) avec une borne
supérieure
finie est vérifié. Les conditions suffisantes
pour que
soit un estimateur quasi sans biais de
l’erreur quadratique moyenne de
(en vertu desquelles le biais converge vers 0
quand la taille de l’échantillon devient arbitrairement grande) sont
et
est de plein rang et est bornée en
probabilité quand la taille de l’échantillon devient arbitrairement grande.
En vertu de cela, de
étant bornée quand
est finie, et de l’inégalité de Cauchy-Schwarz
il n’est pas difficile de voir non seulement
que
est un estimateur convergent de
mais aussi que
dans l’équation (3.2) (qui peut être rendue
sous la forme
possède une limite en probabilité, que nous
appellerons
que le modèle de prédiction soit vérifié ou
non. En outre,
ainsi que
sont
Observons que
où
L’insertion de
dans le
« coefficient de régression »
nous
permet d’ignorer la contribution du deuxième terme de cette somme,
à
l’erreur quadratique moyenne sous le quasi-plan d’échantillonnage. Il en est
ainsi parce que
est vraie
par définition, ce qui implique
que
est
sous nos
hypothèses. En outre, puisque
est
aussi
est
qui est
asymptotiquement ignorable par rapport aux deux composantes
de
La contribution de
étant éliminée, un estimateur sans biais
idéalisé, mais incalculable, de l’erreur quadratique moyenne sous le quasi-plan
d’échantillonnage de
est donné par
où le premier terme du deuxième membre estime
l’erreur quadratique moyenne avant la non-réponse (s’il y en a une) et le
deuxième terme estime la variance ajoutée par la non-réponse.
Un estimateur quasi sans biais idéalisé
de l’erreur quadratique moyenne de rechange, plus près d’être calculable, est
donné par
où de nouveau
quand
autrement. Puisque les
sont
indépendants sous le modèle de réponse et sont de moyenne
et de
variance
quand
Par
contre, l’expression qui suit est vérifiée quand
La
première sommation dans le deuxième membre de l’équation (3.7) contient des termes où
et des termes où
les derniers faisant que la deuxième sommation dans (3.7) diffère
de la deuxième sommation dans le deuxième membre de l’équation (3.6). Notons que l’espérance sous le modèle de
réponse de
dans la
deuxième sommation dans le deuxième membre de (3.7) est
Enfin,
peut être remplacé par l’estimateur
asymptotiquement identique, mais calculable,
dans l’équation (3.1) puisque
est borné pour tout
sous les hypothèses (3.3) et (3.4), ce qui
permet de substituer
et
à
et
inconnus, respectivement (parce que
et
sont
pour tout
3.2 Estimation de la
variance sous le modèle de prédiction
Les choses sont un peu plus simples
quand nous supposons qu’un modèle de prédiction est vérifié mais que le modèle
de réponse de l’équation (2.4) ne l’est pas nécessairement. Supposons que
peu importe que l’unité
soit
échantillonnée ou non ou qu’elle réponde ou non quand elle est échantillonnée,
et que les
sont
des variables aléatoires non corrélées de variance égale à
où
ne nécessite pas d’autres spécifications que
le fait d’avoir des composantes finies.
L’erreur quadratique moyenne de
en tant qu’estimateur de
sous le modèle de prédiction est égale à la
somme de la variance de prédiction de
en tant qu’estimateur de
(voir, par exemple, Kott 2009, page 69),
et du carré du biais,
ce dernier étant égal à zéro quand
La variance combinée de
en tant qu’estimateur de
sous le modèle de prédiction et le plan
d’échantillonnage original est donnée par
où l’indice inférieur
indique
que l’opération (variance ou espérance) est effectuée par rapport au plan
d’échantillonnage original. Rappelons que
pour
Pour voir que
dans l’équation (3.1) donne un estimateur
quasi sans biais de
observons d’abord que
Soit
quand
et
autrement. Parce que les
ne sont pas corrélés, et que
il est maintenant facile de montrer que
pour presque chaque paire
sous le modèle de prédiction quand
converge vers une matrice inversible, et que
les hypothèses (3.3), (3.4), et
sont vérifiées. Observons que le changement
provenant des hypothèses dans (3.5) à (3.8) fait que le biais relatif de
est un
estimateur de
plutôt
que
Précédent | Suivant