Estimateurs de la variance robustes pour estimateurs par la régression généralisée dans des échantillons en grappes
Section 4. Conclusion

Table des matières

Il a été démontré que les ajustements d’effets de levier des estimateurs standards de la variance réduisent le biais et améliorent la couverture de l’intervalle de confiance fondée sur les estimateurs par régression généralisée dans les échantillons à un degré. Le présent article étend ces résultats à des échantillons à deux degrés en présentant de nouveaux ajustements fondés sur des matrices chapeaux. Notre théorie justifie les ajustements et illustre que certains estimateurs proposés sont liés au jackknife avec suppression de grappe, qui est une procédure commune dans l’estimation par sondage.

Pour mettre à l’épreuve la théorie, nous avons mené une série d’études par simulations sur trois populations conçues pour évaluer le rendement dans des situations diverses. Pour ce, nous avons utilisé une grande fraction de sondage d’unités au premier degré dans une population d’âge scolaire. Dans une deuxième population, constituée à partir des données de l’Enquête sur les collectivités américaines (ACS), nous avons mis à l’épreuve les effets des petites tailles d’échantillon. Dans une troisième population simulée, nous avons examiné les performances d’un grand échantillon. Nous avons employé à la fois un échantillonnage aléatoire simple et un échantillonnage avec probabilités proportionnelles à la taille des grappes.

Les relations des estimateurs de la variance étaient semblables dans tous les plans d’échantillonnage. L’estimateur de la variance avec remise, $υ_{w r},$ qui est le choix par défaut dans les progiciels pour données d’enquête, l’estimateur par linéarisation jackknife, $υ_{J L},$ et l’estimateur de la variance fondé sur le plan, $υ_{g},$ qui suppose un échantillonnage de Poisson à chaque degré pour faciliter les calculs, présentent souvent un biais négatif, ce qui entraîne des intervalles de confiance au taux de couverture inférieur au taux souhaité. Certains estimateurs liés au jackknife $-$ $υ_{Jack},$ $υ_{J 1}$ et $υ_{J 2}$ $-$ qui comprennent explicitement ou implicitement des ajustements de matrice chapeau, ont tendance à produire de grandes valeurs aberrantes quand l’échantillon au premier degré est petit. Cela est particulièrement vrai quand le premier degré est sélectionné par EAS, mais moins dans l’échantillonnage avec PPT quand une mesure de taille efficace est utilisée.

Les estimateurs de la variance proposés ici, en particulier $υ_{D},$ offrent des solutions de rechange à l’estimation de la variance des estimateurs GREG dans des échantillons complexes. Au détriment d’une légère inflation de la variabilité de l’estimateur de la variance, les estimateurs sandwich à la matrice chapeau ajustée, notés ici par $v_{D},$ $v_{J 1}$ et $v_{J 2},$ donnent une couverture de l’intervalle de confiance plus proche de la valeur nominale dans les échantillons petits à moyens. Selon le plan d’échantillonnage et les caractéristiques de la population, les estimateurs à la matrice chapeau ajustée peuvent produire des estimations de la variance moins biaisées et de meilleures inférences comparativement aux méthodes standards.

Remerciements

Les auteurs remercient le rédacteur associé et deux examinateurs, dont les commentaires ont considérablement amélioré l’article.

Annexe

Résultats théoriques

A.1 Hypothèses

Voici les hypothèses utilisées pour l’obtention de résultats asymptotiques. Le nombre de populations et de grappes d’échantillons tend vers l’infini. Cependant, le nombre de grappes de population augmente plus rapidement que le nombre de grappes d’échantillon. Certaines quantités de population sont supposées bornées.

A.1.1

m / M \to 0

quand $m \to \infty$ et

M \to \infty .

A.1.2

Tous les $N_{i}$ et $n_{i}$ sont bornés.

A.1.3

π_{i k} = O (m / M)

pour tous les

i k .

A.1.4

Tous les éléments de

X,

$Ψ$ et $Q$ sont bornés.

A.1.5

Le plan d’échantillonnage est tel que $\frac{\sqrt{m}}{M} ({\hat{t}}_{x π} - t_{U x}) \overset{d}{\to} N (0, V),$ où $V$ est une matrice définie positive $p \times p,$ c’est-à-dire que

({\hat{t}}_{x π} - t_{U x}) = O_{p} (M / \sqrt{m}) .

Étant donné que $Π = O (\frac{m}{M})$ élément par élément et $A = X_{s}^{⊤} Q^{- 1} Π^{- 1} X_{s}$ peut être écrit comme la somme de termes $n$ et que $n_{i}$ est borné quand $m \to \infty,$ $A = O (M) .$ Par définition, $g_{i}^{⊤} = 1_{n_{i}} + {(t_{U x} - {\hat{t}}_{x π})}^{⊤} A^{- 1} X_{i}^{⊤} Q_{i} .$ Le second terme dans $g_{i}$ est $O_{p} (m^{- 1 / 2}) .$ Par conséquent, $g_{i}$ converge vers un vecteur de valeurs 1. Si on utilise $A = O (M)$ ainsi que les hypothèses A.1.3 et A.1.4, $H_{i j}$ est $O (m^{- 1})$ élément par élément.

A.2 Variation du modèle de l’estimateur GREG

Soit $y_{s i}$ le vecteur de tous les éléments d’échantillon dans la grappe $i$ et soit $y_{i}$ le vecteur de tous les éléments de la grappe $i .$ La variance du GREG, en ce qui concerne le modèle de travail (2.1), est :

$\begin{array}{l} {var}_{ξ} ({\hat{t}}_{y}^{g r} - t_{y}) & = {var}_{ξ} (\sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} y_{s i} - \sum_{i \in U} 1_{N_{i}}^{⊤} y_{i}) \\ = \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} Ψ_{s i} Π_{i}^{- 1} g_{i} - 2 {cov}_{ξ} (\sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} y_{s i}, \sum_{i \in U} 1_{N_{i}}^{⊤} y_{i}) + 1_{N}^{⊤} Ψ 1_{N} . \end{array}$

Étant donné que $\sum_{i \in U} 1_{i}^{⊤} y_{i} = \sum_{i \in s} 1_{i}^{⊤} y_{i} + \sum_{i \in (U - s)} 1_{i}^{⊤} y_{i}$ et les éléments des différentes grappes ne sont pas corrélés, nous obtenons :

$\begin{array}{l} {var}_{ξ} ({\hat{t}}_{y}^{g r} - t_{y}) & = \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} Ψ_{s i} Π_{i}^{- 1} g_{i} - 2 \sum_{i \in s} [g_{i}^{⊤} Π_{i}^{- 1} {cov}_{ξ} (y_{s i} , y_{i}) 1_{N_{i}}] + 1_{N}^{⊤} Ψ 1_{N} \\ = L_{1} - 2 L_{2} + L_{3} . \end{array}$

Puisque $A^{- 1} = O (M^{- 1})$ et $g_{i}$ et $Ψ_{s i}$ sont bornés, nous avons $L_{1} = O (M^{2} / m) .$ Étant donné que $Ψ_{s i}$ est borné, ${cov}_{ξ} (y_{s i} , y_{i}) = O (1)$ et $L_{2} = O (M) .$ $L_{3}$ est la somme des termes $N .$ Puisque les valeurs $N_{i}$ sont bornées, $L_{3} = O (M) .$ Ainsi, $L_{1}$ est le terme dominant de la variance de prédiction.

A.3 Démonstration de ${var}_{ξ} (e_{i}) \approx Ψ_{s i}$

Dans la présente section, pour simplifier la notation, nous omettons l’indice $s$ dans $y_{s i},$ ${\hat{y}}_{s i}$ et $Ψ_{s i} .$ Le résidu peut s’écrire en termes de matrice chapeau comme suit.

$\begin{array}{l} e_{i} & = y_{i} - {\hat{y}}_{i} \\ = (I_{n_{i}} - H_{i i}) y_{i} - \sum_{j \neq i; i , j \in s} H_{i j} y_{j} \end{array}$

où $I_{n_{i}}$ est la matrice d’identité $n_{i} \times n_{i} .$ La variance du modèle de $e_{i}$ est alors

$\begin{array}{l} {var}_{ξ} (e_{i}) & = {var}_{ξ} [(I_{n_{i}} - H_{i i}) y_{i} - \sum_{j \neq i} H_{i j} y_{j}] \\ = (I_{n_{i}} - H_{i i}) {var}_{ξ} (y_{i}) {(I_{n_{i}} - H_{i i})}^{⊤} + \sum_{j \neq i} H_{i j} {var}_{ξ} (y_{j}) H_{i j}^{⊤} \\ = (I_{n_{i}} - H_{i i}) Ψ_{i} {(I_{n_{i}} - H_{i i})}^{⊤} + \sum_{j \neq i} H_{i j} Ψ_{j} H_{i j}^{⊤} . (A .1) \end{array}$

Comme on l’a indiqué plus haut, $H_{i i} = O (m^{- 1}) .$ Alors, ${var}_{ξ} (e_{i}) = Ψ_{i} + O (m^{- 1}) .$

Pour justifier $υ_{D},$ notons que le second terme de (A.1) peut s’écrire comme suit :

$\sum_{j \neq i} H_{i j} Ψ_{j} H_{i j}^{⊤} = \sum_{j \in s} H_{i j} Ψ_{j} H_{i j}^{⊤} - H_{i i} Ψ_{i} H_{i i}^{⊤} .$

La somme sur l’échantillon en grappes complet est

$\sum_{j \in s} H_{i j} Ψ_{j} H_{i j}^{⊤} = X_{i} A^{- 1} (\sum_{j \in s} X_{j}^{⊤} Q_{j} Π_{j}^{- 1} Ψ_{j} Π_{j}^{- 1} Q_{j} X_{j}) A^{- 1} X_{i}^{⊤} .$

Dans le cas particulier de $Q_{j} = Ψ_{j}^{- 1}$ et $Π_{i} = c I_{n_{i}}$ pour une constante $c \in (0, 1)$ (c’est-à-dire que l’échantillon est autopondéré), nous avons

$\sum_{j \in s} H_{i j} Ψ_{j} H_{i j}^{⊤} = c^{- 2} X_{i} A^{- 1} (\sum_{j \in s} X_{j}^{⊤} Ψ_{j}^{- 1} X_{j}) A^{- 1} X_{i}^{⊤},$

ainsi que $H_{i i} = c X_{i} A^{- 1} X_{i}^{⊤} Ψ_{i}^{- 1}$ et $A = c^{- 1} X Ψ^{- 1} X .$ À partir de ces simplifications, nous obtenons $\sum_{j \in s} H_{i j} Ψ_{j} H_{i j}^{⊤} = H_{i i} Ψ_{i} .$ Si on substitue ce résultat dans (A.1) et qu’on simplifie, on a

$\begin{array}{l} {var}_{ξ} (e_{i}) & = (I_{n_{i}} - H_{i i}) Ψ_{i} {(I_{n_{i}} - H_{i i})}^{⊤} + \sum_{j \neq i} H_{i j} Ψ_{j} H_{i j}^{⊤} \\ = (I_{n_{i}} - H_{i i}) Ψ_{i} . (A .2) \end{array}$

Il s’agit de la base de l’ajustement de $υ_{R}$ pour obtenir $υ_{D} .$

A.4 Démonstration de ${\hat{B}}_{(i)} = \hat{B} - R_{i}$ pour les échantillons en grappes

Dans la présente section, nous omettons l’indice $s$ dans $X_{s},$ $y_{s},$ $X_{s i},$ $y_{s i},$ $X_{s (i)}$ et $y_{s (i)}$ pour simplifier la notation. L’indice $(i)$ désigne la suppression de la $i^{e}$ grappe du vecteur ou de la matrice de l’échantillon complet. Par exemple, ${\hat{B}}_{(i)}$ est l’estimation de $B$ fondée sur toutes les grappes d’échantillon sauf la grappe $i$ soit

${\hat{B}}_{(i)} = {(X_{(i)}^{⊤} W_{(i)} X_{(i)})}^{- 1} X_{(i)}^{⊤} W_{(i)} y_{(i)}$

où $W_{(i)} = Q_{(i)} Π_{(i)}^{- 1} .$ Si nous utilisons le lemme 9.5.1 de Valliant et coll. (2000), nous obtenons

${\hat{B}}_{(i)} = (A^{- 1} + A^{- 1} X_{i}^{⊤} W_{i} {(I_{n_{i}} - H_{i i})}^{- 1} X_{i} A^{- 1}) X_{(i)}^{⊤} W_{(i)} y_{(i)} .$

Étant donné que $X_{(i)}^{⊤} W_{(i)} y_{(i)} = X^{⊤} W y - X_{i}^{⊤} W_{i} y_{i}$ et $\hat{B} = A^{- 1} X^{⊤} W y,$ nous avons

$\begin{array}{l} {\hat{B}}_{(i)} & = A^{- 1} (X^{⊤} W y - X_{i}^{⊤} W_{i} y_{i}) \\ + A^{- 1} X_{i}^{⊤} W_{i} {(I_{n_{i}} - H_{i i})}^{- 1} X_{i} A^{- 1} (X^{⊤} W y - X_{i} W_{i} y_{i}) \\ = \hat{B} - A^{- 1} X_{i}^{⊤} W_{i} {(I_{n_{i}} - H_{i i})}^{- 1} (I_{n_{i}} - H_{i i}) y_{i} + A^{- 1} X_{i}^{⊤} W_{i} {(I_{n_{i}} - H_{i i})}^{- 1} {\hat{y}}_{i} \\ - A^{- 1} X_{i}^{⊤} W_{i} {(I_{n_{i}} - H_{i i})}^{- 1} H_{i i} y_{i} \\ = \hat{B} - A^{- 1} X_{i}^{⊤} W_{i} {(I_{n_{i}} - H_{i i})}^{- 1} e_{i} . \end{array}$

Par conséquent, ${\hat{B}}_{(i)} = \hat{B} - R_{i} .$

A.5 Estimateur de la variance par la méthode du jackknife de GREG en grappes en termes de leviers

Nous simplifions maintenant l’estimateur de la variance par la méthode du jackknife avec suppression de grappe de GREG en grappes. Comme dans les sections A.3 et A.4, nous omettons l’indice $s$ dans plusieurs termes pour simplifier la notation. Le total estimé après la suppression de la grappe $i^{e}$ est défini comme étant

$\begin{array}{l} {\hat{t}}_{y (i)}^{g r} & = \frac{m}{m - 1} {\hat{t}}_{y (i)}^{π} + [t_{U x} - \frac{m}{m - 1} {\hat{t}}_{x (i)}^{π}] {\hat{B}}_{(i)} \\ = \frac{m 1_{n}^{⊤} Π^{- 1} y}{m - 1} - \frac{m 1_{n_{i}}^{⊤} Π_{i}^{- 1} y_{i}}{m - 1} + [1_{N}^{⊤} X_{U} - \frac{m 1_{n}^{⊤} Π^{- 1} X}{m - 1} + \frac{m 1_{n_{i}}^{⊤} Π_{i}^{- 1} X_{i}}{m - 1}] (\hat{B} - R_{i}) \\ = \frac{m 1_{n}^{⊤} Π^{- 1} y}{m - 1} - \frac{m 1_{n_{i}}^{⊤} Π_{i}^{- 1} y_{i}}{m - 1} \\ + \frac{m}{m - 1} (1_{N}^{⊤} X_{U} - 1_{n}^{⊤} Π^{- 1} X) (\hat{B} - R_{i}) - \frac{1}{m - 1} (1_{N}^{⊤} X_{U} - m 1_{n_{i}}^{⊤} Π_{i}^{- 1} X_{i}) (\hat{B} - R_{i}) \\ = \frac{m}{m - 1} {\hat{t}}_{y}^{g r} - \frac{m 1_{n_{i}}^{⊤} Π_{i}^{- 1} y_{i}}{m - 1} - \frac{m}{m - 1} (1_{N}^{⊤} X_{U} - 1_{n}^{⊤} Π^{- 1} X) R_{i} - \frac{1}{m - 1} K_{i} . \end{array}$

L’ajout et la soustraction de $\frac{m}{m - 1} 1_{n_{i}}^{⊤} Π_{i}^{- 1} {(I_{n_{i}} - H_{i i})}^{- 1} e_{i}$ et une importante simplification donnent

${\hat{t}}_{y (i)}^{g r} = \frac{m}{m - 1} {\hat{t}}_{y}^{g r} - \frac{m}{m - 1} g_{i}^{⊤} Π_{i}^{- 1} {(I_{n_{i}} - H_{i i})}^{- 1} e_{i} + \frac{m}{m - 1} G_{i} - \frac{1}{m - 1} K_{i} .$

La différence entre les estimations avec suppression d’une unité et la moyenne de ces estimations donne

$\begin{array}{l} {\hat{t}}_{y (i)}^{g r} - {\hat{t}}_{y (\cdot)}^{g r} & = - \frac{m}{m - 1} (D_{i} - \bar{D}) + \frac{m}{m - 1} (G_{i} - \bar{G}) - \frac{1}{m - 1} (K_{i} - \bar{K}) \\ = - \frac{m}{m - 1} (D_{i} - \bar{D}) + \frac{m}{m - 1} [(G_{i} - \bar{G}) - \frac{1}{m} (K_{i} - \bar{K})] . \end{array}$

Soit $F_{i} = (G_{i} - \bar{G}) - m^{- 1} (K_{i} - \bar{K})$ qui donne la formule de $υ_{Jack}$ dans l’équation (2.12). Puis, étant donné que $H_{i i} = O (m^{- 1})$ et ${\hat{y}}_{i} = X_{i} \hat{B},$

$\begin{array}{l} F_{i} & = (G_{i} - \bar{G}) - \frac{1}{m} (K_{i} - \bar{K}) \\ \approx [- 1_{n_{i}}^{⊤} Π_{i}^{- 1} {\hat{y}}_{i} + \frac{1}{m} \sum_{i \in s} 1_{n_{i}}^{⊤} Π_{i}^{- 1} {\hat{y}}_{i}] - \frac{1}{m} [- m 1_{n_{i}}^{⊤} Π_{i}^{- 1} X_{i} \hat{B} + \sum_{i \in s} 1_{n_{i}}^{⊤} Π_{i}^{- 1} X_{i} \hat{B}] \\ = 0 . \end{array}$

Ainsi, $F_{i} = o (1),$ et $υ_{Jack}$ dans (2.6) et (2.12) équivaut asymptotiquement à $υ_{J 1}$ dans (2.13).

Enfin, pour justifier $υ_{J 2}$ dans (2.14), nous écrivons $υ_{J 1}$ sous la forme du calcul

$υ_{J 1} = \frac{m}{m - 1} [\sum_{i \in s} {(g_{i}^{⊤} U_{i} e_{i})}^{2} - \frac{1}{m} {(\sum_{i \in s} g_{i}^{⊤} U_{i} e_{i})}^{2}] (A .3)$

où $U_{i} = Π_{i}^{- 1} {(I_{n_{i}} - H_{i i})}^{- 1} .$ Notons que la variance du modèle de $D_{i}$ est

$\begin{array}{l} {var}_{ξ} (D_{i}) & = {var}_{ξ} (g_{i}^{⊤} U_{i} e_{i}) \\ = g_{i}^{⊤} U_{i}^{⊤} {var}_{ξ} (e_{i}) U_{i} g_{i} . \end{array}$

Puisque $U_{i} = O (M / m)$ et que la somme dans $\sum_{i \in s} {var}_{ξ} (D_{i})$ contient des termes $n = m \bar{n},$ la variance de $\sum_{i \in s} g_{i}^{⊤} U_{i} e_{i}$ est $O (M^{2} / m) .$ Ensuite, on met à l’échelle $υ_{J 1}$ pour que la valeur soit appropriée pour une moyenne, le premier terme entre parenthèses dans (A.3) est $N^{- 2} \sum_{i \in s} D_{i}^{2} = O (m^{- 1}) .$ Puisque le second terme entre parenthèses a une espérance de modèle de 0 et une variance $O (m^{- 1}),$ il converge en probabilité à 0, et $υ_{J 2}$ équivaut asymptotiquement à $υ_{J 1} .$

A.6 Équivalence asymptotique des estimateurs de la variance

Dans la présente annexe, nous esquissons des arguments pour expliquer pourquoi plusieurs estimateurs de la variance sont asymptotiquement équivalents. En utilisant des arguments fondés sur le plan de sondage, Yung et Rao (1996, Annexe) ont montré que l’estimateur par linéarisation jackknife, $υ_{J L},$ pour l’estimation par la régression généralisée (GREG), équivaut asymptotiquement à l’estimateur convergent par rapport au plan, $υ_{Jack},$ dans des plans à plusieurs degrés stratifiés avec un grand nombre de strates et un nombre borné de grappes d’échantillon sélectionnées dans chaque strate. Si on utilise les conditions de régularité de Rao et Shao (1985), on peut étendre le résultat à des plans dans lesquels soit (i) le nombre de strates est grand et le nombre de grappes par strate est limité ou (ii) le nombre de strates est limité et le nombre de grappes d’échantillon par strate est grand, comme cela est le cas dans le présent article.

L’estimateur par linéarisation jackknife de la section 2 peut être étendu comme suit

$N^{- 2} υ_{J L} = N^{- 2} \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} e_{i} e_{i}^{⊤} Π_{i}^{- 1} g_{i} - N^{- 2} m {(m^{- 1} \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} e_{i})}^{2} . (A .4)$

Le premier terme dans (A.4) est égal à $v_{R} .$ Parce que, dans certaines hypothèses raisonnables, $g_{i}$ et $e_{i}$ sont bornés, et $Π_{i}^{- 1} = O (M / m)$ selon les hypothèses A.1.2 et A.1.3, le premier terme dans (A.4) est $O (1 / m) .$ Le second terme est aussi $O (1 / m),$ mais l’espérance du modèle de ${\bar{e}}_{2} = m^{- 1} \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} e_{i}$ est nulle tant que (2.1) se vérifie. Étant donné que ${\bar{e}}_{2}$ est une moyenne, sa variance de modèle tend vers 0 quand $m \to \infty .$ Ainsi, le second terme dans (A.4) converge en probabilité à 0 et $υ_{J L} \approx υ_{R} .$

À la section A.5, il a été démontré que $υ_{Jack}$ et $υ_{J 1}$ sont asymptotiquement équivalents. Dans A.1.1-A.1.4, $H_{i i} = O (m^{- 1}) .$ Par conséquent, $υ_{J 2}$ et $υ_{D}$ sont approximativement identiques à $υ_{R}$ et $m \to \infty .$ Ainsi, $υ_{Jack} \approx υ_{J L}$ par extension de Yung et Rao (1996), les deux étant convergents par rapport au plan de sondage. De plus, $υ_{J L}$ équivaut asymptotiquement à $υ_{J 1},$ $υ_{J 2},$ $υ_{D}$ et $υ_{R} .$ Par conséquent, les autres estimateurs de la variance examinés ici ont tous des justifications fondées sur le modèle et sur le plan de sondage.

Bibliographie

Kott, P.S. (1988). Model-based finite population correction for the Horvitz-Thompson estimator. Biometrika, 75(4), 797-799.

Krewski, D., et Rao, J.N.K. (1981). Inference from stratified samples: Properties of the linearization, jackknife and balanced repeated replication methods. The Annals of Statistics, 9(5), 1010-1019.

Li, J., et Valliant, R. (2009). Matrice chapeau et effets de levier pondérés par les poids de sondage. Techniques d’enquête, 35, 1, 17-27. Article accessible à l’adresse https://www150.statcan.gc.ca/n1/fr/pub/12-001-x/2009001/article/10881-fra.pdf.

Long, J.S., et Ervin, L.H. (2000). Using heteroscedasticity consistent standard errors in the linear regression model. The American Statistician, 54(3), 217-224.

MacKinnon, J.G., et White, H. (1985). Some heteroskedasticity consistent covariance matrix estimators with improved finite sample properties. Journal of Econometrics, 29(3), 305-325.

Rao, J.N.K., et Shao, J. (1985). Inference from stratified samples: Second-order analysis of three methods for nonlinear statistics. Journal of the American Statistical Association, 80(391), 620-630.

Royall, R.M., et Cumberland, W.G. (1978). Variance estimation in finite population sampling. Journal of the American Statistical Association, 73(362), 351-358.

Särndal, C.-E., Swensson, B. et Wretman, J. (1989). The weighted residual technique for estimating the variance of the general regression estimator of the finite population total. Biometrika, 76(3), 527-537.

Särndal, C.-E., Swensson, B. et Wretman, J. (1992). Model Assisted Survey Sampling. Springer Series in Statistics. New York: Springer-Verlag.

Valliant, R. (2002). Estimation de la variance de l’estimateur de régression généralisée. Techniques d’enquête, 28, 1, 109-122. Article accessible à l’adresse https://www150.statcan.gc.ca/n1/fr/pub/12-001-x/2002001/article/6424-fra.pdf.

Valliant, R., Dorfman, A.H. et Royall, R.M. (2000). Finite Population Sampling and Inference: A Prediction Approach. Wiley Series in Probability and Statistics: Survey Methodology Section. New York: John Wiley & Sons, Inc.

Yung, W., et Rao, J.N.K. (1996). Linéarisation des estimateurs de variance jackknife dans un échantillonnage stratifié à degrés multiples. Techniques d’enquête, 22, 1, 23-31. Article accessible à l’adresse https://www150.statcan.gc.ca/n1/fr/pub/12-001-x/1996001/article/14388-fra.pdf.

ISSN : 1712-5685

Politique de rédaction

Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.

Présentation de textes pour la revue

Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).

Note de reconnaissance

Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.

Normes de service à la clientèle

Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.

Droit d'auteur

Publication autorisée par le ministre responsable de Statistique Canada.

L'utilisation de la présente publication est assujettie aux modalités de l'Entente de licence ouverte de Statistique Canada.

N° 12-001-X au catalogue

Périodicité : semi-annuel

Ottawa

Date de modification :: 2019-12-17

Sélection de la langue

Recherche et menus

Recherche

Estimateurs de la variance robustes pour estimateurs par la régression généralisée dans des échantillons en grappes
Section 4. Conclusion

Remerciements

Annexe

Résultats théoriques

A.1 Hypothèses

A.2 Variation du modèle de l’estimateur GREG

A.3 Démonstration de ${var}_{ξ} (e_{i}) \approx Ψ_{s i}$

A.4 Démonstration de ${\hat{B}}_{(i)} = \hat{B} - R_{i}$ pour les échantillons en grappes

A.5 Estimateur de la variance par la méthode du jackknife de GREG en grappes en termes de leviers

A.6 Équivalence asymptotique des estimateurs de la variance

Bibliographie

Estimateurs de la variance robustes pour estimateurs par la régression généralisée dans des échantillons en grappes Section 4. Conclusion

Remerciements

Annexe

Résultats théoriques

A.1 Hypothèses

A.2 Variation du modèle de l’estimateur GREG

A.5 Estimateur de la variance par la méthode du jackknife de GREG en grappes en termes de leviers

A.6 Équivalence asymptotique des estimateurs de la variance

Bibliographie

Politique de rédaction

Présentation de textes pour la revue

Note de reconnaissance

Normes de service à la clientèle

Droit d'auteur

Estimateurs de la variance robustes pour estimateurs par la régression généralisée dans des échantillons en grappes
Section 4. Conclusion