Estimateurs de la variance robustes pour estimateurs par la régression généralisée dans des échantillons en grappes
Section 2. Résultats théoriques

Table des matières

Supposons une population ayant $i =1, 2, \dots, M$ grappes. Dans la grappe $i,$ il y a $N_{i}$ éléments de sorte qu’il y a $N = \sum_{i =1}^{M} N_{i}$ éléments dans la population. L’univers des grappes est exprimé par $U$ et l’univers des éléments dans la grappe $i$ est $U_{i} .$ La variable d’analyse $y_{i k}$ est associée à l’élément $k$ de la grappe $i .$ La population totale de $y$ est $t_{U y} = \sum_{i =1}^{M} \sum_{k =1}^{N_{i}} y_{i k} .$ Chaque élément de population a également un vecteur $p$ de variables auxiliaires, $x_{i k},$ qui peut être utilisé dans l’estimation. On sélectionne un échantillon à deux degrés sans remise aux premier et deuxième degrés. La probabilité de sélection de la grappe $i$ est $π_{i},$ et $π_{k | i}$ est la probabilité de sélection conditionnelle de l’élément $k$ dans la grappe $i .$ La probabilité globale de sélection de l’élément $i k$ est $π_{i k} = π_{i} π_{k | i} .$ Soit $s$ l’ensemble de grappes d’échantillon et $s_{i}$ l’ensemble d’éléments d’échantillon dans la grappe $i .$ Le nombre de grappes d’échantillon est $m$ tandis que le nombre d’éléments d’échantillon sélectionnés de la grappe d’échantillon $i$ est $n_{i} .$ La taille de l’échantillon total des éléments est $n = \sum_{i \in s} n_{i} .$

Dans le modèle de travail, supposons que $Y_{U},$ le vecteur $N$ des variables d’analyse, suit le modèle linéaire suivant :

$\begin{array}{l} E_{ξ} (Y_{U}) & = X β (2.1) \\ {cov}_{ξ} (Y_{U}) & = Ψ \end{array}$

où l’indice $ξ$ désigne une espérance par rapport à un modèle; $X = {[X_{1}^{⊤}, X_{2}^{⊤}, \dots, X_{M}^{⊤}]}^{⊤}$ est la matrice $N \times p$ des variables auxiliaires et $X_{i}$ est la matrice $N_{i} \times p$ des variables auxiliaires pour les éléments $N_{i}$ dans la grappe $i;$ et $β$ est un vecteur de paramètre de longueur $p .$ On suppose que les éléments des grappes sont corrélés tandis que les éléments des différentes grappes sont indépendants selon le modèle. Ainsi, la matrice de covariance $Ψ$ est une matrice diagonale par blocs $N \times N$ avec des matrices diagonales $Ψ_{i} = {[ψ_{i k}]}_{N_{i} \times N_{i}} .$ Une des principales caractéristiques des estimateurs de la variance que nous proposons est qu’il n’est pas nécessaire de connaître la forme particulière de $ψ_{i k}$ pour construire les estimateurs de la variance. Les estimateurs de la variance proposés seront convergents, quelle que soit la forme de $Ψ .$

Särndal et coll. (1992, chapitre 8) examinent trois estimateurs GREG différents pouvant être utilisés dans les échantillons en grappes. Tous trois dépendent des données disponibles. Considérons leur cas B, qui se produit lorsque des données au niveau de l’unité sont disponibles pour l’échantillon complet et que des totaux de contrôle sont disponibles pour la population. Dans ce cas, l’estimateur GREG est

$\begin{array}{l} {\hat{t}}_{y}^{g r} & = {\hat{t}}_{y π} + {\hat{B}}^{⊤} (t_{U x} - {\hat{t}}_{x π}) \\ = g^{⊤} Π^{- 1} y_{s} (2.2) \end{array}$

où $y_{s}$ est le vecteur $n$ des $y$ pour les éléments d’échantillon, ${\hat{t}}_{y π}$ est l’estimateur $π$ du total des $y,$ $t_{U x}$ est le vecteur $p$ des totaux de population des $x,$ ${\hat{t}}_{x π}$ est l’estimateur $π$ de $t_{U x},$ et (si $Ψ$ est connu) $\hat{B} = A^{- 1} X_{s}^{⊤} Ψ_{s}^{- 1} Π^{- 1} y_{s}$ avec $A = X_{s}^{⊤} Ψ_{s}^{- 1} Π^{- 1} X_{s},$ $X_{s}$ la matrice des variables auxiliaires de l’échantillon, et $Π = diag [π_{i k}]$ $(i \in s, k \in s_{i});$ $Ψ_{s}$ est la partie de $Ψ$ associée aux éléments d’échantillon; et $g^{⊤} = 1_{n}^{⊤} + {(t_{U x} - {\hat{t}}_{x π})}^{⊤} A^{- 1} X_{s}^{⊤} Ψ_{s}^{- 1}$ où $1_{n}$ est un vecteur de $n$ valeurs 1.

La composante du poids $g$ de la grappe d’échantillon $i$ est $g_{i}^{⊤} = 1_{n_{i}}^{⊤} + {(t_{U x} - {\hat{t}}_{x π})}^{⊤} A^{- 1} X_{s i}^{⊤} Ψ_{s i}^{- 1},$ $X_{s i}^{⊤} = [x_{i 1}, \dots, x_{i n_{i}}]$ étant la matrice $p \times n_{i}$ des variables auxiliaires pour les éléments d’échantillon dans la grappe d’échantillon $i,$ $Ψ_{s i}$ est la partie $n_{i} \times n_{i}$ de $Ψ_{i}$ pour les éléments d’échantillon dans la grappe d’échantillon $i,$ et $1_{n_{i}}$ est un vecteur de $n_{i}$ valeurs 1. Puisque $Ψ$ est généralement inconnu, une valeur de substitution $Q$ peut être utilisée pour $Ψ_{s}^{- 1};$ $Q = I$ est un choix courant. Plus bas, nous supposons qu’une valeur générale $Q$ est utilisée dans l’estimation par la régression généralisée plutôt que $Ψ_{s}^{- 1} .$

2.1 Estimateurs de la variance actuels

Särndal et coll. (1992, résultat 8.9.1) présentent un estimateur de la variance par rapport au plan ${\hat{t}}_{y}^{g r},$ qui comporte des probabilités de sélection conjointe des grappes et des éléments des grappes. En cas d’échantillonnage de Poisson, aux deux degrés, leur estimateur est

$υ_{g} = \sum_{i \in s} \frac{(1 - π_{i})}{π_{i}^{2}} {({\hat{t}}_{e , i}^{g})}^{2} + \sum_{i \in s} \frac{1}{π_{i}} \sum_{k \in s_{i}} \frac{(1 - π_{k | i})}{π_{k | i}^{2}} g_{i k}^{2} e_{i k}^{2} (2.3)$

où ${\hat{t}}_{e , i}^{g} = \sum_{s_{i}} g_{i k} e_{i k} / π_{k | i},$ $g_{i k}$ est la composante $k^{e}$ du vecteur $g_{i},$ et $e_{i k} = y_{i k} - x_{i k}^{⊤} \hat{B} .$ Les calculs pour cet estimateur sont plus simples que la formule générale qui utilise des probabilités de sélection conjointe et peut avoir des performances satisfaisantes en cas de plans $pt π$ où l’on peut obtenir une approximation de la variance des estimateurs par des formules qui supposent une indépendance entre les sélections.

Voici un estimateur approprié si l’échantillonnage au premier degré est sélectionné avec remise :

$υ_{w r} = \frac{m}{m - 1} \sum_{i \in s} {(e_{1 i} - {\bar{e}}_{1})}^{2} (2.4)$

avec $e_{1 i} = \sum_{k \in s_{i}} e_{i k} / π_{i k}$ et ${\bar{e}}_{1} = m^{- 1} \sum_{i \in s} e_{1 i} .$ L’estimateur par linéarisation jackknife est (Yung et Rao, 1996)

$υ_{J L} = \frac{m - 1}{m} \sum_{i \in s} {(e_{2 i} - {\bar{e}}_{2})}^{2} (2.5)$

où $e_{2 i} = \sum_{k \in s_{i}} g_{i k} e_{i k} / π_{i k}$ et ${\bar{e}}_{2} = m^{- 1} \sum_{i \in s} e_{2 i},$ $g_{i k}$ étant la composante $k^{e}$ du vecteur $g_{i} .$

La méthode jackknife est une autre technique courante d’estimation de la variance. Krewski et Rao (1981) présentent plusieurs façons asymptotiquement équivalentes d’exprimer le jackknife. La forme suivante de l’estimateur jackknife constitue un point de départ pratique pour les calculs qui suivent :

$υ_{Jack} = \frac{m - 1}{m} \sum_{i \in s} {({\hat{t}}_{y (i)}^{g r} - {\hat{t}}_{y (\cdot)}^{g r})}^{2} (2.6)$

où ${\hat{t}}_{y (i)}^{g r}$ est la valeur de l’estimateur GREG après suppression de la grappe $i$ et ${\hat{t}}_{y (\cdot)}^{g r}$ est la moyenne de toutes les estimations ${\hat{t}}_{y (i)}^{g r} .$ L’utilisation de (2.6) peut exiger d’importantes ressources de calcul, car il faut calculer $m$ estimations différentes de ${\hat{t}}_{y (i)}^{g r} .$ Les estimateurs $υ_{Jack},$ $υ_{w r}$ et $υ_{J L}$ sont tous convergents par rapport au plan de sondage dans les conditions de Krewski et Rao (1981) et de Yung et Rao (1996). L’une de leurs principales conditions était que les grappes devaient être sélectionnées avec remise. Cette hypothèse simplifie les calculs théoriques, mais elle est utilisée seulement par souci de commodité. En effet, de nombreuses études empiriques ont démontré que les résultats théoriques étaient de bons prédicteurs de la performance des estimateurs dans les plans sans remise, tant que la fraction de sondage au premier degré est petite.

2.2 Nouveaux estimateurs de la variance

Nous utilisons le cadre fondé sur un modèle pour construire de nouveaux estimateurs de la variance. En premier lieu, nous calculons la variance fondée sur le modèle de ${\hat{t}}_{y}^{g r} .$ Supposons que le modèle (2.1) se vérifie et que l’échantillonnage est ignorable, en ce sens que la probabilité qu’une unité soit dans l’échantillon donné $Y_{U}$ et $X$ dépend seulement de $X$ (voir par exemple la discussion dans Valliant, Dorfman et Royall, 2000, section 2.6.2 et les références supplémentaires qui y sont citées). Ensuite, nous construisons des estimateurs de la variance du modèle, au moyen d’ajustements de la matrice chapeau pour tenir compte de l’hétérogénéité dans les données. Nous évaluons les propriétés fondées sur le plan de sondage des nouveaux estimateurs de la variance dans une simulation.

Pour calculer la variance du modèle de ${\hat{t}}_{y}^{g r},$ soit $y_{i}$ le vecteur de population des variables d’analyse pour la grappe $i,$ et $y_{s i}$ le vecteur des éléments d’échantillon. Comme le montre l’annexe A.2, sous le modèle (2.1), la variance fondée sur le modèle de ${\hat{t}}_{y}^{g r}$ est :

$\begin{array}{l} {var}_{ξ} ({\hat{t}}_{y}^{g r} - t_{U y}) & = \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} Ψ_{s i} Π_{i}^{- 1} g_{i} - 2 \sum_{i \in s} [g_{i}^{⊤} Π_{i}^{- 1} {cov}_{ξ} (y_{s i}, y_{i}) 1_{N_{i}}] + 1_{N}^{⊤} Ψ 1_{N} \\ = L_{1} - 2 L_{2} + L_{3} \end{array}$

où ${var}_{ξ} (y_{s i}) = Ψ_{s i},$ la partie de $Ψ$ associée à des éléments dans $s_{i},$ et $1_{N_{i}}$ et $1_{N}$ sont des vecteurs de $N_{i}$ et $N$ 1.

La variance de l’erreur fondée sur le modèle de ${\hat{t}}_{y}^{g r}$ nécessite de connaître $Ψ$ pour toute la population. En l’absence de solides hypothèses établissant un lien entre les structures de covariance de l’échantillon et hors de l’échantillon, les composantes de $Ψ$ associées aux valeurs non échantillonnées ne peuvent pas être estimées à partir de l’échantillon. Cependant, comme le montre l’annexe A.2, dans certaines conditions raisonnables, les ordres des termes sont $L_{1} = O (M^{2} / m)$ et $L_{2} = L_{3} = O (M),$ de sorte que $L_{1}$ domine la variance à mesure que le nombre de grappes d’échantillon et de population augmente. Ainsi,

${av}_{ξ} ({\hat{t}}_{y}^{g r} - t_{U y}) = \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} Ψ_{s i} Π_{i}^{- 1} g_{i} (2.7)$

où ${av}_{ξ}$ désigne la variance du modèle asymptotique selon les hypothèses de l’annexe A.1. On peut former un estimateur robuste du deuxième membre de (2.7) même si $Ψ_{s i}$ est inconnu. En revanche, si le nombre de grappes de population augmente au même taux que les grappes d’échantillon (c’est-à-dire que $f = m / M$ converge vers une constante non nulle), alors $L_{1},$ $L_{2}$ et $L_{3}$ peuvent tous contribuer de façon importante à la variance asymptotique. Dans le présent article, nous examinerons uniquement l’estimation de $L_{1} .$

À moins que la vraie matrice de variance de $y_{s}$ soit connue, il faut estimer $Ψ_{i} .$ À l’annexe A.3, nous montrons que dans les grands échantillons ${var}_{ξ} (e_{i}) \approx Ψ_{i},$ où $e_{i} = y_{s i} - {\hat{y}}_{s i},$ avec ${\hat{y}}_{s i} = X_{s i} \hat{B}$ et $X_{s i}$ étant la matrice $n_{i} \times p$ des variables auxiliaires pour les éléments d’échantillon dans la grappe d’échantillon $i .$ Si on substitue $e_{i} e_{i}^{⊤}$ à $Ψ_{s i}$ dans (2.7), on obtient l’estimateur sandwich

$υ_{R} = \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} e_{i} e_{i}^{⊤} Π_{i}^{- 1} g_{i} . (2.8)$

D’après les résultats présentés à l’annexe A.3, $υ_{R}$ est approximativement sans biais pour ${av}_{ξ} ({\hat{t}}_{y}^{g r} - t_{U y})$ dans les grands échantillons. Cet estimateur sandwich est aussi étroitement lié à l’estimateur par grappe ultime fondé sur le plan de sondage pour un plan dans lequel les grappes sont sélectionnées avec remise, qui est, à son tour, semblable à $υ_{g}$ et $υ_{J L}$ avec un échantillonnage avec remise. Par conséquent, $υ_{R}$ possède des propriétés souhaitables fondées à la fois sur le plan et sur le modèle.

Dans les échantillons de taille petite à moyenne, $υ_{R}$ présente un biais par rapport au modèle et sous-estime souvent la variance véritable. On peut ajuster la matrice chapeau pour le corriger. Comme on le montre l’annexe A.3,

$E_{ξ} (e_{i} e_{i}^{⊤}) = {var}_{ξ} (e_{i}) = (I_{n_{i}} - H_{i i}) Ψ_{s i} {(I_{n_{i}} - H_{i i})}^{⊤} + \sum_{j \neq i; i , j \in s} H_{i j} Ψ_{s j} H_{i j}^{⊤} (2.9)$

où $H_{i j} = X_{s i}^{⊤} A^{- 1} X_{s j} Q_{j} Π_{j}^{- 1}$ $(i, j = 1, \dots, m),$ $Q_{j}$ et $Π_{j}$ étant les parties $n_{j} \times n_{j}$ de $Q$ et $Π$ étant associé à la grappe d’échantillon $j .$ Comme dans Li et Valliant (2009) et Valliant (2002), on peut recueillir $H_{i j}$ dans une matrice chapeau pondérée selon l’enquête :

$\begin{array}{l} H & = X_{s} A^{- 1} X_{s}^{⊤} Q Π^{- 1} \\ = [\begin{matrix} X_{s 1} A^{- 1} X_{s 1}^{⊤} Q_{1} Π_{1}^{- 1} & \dots & X_{s 1} A^{- 1} X_{s m}^{⊤} Q_{m} Π_{m}^{- 1} \\ ⋮ & ⋱ & ⋮ \\ X_{s m} A^{- 1} X_{s 1}^{⊤} Q_{1} Π_{1}^{- 1} & \dots & X_{s m} A^{- 1} X_{s m}^{⊤} Q_{m} Π_{m}^{- 1} \end{matrix}] . (2.10) \end{array}$

Selon les hypothèses de l’annexe A.1, $H = O (m^{- 1}),$ ce qui permet de conclure que ${var}_{ξ} (e_{i}) \approx Ψ_{s i} .$ Les sous-matrices diagonales $H_{i i}$ sont des matrices analogues aux effets de levier dans un échantillonnage à un degré. Dans une régression des moindres carrés ordinaires, le vecteur des valeurs prédites peut s’écrire $\hat{y} = H_{MCO} y$ avec $H_{MCO} = X {(X^{T} X)}^{- 1} X^{T} .$ Les effets de levier sont des diagonales de la matrice chapeau, $H_{MCO},$ qui peuvent servir à corriger un petit biais d’échantillon dans $e_{i}^{2} = {(y_{i} - {\hat{y}}_{i})}^{2}$ comme estimateur de ${var}_{ξ} (y_{i}) .$ Nous utilisons $H_{i i}$ de façon analogue ci-dessous.

Pour tenir compte du fait que $e_{i} e_{i}^{⊤}$ présente un biais par rapport au modèle pour les échantillons petits à moyens, nous apportons des ajustements de type levier à $e_{i} e_{i}^{⊤} .$ Si $Q = I$ et que l’échantillon est autopondéré (c’est-à-dire $Π = c I$ pour certains $0< c <1),$ alors ${var}_{ξ} (e_{i}) = (I_{n_{i}} - H_{i i}) Ψ_{s i}$ (voir l’annexe A.3). Si on résout $Ψ_{s i}$ et le substitue dans (2.8), on obtient l’estimateur de la variance :

$υ_{D} = \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} {(I_{n_{i}} - H_{i i})}^{- 1} e_{i} e_{i}^{⊤} Π_{i}^{- 1} g_{i} (2.11)$

qui, dans ce cas particulier, est aussi approximativement sans biais étant donné que $H_{i i} = O (m^{- 1}) .$ Une des caractéristiques indésirables de $υ_{D}$ est qu’il peut être négatif ou avoir des contributions négatives de certaines grappes si $υ_{D i} = g_{i}^{⊤} Π_{i}^{- 1} {(I_{n_{i}} - H_{i i})}^{- 1} e_{i} e_{i}^{⊤} Π_{i}^{- 1} g_{i} <0.$ Pour ces grappes, le remplacement de $υ_{D i}$ par $υ_{R i} = g_{i}^{⊤} Π_{i}^{- 1} e_{i} e_{i}^{⊤} Π_{i}^{- 1} g_{i}$ permet d’obtenir un estimateur de la variance positif. Cet ajustement est utilisé dans la simulation de la section 3.

Aux annexes A.4 et A.5, nous montrons que l’estimateur de la variance jackknife peut être écrit exactement comme suit :

$υ_{Jack} = \frac{m - 1}{m} [\sum_{i \in s} {(D_{i} - \bar{D})}^{2} - 2 \sum_{i \in s} (D_{i} - \bar{D}) F_{i} + \sum_{i \in s} F_{i}^{2}] (2.12)$

où

$\begin{array}{l} F_{i} & = (G_{i} - \bar{G}) - \frac{1}{n} (K_{i} - \bar{K}) \\ D_{i} & = g_{i}^{⊤} Π_{i}^{- 1} {(I_{n_{i}} - H_{i i})}^{- 1} e_{i} \\ K_{i} & = (1_{N}^{⊤} X_{U} - m 1_{n_{i}}^{⊤} Π_{i}^{- 1} X_{s i}) (\hat{B} - R_{i}); \bar{K} = m^{- 1} \sum_{i \in s} K_{i} \\ G_{i} & = 1_{n_{i}}^{⊤} Π_{i}^{- 1} {(I_{n_{i}} - H_{i i})}^{- 1} [H_{i i} y_{s i} - {\hat{y}}_{s i}]; \bar{G} = m^{- 1} \sum_{i \in s} G_{i} \\ R_{i} & = A^{- 1} X_{s i}^{⊤} Q_{i} Π_{i}^{- 1} {(I_{n_{i}} - H_{i i})}^{- 1} e_{i} . \end{array}$

Cette forme de $υ_{Jack}$ réduit considérablement les calculs, puisqu’une seule estimation GREG est nécessaire, au lieu de $m$ estimations. (Il va de soi qu’il peut être avantageux de recalculer l’estimation par l’estimation par la régression généralisée GREG pour chaque réplique jackknife si un ajustement de non-réponse élaboré influe sur la taille de la vraie variance.)

Dans les grands échantillons, on peut établir approximativement $υ_{Jack}$ par :

$υ_{J 1} = \frac{m - 1}{m} \sum_{i \in s} {(D_{i} - \bar{D})}^{2} (2.13)$

ou par

$\begin{array}{l} υ_{J 2} & = \frac{m - 1}{m} \sum_{i \in s} D_{i}^{2} \\ = \frac{m - 1}{m} \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} {(I_{n_{i}} - H_{i i})}^{- 1} e_{i} e_{i}^{⊤} {(I_{n_{i}} - H_{i i})}^{- 1} Π_{i}^{- 1} g_{i} . (2.14) \end{array}$

Les estimateurs $υ_{J 1}$ et $υ_{J 2}$ sont des versions en grappes des approximations à un degré du jackknife dans Valliant (2002, équations (3.5), (3.6)).

Comme l’esquisse l’annexe A.6, $υ_{Jack},$ $υ_{J L},$ $υ_{J 1},$ $υ_{J 2},$ $υ_{D}$ et $υ_{R}$ équivalent tous asymptotiquement à $m \to \infty .$ Comme $υ_{Jack}$ et $υ_{J L}$ sont convergents par rapport au plan de sondage, on peut s’attendre à ce que les autres estimateurs ci-dessus donnent de bons résultats sur des échantillons répétés quand la taille de l’échantillon au premier degré est grande et que le modèle (2.1) est approximativement correct. Il faut cependant garder en tête que la fraction d’échantillonnage des grappes doit être petite pour que les estimateurs construits à partir d’un échantillon au premier degré sans remise aient les mêmes performances que si l’échantillon avait été sélectionné avec remise.

Aucun de ces estimateurs de type sandwich ne comprend de facteurs de correction de la population finie. Ils peuvent par conséquent avoir tendance à surestimer la variance d’échantillonnage quand une grande proportion des grappes d’échantillon est sélectionnée. Pour tenir compte de cela, nous pouvons rajuster davantage tous les estimateurs de la variance de façon ponctuelle en multipliant les estimateurs de la variance par un facteur de correction de population finie, noté $f_{p c},$ tel qu’il a été élaboré par Kott (1988). Il en résulte les estimateurs ajustés suivants :

$\begin{array}{l} υ_{R}^{*} & = f_{p c} \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} e_{i} e_{i}^{⊤} Π_{i}^{- 1} g_{i} \\ υ_{D}^{*} & = f_{p c} \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} {(I_{n_{i}} - H_{i i})}^{- 1} e_{i} e_{i}^{⊤} Π_{i}^{- 1} g_{i} \\ υ_{Jack}^{*} & = f_{p c} \frac{m}{m - 1} [\sum_{i \in s} {(D_{i} - \bar{D})}^{2} - 2 \sum_{i \in s} (D_{i} - \bar{D}) F_{i} + \sum_{i \in s} F_{i}^{2}] \\ υ_{J 1}^{*} & = f_{p c} \frac{m}{m - 1} \sum_{i \in s} {(D_{i} - \bar{D})}^{2} \\ υ_{J 2}^{*} & = f_{p c} \sum_{i \in s} g_{i}^{⊤} Π_{i}^{- 1} {(I_{n_{i}} - H_{i i})}^{- 1} e_{i} e_{i}^{⊤} {(I_{n_{i}} - H_{i i})}^{- 1} Π_{i}^{- 1} g_{i} . \end{array}$

Quand un échantillon aléatoire simple est sélectionné au premier degré, $f_{p c} = 1 - m / M .$ D’après Kott (1988), une correction appropriée quand le premier degré est sélectionné avec des probabilités variables est $f_{p c} =1 - m \sum_{i =1}^{M} p_{i}^{2}$ où $p_{i}$ est la probabilité de tirage unique pour la grappe $i,$ c’est-à-dire la probabilité que la grappe $i$ soit sélectionnée dans un échantillon de taille 1.

ISSN : 1712-5685

Politique de rédaction

Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.

Présentation de textes pour la revue

Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).

Note de reconnaissance

Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.

Normes de service à la clientèle

Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.

Droit d'auteur

Publication autorisée par le ministre responsable de Statistique Canada.

L'utilisation de la présente publication est assujettie aux modalités de l'Entente de licence ouverte de Statistique Canada.

N° 12-001-X au catalogue

Périodicité : semi-annuel

Ottawa

Date de modification :: 2019-12-17

Sélection de la langue

Recherche et menus

Recherche

Estimateurs de la variance robustes pour estimateurs par la régression généralisée dans des échantillons en grappes
Section 2. Résultats théoriques

2.1 Estimateurs de la variance actuels

2.2 Nouveaux estimateurs de la variance

Estimateurs de la variance robustes pour estimateurs par la régression généralisée dans des échantillons en grappes Section 2. Résultats théoriques

2.1 Estimateurs de la variance actuels

2.2 Nouveaux estimateurs de la variance

Politique de rédaction

Présentation de textes pour la revue

Note de reconnaissance

Normes de service à la clientèle

Droit d'auteur

Estimateurs de la variance robustes pour estimateurs par la régression généralisée dans des échantillons en grappes
Section 2. Résultats théoriques