Estimation de la variance dans le calage à plusieurs phases
Section 2. Notation
La notation que nous utilisons est similaire à celle donnée dans Särndal et coll. (1992) et dans Hidiroglou et Särndal (1998). Considérons une population finie Un échantillon probabiliste de première phase est tiré de la population en utilisant un plan d’échantillonnage qui génère la probabilité de sélection pour la unité de la population. Sachant que a été tiré, l’échantillon de la phase est sélectionné à partir de selon un plan d’échantillonnage ayant les probabilités de sélection Soulignons la nature conditionnelle des probabilités de sélection de la phase résultante. À partir de ce point, nous travaillons uniquement avec les poids dans le processus d’estimation. Le poids d’échantillonnage de l’unité à la phase conditionnée et son poids d’échantillonnage global seront désignés par et respectivement.
Soit la valeur de la variable cible pour la unité de la population à laquelle un vecteur auxiliaire est associé. Désignons par le vecteur d’éléments de la variable cible obtenu à la dernière phase d’échantillonnage, Comme il est décrit dans Särndal et coll. (1992, chapitre 9), nous partitionnons le vecteur comme avec de sorte que nous pourrions obtenir plus d’une variable auxiliaire à certaines phases. Le total de population de est supposé inconnu. Cependant, certains totaux démographiques peuvent être connus en s’appuyant sur des sources relativement exactes, comme les données de recensement ou d’autres types de fichiers administratifs. Sans perte de généralité, désignons par le vecteur des variables connues pour toutes les unités dans la population Désignons par le vecteur des variables obtenues dans l’échantillon de première phase et ainsi de suite. Pour les éléments contenus dans l’information complète est alors résumée dans le vecteur Écrivons aussi
Soit la matrice de plan comprenant lignes représentant unités échantillonnées, et un nombre de colonnes correspondant au nombre de variables auxiliaires dans le vecteur Notons que est obtenue dans l’échantillon à la phase de l’échantillonnage, si bien que nous pouvons concevoir comme un échantillon Dans les conditions qui figurent par exemple dans Särndal et coll. (1992) et dans Hidiroglou et Särndal (1998), la matrice de plan englobe toutes les variables auxiliaires plutôt que simplement et est appelée le vecteur complet. Néanmoins, l’analyse est la même dans les deux cas.
L’information auxiliaire disponible à chaque phase de l’échantillonnage peut être utilisée pour obtenir des poids améliorés grâce au processus de calage qui produit des facteurs de calage à utiliser dans le processus d’estimation. Nous utilisons l’indice supérieur «*» pour désigner les poids globaux, c’est-à-dire les poids tenant compte de toutes les phases. Le symbole superposé « » désigne les poids calés. Les facteurs de la phase sont désignés par ce qui donne les poids calés de la phase pour où les sont les poids calés de la phase et Pour le calage par rapport à toutes les phases produit des facteurs de calage globaux désignés par Par conséquent, nous aurons les poids calés globaux où est le poids d’échantillonnage global. Désignons par le vecteur dont les composantes sont et par une matrice diagonale de taille avec sur sa diagonale. La même notation sera utilisée avec les vecteurs et
- Date de modification :