Estimation de la variance dans le calage à plusieurs phases
Section 2. Notation

Table des matières

La notation que nous utilisons est similaire à celle donnée dans Särndal et coll. (1992) et dans Hidiroglou et Särndal (1998). Considérons une population finie $U = {1, \dots, k, \dots, N} .$ Un échantillon probabiliste de première phase $s_{1} (s_{1} \subseteq U)$ est tiré de la population $U$ en utilisant un plan d’échantillonnage qui génère la probabilité de sélection $π_{1 k}$ pour la $k^{e}$ unité de la population. Sachant que $s_{i - 1}$ a été tiré, l’échantillon de la $i^{e}$ phase $s_{i} (s_{i} \subseteq s_{i - 1})$ est sélectionné à partir de $s_{i - 1}$ selon un plan d’échantillonnage ayant les probabilités de sélection $π_{i k | s_{i - 1}} \equiv Pr (k \in s_{i} | k \in s_{i - 1}) .$ Soulignons la nature conditionnelle des probabilités de sélection de la phase résultante. À partir de ce point, nous travaillons uniquement avec les poids dans le processus d’estimation. Le poids d’échantillonnage de l’unité $k \in s_{i}$ à la $i^{e}$ phase conditionnée et son poids d’échantillonnage global seront désignés par $w_{i k} = 1 / π_{i k | s_{i - 1}}$ et $w_{i k}^{*} = \prod_{j =1}^{i} w_{j k} ,$ respectivement.

Soit $y_{k}$ la valeur de la variable cible pour la $k^{e}$ unité de la population à laquelle un vecteur auxiliaire $x_{k} = (x_{1 k} , \dots, x_{j k} , \dots, x_{J k})$ est associé. Désignons par $y$ le vecteur d’éléments de la variable cible obtenu à la dernière phase d’échantillonnage, $p .$ Comme il est décrit dans Särndal et coll. (1992, chapitre 9), nous partitionnons le vecteur $x$ comme $x = {(x_{1}^{'} , x_{2}^{'} , \dots, x_{p}^{'})}^{'}$ avec $p \leq J,$ de sorte que nous pourrions obtenir plus d’une variable auxiliaire à certaines phases. Le total de population de $x,$ $t_{x} = \sum_{U} x_{k}$ est supposé inconnu. Cependant, certains totaux démographiques peuvent être connus en s’appuyant sur des sources relativement exactes, comme les données de recensement ou d’autres types de fichiers administratifs. Sans perte de généralité, désignons par $x_{1}$ le vecteur des variables connues pour toutes les unités dans la population $U .$ Désignons par $x_{2}$ le vecteur des variables obtenues dans l’échantillon de première phase $s_{1},$ et ainsi de suite. Pour les éléments contenus dans $s_{r}, r \leq p,$ l’information complète est alors résumée dans le vecteur $x = {(x_{1}^{'} , x_{2}^{'} , \dots, x_{r}^{'})}^{'} .$ Écrivons aussi $t_{i} = t_{x_{i}} .$

Soit $X_{r}$ la matrice de plan comprenant $n_{r}$ lignes représentant $n_{r}$ unités échantillonnées, et un nombre de colonnes correspondant au nombre de variables auxiliaires dans le vecteur $x_{r} .$ Notons que $X_{r}$ est obtenue dans l’échantillon $s_{r - 1}$ à la $r - 1^{e}$ phase de l’échantillonnage, si bien que nous pouvons concevoir $U$ comme un échantillon $s_{0} .$ Dans les conditions qui figurent par exemple dans Särndal et coll. (1992) et dans Hidiroglou et Särndal (1998), la matrice de plan $X_{r}$ englobe toutes les variables auxiliaires $x_{1}, \dots, x_{r},$ plutôt que simplement $x_{r},$ et est appelée le vecteur complet. Néanmoins, l’analyse est la même dans les deux cas.

L’information auxiliaire disponible à chaque phase de l’échantillonnage peut être utilisée pour obtenir des poids améliorés grâce au processus de calage qui produit des facteurs de calage à utiliser dans le processus d’estimation. Nous utilisons l’indice supérieur «*» pour désigner les poids globaux, c’est-à-dire les poids tenant compte de toutes les phases. Le symbole superposé « $\sim$ » désigne les poids calés. Les facteurs $g$ de la $i^{e}$ phase sont désignés par $g_{i k},$ ce qui donne les poids calés de la $i^{e}$ phase ${\tilde{w}}_{i k} = {\tilde{w}}_{i - 1, k} w_{i k} g_{i k}$ pour $k \in s_{i},$ où les ${\tilde{w}}_{i - 1, k}$ sont les poids calés de la $i - 1^{e}$ phase et ${\tilde{w}}_{0 k} =1.$ Pour $k \in s_{i}$ le calage par rapport à toutes les phases produit des facteurs de calage globaux désignés par $g_{i k}^{*} .$ Par conséquent, nous aurons les poids calés globaux ${\tilde{w}}_{i k} = w_{i k}^{*} g_{i k}^{*} ,$ où $w_{i k}^{*}$ est le poids d’échantillonnage global. Désignons par $w_{i}$ le vecteur dont les composantes sont $w_{i k} ; k =1, \dots, n_{i} ,$ et par $D_{i}$ une matrice diagonale de taille $n_{i}$ avec $w_{i}$ sur sa diagonale. La même notation sera utilisée avec les vecteurs $w_{i}^{*} , {\tilde{w}}_{i}$ et $g_{i} .$

ISSN : 1712-5685

Politique de rédaction

Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.

Présentation de textes pour la revue

Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).

Note de reconnaissance

Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.

Normes de service à la clientèle

Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.

Droit d'auteur

Publication autorisée par le ministre responsable de Statistique Canada.

L'utilisation de la présente publication est assujettie aux modalités de l'Entente de licence ouverte de Statistique Canada.

N° 12-001-X au catalogue

Périodicité : Semi-annuel

Ottawa

Date de modification :: 2017-06-22

Sélection de la langue

Recherche et menus

Recherche

Estimation de la variance dans le calage à plusieurs phases
Section 2. Notation

Estimation de la variance dans le calage à plusieurs phases Section 2. Notation

Politique de rédaction

Présentation de textes pour la revue

Note de reconnaissance

Normes de service à la clientèle

Droit d'auteur

Estimation de la variance dans le calage à plusieurs phases
Section 2. Notation