4 Pondérations basées sur la loi a posteriori de Pólya contrainte

Jeremy Strief et Glen Meeden

Une critique de la loi a posteriori de Pólya et de la loi a posteriori de Pólya contrainte pourrait être que toute copie complète simulée de la population ne contient que les valeurs des caractéristiques qui figurent dans l'échantillon. Cependant, c'est exactement cette propriété qui va nous permettre d'attribuer des pondérations aux membres de l'échantillon.

Nous supposons que nous avons un échantillon fixe pour lequel le sous-ensemble du simplex défini par les équations (3.1) et (3.2) est non vide. Pour $j = 1, \dots, n$ soit

$w_{j} = N E (p_{j}) = N μ_{j}$ (4.1)

où l'espérance est prise par rapport à la LPPC. Notons que la somme des éléments de $w = (w_{1}, \dots, w_{n})$ est égale à la taille de la population $N$ et que $w_{j}$ peut être considéré comme la pondération associée au $j^{e}$ membre de l'échantillon. Ces pondérations ne dépendent que des valeurs observées des variables auxiliaires et des contraintes de population connues. Par conséquent, il s'agit d'une méthode bayésienne séquentielle d'attribution des pondérations aux unités de l'échantillon dans laquelle est intégrée l'information a priori présente dans les variables auxiliaires et qui ne dépend pas explicitement du plan de sondage.

Nous supposons ici que la taille de la population $N$ est connue, ce qui n'est pas toujours vrai. Le cas échéant, on pourrait remplacer $N$ par une estimation dans l'équation susmentionnée. Si l'estimation est bonne, les inférences résultantes pour un total de population devraient être satisfaisantes. Dans le cas de l'estimation d'une moyenne de population, les résultats seraient nettement moins sensibles à la mesure dans laquelle l'estimation est proche de la taille réelle de la population.

De nombreuses données d'enquête utilisées par les chercheurs du domaine de la science sociale sont fournies avec des pondérations appliquées aux unités individuelles. Dans ces situations, les pondérations basées sur la LPPC pourraient être reliées aux unités de la même façon et l'utilisateur n'aurait pas besoin de faire appel à des méthodes MCMC pour calculer les pondérations. Nous allons nous servir des pondérations pour définir la loi a posteriori de Dirichlet pondérée qui peut être utilisée pour trouver les estimations ponctuelles et les estimations des intervalles pour les quantités de population d'intérêt moyennant des calculs relativement modestes. Dans la suite de l'article, nous illustrerons à l'aide d'exemples comment ces poids peuvent être utilisés pour générer des procédures d'inférence ayant de bonnes propriétés fréquentistes.

Mais avant de poursuivre, faisons une simple observation. Supposons que nous disposions de l'échantillon ainsi que d'un ensemble de pondérations. Si $N$ est grand, nous pouvons construire une population dont la proportion d'unités de type $(y_{i}, x_{i})$ est $w_{i} / N$ pour $i = 1, \dots, n .$ Étant donné l'échantillon et l'ensemble de pondérations, nous pouvons considérer cette population construite comme étant la meilleure approximation de la population inconnue. Alors

${\bar{y}}_{b w} = \sum_{i = 1}^{n} \frac{w_{i}}{N} y_{i}$ et $σ_{b w}^{2} = \sum_{i = 1}^{n} \frac{w_{i}}{N} {(y_{i} - {\bar{y}}_{b w})}^{2}$ (4.2)

sont la moyenne et la variance de cette population construite.

Précédent | Suivant

Date de modification :: 2017-09-20

Sélection de la langue

Recherche et menus

Recherche

Publications

Techniques d’enquête

Recherche par

4 Pondérations basées sur la loi a posteriori de Pólya contrainte