Échantillonnage inverse à probabilités inégales Section 6. Tirage à probabilités inégales sans remiseÉchantillonnage inverse à probabilités inégales Section 6. Tirage à probabilités inégales sans remise

6.1 Tirage séquentiel sans remise

Pour le tirage sans remise, le premier problème est la définition du plan. Une option est d’utiliser la méthode d’Ohlsson (1995) appelée échantillonnage de Poisson séquentiel. Cette méthode consiste à générer $M$ variable aléatoires uniformes dans l’intervalle $[0,1]$ notée $u_{i k} .$ Ensuite on choisit les $n$ unités correspondant aux plus petites valeurs de $u_{i k} / π_{k | i} .$ Cette méthode a l’avantage d’être utilisable pour toute taille d’échantillon et de fournir une suite d’échantillons qui sont inclus l’un dans l’autre. Malheureusement, elle ne vérifie qu’approximativement les probabilités d’inclusion fixées. Les approximations sont cependant très précises selon les simulations données dans Ohlsson (1995).

Des méthodes ont été également proposées par Sampford (1962) et Pathak (1964). Nous proposons une solution exacte à ce problème au sens où les probabilités d’inclusion sont exactement vérifiées. On commence par calculer les probabilités d’inclusion pour un plan de taille fixe $n$ avec des probabilités d’inclusion proportionnelles à une variable auxiliaire strictement positive $b_{k}, k \in L .$ Les probabilités sont déterminées par

$π_{k | i} (n) = \min (1, C_{n} \frac{b_{k}}{\sum_{l \in L} b_{l}}),$

où $C_{n}$ est déterminé de sorte que

$\sum_{k \in L} π_{k | i} (n) = \sum_{k \in L} \min (1, C_{n} \frac{b_{k}}{\sum_{l \in L} b_{l}}) = n .$

Un algorithme simple pour calculer ces probabilités est décrit entre autres dans Tillé (2006, page 19). Ces probabilités peuvent être calculées simplement au moyen de la fonction inclusionprobabilities du package R sampling.

Une méthode de tirage séquentielle doit donc sélectionner un échantillon de taille $n$ avec des probabilités d’inclusion $π_{k | i} (n) .$ Ensuite, elle doit permettre de passer de la taille $n$ à la taille $n + 1$ en sélectionnant simplement une unité supplémentaire de manière à ce que l’échantillon complété ait bien une probabilité d’inclusion $π_{k | i} (n + 1) .$ Il semble que la seule méthode permettant de réaliser cela est la méthode éliminatoire (Tillé 1996). La méthode éliminatoire part de la population complète (la liste des professions) et élimine une unité à chaque étape. À l’étape $j =1, \dots, N,$ l’unité est éliminée parmi les unités restantes avec la probabilité

$1 - \frac{π_{k | i} (N - j)}{π_{k | i} (N - j + 1)} .$

Cette méthode permet ainsi de créer une suite d’échantillons inclus l’un dans l’autre qui vérifient les probabilités d’inclusion relatifs à leur taille.

Il suffit donc d’appliquer la méthode éliminatoire pour la taille d’échantillon $n =1$ afin que l’algorithme élimine toutes les unités successivement. En les prenant dans l’ordre inverse des éliminations, on obtient une suite d’unités. Les $n$ premières unités de cette suite sont bien sélectionnées avec les probabilités d’inclusion $π_{k | i} (n) .$ L’Annexe contient une fonction en langage R qui permet de générer cette suite. Ce code est soumis à une simulation qui montre que les probabilités obtenues par simulations en appliquant cette fonction sont bien égales aux probabilités d’inclusions fixées pour toutes les tailles d’échantillon.

6.2 Plan inverse ou négatif à probabilités inégales

Maintenant que le plan est bien défini, on peut définir le plan inverse. On prend les unités dans la liste de professions au moyen de la méthode éliminatoire jusqu’à ce que $r$ professions présentes dans l’entreprise soient sélectionnées. Dans ce cas, la distribution de probabilité du nombre d’échecs $X_{i}$ semble impossible à calculer. Le calcul de la probabilité d’inclusion conditionnelle $E (A_{i k} | X_{i})$ est également problématique.

On peut cependant procéder par analogie et estimer les probabilités d’inclusion en se basant sur l’expression (5.1) développée pour le cas avec remise où l’on remplace simplement $p_{i k}$ par

$\frac{π_{k | i} (r + X_{i})}{r + X_{i}} .$

On obtient alors

$\hat{1 / π_{k | i}} = {\begin{array}{l} \frac{(r - 1) (r + X_{i})}{r (X_{i} + r - 1) π_{k | i} (r + X_{i})} & si k \in F_{i} \\ \frac{r + X_{i}}{(X_{i} + r - 1) π_{k | i} (r + X_{i})} & si k \in D_{i} . \end{array}$

ISSN : 1712-5685

Politique de rédaction

Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.

Présentation de textes pour la revue

Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).

Note de reconnaissance

Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.

Normes de service à la clientèle

Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.

Droit d'auteur

Publication autorisée par le ministre responsable de Statistique Canada.

L'utilisation de la présente publication est assujettie aux modalités de l'Entente de licence ouverte de Statistique Canada.

N° 12-001-X au catalogue

Périodicité : Semi-annuel

Ottawa

Date de modification :: 2016-12-20

Sélection de la langue

Recherche et menus

Recherche

Échantillonnage inverse à probabilités inégales Section 6. Tirage à probabilités inégales sans remiseÉchantillonnage inverse à probabilités inégales Section 6. Tirage à probabilités inégales sans remise

6.1 Tirage séquentiel sans remise

6.2 Plan inverse ou négatif à probabilités inégales