Échantillonnage inverse à probabilités inégales
Section 6. Tirage à probabilités inégales sans remiseÉchantillonnage inverse à probabilités inégales
Section 6. Tirage à probabilités inégales sans remise
Pour le tirage sans
remise, le premier problème est la définition du plan. Une option est
d’utiliser la méthode d’Ohlsson (1995) appelée échantillonnage de Poisson
séquentiel. Cette méthode consiste à générer
variable aléatoires uniformes dans
l’intervalle
notée
Ensuite on choisit les
unités correspondant aux plus petites valeurs
de
Cette méthode a l’avantage d’être utilisable
pour toute taille d’échantillon et de fournir une suite d’échantillons qui sont
inclus l’un dans l’autre. Malheureusement, elle ne vérifie qu’approximativement
les probabilités d’inclusion fixées. Les approximations sont cependant très
précises selon les simulations données dans Ohlsson (1995).
Des méthodes ont été
également proposées par Sampford (1962) et Pathak (1964). Nous proposons une
solution exacte à ce problème au sens où les probabilités d’inclusion sont
exactement vérifiées. On commence par calculer les probabilités d’inclusion
pour un plan de taille fixe
avec des probabilités d’inclusion
proportionnelles à une variable auxiliaire strictement positive
Les probabilités sont déterminées par
où
est déterminé de sorte que
Un algorithme simple pour
calculer ces probabilités est décrit entre autres dans Tillé (2006, page 19).
Ces probabilités peuvent être calculées simplement au moyen de la fonction inclusionprobabilities du package R sampling.
Une méthode de tirage
séquentielle doit donc sélectionner un échantillon de taille
avec des probabilités d’inclusion
Ensuite, elle doit permettre de passer de la
taille
à la taille
en sélectionnant simplement une unité
supplémentaire de manière à ce que l’échantillon complété ait bien une
probabilité d’inclusion
Il semble que la seule méthode permettant de
réaliser cela est la méthode éliminatoire (Tillé 1996). La méthode éliminatoire
part de la population complète (la liste des professions) et élimine une unité
à chaque étape. À l’étape
l’unité est éliminée parmi les unités
restantes avec la probabilité
Cette méthode permet ainsi de
créer une suite d’échantillons inclus l’un dans l’autre qui vérifient les
probabilités d’inclusion relatifs à leur taille.
Il suffit donc
d’appliquer la méthode éliminatoire pour la taille d’échantillon
afin que l’algorithme élimine toutes les
unités successivement. En les prenant dans l’ordre inverse des éliminations, on
obtient une suite d’unités. Les
premières unités de cette suite sont bien
sélectionnées avec les probabilités d’inclusion
L’Annexe contient une fonction en langage R
qui permet de générer cette suite. Ce code est soumis à une simulation qui
montre que les probabilités obtenues par simulations en appliquant cette
fonction sont bien égales aux probabilités d’inclusions fixées pour toutes les
tailles d’échantillon.
6.2 Plan
inverse ou négatif à probabilités inégales
Maintenant que le plan
est bien défini, on peut définir le plan inverse. On prend les unités dans la
liste de professions au moyen de la méthode éliminatoire jusqu’à ce que
professions présentes dans l’entreprise soient
sélectionnées. Dans ce cas, la distribution de probabilité du nombre d’échecs
semble impossible à calculer. Le calcul de la
probabilité d’inclusion conditionnelle
est également problématique.
On peut cependant procéder
par analogie et estimer les probabilités d’inclusion en se basant sur
l’expression (5.1) développée pour le cas avec remise où l’on remplace
simplement
par
Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.
Présentation de textes pour la revue
Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).
Note de reconnaissance
Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.
Normes de service à la clientèle
Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.
Droit d'auteur
Publication autorisée par le ministre responsable de Statistique Canada.