1. Introduction

Benmei Liu, Partha Lahiri et Graham Kalton

Précédent | Suivant

Les méthodes d'estimation sur petits domaines sont souvent utilisées pour estimer les proportions d'unités ayant une caractéristique donnée dans de petits domaines. Ainsi, ces méthodes sont appliquées aux données du programme des Small Area Income and Poverty Estimates (SAIPE) du Census Bureau pour estimer les taux de pauvreté au niveau de l'État, du comté et du district scolaire (Citro et Kalton, 2000; Maples et Bell 2005), aux données de la National Survey on Drug Use and Health (NSDUH) pour estimer les taux de consommation de drogues au niveau de l'État (Wright, Sathe et Spagnola 2007), et aux données de la National Assessment of Adult Literacy (NAAL) pour estimer les proportions de personnes ayant le plus faible niveau d'alphabétisation au niveau de l'État et du comté (Mohadjer, Rao, Liu, Krenzke et Van De Kerckhove 2012). Dans chaque cas, les tailles d'échantillon dans les petits domaines sont trop faibles pour produire des estimations directes d'une précision suffisante. Une grande variété de méthodes ont été élaborées pour résoudre ces problèmes d'estimation sur petits domaines. Voir Rao (2003) et Jiang et Lahiri (2006a) pour une revue de ces méthodes, et Chattopadhyay, Lahiri, Larsen et Reimnitz (1999), Farrell, MacGibbon and Tomberlin (1997) ainsi que Malec, Sedransk, Moriarity et LeClere (1997) et Malec, Davis et Cao (1999) pour des méthodes conçues spécialement pour estimer les proportions dans les petits domaines. La gamme de méthodes englobe l'approche hiérarchique bayésienne (HB) et celle du meilleur prédicteur empirique (MPE), ainsi que les modèles élaborés au niveau du domaine et au niveau de l'unité. Nous nous concentrons ici sur les modèles HB au niveau du domaine.

Lorsqu'on fait appel à un modèle HB au niveau du domaine pour produire des estimations des proportions d'unités possédant une caractéristique donnée dans de petits domaines, on suppose habituellement que, pour chaque domaine échantillonné, la proportion pondérée par les poids de sondage suit une loi d’échantillonnage normale et que sa variance d'échantillonnage est connue. Cependant, ces hypothèses posent problème lorsque la taille de l'échantillon de petit domaine est petite ou que la proportion réelle est proche de 0 ou de 1. Afin de pouvoir appliquer le théorème central limite pour approximer la normalité de la distribution d'échantillonnage d'une proportion, les échantillons doivent être raisonnablement grands, particulièrement si la proportion dans la population est très petite ou très grande (p. ex., inférieure à 0,1 ou supérieure à 0,9). En outre, quand les proportions sont très petites ou très grandes, la variance d'échantillonnage d'une proportion dans l'échantillon est extrêmement sensible à la valeur réelle de la proportion, de sorte qu'il est difficile d'établir une valeur appropriée pour la variance d'échantillonnage. Pour tenter de contourner ces problèmes, nous proposons deux modèles de rechange pour estimer les proportions dans les petits domaines et nous les comparons à deux modèles utilisés fréquemment. Les modèles sont décrits à la section 3. Les quatre modèles sont comparés au moyen d'une étude par simulation Monte Carlo dans laquelle des échantillons aléatoires simples stratifiés sont générés à partir d'une population finie fixe. L'étude par simulation est décrite à la section 4 et les résultats sont présentés à la section 5. Certaines conclusions sont formulées à la section 6. Cependant, pour commencer, nous présentons la notation pour un plan de sondage aléatoire simple stratifié à la section 2.

Précédent | Suivant

Date de modification :