Répartition de l’échantillon pour une estimation efficace sur petits domaines par modélisation
Section 5. Observations en conclusion

Notre recherche a porté sur sept modes de répartition classés en trois groupes selon les données auxiliaires nécessaires à la mise en œuvre des solutions. La quantité d’information auxiliaire est la moindre dans les répartitions égale et proportionnelle qui reposent sur le nombre de domaines et le nombre d’unités statistiques dans chacun. Les répartitions de Neyman et Bankier et la répartition PNL sont fondées sur des critères d’optimisation préétablis et l’application de ces méthodes fait intervenir des valeurs de paramètres par domaine comme l’écart-type ou le coefficient de variation de la variable étudiée. Dans la répartition de Bankier, les totaux de domaine d’au moins une variable auxiliaire doivent être connus. Comme la variable étudiée est inconnue, elle doit être remplacée par une variable substitutive ou auxiliaire appropriée pour que ces trois méthodes puissent s’appliquer. Un trait commun aux répartitions fondées sur des données de dénombrement et sur des paramètres est qu’elles ne font appel à aucun modèle, alors que les trois autres utilisent non seulement un modèle, mais aussi des données de dénombrement.

À en juger par nos résultats empiriques, nous pouvons penser que la répartition g 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpC0xd9Wqpe0dd9 qqaqFeFr0xbbG8FaYPYRWFb9fi0lXxbvc9Ff0dfrpm0dXdHqps0=vr 0=vr0=fdbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeeaaaaaaaa4 0BPjhapeGaam4zaiaabgdaaaa@3778@ fondée sur un modèle est la meilleure de toutes les répartitions analysées dans notre recherche. Il faut aussi dire que les répartitions égale et proportionnelle ont donné de bons résultats, alors que les répartitions assistées d’un modèle et fondées sur des paramètres étaient d’un rendement nettement moindre. Les trois derniers modes de répartition ont été conçus à l’origine pour une estimation directe selon le plan, et leurs résultats peuvent se comprendre de ce point de vue. Si on les compare à la répartition g 1, MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpC0xd9Wqpe0dd9 qqaqFeFr0xbbG8FaYPYRWFb9fi0lXxbvc9Ff0dfrpm0dXdHqps0=vr 0=vr0=fdbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeeaaaaaaaa4 0BPjhapeGaam4zaiaabgdacaqGSaaaaa@3827@ les répartitions MC font appel à un modèle différent, ce qui peut influer sur leurs résultats.

Une caractéristique de la répartition g 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpC0xd9Wqpe0dd9 qqaqFeFr0xbbG8FaYPYRWFb9fi0lXxbvc9Ff0dfrpm0dXdHqps0=vr 0=vr0=fdbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeeaaaaaaaa4 0BPjhapeGaam4zaiaabgdaaaa@3778@ est que le modèle et la méthode d’estimation sont intégrés au départ à l’élaboration du plan d’échantillonnage et constituent donc une information préalable donnée. Pour ce mode de répartition qui repose sur un modèle linéaire mixte au niveau de l’unité et sur la méthode d’estimation EBLUP, nous avons seulement besoin du coefficient d’homogénéité entre domaines qui se calcule par les valeurs de la variable auxiliaire. À cet égard, cette répartition diffère des autres dans notre comparaison. Ajoutons que le point de départ est différent au moment de choisir la méthode d’estimation finale, puisque cette répartition privilégie une estimation fondée sur un modèle, et non une estimation directe selon le plan où interviennent les poids d’échantillonnage. Le choix d’une estimation fondée sur un modèle se justifie également par son caractère courant dans l’estimation sur petits domaines. Par ailleurs, la répartition g 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpC0xd9Wqpe0dd9 qqaqFeFr0xbbG8FaYPYRWFb9fi0lXxbvc9Ff0dfrpm0dXdHqps0=vr 0=vr0=fdbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeeaaaaaaaa4 0BPjhapeGaam4zaiaabgdaaaa@3778@ permet d’utiliser de petites tailles d’échantillon, l’information pouvant être empruntée entre domaines dans l’application du modèle. Cela peut avoir de l’importance dans les enquêtes ou les études rapides que peuvent faire les organismes d’études de marché là où même une mesure unique coûte cher. Il importe toutefois d’examiner les caractéristiques des domaines, et des petits en particulier, avant d’établir les tailles d’échantillon finales.

Nous recommanderions d’entreprendre une recherche plus large pour constater quels sont les avantages et les inconvénients de la détermination, dès la conception du plan de recherche, de la technique de calcul à employer pour produire les statistiques de domaines.

Remerciements

Les auteurs remercient le rédacteur en chef, le rédacteur adjoint et les deux examinateurs, ainsi que le professeur Risto Lehtonen, de leurs observations et leurs suggestions constructives.

Bibliographie

Bankier, M.D. (1988). Power allocations: Determining sample sizes for subnational areas. The American Statistician, 42, 174-177.

Choudhry, G.H., Rao, J.N.K. et Hidiroglou, M.A. (2012). À propos de la répartition de l’échantillon pour une estimation sur domaine efficace. Techniques d’enquête, 38, 1, 25-32. Article accessible à l’adresse http://www.statcan.gc.ca/pub/12-001-x/2012001/article/11682-fra.pdf.

Costa, A., Satorra, A. et Ventura, E. (2004). Improving both domain and total area estimation by composition. SORT, 28(1), 69-86.

Falorsi, P.D., et Righi, P. (2008). Une approche d’échantillonnage équilibré pour des plans de sondage à stratification multidimensionnelle pour l’estimation pour petits domaines. Techniques d’enquête, 34, 2, 247-259. Article accessible à l’adresse http://www.statcan.gc.ca/pub/12-001-x/2008002/article/10763-fra.pdf.

Keto, M., et Pahkinen, E. (2009). On sample allocation for effective EBLUP estimation of small area totals MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfFv0dg9Wqpe0dar pepeuf0xe9q8qiYRWFGCk9vi=dbvc9s8vr0db9Ff0dbbG8Fq0Jfr=x fr=xfbpdbaqaaeaaciGaaiaabeqaamaabaabaaGcbaacbaqcLbwaqa aaaaaaaaWdbiaa=nbiaaa@38D5@ “Experimental Allocation”. Dans Survey Sampling Methods in Economic and Social Research, (Éds., J. Wywial et W. Gamrot), 2010. Katowice: Katowice University of Economics.

Keto, M., et Pahkinen, E. (2014). On sample allocation for efficient small area estimation. Book of Abstracts. SAE 2014, Poland: Poznan University of Economics, page 50.

Longford, N.T. (2006). Calcul de la taille de l’échantillon pour l’estimation pour petits domaines. Techniques d’enquête, 32, 1, 97-106. Article accessible à l’adresse http://www.statcan.gc.ca/pub/12-001-x/2006001/article/9259-fra.pdf.

Molefe, W.B., et Clark, R.G. (2015). Répartition optimale assistée par modèle pour des domaines planifiés en utilisant l’estimation composite. Techniques d’enquête, 41, 2, 399-410. Article accessible à l’adresse http://www.statcan.gc.ca/pub/12-001-x/2015002/article/14230-fra.pdf.

Nissinen, K. (2009). Small Area Estimation with Linear Mixed Models from Unit-Level Panel and Rotating Panel Data. Thèse de doctorat, Université de Jyväskylä, Département de mathématiques et de statistique, Rapport 117, https://jyx.jyu.fi/dspace/handle/123456789/21312.

Pfefferman, D. (2013). New important developments in small area estimation. Statistical Science, 28, 40-68.

Rao, J.N.K. (2003). Small Area Estimation. Hobogen, New Jersey: John Wiley & Sons, Inc.

Tschuprow, A.A. (1923). On the mathematical expectation of the moments of frequency distributions in the case of correlated observations. Metron, Vol. 2, 3, 461-493; 4, 646-683.


Date de modification :