6. Discussion

Benmei Liu, Partha Lahiri et Graham Kalton

Précédent

Le présent article décrit les résultats d'une étude par simulation réalisée à partir d'une population finie réelle pour évaluer les intervalles de crédibilité produits par quatre modèles hiérarchiques, en se basant sur leur longueur et sur leurs propriétés de couverture sous le plan de sondage. Autant que nous sachions, ce genre d'évaluation des intervalles de crédibilité (ou de confiance) fondée sur le plan de sondage n'a encore jamais été effectuée dans le contexte de l'estimation sur petits domaines.

Dans l'étude par simulation, nous avons comparé les propriétés de couverture sous le plan de sondage des intervalles de crédibilité résultant de divers modèles hiérarchiques bayésiens élaborés pour estimer les proportions dans de petits domaines sous un plan de sondage aléatoire simple stratifié. Globalement, aucun modèle ne l'emporte clairement sur les autres, si bien que nous ne pouvons pas en recommander un plutôt que les autres.

La version hiérarchique bayésienne du modèle bien connu de Fay-Herriot semble produire des intervalles de crédibilité exagérément prudents. La non-normalité du modèle d'échantillonnage ainsi que du modèle de lien pourrait être la source de ce problème. Pour le modèle hiérarchique bêta-logistique, les intervalles de crédibilité donnent presque la couverture nominale pour les proportions de population finie et, des quatre modèles étudiés, ce modèle est celui qui possède les meilleures propriétés de biais quand la taille d'échantillon est petite. Cependant, comme l'une des distributions conditionnelles complètes pour le modèle bêta-logistique fait intervenir les proportions pondérées par les poids de sondage, la méthode MCMC pose problème chaque fois qu'une de ces proportions est nulle. Les intervalles de crédibilité pour ce modèle sont également plus larges que ceux observés pour les deux autres modèles comportant un modèle de lien logistique. La largeur de l'intervalle de crédibilité sous le modèle bêta-logistique pourrait peut-être être réduite si le modèle est modifié, par exemple en utilisant un modèle de mélange de lois à effet aléatoire en deux parties approprié qui permettrait d'éviter le problème des proportions pondérées par les poids de sondage nulles. Une étude plus approfondie à ce sujet est nécessaire. Il pourrait aussi être utile d'envisager d'autres modèles, peut-être un modèle probabiliste discret pour le niveau 1, en vue d'améliorer l'estimation des intervalles des petites proportions pour les petits domaines.

L'étude par simulation a montré que la couverture des intervalles de crédibilité bayésiens des proportions dans la population finie s'écartait considérablement du niveau nominal de 95 % pour les quatre modèles, et une constatation semblable a été faite pour la couverture sous le plan de sondage du modèle de Fay-Herriot dont l'usage est très répandu. Compte tenu de ces résultats, nous avons effectué un certain nombre d'analyses supplémentaires en vue de trouver une explication. Ces analyses comprenaient l'ajout de variables prédictives aux modèles, l'utilisation d'une loi a priori uniforme pour σ ν 2 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaaeeqmaGcqwbi eBHn2Aa8qacaaHdpWaa0baaSqaaiaae27aaeaacaaIYaaaaaaa@3D1F@  (fondée sur des arguments formulés par Gelman 2006), l'utilisation de l'approche de la meilleure prédiction empirique pour le modèle M1, l'accroissement de la taille d'échantillon dans les États ne comptant que quelques naissances en fixant le nombre minimum à 50, et l'application de ces méthodes pour estimer la proportion de naissances dont le poids à la naissance était inférieur à la médiane nationale dans chaque État. Même si les propriétés de couverture des intervalles des proportions dans la population finie au niveau de l'État présentaient certaines différences, aucune de ces analyses n'a produit des taux de couverture proches des taux nominaux. Le seul cas où ces derniers coïncidaient avec les taux de couverture réels était celui d'un jeu de données simulé construit sous le modèle M1 pour les proportions au niveau de l'État de naissances pour lesquelles le poids de naissance était inférieur à la médiane nationale; les taux de couverture moyens étaient de 5,1 % et de 5,2 % pour les approches du meilleur prédicteur empirique (MPE) et HB, respectivement.

L'étude par simulation a été limitée à un plan de sondage à un seul degré. En outre, pour simplifier, aucune variable auxiliaire n'a été incluse dans les modèles de lien dans les analyses principales, alors qu'en pratique, l'ajout de ce genre de variables est habituel et presque essentiel. D'autres études par simulation doivent être réalisées en vue d'examiner différents plans de sondage et différentes tailles d'échantillon, et d'intégrer certaines variables auxiliaires dans les modèles de lien. Nous espérons que notre étude encouragera d'autres chercheurs à exécuter des simulations fondées sur le plan de sondage similaires pour évaluer les méthodes d'estimation sur petits domaines. À la lumière de nos résultats limités, il convient de mettre en garde les utilisateurs d'estimations sur petits domaines quant à l'interprétation des intervalles de crédibilité des estimations.

Remerciements

Les auteurs tiennent à remercier les rédacteurs associés ainsi que deux réviseurs pour leurs suggestions constructives ayant permis d'améliorer significativement l'article original. Les travaux de recherche du deuxième auteur ont été financés par la National Science Foundation SES-085100.

Annexe

Annexe A

A1. Distributions conditionnelles complètes pour les paramètres de chaque modèle

Soit p = ( p 1w ,..., p mw ) t MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGabmiCayaala Gaeyypa0JaaiikaiaadchadaWgaaWcbaGaaGymaiaadEhaaeqaaOGa aiilaiaac6cacaGGUaGaaiOlaiaacYcacaWGWbWaaSbaaSqaaiaad2 gacaWG3baabeaakiaacMcadaahaaWcbeqaaiaadshaaaaaaa@43E1@  et r i = ψ i ψ i + σ v 2 MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamOCamaaBa aaleaacaWGPbaabeaakiabg2da9maalaaabaGaaqiYdmaaBaaaleaa caWGPbaabeaaaOqaaiaaeI8adaWgaaWcbaGaamyAaaqabaGccqGHRa WkcaaHdpWaa0baaSqaaiaadAhaaeaacaaIYaaaaaaaaaa@4211@ .

Les distributions conditionnelles complètes pour le modèle de Fay-Herriot (M1) sont les suivantes :

i) θ i |μ, σ v 2 , p ~N((1 r i ) p iw + r i μ,     ψ i (1 r i )) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiUdmaaBa aaleaacaWGPbaabeaakiaacYhacaaH8oGaaiilaiaaeo8adaqhaaWc baGaamODaaqaaiaaikdaaaGccaGGSaGabmiCayaalaGaaiOFaiaad6 eacaGGOaGaaiikaiaaigdacqGHsislcaWGYbWaaSbaaSqaaiaadMga aeqaaOGaaiykaiaadchadaWgaaWcbaGaamyAaiaadEhaaeqaaOGaey 4kaSIaamOCamaaBaaaleaacaWGPbaabeaakiaaeY7acaGGSaGaaeii aiaabccacaqGGaGaaeiiaiaaeI8adaWgaaWcbaGaamyAaaqabaGcca GGOaGaaGymaiabgkHiTiaadkhadaWgaaWcbaGaamyAaaqabaGccaGG PaGaaiykaaaa@5A9D@ ;

ii) μ| θ i , σ v 2 ,p~N( 1 m i=1 m θ i , σ v 2 m ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiVdiaacY hacaaH4oWaaSbaaSqaaiaadMgaaeqaaOGaaiilaiaaeo8adaqhaaWc baGaamODaaqaaiaaikdaaaGccaGGSaGaamiCaiaac6hacaWGobWaae WaaeaadaWcaaqaaiaaigdaaeaacaWGTbaaamaaqahabaGaaqiUdmaa BaaaleaacaWGPbaabeaaaeaacaWGPbGaeyypa0JaaGymaaqaaiaad2 gaa0GaeyyeIuoakiaacYcadaWcaaqaaiaaeo8adaqhaaWcbaGaamOD aaqaaiaaikdaaaaakeaacaWGTbaaaaGaayjkaiaawMcaaaaa@5261@ ;

iii) σ v 2 |μ, θ i , p ~ING( a+ 1 2 m,b+ 1 2 i=1 m ( θ i μ ) 2 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaq4WdmaaDa aaleaacaWG2baabaGaaGOmaaaakiaacYhacaaH8oGaaiilaiaaeI7a daWgaaWcbaGaamyAaaqabaGccaGGSaGabmiCayaalaGaaiOFaiaadM eacaWGobGaam4ramaabmaabaGaamyyaiabgUcaRmaalaaabaGaaGym aaqaaiaaikdaaaGaamyBaiaacYcacaWGIbGaey4kaSYaaSaaaeaaca aIXaaabaGaaGOmaaaadaaeWbqaaiaacIcacaaH4oWaaSbaaSqaaiaa dMgaaeqaaaqaaiaadMgacqGH9aqpcaaIXaaabaGaamyBaaqdcqGHri s5aOGaeyOeI0IaaqiVdiaacMcadaahaaWcbeqaaiaaikdaaaaakiaa wIcacaGLPaaaaaa@5A23@ .

Les distributions conditionnelles complètes pour le modèle normal-logistique (M2) sont les suivantes :

i) θ i |μ, σ v 2 , p 1 θ i (1 θ i ) σ v ψ i exp( ( p iw θ i ) 2 2 ψ i (logit( θ i )μ) 2 2 σ v 2 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiUdmaaBa aaleaacaWGPbaabeaakiaacYhacaaH8oGaaiilaiaaeo8adaqhaaWc baGaamODaaqaaiaaikdaaaGccaGGSaGabmiCayaalaGaeyyhIu7aaS aaaeaacaaIXaaabaGaaqiUdmaaBaaaleaacaWGPbaabeaakiaacIca caaIXaGaeyOeI0IaaqiUdmaaBaaaleaacaWGPbaabeaakiaacMcaca aHdpWaaSbaaSqaaiaadAhaaeqaaOWaaOaaaeaacaaHipWaaSbaaSqa aiaadMgaaeqaaaqabaaaaOGaciyzaiaacIhacaGGWbWaaeWaaeaacq GHsisldaWcaaqaaiaacIcacaWGWbWaaSbaaSqaaiaadMgacaWG3baa beaakiabgkHiTiaaeI7adaWgaaWcbaGaamyAaaqabaGccaGGPaWaaW baaSqabeaacaaIYaaaaaGcbaGaaGOmaiaaeI8adaWgaaWcbaGaamyA aaqabaaaaOGaeyOeI0YaaSaaaeaacaGGOaGaciiBaiaac+gacaGGNb GaaiyAaiaacshacaGGOaGaaqiUdmaaBaaaleaacaWGPbaabeaakiaa cMcacqGHsislcaaH8oGaaiykamaaCaaaleqabaGaaGOmaaaaaOqaai aaikdacaaHdpWaa0baaSqaaiaadAhaaeaacaaIYaaaaaaaaOGaayjk aiaawMcaaaaa@7270@ ;

ii) μ| θ i , σ v 2 ,p~N( 1 m i=1 m logit( θ i ),  σ v 2 m ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiVdiaacY hacaaH4oWaaSbaaSqaaiaadMgaaeqaaOGaaiilaiaaeo8adaqhaaWc baGaamODaaqaaiaaikdaaaGccaGGSaGaamiCaiaac6hacaWGobWaae WaaeaadaWcaaqaaiaaigdaaeaacaWGTbaaamaaqahabaGaciiBaiaa c+gacaGGNbGaaiyAaiaacshacaGGOaGaaqiUdmaaBaaaleaacaWGPb aabeaaaeaacaWGPbGaeyypa0JaaGymaaqaaiaad2gaa0GaeyyeIuoa kiaacMcacaGGSaGaaeiiamaalaaabaGaaq4WdmaaDaaaleaacaWG2b aabaGaaGOmaaaaaOqaaiaad2gaaaaacaGLOaGaayzkaaaaaa@5912@ ;

iii) σ v 2 |μ, θ i , p ~ING( a+ 1 2 m,b+ 1 2 i=1 m (logit( θ i )μ ) 2 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaq4WdmaaDa aaleaacaWG2baabaGaaGOmaaaakiaacYhacaaH8oGaaiilaiaaeI7a daWgaaWcbaGaamyAaaqabaGccaGGSaGabmiCayaalaGaaiOFaiaadM eacaWGobGaam4ramaabmaabaGaamyyaiabgUcaRmaalaaabaGaaGym aaqaaiaaikdaaaGaamyBaiaacYcacaWGIbGaey4kaSYaaSaaaeaaca aIXaaabaGaaGOmaaaadaaeWbqaaiaacIcaciGGSbGaai4BaiaacEga caGGPbGaaiiDaiaacIcacaaH4oWaaSbaaSqaaiaadMgaaeqaaaqaai aadMgacqGH9aqpcaaIXaaabaGaamyBaaqdcqGHris5aOGaaiykaiab gkHiTiaaeY7acaGGPaWaaWbaaSqabeaacaaIYaaaaaGccaGLOaGaay zkaaaaaa@6031@ .

Les distributions conditionnelles complètes pour le modèle normal-logistique avec variance inconnue (M3) sont les mêmes que pour le modèle M2 excepté que ψ i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiYdmaaBa aaleaacaWGPbaabeaaaaa@384F@  est remplacé par θ i (1 θ i )def f iw / n i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiUdmaaBa aaleaacaWGPbaabeaakiaacIcacaaIXaGaeyOeI0IaaqiUdmaaBaaa leaacaWGPbaabeaakiaacMcacaWGKbGaamyzaiaadAgacaWGMbWaaS baaSqaaiaadMgacaWG3baabeaakiaac+cacaWGUbWaaSbaaSqaaiaa dMgaaeqaaaaa@4638@  pour la distribution de θ i MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiUdmaaBa aaleaacaWGPbaabeaaaaa@3840@  sachant les autres paramètres.

Soit δ iw = n i def f iw 1. MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiTdmaaBa aaleaacaWGPbGaam4DaaqabaGccqGH9aqpdaWcaaqaaiaad6gadaWg aaWcbaGaamyAaaqabaaakeaacaWGKbGaamyzaiaadAgacaWGMbWaaS baaSqaaiaadMgacaWG3baabeaaaaGccqGHsislcaaIXaGaaiOlaaaa @4491@  Les distributions conditionnelles complètes pour le modèle bêta-logistique (M4) sont les suivantes :

i) θ i |μ, σ v 2 , p 1 θ i (1 θ i ) σ v p iw θ i δ iw 1 (1 p iw ) (1 θ i ) δ iw 1 Γ( θ i δ iw )Γ((1 θ i ) δ iw ) exp( (logit( θ i )μ) 2 2 σ v 2 ); MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiUdmaaBa aaleaacaWGPbaabeaakiaacYhacaaH8oGaaiilaiaaeo8adaqhaaWc baGaamODaaqaaiaaikdaaaGccaGGSaGabmiCayaalaGaeyyhIu7aaS aaaeaacaaIXaaabaGaaqiUdmaaBaaaleaacaWGPbaabeaakiaacIca caaIXaGaeyOeI0IaaqiUdmaaBaaaleaacaWGPbaabeaakiaacMcaca aHdpWaaSbaaSqaaiaadAhaaeqaaaaakmaalaaabaGaamiCamaaDaaa leaacaWGPbGaam4DaaqaaiaaeI7adaWgaaadbaGaamyAaaqabaWcca aH0oWaaSbaaWqaaiaadMgacaWG3baabeaaliabgkHiTiaaigdaaaGc caGGOaGaaGymaiabgkHiTiaadchadaWgaaWcbaGaamyAaiaadEhaae qaaOGaaiykamaaCaaaleqabaGaaiikaiaaigdacqGHsislcaaH4oWa aSbaaWqaaiaadMgaaeqaaSGaaiykaiaaes7adaWgaaadbaGaamyAai aadEhaaeqaaSGaeyOeI0IaaGymaaaaaOqaaiaafo5acaGGOaGaaqiU dmaaBaaaleaacaWGPbaabeaakiaaes7adaWgaaWcbaGaamyAaiaadE haaeqaaOGaaiykaiaafo5acaGGOaGaaiikaiaaigdacqGHsislcaaH 4oWaaSbaaSqaaiaadMgaaeqaaOGaaiykaiaaes7adaWgaaWcbaGaam yAaiaadEhaaeqaaOGaaiykaaaaciGGLbGaaiiEaiaacchadaqadaqa aiabgkHiTmaalaaabaGaaiikaiGacYgacaGGVbGaai4zaiaacMgaca GG0bGaaiikaiaaeI7adaWgaaWcbaGaamyAaaqabaGccaGGPaGaeyOe I0IaaqiVdiaacMcadaahaaWcbeqaaiaaikdaaaaakeaacaaIYaGaaq 4WdmaaDaaaleaacaWG2baabaGaaGOmaaaaaaaakiaawIcacaGLPaaa caGG7aaaaa@928A@

ii) μ| θ i , σ v 2 ,p~N( 1 m i=1 m logit( θ i ),  σ v 2 m ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiVdiaacY hacaaH4oWaaSbaaSqaaiaadMgaaeqaaOGaaiilaiaaeo8adaqhaaWc baGaamODaaqaaiaaikdaaaGccaGGSaGaamiCaiaac6hacaWGobWaae WaaeaadaWcaaqaaiaaigdaaeaacaWGTbaaamaaqahabaGaciiBaiaa c+gacaGGNbGaaiyAaiaacshacaGGOaGaaqiUdmaaBaaaleaacaWGPb aabeaaaeaacaWGPbGaeyypa0JaaGymaaqaaiaad2gaa0GaeyyeIuoa kiaacMcacaGGSaGaaeiiamaalaaabaGaaq4WdmaaDaaaleaacaWG2b aabaGaaGOmaaaaaOqaaiaad2gaaaaacaGLOaGaayzkaaaaaa@5912@ ;

iii) σ v 2 |μ, θ i , p ~ING( a+ 1 2 m,b+ 1 2 i=1 m (logit( θ i )μ ) 2 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaq4WdmaaDa aaleaacaWG2baabaGaaGOmaaaakiaacYhacaaH8oGaaiilaiaaeI7a daWgaaWcbaGaamyAaaqabaGccaGGSaGabmiCayaalaGaaiOFaiaadM eacaWGobGaam4ramaabmaabaGaamyyaiabgUcaRmaalaaabaGaaGym aaqaaiaaikdaaaGaamyBaiaacYcacaWGIbGaey4kaSYaaSaaaeaaca aIXaaabaGaaGOmaaaadaaeWbqaaiaacIcaciGGSbGaai4BaiaacEga caGGPbGaaiiDaiaacIcacaaH4oWaaSbaaSqaaiaadMgaaeqaaaqaai aadMgacqGH9aqpcaaIXaaabaGaamyBaaqdcqGHris5aOGaaiykaiab gkHiTiaaeY7acaGGPaWaaWbaaSqabeaacaaIYaaaaaGccaGLOaGaay zkaaaaaa@6031@ .

Annexe B

Code WinBUGS pour le modèle 1 :

Model {
      for ( i in 1 :N)  {
         pobs[i] ~ dnorm(theta[i], D[i])
         D[i] <- 1/varhat[i]
         theta[i]<-u+v[i]
         v[i]~dnorm(0, tau)
                          }
       u~dflat()
       tau~dgamma(0.001, 0.001)
       sigma_v2<-1/tau
          }

Code WinBUGS pour le modèle 2 :

Model {
      for ( i in 1 :N)  {
         pobs[i] ~ dnorm(theta[i], D[i])
         D[i] <- 1/varhat[i]
         logit(theta[i])<-u+v[i]
         v[i]~dnorm(0, tau)
                           }
       u~dflat()
       tau~dgamma(0.001, 0.001)
       sigma_v2<-1/tau
          }

Code WinBUGS pour le modèle 3 :

Model {
      for ( i in 1 :N)  {
         pobs[i] ~ dnorm(theta[i], E[i])
         E[i] <- SAMPn[i]/(theta[i]*(1-theta[i])*DEFF_kish[i])
         logit(theta[i])<-u+v[i]
         v[i]~dnorm(0, tau)
         D[i]<-1/E[i]
                          }
       u~dflat()
       tau~dgamma(0.001, 0.001)
       sigma_v2<-1/tau
          }

Code WinBUGS pour le modèle 4 :

Model {
      for ( i in 1 :N) {
         pobs[i] ~ dbeta(a[i], b[i])
         a[i] <- theta[i]*(theta[i]*(1-theta[i])/D[i]-1)
         b[i] <- (1-theta[i])*(theta[i]*(1-theta[i])/D[i]-1)
         logit(theta[i])<-u+v[i]
         v[i]~dnorm(0, tau)
         D[i]<-theta[i]*(1-theta[i])*DEFF_kish[i]/SAMPn[i]
                          }
       u~dflat()
       tau~dgamma(0.001, 0.001)
       sigma_v2<-1/tau
          }

Bibliographie

Arora, V. et Lahiri, P. (1997). On the superiority of the Bayesian method over the BLUP in small area estimation problems. Statistica Sinica, 7, 1053-1063.

Chattopadhyay, M., Lahiri, P., Larsen, M., et Reimnitz, J. (1999). Estimation composite de la prevalence des drogues pour des zones infraétats. Techniques d'enquetes, 25, 91-97.

Chen, M., Shao, Q., et Ibraham, J.G. (2000). Monte Carlo Methods in Bayesian Computation. New York: Springer-Verlag.

Citro, C., et Kalton, G. (Eds.) (2000). Small-Area Income and Poverty Estimates: Priorities for 2000 and Beyond. Washington, DC: National Academy Press.

Farrell, P.J., MacGibbon, B., et Tomberlin, T.J. (1997). Empirical Bayes estimators of small area proportions in multistage designs. Statistical Sinica, 7, 1065-1083.

Fay, R.E., et Herriot, R.A. (1979). Estimates of income for small places: An application of James-Stein procedures to census data. Journal of the American Statistical Association, 74, 269-277.

Gelman, A.  (2006). Prior distributions for variance parameters in hierarchical models. Bayesian Analysis, 1, 515-533.

Gelman, A., et Rubin, D.B. (1992). Inference from iterative simulation using multiple sequences. Statistical Science, 7, 457-472.

Jiang, J., et Lahiri, P. (2006a). Mixed model prediction and small area estimation. Test, 15, 111-999.

Jiang, J., et Lahiri, P. (2006b). Estimation of finite population domain means: A model-assisted empirical best prediction approach. Journal of the American Statistical Association, 101, 301-311.

Kish, L. (1965). Survey sampling. New York: John Wiley.

Lunn, D.J., Thomas, A., Best, N., et Spiegelhalter, D. (2000). WinBUGS - A Bayesian modeling framework: Concepts, structure, and extensibility. Statistics and Computing, 10, 325-337.

Malec, D., Davis, W., et Cao, X. (1999). Small area estimates of overweight prevalence using sample selection adjustment. Statistics in Medicine, 18, 3189-3200.

Malec, D., Sedransk, J., Moriarity, C.L., et LeClere, F.B. (1997). Small area inference for binary variables in the National Health Interview Survey. Journal of the American Statistical Association, 92, 815-826.

Maples, J., et Bell, W.R. (2005). Evaluation of school district poverty estimates: Predictive models using IRS income tax data. Proceedings of the Survey Research Methods Section, American Statistical Association, 1322-1329.

Mohadjer, L., Rao, J.N.K., Liu, B., Krenzke, T., et Van De Kerckhove, W. (2012). Hierarchical Bayes small area estimates of adult literacy using unmatched sampling and linking models. Journal of the Indian Society of Agricultural Statistics, 66 (1), 55-63.

Rao, J.N.K. (2003). Small area estimation. New York: John Wiley and Sons.

Robert, C.P., et Casella, G. (1999). Monte Carlo Statistical Methods. New York: Springer-Verlag.

Singh, A.C., Folsom, R.E., Jr. et Vaish, A.K. (2005). Small area modeling for survey data with smoothed error covariance structure via generalized design effects. Federal Committee on Statistical Methods Statistical Working Paper No. 39. (http://www.fcsm.gov/05papers/Singh_etal_IIIC.pdf)

U.S. National Center for Health Statistics (2009). National Vital Statistics System. Birth Data. (http://www.cdc.gov/nchs/births.htm)

Wright, D., Sathe, N., et Spagnola, K. (2007). State Estimates of Substance Use from the 2004-2005 National Surveys on Drug Use and Health. (DHHS Publication No. SMA 07-4235, NSDUH Series H-31). Rockville, MD: Substance Abuse and Mental Health Services Administration, Office of Applied Studies.

You, Y. (2008). Une approche intégrée de modélisation de l'estimation du taux de chômage pour les régions infraprovinciales au Canada. Techniques d'enquêtes, 34, 21-30.

You, Y., et Rao, J.N.K. (2002). Small area estimation using unmatched sampling and linking models. Canadian Journal of Statistics, 30, 3-15.

Précédent

Date de modification :