5. Résultats des simulations
Benmei Liu, Partha Lahiri et Graham Kalton
Précédent | Suivant
À la section 5.1, nous présentons les principaux résultats relatifs
aux intervalles de crédibilité obtenus pour les proportions de naissances
vivantes avec faible poids de naissance au niveau de l'État en appliquant
chacun des quatre modèles. Ensuite, à la section 5.2, nous examinons les biais
et les racines carrées des erreurs quadratiques moyennes de ces estimations.
5.1
Estimations des modèles et intervalles de crédibilité
Soit un
estimateur HB de , le pourcentage de naissances
vivantes avec faible poids de naissance dans l'État , et soit le centile de la distribution a posteriori de . Fondé sur les résultats des 1 000 jeux
de données de simulation, le tableau 5.1 donne les résultats qui suivent pour
chaque modèle : la probabilité de non-couverture des intervalles de
crédibilité à 95 % de , c.-à-d. la probabilité que l'intervalle
allant de à ne contienne pas , et la largeur moyenne des intervalles
de crédibilité . Les erreurs-types de simulation
Monte Carlo correspondantes sont également présentées entre parenthèses dans le
tableau.
Pour
examiner l'effet de la taille de l'échantillon de l'État sur les résultats des simulations,
les 50 États et le district de Columbia sont répartis en trois groupes en
fonction de la taille de leur échantillon, à savoir les 15 États dont l'échantillon
est de petite taille les 24 États dont l'échantillon est de taille moyenne et les 12 États dont l'échantillon est de grande taille Les résultats présentés au tableau 5.1 sont les moyennes
globales sur l'ensemble des États et les moyennes pour les trois groupes
distincts.
L'examen
de la moitié supérieure du tableau 5.1 montre que les intervalles de
crédibilité pour le modèle de Fay-Herriot
(M1) sont très prudents, ne donnant quasiment aucune non-couverture. La moitié
inférieure du tableau révèle que ce résultat est obtenu au prix de la plus
grande largeur moyenne de l'intervalle de crédibilité parmi les quatre modèles.
La largeur des intervalles de crédibilité de M1 est très stable. Une faible proportion
de ces intervalles possède une borne inférieure négative.
Le faible niveau de non-couverture observé pour M1 pourrait tenir au fait que les variances
d'échantillonnage ont été surestimées, peut-être parce que a été utilisé au lieu de . Pour examiner
cette possibilité, nous avons utilisé pour calculer la variance d'échantillonnage et
nous n'avons constaté presque aucune différence de taux de non-couverture. Nous
avons également exécuté le modèle en nous servant de la vraie variance définie
dans (2.2) et n'avons de nouveau observé aucune différence appréciable entre
les taux de non-couverture. La non-normalité de la distribution d'échantillonnage
de pourrait également être à l'origine de ce problème.
Tableau 5.1
Pourcentage de fois que les intervalles de crédibilité à 95 % ne contiennent pas
, largeur moyenne des intervalles de crédibilité à 95 %, avec les erreurs-types de simulation Monte Carlo fondées sur 1 000 simulations (en pourcentage)
Sommaire du tableau
Le tableau montre les résultats du pourcentage de fois que les intervalles de crédibilité à 95 % ne contiennent pas . Les données sont présentées selon taille de l'échantillon de l'État (titres de rangée) et M1, M2, M3 et M4(figurant comme en-tête de colonne).
Taille de l'échantillon de l'État
|
M1*
|
M2
|
M3
|
M4
|
|
Pourcentage de non-couverture (erreur-type de simulation Monte Carlo)
|
Échantillon global
|
0,40
(0,028) |
8,24
(0,109) |
6,52
(0,101) |
4,36
(0,088) |
(15 États) |
0,05
(0,019) |
11,39
(0,239) |
8,45
(0,216) |
6,21
(0,190) |
(24 États)
|
0,46
(0,043) |
9,44
(0,167) |
7,61
(0,156) |
4,52
(0,132) |
(12 États)
|
0,70
(0,076) |
1,91
(0,122) |
1,94
(0,124) |
1,74
(0,119) |
|
Largeur moyenne de l'intervalle de crédibilité à 95 % (erreur-type de simulation Monte Carlo)
|
Échantillon global |
9,05
(0,004) |
5,52
(0,009) |
6,20
(0,009) |
8,45
(0,014) |
(15 États) |
10,27
(0,009) |
5,94
(0,020) |
6,78
(0,021) |
9,30
(0,034) |
(24 États) |
9,16
(0,005) |
5,60
(0,013) |
6,28
(0,013) |
8,71
(0,021) |
(12 États) |
7,29
(0,004) |
4,84
(0,012) |
5,30
(0,013) |
6,88
(0,017) |
À 8,2 %,
le taux global de non-couverture des intervalles de crédibilité pour le modèle
normal-logistique (M2) est sensiblement supérieur au taux nominal de 5 %. Ce
modèle donne la plus petite largeur moyenne de l'intervalle. Le taux de non-couverture
pour le modèle normal-logistique avec variance inconnue (M3) s'approche davantage
du taux nominal, avec une largeur globale de l'intervalle un peu plus grande
que dans le cas de M2.
Le
taux global de non-couverture de 4,4 % observé pour le modèle
bêta-logistique (M4) est celui qui est le plus proche du taux de non-couverture
nominal. Cependant, la largeur moyenne des intervalles de crédibilité est plus
grande que celle obtenue pour M2 et M3, et l'erreur-type Monte Carlo de la
largeur de l'intervalle est plus grande que celle observée pour les trois
autres modèles. Cette instabilité pourrait découler de la complexité de la distribution
conditionnelle complète pour le modèle bêta. La forte proportion des 1 000 estimations
directes qui étaient nulles pour certains États dont la taille d'échantillon était
petite pourrait aussi avoir causé d'importants problèmes d'ajustement de la loi
bêta.
Comme prévu, pour
les quatre modèles, la largeur moyenne des intervalles de crédibilité diminue
lorsque la taille de l'échantillon de l'État augmente, et la variation de la
largeur diminue également lorsque la taille de l'échantillon augmente. Toutefois,
malgré ces diminutions, les taux de non-couverture diminuent aussi lorsque la taille
de l'échantillon augmente pour les modèles 2, 3 et 4. En fait, les taux de
non-couverture sont très petits pour les États dont la valeur de est grande, ce qui fait
penser que les intervalles de crédibilité ne reflètent pas adéquatement l'effet
de la plus grande précision des estimations directes dans les États où la taille
d'échantillon est grande.
5.2 Biais et REQM des estimations
fondées sur les modèles
Afin d'étudier ces
résultats plus en détail, nous avons examiné le biais et la racine carrée de l'erreur
quadratique moyenne (REQM) des estimations pour chaque modèle. Les résultats sont présentés au tableau 5.2
dans le même format qu'au tableau 5.1. Les biais des estimations sous les
modèles M1, M2 et M3 présentent une tendance similaire : les biais
observés pour les petits États sont grands et positifs, et sont compensés dans
une certaine mesure par les biais négatifs relativement faibles observés pour
les États de moyenne et de grande taille. Dans le cas du modèle M4, les biais
des estimations présentent une tendance très différente : ils sont presque
nuls pour les petits États et leur valeur est grande et négative pour les États
de moyenne et de grande taille. Cela indique que M4 donnerait de meilleurs
résultats que les trois autres modèles en ce qui concerne le biais lorsque les échantillons
des petits domaines sont de petite taille.
Tableau 5.2
Biais et racine carrée de l'erreur quadratique moyenne des estimations de
fondées sur les quatre modèles (en pourcentage)
Sommaire du tableau
Le tableau montre les résultats du biais et racine carrée de l'erreur quadratique moyenne des estimations de
fondées sur les quatre modèles. Les données sont présentées selon la taille de l'échantillon de l'État (titres de rangée) et M1, M2, M3 et M4(figurant comme en-tête de colonne).
Taille de l'échantillon de l'État
|
M1
|
M2
|
M3
|
M4
|
Biais |
REQM |
Biais |
REQM |
Biais |
REQM |
Biais |
REQM |
Échantillon global |
0,165 |
1,518 |
0,071 |
1.346 |
-0,009 |
1,411 |
-0,214 |
1,712 |
(15 États)
|
0,621 |
1,651 |
0,572 |
1.630 |
0,466 |
1,652 |
0,009 |
1,.922 |
(24 États)
|
-0,006 |
1,547 |
-0,123 |
1.386 |
-0,201 |
1,452 |
-0,319 |
1,775 |
(12 États)
|
-0,063 |
1,294 |
-0,167 |
0.911 |
-0,219 |
1,026 |
-0,283 |
1,323 |
Précédent | Suivant