5. Résultats des simulations

Benmei Liu, Partha Lahiri et Graham Kalton

À la section 5.1, nous présentons les principaux résultats relatifs aux intervalles de crédibilité obtenus pour les proportions de naissances vivantes avec faible poids de naissance au niveau de l'État en appliquant chacun des quatre modèles. Ensuite, à la section 5.2, nous examinons les biais et les racines carrées des erreurs quadratiques moyennes de ces estimations.

5.1 Estimations des modèles et intervalles de crédibilité

Soit $P_{i}^{H B}$ un estimateur HB de $P_{i}$ , le pourcentage de naissances vivantes avec faible poids de naissance dans l'État $i$ , et soit $P_{i, q}^{H B}$ le $q^{e}$ centile de la distribution a posteriori de $P_{i}$ . Fondé sur les résultats des 1 000 jeux de données de simulation, le tableau 5.1 donne les résultats qui suivent pour chaque modèle : la probabilité de non-couverture des intervalles de crédibilité à 95 % de $P_{i}^{}$ , c.-à-d. la probabilité que l'intervalle allant de $P_{i; 0, 025}^{H B}$ à $P_{i; 0, 975}^{H B}$ ne contienne pas $P_{i}$ , et la largeur moyenne des intervalles de crédibilité $P_{i; 0, 975}^{H B} - P_{i; 0, 025}^{H B}$ . Les erreurs-types de simulation Monte Carlo correspondantes sont également présentées entre parenthèses dans le tableau.

Pour examiner l'effet de la taille de l'échantillon de l'État sur les résultats des simulations, les 50 États et le district de Columbia sont répartis en trois groupes en fonction de la taille de leur échantillon, à savoir les 15 États dont l'échantillon est de petite taille $(n_{i} \leq 30),$ les 24 États dont l'échantillon est de taille moyenne $(30 < n_{i} \leq 100),$ et les 12 États dont l'échantillon est de grande taille $(n_{i} > 100) .$ Les résultats présentés au tableau 5.1 sont les moyennes globales sur l'ensemble des États et les moyennes pour les trois groupes distincts.

L'examen de la moitié supérieure du tableau 5.1 montre que les intervalles de crédibilité pour le modèle de Fay-Herriot (M1) sont très prudents, ne donnant quasiment aucune non-couverture. La moitié inférieure du tableau révèle que ce résultat est obtenu au prix de la plus grande largeur moyenne de l'intervalle de crédibilité parmi les quatre modèles. La largeur des intervalles de crédibilité de M1 est très stable. Une faible proportion de ces intervalles possède une borne inférieure négative.

Le faible niveau de non-couverture observé pour M1 pourrait tenir au fait que les variances d'échantillonnage ont été surestimées, peut-être parce que $d e f f_{i w}$ a été utilisé au lieu de $D E F F_{i}$ . Pour examiner cette possibilité, nous avons utilisé $D E F F_{i}$ pour calculer la variance d'échantillonnage et nous n'avons constaté presque aucune différence de taux de non-couverture. Nous avons également exécuté le modèle en nous servant de la vraie variance définie dans (2.2) et n'avons de nouveau observé aucune différence appréciable entre les taux de non-couverture. La non-normalité de la distribution d'échantillonnage de $p_{i w}$ pourrait également être à l'origine de ce problème.

Tableau 5.1
Pourcentage de fois que les intervalles de crédibilité à 95 % ne contiennent pas $P_{i}$ , largeur moyenne des intervalles de crédibilité à 95 %, avec les erreurs-types de simulation Monte Carlo fondées sur 1 000 simulations (en pourcentage)
Sommaire du tableau
Le tableau montre les résultats du pourcentage de fois que les intervalles de crédibilité à 95 % ne contiennent pas $P_{i}$ . Les données sont présentées selon taille de l'échantillon de l'État $n_{i}$ (titres de rangée) et M1, M2, M3 et M4(figurant comme en-tête de colonne).
Taille de l'échantillon de l'État $n_{i}$	M1*	M2	M3	M4
	Pourcentage de non-couverture (erreur-type de simulation Monte Carlo)
Échantillon global	0,40 (0,028)	8,24 (0,109)	6,52 (0,101)	4,36 (0,088)
$n_{i} \leq 30$ (15 États)	0,05 (0,019)	11,39 (0,239)	8,45 (0,216)	6,21 (0,190)
$30 < n_{i} \leq 100$ (24 États)	0,46 (0,043)	9,44 (0,167)	7,61 (0,156)	4,52 (0,132)
$n_{i} > 100$ (12 États)	0,70 (0,076)	1,91 (0,122)	1,94 (0,124)	1,74 (0,119)
	Largeur moyenne de l'intervalle de crédibilité à 95 % (erreur-type de simulation Monte Carlo)
Échantillon global	9,05 (0,004)	5,52 (0,009)	6,20 (0,009)	8,45 (0,014)
$n_{i} \leq 30$ (15 États)	10,27 (0,009)	5,94 (0,020)	6,78 (0,021)	9,30 (0,034)
$30 < n_{i} \leq 100$ (24 États)	9,16 (0,005)	5,60 (0,013)	6,28 (0,013)	8,71 (0,021)
$n_{i} > 100$ (12 États)	7,29 (0,004)	4,84 (0,012)	5,30 (0,013)	6,88 (0,017)
*Nota : Pour le modèle 1, une faible proportion d'intervalles de crédibilité possède une borne inférieure négative.

À 8,2 %, le taux global de non-couverture des intervalles de crédibilité pour le modèle normal-logistique (M2) est sensiblement supérieur au taux nominal de 5 %. Ce modèle donne la plus petite largeur moyenne de l'intervalle. Le taux de non-couverture pour le modèle normal-logistique avec variance inconnue (M3) s'approche davantage du taux nominal, avec une largeur globale de l'intervalle un peu plus grande que dans le cas de M2.

Le taux global de non-couverture de 4,4 % observé pour le modèle bêta-logistique (M4) est celui qui est le plus proche du taux de non-couverture nominal. Cependant, la largeur moyenne des intervalles de crédibilité est plus grande que celle obtenue pour M2 et M3, et l'erreur-type Monte Carlo de la largeur de l'intervalle est plus grande que celle observée pour les trois autres modèles. Cette instabilité pourrait découler de la complexité de la distribution conditionnelle complète pour le modèle bêta. La forte proportion des 1 000 estimations directes qui étaient nulles pour certains États dont la taille d'échantillon était petite pourrait aussi avoir causé d'importants problèmes d'ajustement de la loi bêta.

Comme prévu, pour les quatre modèles, la largeur moyenne des intervalles de crédibilité diminue lorsque la taille de l'échantillon de l'État augmente, et la variation de la largeur diminue également lorsque la taille de l'échantillon augmente. Toutefois, malgré ces diminutions, les taux de non-couverture diminuent aussi lorsque la taille de l'échantillon augmente pour les modèles 2, 3 et 4. En fait, les taux de non-couverture sont très petits pour les États dont la valeur de $n_{i}$ est grande, ce qui fait penser que les intervalles de crédibilité ne reflètent pas adéquatement l'effet de la plus grande précision des estimations directes dans les États où la taille d'échantillon est grande.

5.2 Biais et REQM des estimations fondées sur les modèles

Afin d'étudier ces résultats plus en détail, nous avons examiné le biais et la racine carrée de l'erreur quadratique moyenne (REQM) des estimations $P_{i}^{H B}$ pour chaque modèle. Les résultats sont présentés au tableau 5.2 dans le même format qu'au tableau 5.1. Les biais des estimations sous les modèles M1, M2 et M3 présentent une tendance similaire : les biais observés pour les petits États sont grands et positifs, et sont compensés dans une certaine mesure par les biais négatifs relativement faibles observés pour les États de moyenne et de grande taille. Dans le cas du modèle M4, les biais des estimations présentent une tendance très différente : ils sont presque nuls pour les petits États et leur valeur est grande et négative pour les États de moyenne et de grande taille. Cela indique que M4 donnerait de meilleurs résultats que les trois autres modèles en ce qui concerne le biais lorsque les échantillons des petits domaines sont de petite taille.

Tableau 5.2
Biais et racine carrée de l'erreur quadratique moyenne des estimations de $P_{i}$ fondées sur les quatre modèles (en pourcentage)
Sommaire du tableau
Le tableau montre les résultats du biais et racine carrée de l'erreur quadratique moyenne des estimations de $P_{i}$ fondées sur les quatre modèles. Les données sont présentées selon la taille de l'échantillon de l'État (titres de rangée) et M1, M2, M3 et M4(figurant comme en-tête de colonne).
Taille de l'échantillon de l'État $n_{i}$	M1		M2		M3		M4
Taille de l'échantillon de l'État $n_{i}$	Biais	REQM	Biais	REQM	Biais	REQM	Biais	REQM
Échantillon global	0,165	1,518	0,071	1.346	-0,009	1,411	-0,214	1,712
$n_{i} \leq 30$ (15 États)	0,621	1,651	0,572	1.630	0,466	1,652	0,009	1,.922
$30 < n_{i} \leq 100$ (24 États)	-0,006	1,547	-0,123	1.386	-0,201	1,452	-0,319	1,775
$n_{i} > 100$ (12 États)	-0,063	1,294	-0,167	0.911	-0,219	1,026	-0,283	1,323

Précédent | Suivant

Date de modification :: 2017-09-20

Sélection de la langue

Recherche et menus

Recherche

Publications

Techniques d’enquête

Recherche par

5. Résultats des simulations

5.1 Estimations des modèles et intervalles de crédibilité

5.2 Biais et REQM des estimations fondées sur les modèles