2. Études par
simulation : MPO c. MPLSBE
Jiming Jiang, Thuan Nguyen et J. Sunil Rao
Précédent | Suivant
2.1 Une démonstration
Nous présentons d'abord un exemple
simulé simple pour montrer l'effet que peut avoir la spécification inexacte du
modèle sur les propriétés prédictives, basées sur le plan de sondage, de la MPO
et du MPLSBE. Soit le cas d'une covariable
unique,
considérée comme linéairement
associée à la réponse
conformément au modèle REE suivant :
(donc,
nous avons
dans ce cas), où
est un coefficient
inconnu, et les termes
sont les mêmes
que dans (1.1). Donc, nous croyons en particulier que la réponse moyenne doit
être nulle quand la valeur de la covariable est nulle.
Nous considérons trois tailles
d'échantillon différentes :
ou ainsi que
deux valeurs réelles différentes de
ou où
est défini ci-après. Dès lors,
il existe six cas, chacun étant une combinaison de taille d'échantillon et de
valeur de
Dans chaque cas, une
sous-population
est générée à partir de la
loi normale de moyenne égale à 1 et d'écart-type égal à La sous-population
est alors générée à partir du modèle de superpopulation
REE hétéroscédastique suivant :
(donc
la taille de la sous-population est
où
est tiré de la
loi normale de moyenne 0 et d'écart-type
est tiré de la
loi normale de moyenne 0 et d'écart-type
où les
sont générés indépendamment
à partir de la loi uniforme
(de sorte que l'intervalle pour
est environ de 0,22
à 0,39); et les
et les
sont générés
indépendamment. On voit que le modèle REE supposé est spécifié incorrectement
en ce qui concerne les fonctions moyenne
ainsi que variance. Une fois que les sous-populations
et
sont générées, elles
demeurent fixes dans toutes les simulations.
Dans chaque simulation, nous tirons un échantillon
aléatoire simple de taille 5 de
qui détermine les échantillons
et
pour chaque
L'exercice est répété pour
simulations. Nous effectuons des comparaisons
des mêmes données pour la MPO et le MPLSBE, en utilisant l'estimateur du MV de
pour le second, en ce qui
concerne à la fois l'EQMP globale et l'EQMP au niveau du domaine. L'EQMP
globale est définie comme étant
où
est le vecteur des moyennes
réelles de petit domaine avec
et
est le vecteur des valeurs
prédites (par la MPO ou par le MPLSBE). Notons que la même mesure a été
utilisée dans Jiang et coll. (2011). Le tableau 2.1 donne les
résultats pour l'EQMP globale, où l'EQMP est
évaluée empiriquement par
et
et
sont
et
dans la
simulation, respectivement. On voit que l'augmentation
en pourcentage de l'EQMP globale du MPLSBE comparativement à celle de la MPO varie
d'environ 20 % à presque 1 000 %, selon la taille de
l'échantillon et la valeur de
Les tendances qui se dégagent
ici concordent avec celles décrites dans Jiang et coll. (2011) sous le modèle
de Fay-Herriot, où les propriétés prédictives basées sur un modèle sont évaluées. Cependant,
l'amélioration apportée par la MPO est nettement plus importante, pour
et
que celle mentionnée dans Jiang et coll.(2011).
Tableau 2.1
EQMP globale empirique (augmentation en % pour le MPLSBE par rapport à la MPO)
Sommaire du tableau
Le tableau montre les résultats de EQMP globale empirique (augmentation en % pour le MPLSBE par rapport à la MPO). Les données sont présentées selon
(titres de rangée) et
, MPO, MPLSBE et Augmentation en %(figurant comme en-tête de colonne).
|
|
MPO |
MPLSBE |
Augmentation en % |
50 |
0,5 |
0,130 |
0,161 |
24 |
50 |
1,0 |
0,503 |
0,598 |
19 |
100 |
0,5 |
0,076 |
0,277 |
264 |
100 |
1,0 |
0,396 |
1,077 |
172 |
400 |
0,5 |
0,096 |
0,965 |
905 |
400 |
1,0 |
0,393 |
4,046 |
930 |
Dans le cas des EQMP au niveau du domaine,
à l'instar de Jiang et coll. (2011), nous utilisons des boîtes à
moustache pour représenter les distributions des EQMP au niveau du domaine associées
aux deux méthodes. Voir la figure 2.1. Les graphiques montrent des détails
non révélés par les EQMP globales. Ainsi, on pourrait se demander si
l'augmentation en pourcentage de l'EQMP globale dans le cas du MPLSBE est
simplement due au nombre accru de domaines additionnés. Un simple calcul donne
à penser que cela pourrait ne pas être le cas, par exemple,
vaut seulement 152 % (et
non 930 %). Une raison plus explicite est donnée à la figure 2.1. Par
exemple, si l'on compare le cas où
au cas
on constate que, tandis que
le chevauchement entre les boîtes à moustache pour la MPO et le MPLSBE est
important dans le premier cas, les boîtes à moustache sont entièrement séparées
dans le deuxième; autrement dit, la plus grande EQMP de la MPO au niveau du
domaine est plus petite que la plus petite EQMP du MPLSBE au niveau du domaine.
Cette constatation ne peut pas être attribuée simplement à l'addition ou à la
duplication des domaines. En fait, dans le dernier cas, la MPO donne de
nettement meilleurs résultats que le MPLSBE, non seulement globalement, mais
aussi pour chacun des 400 petits domaines. Il s'agit clairement d'un
résultat inédit. Par exemple, dans le premier exemple simulé de Jiang et coll.
(2011), les auteurs ont constaté que l'EQMP de la MPO était plus petite que
celle du MPLSBE pour la moitié des petits domaines, tandis que celle du MPLSBE était
plus petite que celle de la MPO pour l'autre moitié; des tendances comparables
ont été observées dans le deuxième exemple simulé dans Jiang et coll.
(2011).
L'estimation des EQMP de la MPO au
niveau du domaine est examinée à la section 3.
Figure 2.1 EQMP empiriques au niveau du domaine (boîtes à moustache). En haut à gauche :
en haut à droite :
au milieu à gauche :
au milieu à droite :
en bas à gauche :
en bas à droite :
Description de la figure 2.1
2.2 Autres
considérations
La situation considérée à la sous-section 2.1
pourrait être un peu extrême (raison pour laquelle nous la qualifions de « démonstration
théorique »). En pratique, le modèle supposé peut ne pas être entièrement faux,
ou être presque exact. À la présente sous-section, nous examinons d'abord un
cas où le modèle supposé est « partiellement
exact ». Plus précisément, la pente dans (2.1) n'est pas nulle (de sorte que
le modèle supposé est correct à cet égard); l'ordonnée à l'origine n'est pas
nulle, mais sa valeur est nettement plus faible que celles prises en
considération à la sous-section 2.1 (de sorte que le modèle supposé est
inexact, mais n'est pas « terriblement inexact »). Plus précisément, le
modèle sous-jacent réel est
par
opposition à (2.2), où
les
sont générés indépendamment
à partir de la loi normale de moyenne 0 et d'écart-type 0,1; et les
sont générées à
partir de la loi normale hétéroscédastique comme à la sous-section 2.1. En
plus de l'EQMP globale, nous présentons la contribution à l'EQMP résultant du « biais »
et de la « variance ». Posons que
et que
est
basé sur le
ensemble de
données simulé,
Nous définissons
le biais et la variance empiriques pour le
petit domaine comme
étant
et
respectivement. Notons
l'EQMP empirique
pour le
petit domaine. Il
est facile de montrer que l'EQMP empirique globale est
Donc,
les contributions du biais et de la variance à l'EQMP globale sont définies par
et
respectivement. Les résultats
basés sur
simulations
sont présentés au tableau 2.2. On peut voir que, pour la plus petite
valeur de
la MPO donne des
résultats (légèrement) moins bons que le MPLSBE, mais que pour les plus grandes
valeurs de
et
la MPO donne des
résultats (légèrement) meilleurs, et que l'avantage augmente avec la valeur de
En ce qui
concerne la contribution du biais et de la variance, la MPO semble posséder un biais
plus faible, et une variance plus faible pour les valeurs de
plus élevées
Tableau 2.2
EQMP globale empirique (contribution du biais, de la variance) : Le modèle supposé est partiellement exact; augmentation en % donnée pour l’EQMP du MPLSBE par rapport à l’EQMP de la MPO (une valeur négative indique une diminution)
Sommaire du tableau
Le tableau montre les résultats de EQMP globale empirique (contribution du biais. Les données sont présentées selon
(titres de rangée) et MPO, MPLSBE et Augmentation en %(figurant comme en-tête de colonne).
|
MPO |
MPLSBE |
Augmentation en % |
50 |
0,421 (0,224; 0,197) |
0,405 (0,238; 0,167) |
-4,0 |
100 |
0,733 (0,448; 0,285) |
0,748 (0,457; 0,291) |
2,1 |
400 |
2,745 (1,847; 0,899) |
2,848 (1,878; 0,971) |
3,8 |
Ensuite, nous considérons le cas où le modèle supposé est effectivement exact. À
savoir, le vrai modèle sous-jacent donné en (2.3) avec
les erreurs
sont homoscédastiques de
variance égale à 0,1, et tous les autres éléments restent les mêmes que pour le
cas susmentionné. Les résultats basés sur
simulations sont
présentés au tableau 2.3. Cette fois-ci, nous voyons que le MPLSBE donne
des résultats légèrement meilleurs que la MPO sous différentes valeurs de
mais que l'écart diminue à
mesure que la taille d'échantillon augmente. En ce qui concerne la contribution
du biais et de la variance, le MPLSBE semble posséder une plus petite variance,
et un plus petit biais pour les valeurs de
plus grandes
mais les avantages en ce qui concerne tant le biais
que la variance se réduisent à mesure que
augmente.
Tableau 2.3
EQMP globale empirique (contribution du biais, de la variance) : Le modèle supposé est exact; augmentation en % donnée pour l’EQMP du MPLSBE par rapport à l’EQMP de la MPO (une valeur négative indique une diminution)
Sommaire du tableau
Le tableau montre les résultats de EQMP globale empirique (contribution du biais. Les données sont présentées selon
(titres de rangée) et MPO, MPLSBE et Augmentation en %(figurant comme en-tête de colonne).
|
MPO |
MPLSBE |
Augmentation en % |
50 |
0,335 (0,204; 0,131) |
0,330 (0,205; 0,125) |
-1,4 |
100 |
0,749 (0,457; 0,292) |
0,746 (0,456; 0,290) |
-0,4 |
400 |
2,796 (1,800; 0,997) |
2,794 (1,799; 0,996) |
-0,1 |
Brièvement, selon les résultats de la
simulation, quand la spécification du modèle supposé est légèrement inexacte, la
MPO ne donne pas nécessairement de meilleurs résultats que le MPLSBE quand
le nombre de petits domaines,
est relativement faible. Par contre, la MPO devrait surpasser le MPLSBE quand
est relativement grand, et l'avantage
de la MPO par rapport au MPLSBE augmente avec
(souvenons-nous de la définition de l'EQMP
globale). Par ailleurs, si la spécification du modèle supposé est exacte, le
MPLSBE devrait donner de meilleurs résultats que la MPO, quoique l'écart
pourrait être ignorable; et l'avantage du
MPLSBE par rapport à la MPO s'estompe à mesure que
augmente. Ces résultats, ainsi
que ceux de la sous-section 2.1, concordent bien avec ceux de Jiang et coll.
(2011; section 4) sous le modèle de Fay-Herriot.
Précédent | Suivant