3. Modèles étudiés

Benmei Liu, Partha Lahiri et Graham Kalton

Précédent | Suivant

Un modèle général d'estimation sur petits domaines au niveau du domaine comprend deux composantes. L'une  MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbcvPDwzYbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0x e9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKk Fr0xfr=xfr=xb9adbaqaaeGacaGaaiaabeqaamaabeabaaGcbaacba qcLbwaqaaaaaaaaaWdbiaa=rbiaaa@39BE@ le modèle d'échantillonnage  MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbcvPDwzYbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0x e9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKk Fr0xfr=xfr=xb9adbaqaaeGacaGaaiaabeqaamaabeabaaGcbaacba qcLbwaqaaaaaaaaaWdbiaa=rbiaaa@39BE@ est un modèle pour l'erreur d'échantillonnage des estimations directes d'après l'enquête. L'autre  MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbcvPDwzYbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0x e9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKk Fr0xfr=xfr=xb9adbaqaaeGacaGaaiaabeqaamaabeabaaGcbaacba qcLbwaqaaaaaaaaaWdbiaa=rbiaaa@39BE@ le modèle de lien  MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbcvPDwzYbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0x e9Lq=Jc9vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKk Fr0xfr=xfr=xb9adbaqaaeGacaGaaiaabeqaamaabeabaaGcbaacba qcLbwaqaaaaaaaaaWdbiaa=rbiaaa@39BE@ relie la valeur de population pour un domaine aux variables auxiliaires propres au domaine x i = ( x i1 ,..., x ip ) ' MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiEamaaBa aaleaacaWGPbaabeaakiabg2da9iaabIcacaWG4bWaaSbaaSqaaiaa dMgacaaIXaaabeaakiaacYcacaGGUaGaaiOlaiaac6cacaGGSaGaam iEamaaBaaaleaacaWGPbGaamiCaaqabaGccaqGPaWaaWbaaSqabeaa caGGNaaaaaaa@44A2@ .

La section 3.1 décrit deux modèles au niveau du domaine souvent utilisés pour estimer les proportions dans les petits domaines et la section 3.2 décrit certains problèmes associés à ces modèles. La section 3.3 décrit deux autres modèles dont on peut se servir pour résoudre ces problèmes.

3.1 Deux modèles souvent utilisés

Nous étudions deux modèles souvent utilisés en vue de les comparer aux deux nouveaux modèles décrits à la section 3.4. Le premier est le modèle de Fay-Herriot (Fay et Herriot 1979), qui suppose que les variances d'échantillonnage sont connues et que les variables suivent des lois normales dans le modèle d'échantillonnage ainsi que dans le modèle de lien. Le second est le modèle normal logistique, qui ne diffère du modèle de Fay-Herriot que par le remplacement de la loi normale par une loi logit-normale dans le modèle de lien.

Modèle 1 : (modèle normal-normal de Fay-Herriot)

Modèle d'échantillonnage :

p iw | P i ~ ind N( P i ,   ψ i )             (3.1) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiCamaaBa aaleaacaWGPbGaam4DaaqabaGccaGG8bGaamiuamaaBaaaleaacaWG PbaabeaakmaaxacabaGaaiOFaaWcbeqaaiaadMgacaWGUbGaamizaa aakiaad6eacaqGOaGaamiuamaaBaaaleaacaWGPbaabeaakiaacYca caqGGaGaaeiiaiaaeI8adaWgaaWcbaGaamyAaaqabaGccaqGPaGaae iiaiaabccacaqGGaGaaeiiaiaabccacaqGGaGaaeiiaiaabccacaqG GaGaaeiiaiaabccacaqGGaGaaeiiaiaacIcacaaIZaGaaiOlaiaaig dacaGGPaaaaa@5469@

Modèle de lien :

P i |β, σ v 2 ~ ind N( x i ' β, σ v 2 )             (3.2) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiuamaaBa aaleaacaWGPbaabeaakiaacYhacaaHYoGaaiilaiaaeo8adaqhaaWc baGaamODaaqaaiaaikdaaaGcdaWfGaqaaiaac6haaSqabeaacaWGPb GaamOBaiaadsgaaaGccaWGobGaaeikaiaadIhadaqhaaWcbaGaamyA aaqaaiaacEcaaaGccaaHYoGaaiilaiaaeo8adaqhaaWcbaGaamODaa qaaiaaikdaaaGccaqGPaGaaeiiaiaabccacaqGGaGaaeiiaiaabcca caqGGaGaaeiiaiaabccacaqGGaGaaeiiaiaabccacaqGGaGaaeiiai aabIcacaqGZaGaaeOlaiaabkdacaqGPaaaaa@57F7@  

Modèle 2 : (modèle normal-logistique)

Modèle d'échantillonnage :

p iw | P i ~ ind N( P i ,   ψ i )             (3.3) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiCamaaBa aaleaacaWGPbGaam4DaaqabaGccaGG8bGaamiuamaaBaaaleaacaWG PbaabeaakmaaxacabaGaaiOFaaWcbeqaaiaadMgacaWGUbGaamizaa aakiaad6eacaqGOaGaamiuamaaBaaaleaacaWGPbaabeaakiaacYca caqGGaGaaeiiaiaaeI8adaWgaaWcbaGaamyAaaqabaGccaqGPaGaae iiaiaabccacaqGGaGaaeiiaiaabccacaqGGaGaaeiiaiaabccacaqG GaGaaeiiaiaabccacaqGGaGaaeiiaiaacIcacaaIZaGaaiOlaiaaio dacaGGPaaaaa@546B@

Modèle de lien :

g( P i )|β, σ v 2 ~ ind N( x i ' β, σ v 2 )             (3.4) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaam4zaiaabI cacaWGqbWaaSbaaSqaaiaadMgaaeqaaOGaaeykaiaacYhacaaHYoGa aiilaiaaeo8adaqhaaWcbaGaamODaaqaaiaaikdaaaGcdaWfGaqaai aac6haaSqabeaacaWGPbGaamOBaiaadsgaaaGccaWGobGaaeikaiaa dIhadaqhaaWcbaGaamyAaaqaaiaacEcaaaGccaaHYoGaaiilaiaaeo 8adaqhaaWcbaGaamODaaqaaiaaikdaaaGccaqGPaGaaeiiaiaabcca caqGGaGaaeiiaiaabccacaqGGaGaaeiiaiaabccacaqGGaGaaeiiai aabccacaqGGaGaaeiiaiaacIcacaaIZaGaaiOlaiaaisdacaGGPaaa aa@5A4D@

Les deux modèles reposent sur l'hypothèse que la variance d'échantillonnage ψ i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiYdmaaBa aaleaacaWGPbaabeaaaaa@384E@  est connue. Le modèle 1 est considéré comme un modèle apparié parce que les modèles d'échantillonnage et de lien peuvent être combinés pour produire un modèle mixte linéaire relativement simple. Cependant, on préfère souvent utiliser un modèle de lien non linéaire pour modéliser les proportions, ce qui donne des modèles d'échantillonnage et de lien non appariés, comme dans le modèle 2 (voir, par exemple, You et Rao 2002). La fonction lien g() MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaam4zaiaabI cacqGHflY1caqGPaaaaa@3A71@  peut être déterminée empiriquement en vérifiant l'adéquation du modèle. Les fonctions lien log et logit ont été utilisées. Le modèle de lien logit( P i ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaeiBaiaab+ gacaqGNbGaaeyAaiaabshacaqGOaGaamiuamaaBaaaleaacaWGPbaa beaakiaacMcaaaa@3DE3@  est choisi ici afin d'être certain que l'estimation de P i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiuamaaBa aaleaacaWGPbaabeaaaaa@37D3@  soit toujours comprise dans l'intervalle de valeurs permises (0, 1).

3.2 Problèmes posés par les modèles 1 et 2

Deux problèmes importants sont associés aux modèles 1 et 2. Le premier tient au fait que ces modèles reposent tous deux sur l'hypothèse que les variances d'échantillonnage ψ i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiYdmaaBa aaleaacaWGPbaabeaaaaa@384E@  sont connues, alors qu'en pratique elles doivent être estimées. Une approche simple consiste à utiliser l'estimation directe de la variance, mais celle-ci est très imprécise quand la valeur de P i MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiuamaaBa aaleaacaWGPbaabeaaaaa@37D4@  est très petite ou très grande et que la taille de l'échantillon n i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamOBamaaBa aaleaacaWGPbaabeaaaaa@37F1@  est petite. Une autre approche, plus complexe, consiste à élaborer une estimation approximative de P i MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiuamaaBa aaleaacaWGPbaabeaaaaa@37D4@ , disons p isyn MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiCamaaBa aaleaacaWGPbGaam4CaiaadMhacaWGUbaabeaaaaa@3ADC@ , en partant d'un modèle simple, tel qu'un modèle logistique pour p iw MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiCamaaBa aaleaacaWGPbGaam4Daaqabaaaaa@38EF@  en fonction des variables auxiliaires, puis à utiliser cette estimation dans l'estimateur de variance synthétique suivant :

var stsyn = p isyn (1- p isyn ) n i def f iw .             (3.5) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaciODaiaacg gacaGGYbWaaSbaaSqaaiaadohacaWG0bGaam4CaiaadMhacaWGUbaa beaakiabg2da9maalaaabaGaamiCamaaBaaaleaacaWGPbGaam4Cai aadMhacaWGUbaabeaakiaabIcacaaIXaacbaGaa8xlaiaadchadaWg aaWcbaGaamyAaiaadohacaWG5bGaamOBaaqabaGccaqGPaaabaGaam OBamaaBaaaleaacaWGPbaabeaaaaGccaWGKbGaamyzaiaadAgacaWG MbWaaSbaaSqaaiaadMgacaWG3baabeaakiaab6cacaqGGaGaaeiiai aabccacaqGGaGaaeiiaiaabccacaqGGaGaaeiiaiaabccacaqGGaGa aeiiaiaabccacaqGGaGaaiikaiaaiodacaGGUaGaaGynaiaacMcaaa a@600D@

Lorsqu'on ne dispose pas de variables auxiliaires, la proportion dans l'échantillon global peut être utilisée pour p isyn MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiCamaaBa aaleaacaWGPbGaam4CaiaadMhacaWGUbaabeaaaaa@3ADC@  dans le calcul de l'estimateur de variance synthétique.

Le deuxième problème a trait à l'hypothèse de normalité dans le modèle d'échantillonnage, qui est fondée sur une approximation en grand échantillon. Comme il est mentionné à la section 1, lorsque la taille de l'échantillon n i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamOBamaaBa aaleaacaWGPbaabeaaaaa@37F1@  est petite et que P i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiuamaaBa aaleaacaWGPbaabeaaaaa@37D3@  est proche de 0 ou de 1, ce qui est fréquent dans le cas de l'estimation sur petits domaines, cette hypothèse pose problème.

3.3 Deux modèles de rechange

Sous les modèles 1 et 2, les variances d'échantillonnage inconnues ψ i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiYdmaaBa aaleaacaWGPbaabeaaaaa@384F@  sont estimées, puis les estimations résultantes sont traitées comme s'il s'agissait des valeurs vraies connues. Une autre approche possible consiste à considérer que les ψ i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiYdmaaBa aaleaacaWGPbaabeaaaaa@384F@  sont des paramètres inconnus dans le modèle HB, comme cela a été fait dans un certain nombre d'études. Par exemple, Arora et Lahiri (1997) ont appliqué un modèle HB pour modéliser les variances sous le plan de sondage pour les estimations sur échantillon. Singh, Folsom et Vaish (2005) ont proposé d'utiliser un modèle à effet de plan généralisé pour lisser la matrice de covariance d'échantillonnage dans la modélisation pour petits domaines au moyen de données d'enquête. Récemment, You (2008) a proposé d'utiliser des effets de plan égaux au cours du temps pour modéliser les variances d'échantillonnage dans l'estimation des taux de chômage dans les petits domaines en utilisant un modèle log-linéaire transversal et chronologique. Dans le modèle 3, en tant que variante du modèle 2, les variances d'échantillonnage ψ i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiYdmaaBa aaleaacaWGPbaabeaaaaa@384F@  sont traitées comme étant inconnues. Afin de tenir compte de la non-normalité des distributions d'échantillonnage des proportions de petit domaine pondérées par les poids de sondage, l'hypothèse d'une loi normale peut-être remplacée par celle d'une autre loi. Cette approche est appliquée dans le modèle 4 en faisant l'hypothèse d'une distribution d'échantillonnage bêta, c'est-à-dire une distribution qui possède la propriété désirable d'avoir l'intervalle de valeurs (0,1). Pour le reste, le modèle 4 est semblable au modèle 3, y compris le traitement des ψ i , i=1,...,m MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiYdmaaBa aaleaacaWGPbaabeaakiaacYcacaqGGaGaamyAaiabg2da9iaaigda caGGSaGaaiOlaiaac6cacaGGUaGaaiilaiaad2gaaaa@40C3@  comme des paramètres inconnus. Le modèle 4 a été pris en considération antérieurement par Jiang et Lahiri (2006b) à titre d'exemple de l'estimation des moyennes de domaines de population finie en utilisant l'approche du meilleur prédicteur empirique.

Modèle 3 (modèle normal-logistique avec variance d'échantillonnage inconnue) :

Modèle d'échantillonnage :

p iw | P i ~ ind N( P i ,   ψ i )             (3.6) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiCamaaBa aaleaacaWGPbGaam4DaaqabaGccaGG8bGaamiuamaaBaaaleaacaWG PbaabeaakmaaxacabaGaaiOFaaWcbeqaaiaadMgacaWGUbGaamizaa aakiaad6eacaqGOaGaamiuamaaBaaaleaacaWGPbaabeaakiaacYca caqGGaGaaeiiaiaaeI8adaWgaaWcbaGaamyAaaqabaGccaqGPaGaae iiaiaabccacaqGGaGaaeiiaiaabccacaqGGaGaaeiiaiaabccacaqG GaGaaeiiaiaabccacaqGGaGaaeiiaiaabIcacaqGZaGaaeOlaiaabA dacaqGPaaaaa@545D@

Modèle de lien :

logit( P i )|β, σ v 2 ~ ind N( x ' β, σ v 2 )             (3.7) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaacbiGaa8hBai aa=9gacaWFNbGaa8xAaiaa=rhacaqGOaGaamiuamaaBaaaleaacaWG PbaabeaakiaabMcacaGG8bGaaqOSdiaacYcacaaHdpWaa0baaSqaai aadAhaaeaacaaIYaaaaOWaaCbiaeaacaGG+baaleqabaGaamyAaiaa d6gacaWGKbaaaOGaamOtaiaabIcacaWG4bWaaWbaaSqabeaacaGGNa aaaOGaaqOSdiaacYcacaaHdpWaa0baaSqaaiaadAhaaeaacaaIYaaa aOGaaeykaiaabccacaqGGaGaaeiiaiaabccacaqGGaGaaeiiaiaabc cacaqGGaGaaeiiaiaabccacaqGGaGaaeiiaiaabccacaGGOaGaaG4m aiaac6cacaaI3aGaaiykaaaa@5D25@

Modèle 4 : (modèle bêta-logistique avec variance d'échantillonnage inconnue)

Modèle d'échantillonnage :

p iw | P i ~ ind beta( a i , b i )             (3.8) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiCamaaBa aaleaacaWGPbGaam4DaaqabaGccaGG8bGaamiuamaaBaaaleaacaWG PbaabeaakmaaxacabaGaaiOFaaWcbeqaaiaadMgacaWGUbGaamizaa aakiaadkgacaWGLbGaamiDaiaadggacaqGOaGaamyyamaaBaaaleaa caWGPbaabeaakiaacYcacaWGIbWaaSbaaSqaaiaadMgaaeqaaOGaae ykaiaabccacaqGGaGaaeiiaiaabccacaqGGaGaaeiiaiaabccacaqG GaGaaeiiaiaabccacaqGGaGaaeiiaiaabccacaGGOaGaaG4maiaac6 cacaaI4aGaaiykaaaa@55AE@    

Modèle de lien :

logit( P i )|β, σ v 2 ~ ind N( x i ' β, σ v 2 )             (3.9)  MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaacbiGaa8hBai aa=9gacaWFNbGaa8xAaiaa=rhacaqGOaGaamiuamaaBaaaleaacaWG PbaabeaakiaabMcacaGG8bGaaqOSdiaacYcacaaHdpWaa0baaSqaai aadAhaaeaacaaIYaaaaOWaaCbiaeaacaGG+baaleqabaGaamyAaiaa d6gacaWGKbaaaOGaamOtaiaabIcacaWG4bWaa0baaSqaaiaadMgaae aacaGGNaaaaOGaaqOSdiaacYcacaaHdpWaa0baaSqaaiaadAhaaeaa caaIYaaaaOGaaeykaiaabccacaqGGaGaaeiiaiaabccacaqGGaGaae iiaiaabccacaqGGaGaaeiiaiaabccacaqGGaGaaeiiaiaabccacaGG OaGaaG4maiaac6cacaaI5aGaaiykaiaabccaaaa@5EB8@

La fonction de variance approximative utilisée dans les modèles 3 et 4 est ψ i =[ P i (1- P i )/ n i ]def f iw MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaqiYdmaaBa aaleaacaWGPbaabeaakiabg2da9iaabUfacaWGqbWaaSbaaSqaaiaa dMgaaeqaaOGaaeikaiaaigdaieaacaWFTaGaamiuamaaBaaaleaaca WGPbaabeaakiaabMcacaqGVaGaamOBamaaBaaaleaacaWGPbaabeaa kiaab2facaWGKbGaamyzaiaadAgacaWGMbWaaSbaaSqaaiaadMgaca WG3baabeaaaaa@4A60@ . Dans le modèle 4, les paramètres a i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamyyamaaBa aaleaacaWGPbaabeaaaaa@37E4@  et b i MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamOyamaaBa aaleaacaWGPbaabeaaaaa@37E5@  sont donnés par :

a i = P i ( n i def f iw -1 ), et  b i =(1- P i )( n i def f iw -1 ). MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamyyamaaBa aaleaacaWGPbaabeaakiabg2da9iaadcfadaWgaaWcbaGaamyAaaqa baGcdaqadaqaamaalaaabaGaamOBamaaBaaaleaacaWGPbaabeaaaO qaaiaadsgacaWGLbGaamOzaiaadAgadaWgaaWcbaGaamyAaiaadEha aeqaaaaakiaab2cacaaIXaaacaGLOaGaayzkaaGaaeilaiaabccaca qGLbGaaeiDaiaabccacaWGIbWaaSbaaSqaaiaadMgaaeqaaOGaeyyp a0JaaeikaiaaigdaieaacaWFTaGaamiuamaaBaaaleaacaWGPbaabe aakiaabMcadaqadaqaamaalaaabaGaamOBamaaBaaaleaacaWGPbaa beaaaOqaaiaadsgacaWGLbGaamOzaiaadAgadaWgaaWcbaGaamyAai aadEhaaeqaaaaakiaa=1cacaaIXaaacaGLOaGaayzkaaGaaeOlaaaa @5D0B@

Les estimations HB sur petits domaines peuvent être calculées au moyen des quatre modèles en utilisant l'algorithme de Metropolis-Hastings dans l'échantillonneur de Gibbs. Une description détaillée de l'algorithme, qui tire des échantillons aléatoires en se basant sur les lois conditionnelles complètes des paramètres inconnus à partir d'un ou de plusieurs jeux de valeurs initiales, figure dans Robert et Casella (1999) et dans Chen, Shao et Ibraham (2000). You et Rao (2002) décrivent également en détail comment l'algorithme de Metropolis-Hastings fonctionne dans l'échantillonneur de Gibbs pour des modèles similaires aux modèles 1 et 2. Pour les modèles 3 et 4, l'algorithme fonctionne de la même façon que pour le modèle 2. Les distributions conditionnelles complètes sous chaque modèle sont données à l'annexe A.

Précédent | Suivant

Date de modification :