Inférence bayésienne prédictive sur une proportion sous un modèle double pour petits domaines avec corrélations hétérogènes
Section 2. Modèles doubles bayésiens pour petits domaines et calculs

Table des matières

Nous considérons une population finie de $l$ domaines et de $M_{i}$ grappes dans le $i^{e}$ domaine, et nous supposons qu’il existe $N_{i j}$ individus dans la $j^{e}$ grappe dans le $i^{e}$ domaine. Les réponses binaires sont $y_{i j k}$ pour $i =1, \dots, l, j =1, \dots, M_{i},$ $k =1, \dots, N_{i j} .$ Nous supposons qu’un échantillon aléatoire simple de $m_{i}$ grappes est tiré du $i^{e}$ petit domaine et qu’un échantillon aléatoire simple de $n_{i j}$ individus est tiré des $m_{i}$ grappes échantillonnées provenant du $i^{e}$ domaine. Ici, nous supposons que les poids de sondage sont les mêmes dans toutes les grappes dans chaque domaine. Soit $n_{i} = \sum_{j =1}^{m_{i}} n_{i j}, s_{i j} = \sum_{k =1}^{n_{i j}} y_{i j k}$ et $s_{i} = \sum_{j =1}^{m_{i}} s_{i j} .$

Notre cible est la proportion du $i^{e}$ domaine dans la population finie, qui est donnée par

$P_{i} = \frac{\sum_{j =1}^{M_{i}} \sum_{k =1}^{N_{i j}} y_{i j k}}{N_{i}}, i =1, \dots, l,$

où $N_{i} = \sum_{j =1}^{M_{i}} N_{i j} .$ Soit $T_{i j}^{(1)} = \sum_{k = n_{i j} + 1}^{N_{i j}} y_{i j k}$ les totaux des unités non échantillonnées des grappes échantillonnées $(j =1, \dots, m_{i}),$ et $T_{i j}^{(2)} = \sum_{k =1}^{N_{i j}} y_{i j k},$ les totaux des grappes non échantillonnées $(j = m_{i} + 1, \dots, M_{i}) .$ En posant que $n_{i} = \sum_{j =1}^{m_{i}} n_{i j},$ ${\hat{p}}_{i} = \sum_{j =1}^{m_{i}} \sum_{k =1}^{n_{i j}} y_{i j k} / n_{i},$ nous pouvons exprimer notre cible, $P_{i},$ sous la forme

$P_{i} = \frac{n_{i} {\hat{p}}_{i} + \sum_{j =1}^{m_{i}} T_{i j}^{(1)} + \sum_{j = m_{i} + 1}^{M_{i}} T_{i j}^{(2)}}{N_{i}}, i =1, \dots, l . (2.1)$

Pour faire une inférence au sujet de $P_{i},$ nous ajustons des modèles bayésiens hiérarchiques aux données. En utilisant la représentation bêta-binomiale, ces modèles s’adaptent à la structure du plan double. Nous décrivons deux modèles, l’un avec une corrélation homogène et l’autre avec des corrélations hétérogènes, ce qui représente notre principale contribution à l’extension du modèle de Nandram (2015). À la section 2.1, nous examinons le modèle bayésien hiérarchique avec corrélation homogène de Nandram (2015) et nous montrons comment le rendre comparable à notre modèle bayésien hiérarchique avec corrélations hétérogènes que nous décrivons à la section 2.2. À la section 2.3, nous décrivons l’échantillonneur de Gibbs par blocs utilisé pour ajuster notre modèle avec corrélations hétérogènes.

2.1 Une revue du modèle double avec corrélation homogène

Nandram (2015) a décrit le modèle double pour petits domaines avec corrélation homogène. Ici, nous examinons brièvement les principales hypothèses qui le sous-tendent, à savoir

$y_{i j k} | p_{i j} \overset{ind}{\sim} Bernoulli (p_{i j}), (2.2)$

$\begin{array}{l} μ_{i} | θ, γ & \overset{iid}{\sim} Bêta [θ \frac{1 - γ}{γ}, (1 - θ) \frac{1 - γ}{γ}], (2.3) \\ ρ, θ, γ & \overset{iid}{\sim} Uniforme (0,1), (2.4) \end{array}$

où $ρ$ et $γ$ représentent les corrélations intragrappe et intergrappes, respectivement. L’hypothèse est que $0< θ, ρ, γ <1$ strictement. Notons que, dans un même domaine, la corrélation intragrappe $ρ,$ c’est-à-dire la corrélation entre deux unités dans une même grappe, est $cor (y_{i j k}, y_{i j k^{'}} | μ_{i}, γ, ρ) = ρ, k \neq k^{'} .$ Semblablement, dans un même domaine, la corrélation intergrappes $γ,$ c’est-à-dire la corrélation entre deux unités dans deux grappes différentes, est $cor (y_{i j k}, y_{i j^{'} k^{'}} | θ, γ, ρ) = γ, j \neq j^{'}, k \neq k^{'} .$ Ici, c’est $ρ$ qui fait la distinction entre les modèles simple et double, et quand $ρ$ tend vers zéro, le modèle double devient le modèle simple, Nandram (2015).

Pour ajuster le modèle spécifié par (2.2) à (2.4), Nandram (2015) a recouru à l’échantillonnage aléatoire et à la quadrature gaussienne pour exécuter des intégrations numériques unidimensionnelles. Il a également utilisé l’échantillonnage de Gibbs pour la comparaison et constaté de légères différences. Cependant, notre généralisation aux corrélations hétérogènes (nombre accru de paramètres) aboutit à des paramètres faiblement identifiés supplémentaires et l’ajustement du modèle devient plus difficile. Donc, nous intégrons des contraintes d’unimodalité sur les distributions a priori des paramètres de domaine, ce qui permet d’analyser des données éparses. Pour faire des comparaisons entre les deux modèles, l’un avec des corrélations homogènes et l’autre avec des corrélations hétérogènes, nous imposons aussi des contraintes d’unimodalité dans le modèle spécifié par (2.2) à (2.4). Nos résultats sous ce modèle homogène légèrement modifié sont semblables à ceux de Nandram (2015).

Les méthodes exposées dans le présent article permettent d’imposer l’unimodalité sur certaines distributions pour faciliter l’estimation des paramètres faiblement identifiés. Les conditions d’unimodalité sont suffisamment flexibles pour éviter de contraindre excessivement les modèles. Pour une procédure bayésienne non paramétrique complète, consulter Damien, Laud et Smith (1997). Donc, tout au long de nos calculs, nous appliquons la contrainte d’unimodalité aux hyperparamètres de $μ_{i} (i =1, \dots, l),$

$\frac{γ}{1 - γ} < θ < \frac{1 - 2 γ}{1 - γ},0< γ < \frac{1}{3} . (2.5)$

Nous imposons aussi des contraintes d’unimodalité similaires à la section 2.2 pour le modèle avec corrélations hétérogènes. D’où, nous donnons au modèle spécifié par (2.2) à (2.5) le nom de modèle CHO (pour corrélation homogène).

Pour ajuster le modèle, Nandram (2015) utilise la règle de multiplication en obtenant $p_{i j}$ après le tirage d’échantillons aléatoires de $(μ, ρ, θ, et γ)$ à partir de leur densité a posteriori conjointe, où $μ = {(μ_{1}, \dots, μ_{l})}^{'} .$ La densité a posteriori conditionnelle des $p_{i j}$ est donnée par

$p_{i j} | s_{i j}, μ_{i}, ρ \overset{ind}{\sim} Bêta {s_{i j} + μ_{i} \frac{1 - ρ}{ρ}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ}{ρ}},$

et, en posant que $s_{i j} = \sum_{k =1}^{n_{i j}} y_{i j k}$ et en agrégeant sur les $p_{i j},$ nous obtenons

$\begin{array}{l} π (μ, ρ, θ, γ | y) & \propto \prod_{i =1}^{l} \prod_{j =1}^{m_{i}} \frac{B (s_{i j} + μ_{i} \frac{1 - ρ}{ρ}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ}{ρ})}{B (μ_{i} \frac{1 - ρ}{ρ}, (1 - μ_{i}) \frac{1 - ρ}{ρ})} \\ \times \frac{μ_{i}^{θ \frac{1 - γ}{γ} - 1} {(1 - μ_{i})}^{(1 - θ) \frac{1 - γ}{γ} - 1}}{B (θ \frac{1 - γ}{γ}, (1 - θ) \frac{1 - γ}{γ})}, 0< μ_{i}, ρ <1, i =1, \dots, l, \frac{γ}{1 - γ} < θ < \frac{1 - 2 γ}{1 - γ},0< γ < \frac{1}{3} . \end{array}$

Parce que $T_{i j}^{(1)} | p_{i j} \overset{ind}{\sim} Binomiale (N_{i j} - n_{i j}, p_{i j})$ et $T_{i j}^{(2)} | p_{i j} \overset{ind}{\sim} Binomiale (N_{i j}, p_{i j})$ et que, sachant $p_{i j},$ $T_{i j}^{(1)}$ et $T_{i j}^{(2)}$ sont indépendants, après avoir obtenu les échantillons des $p_{i j},$ il est facile de faire une inférence bayésienne prédictive. Voir Nandram (2015) pour des renseignements détaillés.

2.2 Un modèle double avec corrélations hétérogènes

Nous étendons le modèle CHO pour pouvoir traiter les corrélations hétérogènes. Nos hypothèses sont

$\begin{array}{l} y_{i j k} | p_{i j} & \overset{ind}{\sim} Bernoulli (p_{i j}), (2.6) \\ p_{i j} | μ_{i}, ρ_{i} & \overset{ind}{\sim} Bêta [μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}}], (2.7) \\ μ_{i} | θ, γ & \overset{iid}{\sim} Bêta [θ \frac{1 - γ}{γ}, (1 - θ) \frac{1 - γ}{γ}], (2.8) \\ ρ_{i} | ϕ, δ & \overset{iid}{\sim} Bêta [ϕ \frac{1 - δ}{δ}, (1 - ϕ) \frac{1 - δ}{δ}], (2.9) \\ θ, γ, ϕ, δ & \overset{iid}{\sim} Uniforme (0,1) . (2.10) \end{array}$

Notons que le coefficient de corrélation intragrappe $ρ$ introduit dans le modèle CHO est remplacé par $ρ_{i} (i =1, \dots, l)$ pour fournir le modèle bayésien hiérarchique avec corrélations hétérogènes.

Comme pour le modèle CHO, nous imposons aussi a priori deux ensembles de contraintes d’unimodalité,

$\frac{γ}{1 - γ} < θ < \frac{1 - 2 γ}{1 - γ},0< γ < \frac{1}{3} et \frac{δ}{1 - δ} < ϕ < \frac{1 - 2 δ}{1 - δ},0< δ < \frac{1}{3} . (2.11)$

L’annexe B donne des preuves simples des inégalités susmentionnées en tant que critères d’unimodalité et la façon d’intégrer ces contraintes dans nos calculs. Donc, nous dénommons modèle CHE (pour corrélations hétérogènes) le modèle bayésien hiérarchique spécifié par (2.6) à (2.11).

De nouveau, à l’instar de Nandram (2015), nous montrons à l’annexe A que, sous le modèle CHE,

$\begin{array}{l} cor (y_{i j k}, y_{i j k^{'}} | μ_{i}, γ, ρ_{i}) & = ρ_{i}, k \neq k^{'}, (2.12) \\ cor (y_{i j k}, y_{i j^{'} k^{'}} | θ, γ, ρ_{i}) & = γ, j \neq j^{'}, k \neq k^{'} . (2.13) \end{array}$

En d’autres mots, à l’intérieur du $i^{e}$ domaine, le coefficient de corrélation intragrappe est $ρ_{i}$ et le coefficient de corrélation intergrappes est $γ .$

En appliquant le théorème de Bayes dans le modèle CHE, la densité conjointe a posteriori $π (p, μ, ρ, θ, γ, ϕ, δ | y)$ est facile à écrire. (Il s’agit de la densité sans la constante de normalisation.) Donc, nous pourrions donner à cette densité conjointe a posteriori le nom de posterior CHE.

Pour faire une inférence sur la proportion dans la population finie, $P_{i},$ nous tirons des échantillons de $π (p, μ, ρ, θ, γ, ϕ, δ | y)$ en utilisant la règle de multiplication et l’échantillonneur de Gibbs par blocs. Cette procédure est décrite à la section 2.3.

2.3 Calculs du posterior CHE

En premier lieu, notons que nous agrégeons le posterior CHE sur les $p_{i j}$ et que nous utilisons ensuite l’échantillonneur de Gibbs pour ajuster la densité a posteriori marginale conjointe. Après avoir obtenu les échantillons, nous pouvons tirer des échantillons des $p_{i j}$ à partir de densités a posteriori conditionnelles des $p_{i j}$ en appliquant la règle de multiplication.

Comme dans le modèle CHO, la densité a posteriori conditionnelle des $p_{i j}$ est

$p_{i j} | μ_{i}, ρ_{i}, θ, γ, ϕ, δ, y \overset{ind}{\sim} Bêta {s_{i j} + μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}}}, 0< p_{i j} <1.$

Donc, il est facile de tirer des échantillons des $p_{i j}$ une fois que les échantillons sont obtenus à partir de la densité a posteriori conjointe de $(μ, ρ, θ, γ, ϕ, δ) .$ Après élimination des $p_{i j}$ du posterior CHE par intégration, la densité a posteriori conjointe marginale est donnée par

$\begin{array}{l} π (μ, ρ, θ, γ, ϕ, δ | y) & \propto \prod_{i =1}^{l} \prod_{j =1}^{m_{i}} \frac{B (s_{i j} + μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}{B (μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})} \\ \times \frac{μ_{i}^{θ \frac{1 - γ}{γ} - 1} {(1 - μ_{i})}^{(1 - θ) \frac{1 - γ}{γ} - 1}}{B (θ \frac{1 - γ}{γ}, (1 - θ) \frac{1 - γ}{γ})} \times \frac{ρ_{i}^{ϕ \frac{1 - δ}{δ} - 1} {(1 - ρ_{i})}^{(1 - ϕ) \frac{1 - δ}{δ} - 1}}{B (ϕ \frac{1 - δ}{δ}, (1 - ϕ) \frac{1 - δ}{δ})}, 0< μ_{i}, ρ_{i} <1, i =1, \dots, l, \\ \frac{γ}{1 - γ} < θ < \frac{1 - 2 γ}{1 - γ},0< γ < \frac{1}{3}, \frac{δ}{1 - δ} < ϕ < \frac{1 - 2 δ}{1 - δ},0< δ < \frac{1}{3} . \end{array}$

Les densités a posteriori conditionnelles sont

$\begin{array}{l} π (μ_{i} | ρ_{i}, θ, γ, ϕ, δ, y) & \propto \prod_{j =1}^{m_{i}} \frac{B (s_{i j} + μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}{B (μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})} \times μ_{i}^{θ \frac{1 - γ}{γ} - 1} {(1 - μ_{i})}^{(1 - θ) \frac{1 - γ}{γ} - 1}, \\ π (ρ_{i} | μ_{i}, θ, γ, ϕ, δ, y) & \propto \prod_{j =1}^{m_{i}} \frac{B (s_{i j} + μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}{B (μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})} \times ρ_{i}^{ϕ \frac{1 - δ}{δ} - 1} {(1 - ρ_{i})}^{(1 - δ) \frac{1 - δ}{δ} - 1}, \end{array}$

et, en posant $G_{1} = {\prod_{i =1}^{l} μ_{i}}^{1 / l}$ et $G_{2} = {\prod_{i =1}^{l} (1 - μ_{i})}^{1 / l},$

$π (θ | μ, ρ, γ, ϕ, δ, y) \propto {\frac{G_{1}^{θ \frac{1 - γ}{γ} - 1} G_{2}^{(1 - θ) \frac{1 - γ}{γ} - 1}}{B (θ \frac{1 - γ}{γ}, (1 - θ) \frac{1 - γ}{γ})}}^{l},$

$π (γ | μ, ρ, θ, ϕ, δ, y) \propto {\frac{G_{1}^{θ \frac{1 - γ}{γ} - 1} G_{2}^{(1 - θ) \frac{1 - γ}{γ} - 1}}{B (θ \frac{1 - γ}{γ}, (1 - θ) \frac{1 - γ}{γ})}}^{l} .$

De même, en posant $H_{1} = {\prod_{i =1}^{l} ρ_{i}}^{1 / l}$ et $H_{2} = {\prod_{i =1}^{l} (1 - ρ_{i})}^{1 / l},$

$π (ϕ | μ, ρ, θ, γ, δ, y) \propto {\frac{H_{1}^{ϕ \frac{1 - δ}{δ} - 1} H_{2}^{(1 - ϕ) \frac{1 - δ}{δ} - 1}}{B (ϕ \frac{1 - δ}{δ}, (1 - ϕ) \frac{1 - δ}{δ})}}^{l},$

$π (δ | μ, ρ, θ, γ, ϕ, y) \propto {\frac{H_{1}^{ϕ \frac{1 - δ}{δ} - 1} H_{2}^{(1 - ϕ) \frac{1 - δ}{δ} - 1}}{B (ϕ \frac{1 - δ}{δ}, (1 - ϕ) \frac{1 - δ}{δ})}}^{l} .$

Le problème de cette procédure est que $θ$ et $γ$ sont corrélés, parce qu’intuitivement, ils dépendent tous deux uniquement de ${μ_{i}}$ à travers deux nombres, $G_{1}$ et $G_{2},$ et non les données, $y .$ Cela donne un mauvais mélange dans l’échantillonneur de Gibbs. Par exemple, $E (μ_{i} | θ, γ) = θ,$ $É .-T . (μ_{i} | θ, γ) = θ \sqrt{γ (1 - θ) / θ}$ et $μ_{i} \approx θ {1 + z_{i} \sqrt{γ (1 - θ) / θ}},$ où $E (z_{i}) = 0$ et $Var (z_{i}) = 1,$ Nandram (2015). Autrement dit, ${μ_{i}}$ est corrélé à $θ$ et $γ .$ Un problème similaire se manifeste dans $(ρ, ϕ, δ) .$ Par conséquent, afin de résoudre ces problèmes de faible identifiabilité, nous utilisons l’échantillonneur de Gibbs par blocs pour tirer des échantillons aléatoires de $(μ, ρ, θ, γ, ϕ, δ) .$

L’échantillonneur de Gibbs par blocs s’obtient en tirant $(μ, θ, γ | ρ, ϕ, δ, y)$ et $(ρ, ϕ, δ | μ, θ, γ, y)$ à tour de rôle de la densité a posteriori conditionnelle jusqu’à la convergence, comme nous le décrivons plus bas. Les deux densités a posteriori conditionnelles conjointes sont

$\begin{array}{l} π_{1} (μ, θ, γ | ρ, ϕ, δ, y) & \propto \prod_{i =1}^{l} \prod_{j =1}^{m_{i}} \frac{B (s_{i j} + μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}{B (μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})} \\ \times \frac{μ_{i}^{θ \frac{1 - γ}{γ} - 1} {(1 - μ_{i})}^{(1 - θ) \frac{1 - γ}{γ} - 1}}{B (θ \frac{1 - γ}{γ}, (1 - θ) \frac{1 - γ}{γ})}, 0< μ_{i} <1, i =1, \dots, l, \frac{γ}{1 - γ} < θ < \frac{1 - 2 γ}{1 - γ},0< γ < \frac{1}{3} \end{array}$

$\begin{array}{l} π_{2} (ρ, ϕ, δ | μ, θ, γ, y) & \propto \prod_{i =1}^{l} \prod_{j =1}^{m_{i}} \frac{B (s_{i j} + μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}{B (μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})} \\ \times \frac{ρ_{i}^{ϕ \frac{1 - δ}{δ} - 1} {(1 - ρ_{i})}^{(1 - ϕ) \frac{1 - δ}{δ} - 1}}{B (ϕ \frac{1 - δ}{δ}, (1 - ϕ) \frac{1 - δ}{δ})}, 0< ρ_{i} <1, i =1, \dots, l, \frac{δ}{1 - δ} < ϕ < \frac{1 - 2 δ}{1 - δ},0< δ < \frac{1}{3} . \end{array}$

Pour exécuter l’échantillonneur de Gibbs par blocs, nous appliquons la règle de multiplication dans $π_{1} (μ, θ, γ | ρ, ϕ, δ, y)$ et $π_{2} (ρ, ϕ, δ | μ, θ, γ, y);$ voir, par exemple, Molina et coll. (2014) et Toto et Nandram (2010).

D’abord, nous considérons $π_{1} (μ, θ, γ | ρ, ϕ, δ, y) .$ Nous éliminons $μ$ par intégration et obtenons la densité a posteriori conditionnelle conjointe de $(θ, γ)$ sachant $ρ, ϕ, δ$ et $y,$

$\begin{array}{l} p (θ, γ | ρ, ϕ, δ, y) & \propto \prod_{i =1}^{l} {\int_{0}^{1} [\prod_{j =1}^{m_{i}} \frac{B (s_{i j} + μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}{B (μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}] \\ \times \frac{μ_{i}^{θ \frac{1 - γ}{γ} - 1} {(1 - μ_{i})}^{(1 - θ) \frac{1 - γ}{γ} - 1}}{B (θ \frac{1 - γ}{γ}, (1 - θ) \frac{1 - γ}{γ})} d μ_{i}}, 0< μ_{i} <1, i =1, \dots, l, \\ \frac{γ}{1 - γ} < θ < \frac{1 - 2 γ}{1 - γ},0< γ < \frac{1}{3} . \end{array}$

Ici, nous utilisons la somme de Riemann par la méthode du point milieu pour éliminer par intégration tous les $μ_{i}, i = 1, \dots, l .$ Nous subdivisons l’intervalle (0, 1) en $G$ sous-intervalles $(a_{0}, a_{1}], (a_{1}, a_{2}], \dots, [a_{G - 1}, a_{G}],$ où $a_{0} = 0, a_{i} = i / G, i = 1, \dots G .$ Alors, nous pouvons calculer la distribution a posteriori conditionnelle conjointe de $(θ, γ)$ comme il suit.

$p (θ, γ | ρ, ϕ, δ, y) \propto \prod_{i =1}^{l} [\lim_{G \to \infty} \sum_{v = 1}^{G} g_{i} (\frac{a_{v - 1} + a_{v}}{2}) {F_{1} (a_{v - 1}) - F_{1} (a_{v})}],$

$g_{i} (μ_{i}) = \prod_{j = 1}^{m_{i}} \frac{B (s_{i j} + μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}{B (μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}$

et $F_{1} (\cdot)$ est la fonction de répartition correspondant à $f_{1} (\cdot),$ qui est une fonction de densité de $Bêta (θ \frac{1 - γ}{γ}, (1 - θ) \frac{1 - γ}{γ}) .$ Ensuite, nous éliminons également $θ$ par intégration en utilisant la quadrature gaussienne au moyen des polynômes orthogonaux de Legendre,

$p (γ | ρ, ϕ, δ, y) \approx \sum_{g = 1}^{G} ω_{g} {\prod_{i =1}^{l} \int_{0}^{1} π_{1} (μ_{i}, x_{g}, γ | ρ_{i}, ϕ, δ, y) d μ_{i}},$

où ${ω_{g}}$ sont les poids et ${x_{g}}$ sont les racines du polynôme de Legendre sur l’intervalle $[\frac{γ}{1 - γ}, \frac{1 - 2 γ}{1 - γ}] .$ Nous avons pris $G = 20$ dans nos calculs (de plus grandes valeurs de $G$ ne font guère de différence).

Maintenant, nous pouvons utiliser une méthode à grille univariée (par exemple, Molina, Nandram et Rao 2014 et Toto et Nandram 2010) en vue de tirer des échantillons de la densité a posteriori de $γ$ conditionnellement à $ρ, ϕ, δ$ et $y;$ voir Ritter et Tanner (1992) pour une description de l’échantillonneur de Gibbs «à grille ». Alors, conditionnellement à $γ,$ nous obtenons la densité a posteriori de $θ$ comme il suit,

$p (θ | γ, ρ, ϕ, δ, y) \approx \sum_{g = 1}^{G} ω_{g} {\prod_{i =1}^{l} \int_{0}^{1} π_{1} (μ_{i}, θ | γ, ρ_{i}, ϕ, δ, y) d μ_{i}} .$

Les échantillons sont tirés de la densité a posteriori conditionnelle de $θ$ en utilisant de nouveau l’échantillonneur à grille univariée. Par la suite, conditionnellement à $(θ, γ), μ$ est tiré de $p (μ | θ, γ, ρ, ϕ, δ, y)$ en utilisant l’échantillonneur à grille univariée.

Pour la méthode à grille, nous divisons l’intervalle unitaire en sous-intervalles de 0,01 de largeur, et nous approximons la densité a posteriori conjointe par une distribution discrète avec probabilités proportionnelles aux hauteurs de la distribution continue aux points milieu de ces sous-intervalles. Notons que nous introduisons un bruit aléatoire (jittering) uniforme à l’intérieur de chaque intervalle sélectionné pour permettre différents écarts avec probabilité de un (Nandram 2015). Même quand nous avons utilisé des sous-intervalles plus fins (par exemple, largeur de 0,005), les résultats d’inférence ont été presque les mêmes. Donc, nous utilisons les sous-intervalles de 0,01 de largeur; voir Molina et coll. (2014). Lorsque la plupart de la distribution se trouve près de l’une des bornes (par exemple, 0 ou 1), nous créons des intervalles de plus petite largeur pour saisir les petites ou les grandes valeurs du paramètre.

Deuxièmement, nous considérons $π_{2} (ρ, ϕ, δ | μ, θ, γ, y) .$ Nous éliminons $ρ$ par intégration et obtenons la densité a posteriori conditionnelle conjointe de $(ϕ, δ)$ sachant $μ, θ, γ$ et $y,$

$\begin{array}{l} p (ϕ, δ | μ, θ, γ, y) & \propto \prod_{i =1}^{l} {\int_{0}^{1} [\prod_{j =1}^{m_{i}} \frac{B (s_{i j} + μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}{B (μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}] \\ \times \frac{ρ_{i}^{ϕ \frac{1 - δ}{δ} - 1} {(1 - ρ_{i})}^{(1 - ϕ) \frac{1 - δ}{δ} - 1}}{B (ϕ \frac{1 - δ}{δ}, (1 - ϕ) \frac{1 - δ}{δ})}}, 0< ρ_{i} <1, i =1, \dots, l, \frac{δ}{1 - δ} < ϕ < \frac{1 - 2 δ}{1 - δ}, 0< δ < \frac{1}{3} . \end{array}$

De nouveau, nous appliquons la somme de Riemann par la méthode du point milieu pour éliminer par intégration tous les $ρ_{i}, i = 1, \dots, l$ et calculer la distribution a posteriori conditionnelle conjointe de $(ϕ, δ),$

$p (ϕ, δ | μ, θ, γ, y) \propto \prod_{i =1}^{l} [\lim_{G \to \infty} \sum_{v = 1}^{G} h_{i} (\frac{a_{v - 1} + a_{v}}{2}) {F_{2} (a_{v - 1}) - F_{2} (a_{v})}],$

où

$h_{i} (ρ_{i}) = \prod_{j = 1}^{m_{i}} \frac{B (s_{i j} + μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, n_{i j} - s_{i j} + (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}{B (μ_{i} \frac{1 - ρ_{i}}{ρ_{i}}, (1 - μ_{i}) \frac{1 - ρ_{i}}{ρ_{i}})}$

et $F_{2} (\cdot)$ est la fonction de répartition correspondant à $f_{2} (\cdot)$ qui est une fonction de densité de $Bêta (ϕ \frac{1 - δ}{δ}, (1 - ϕ) \frac{1 - δ}{δ}) .$ En utilisant la quadrature gaussienne au moyen des polynômes orthogonaux de Legendre, nous pouvons éliminer $ϕ$ par intégration et obtenir la densité a posteriori conditionnelle de $δ,$

$p (δ | μ, θ, γ, y) \approx \sum_{g = 1}^{G} {ω^{}}_{g'} {\prod_{i =1}^{l} \int_{0}^{1} π_{2} (ρ_{i}, {x^{}}_{g'}, δ | μ_{i}, θ, γ, y) d ρ_{i}},$

où ${{ω^{}}_{g'}}$ sont les poids et ${{x^{}}_{g'}}$ sont les racines du polynôme de Legendre sur l’intervalle $[\frac{δ}{1 - δ}, \frac{1 - 2 δ}{1 - δ}] .$

Alors, nous appliquons la méthode à grille univariée afin de tirer des échantillons de la densité a posteriori de $δ$ conditionnellement à $μ, θ, γ$ et $y .$ Par conséquent, nous pouvons représenter la densité a posteriori conditionnelle de $ϕ$ par

$p (ϕ | δ, μ, θ, γ, y) \approx \sum_{g = 1}^{G} {ω^{}}_{g'} {\prod_{i =1}^{l} \int_{0}^{1} π_{2} (ρ_{i}, ϕ | δ, μ_{i}, θ, γ, y) d ρ_{i}},$

et obtenir des échantillons de $θ$ en utilisant de nouveau l’échantillonneur à grille univariée. Enfin, conditionnellement à $(ϕ, δ), ρ$ peut être tiré de $p (ρ | μ, θ, γ, ϕ, δ, y),$ où nous utilisons également la méthode à grille univariée.

Cet algorithme échantillonne $π_{1} (μ, θ, γ | ρ, ϕ, δ, y)$ en tirant d’abord une itération de $π_{1} (γ | ρ, ϕ, δ, y),$ une itération de $π_{1} (θ | γ, ρ, ϕ, δ, y),$ puis une itération de $π_{1} (μ | θ, γ, ρ, ϕ, δ, y) .$ Ensuite, il échantillonne $π_{2} (ρ, ϕ, δ | μ, θ, γ, y)$ en tirant d’abord une itération de $π_{2} (δ | μ, θ, γ, y),$ une itération de $π_{2} (ϕ | δ, μ, θ, γ, y),$ puis une itération de $π_{2} (ρ | ϕ, δ, μ, θ, γ, y) .$ La procédure complète se poursuit jusqu’à la convergence. Cela revient à utiliser un échantillonneur de Gibbs avec deux densités a posteriori conditionnelles, ce qui est, en fait, l’échantillonneur de Gibbs par blocs. La construction de l’échantillonneur de Gibbs par blocs est très efficace et il s’agit de l’une de nos principales contributions dans le présent article. En fait, nous pourrions donner à l’échantillonneur de Gibbs par blocs le nom d’échantillonneur de Gibbs « à grille » par blocs (Ritter et Tanner 1992).

Nous avons examiné la convergence de l’échantillonneur de Gibbs par blocs en utilisant des tracés, des graphiques d’autocorrélation et le test de stationnarité de Geweke. Les tracés (itérations en fonction du temps) renseignent sur la durée de la période de rodage requise pour éliminer l’effet des valeurs initiales. Les graphiques d’autocorrélation montrent la dépendance dans la chaîne et, par conséquent, ceux présentant de fortes corrélations entre de longs décalages sont le signe d’une mauvaise chaîne de mélange. Le test de Geweke compare les moyennes de la partie initiale et de la partie ultérieure de la chaîne de Markov en utilisant une statistique de score $z,$ où l’hypothèse nulle est que la chaîne est stationnaire; les valeurs $p$ sont toutes supérieures à 0,10. Nous avons utilisé les tracés, les graphiques d’autocorrélation et le test de Geweke pour chaque paramètre afin d’étudier la convergence de chaque exécution de l’échantillonneur de Gibbs par blocs. Pour nos données, nous avons tiré 2 000 échantillons et en avons utilisé 1 000 pour le rodage afin d’obtenir un échantillon de 1 000 itérations pour l’inférence. Cette période de rodage, qui est basée sur les tracés et le test de Geweke, est suffisamment longue pour obtenir des échantillons aléatoires. Les corrélations sont toutes non significatives, et, ce qui est intéressant, nous ne devons pas réduire les itérations. En outre, le test de Geweke donne la preuve de la stationnarité de notre échantillonneur. Donc, nous disposons d’un échantillonneur de Gibbs par blocs très efficace. L’exécution de la procédure en R prend quelques minutes. Nous avons appliqué la même procédure pour notre étude en simulation.

ISSN : 1712-5685

Politique de rédaction

Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.

Présentation de textes pour la revue

Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).

Note de reconnaissance

Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.

Normes de service à la clientèle

Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.

Droit d'auteur

Publication autorisée par le ministre responsable de Statistique Canada.

L'utilisation de la présente publication est assujettie aux modalités de l'Entente de licence ouverte de Statistique Canada.

N° 12-001-X au catalogue

Périodicité : Semi-annuel

Ottawa

Date de modification :: 2017-06-22

Sélection de la langue

Recherche et menus

Recherche

Inférence bayésienne prédictive sur une proportion sous un modèle double pour petits domaines avec corrélations hétérogènes
Section 2. Modèles doubles bayésiens pour petits domaines et calculs

2.1 Une revue du modèle double avec corrélation homogène

2.2 Un modèle double avec corrélations hétérogènes

2.3 Calculs du posterior CHE

Inférence bayésienne prédictive sur une proportion sous un modèle double pour petits domaines avec corrélations hétérogènes Section 2. Modèles doubles bayésiens pour petits domaines et calculs

2.1 Une revue du modèle double avec corrélation homogène

2.2 Un modèle double avec corrélations hétérogènes

2.3 Calculs du posterior CHE

Politique de rédaction

Présentation de textes pour la revue

Note de reconnaissance

Normes de service à la clientèle

Droit d'auteur

Inférence bayésienne prédictive sur une proportion sous un modèle double pour petits domaines avec corrélations hétérogènes
Section 2. Modèles doubles bayésiens pour petits domaines et calculs