Critère d'information bayésien fondé sur la pseudo-vraisemblance pour la sélection de variables dans les données d'enquête

Warning Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Chen Xu, Jiahua Chen et Harold Mantel1

Résumé

Les modèles de régression sont utilisés couramment pour analyser les données d'enquête lorsque l'on souhaite déterminer quels sont les facteurs influents associés à certains indices comportementaux, sociaux ou économiques au sein d'une population cible. Lorsque des données sont recueillies au moyen d'enquêtes complexes, il convient de réexaminer les propriétés des approches classiques de sélection des variables élaborées dans des conditions i.i.d. ne faisant pas appel au sondage. Dans le présent article, nous dérivons un critère BIC fondé sur la pseudo vraisemblance pour la sélection des variables dans l'analyse des données d'enquête et proposons une approche de vraisemblance pénalisée dans des conditions de sondage pour sa mise en œuvre. Les poids de sondage sont attribués comme il convient pour corriger le biais de sélection causé par la distorsion entre l'échantillon et la population cible. Dans un cadre de randomisation conjointe, nous établissons la cohérence de la procédure de sélection proposée. Les propriétés en échantillon fini de l'approche sont évaluées par des analyses et des simulations informatiques en se servant de données provenant de la composante de l'hypertension de l'Enquête sur les personnes ayant une maladie chronique au Canada de 2009.

Mots clés

sélection des variables; poids de sondage; inférence sous le modèle et sous le plan; BIC; vraisemblance pénalisée; cohérence de sélection.

Table des matières

1 Introduction

2 Inférence conjointe et superpopulation

3 Sélection fondée sur la pseudo-vraisemblance avec le BIC

4 Convergence de la procédure BIC-PVP

5 Études numériques

6 Conclusion

 

 

 

 

 


1  Chen Xu et Jiahua Chen, Département de statistique, Université de la Colombie-Britannique, Vancouver (C.-B.), Canada, V6T 1Z4. Courriel : chen.xu@stat.ubc.ca et jhchen.stat.ubc.ca; Harold Mantel, Division de la recherche et de l'innovation en statistique, Statistique Canada, Ottawa (Ontario), Canada, K1A 0T6. Courriel : Harold.Mantel@statcan.gc.ca.

Signaler un problème sur cette page

Quelque chose ne fonctionne pas? L'information n'est plus à jour? Vous ne trouvez pas ce que vous cherchez?

S'il vous plaît contactez-nous et nous informer comment nous pouvons vous aider.

Avis de confidentialité

Date de modification :