Techniques d’enquête

Date de diffusion : 17 décembre 2019

La revue Techniques d’enquête volume 45, numéro 3 (décembre 2019) comprend huit articles et une communication brève.

Articles réguliers

Estimation du niveau et de la variation du chômage au moyen de modèles de séries chronologiques structurels

par Harm Jan Boonstra et Jan A. van den Brakel

On obtient les estimations mensuelles du chômage provincial fondées sur l’Enquête sur la population active (EPA) des Pays-Bas au moyen de modèles de séries chronologiques. Les modèles tiennent compte du biais de renouvellement et de la corrélation sérielle causée par le plan d’échantillonnage à panel rotatif de l’EPA. L’article compare deux méthodes d’estimation de modèles de séries chronologiques structurels (MSCS). Dans la première méthode, les MSCS sont exprimés sous forme de modèles espace-état, auxquels sont appliqués le filtre et le lisseur de Kalman dans un cadre fréquentiste. L’autre solution consiste à exprimer ces MSCS sous forme de modèles multiniveaux de séries chronologiques dans un cadre bayésien hiérarchique et à les estimer à l’aide de l’échantillonneur de Gibbs. Nous comparons ici les estimations mensuelles du chômage et les erreurs-types fondées sur ces modèles pour les 12 provinces des Pays-Bas. Nous discutons ensuite des avantages et des inconvénients de la méthode multiniveau et de la méthode espace-état.

Article complet Version PDF

Estimateurs de la variance robustes pour estimateurs par la régression généralisée dans des échantillons en grappes

par Timothy L. Kennel et Richard Valliant

Les estimateurs de la variance par linéarisation classiques de l’estimateur par la régression généralisée sont souvent trop petits, ce qui entraîne des intervalles de confiance ne donnant pas le taux de couverture souhaité. Pour remédier à ce problème, on peut apporter des ajustements à la matrice chapeau dans l’échantillonnage à deux degrés. Nous présentons la théorie de plusieurs nouveaux estimateurs de la variance et les comparons aux estimateurs classiques dans une série de simulations. Les estimateurs proposés corrigent les biais négatifs et améliorent les taux de couverture de l’intervalle de confiance dans diverses situations correspondant à celles rencontrées en pratique.

Article complet Version PDF

Note sur la méthode de pondération des scores de propension par l’utilisation de paradonnées dans l’échantillonnage

par Seho Park, Jae Kwang Kim et Kimin Kim

Souvent, des paradonnées sont recueillies pendant le processus d’enquête afin de surveiller la qualité des réponses. L’une des paradonnées recueillies est le comportement du répondant, qui peut servir dans la construction des modèles de réponse. On peut appliquer le poids du score de propension utilisant les renseignements sur le comportement du répondant à l’analyse finale pour réduire le biais dû à la non-réponse. Toutefois, l’inclusion de la variable de substitution dans la pondération du score de propension ne garantit pas toujours une amélioration de l’efficacité. Nous montrons que la variable de substitution n’est utile que quand elle est corrélée à la variable étudiée. Les résultats d’une étude par simulations limitée confirment cette constatation. L’article présente aussi une application sur données réelles utilisant les données de la Korean Workplace Panel Survey (enquête par panel sur le milieu de travail en Corée).

Article complet Version PDF

Suggestion de méthodes d’établissement d’intervalles de confiance pour l’alpha de Cronbach dans une application à des données complexes d’enquête

par Jihnhee Yu, Ziqiang Chen, Kan Wang et Mine Tezal

Ce document décrit une inférence utile pour le coefficient alpha (Cronbach, 1951), statistique répandue sous forme de rapport visant les covariances et les variances en échantillonnage d’enquête, notamment dans un échantillonnage complexe comportant des probabilités inégales d’inclusion. Cette étude peut éclairer les enquêteurs désireux d’évaluer divers instruments psychologiques ou sociaux employés dans les grandes enquêtes. Pour les données d’enquête, nous étudions ici des intervalles de confiance praticables en utilisant deux méthodes soit (1) par la méthode de linéarisation et la fonction d’influence et (2) par la méthode bootstrap à correction de couverture. La première de ces méthodes assure des taux suffisants de couverture avec les valeurs ordinales corrélées propres à un grand nombre d’instruments, mais elle pourrait ne pas donner d’aussi bons résultats avec certaines distributions non normales, entre autres avec une distribution lognormale à plusieurs variables (multilognormale). Nous proposons d’utiliser la seconde de ces méthodes à correction de couverture en complément à la méthode de linéarisation, parce qu’elle est vorace en calcul. En appliquant les méthodes ainsi conçues, nous établissons des intervalles de confiance pour le coefficient alpha à des fins d’évaluation de divers instruments en santé mentale (Kessler 10, Kessler 6 et échelle d’invalidité de Sheehan) applicables à des entités démographiques, et ce, à l’aide des données d’une reprise de l’enquête nationale américaine sur la comorbidité (National Comorbidity Survey − Replication ou NCS-R).

Article complet Version PDF

Échantillonnage optimal en coût pour l’observation intégrée de populations différentes

par Piero Demetrio Falorsi, Paolo Righi et Pierre Lavallée

Dans les études sociales ou économiques, il faut souvent adopter une vue d’ensemble de la société. Dans les études en agriculture par exemple, on peut établir un lien entre les caractéristiques des exploitations et les activités sociales des particuliers. On devrait donc étudier un phénomène en considérant les variables d’intérêt et en se reportant à cette fin à diverses populations cibles liées entre elles. Pour se renseigner sur un phénomène, on se doit de faire des observations en toute intégration, les unités d’une population devant être observées conjointement avec les unités liées d’une autre. Dans l’exemple de l’agriculture, cela veut dire qu’on devrait prélever un échantillon de ménages ruraux qui serait lié de quelque manière à l’échantillon d’exploitations à utiliser aux fins de l’étude.

Article complet Version PDF

Algorithme génétique de regroupement pour la stratification et la répartition simultanée de l’échantillon dans les plans de sondage

par Mervyn O’Luing, Steven Prestwich et S. Armagan Tarim

Lorsque la base de sondage est importante, il est difficile d’optimiser la stratification et la taille de l’échantillon dans un plan de sondage univarié ou multivarié. Il existe diverses façons de modéliser et de résoudre ce problème. Un des moyens les plus naturels est l’algorithme génétique (AG) combiné à l’algorithme d’évaluation de Bethel-Chromy. Un AG recherche itérativement la taille minimale d’échantillon permettant de respecter les contraintes de précision lorsqu’il s’agit de partitionner les strates atomiques formées par le produit cartésien de variables auxiliaires. Nous signalons un inconvénient avec les AG classiques appliqués à un problème de regroupement et proposons un nouvel algorithme génétique de « regroupement » avec des opérateurs génétiques au lieu des opérateurs classiques. Des expériences indiquent qu’on se trouve ainsi à améliorer nettement la qualité de solution pour un même effort de calcul.

Article complet Version PDF

Poids de calage « optimaux » dans les cas de non-réponse des unités lors de l’échantillonnage d’enquête

par Per Gösta Andersson

Un taux de non-réponse élevé est un problème très courant dans les enquêtes-échantillons de nos jours. Du point de vue statistique, nous entretenons des inquiétudes au sujet du biais et de la variance accrus des estimateurs de chiffres de population comme les totaux ou les moyennes. Diverses méthodes ont été proposées pour compenser ce phénomène. En gros, nous pouvons les diviser en imputation et calage, et c’est sur la dernière méthode que nous nous concentrons ici. La catégorie des estimateurs par calage offre un large éventail de possibilités. Nous examinons le calage linéaire, pour lequel nous suggérons d’utiliser une version de non-réponse de l’estimateur de régression optimal fondé sur le plan. Nous faisons des comparaisons entre cet estimateur et un estimateur de type GREG. Les mesures de la distance jouent un rôle très important dans l’élaboration des estimateurs par calage. Nous démontrons qu’un estimateur de la propension moyenne à répondre (probabilité) peut être inclus dans la mesure de la distance « optimale » dans les cas de non-réponse, ce qui aide à réduire le biais de l’estimateur ainsi obtenu. Une étude en simulation a été réalisée pour illustrer de manière empirique les résultats obtenus de façon théorique pour les estimateurs proposés. La population se nomme KYBOK et se compose de municipalités administratives de la Suède, pour lesquelles les variables comprennent des mesures financières et de la taille. Les résultats sont encourageants pour l’estimateur « optimal » combiné à la propension estimative moyenne à répondre, où le biais a été réduit pour la plupart des cas d’échantillonnage de Poisson faisant partie de l’étude.

Article complet Version PDF

Méthode de correction de l’erreur d’appartenance à une base dans les estimateurs à double base de sondage

par Dong Lin, Zhaoce Liu et Lynne Stokes

Les enquêtes à double base de sondage sont utiles là où une seule base n’assure pas une couverture suffisante, mais pour les estimateurs d’un tel plan d’échantillonnage à double base, il faut connaître l’appartenance à une base pour chaque unité échantillonnée. Si cette indication ne peut être tirée de la base de sondage même, elle est souvent à recueillir auprès de l’enquêté. Si l’enquêté donne alors une indication erronée, les estimations résultantes des moyennes ou des totaux pourront s’en trouver biaisées. Nous proposons une méthode de réduction de ce biais grâce à des données exactes d’appartenance venant d’un sous-échantillon d’enquêtés. Nous examinons les propriétés de notre nouvel estimateur et le comparons à d’autres. Nous l’appliquons aux données de l’exemple qui a été à l’origine de notre étude, soit une enquête auprès des pêcheurs à la ligne pêchant à des fins récréatives qui reposait sur une base d’adresses et une base incomplète de permis de pêche.

Article complet Version PDF

Communication brève

Nouvel estimateur de la variance de l’estimateur par le ratio avec corrections de petit échantillon

par Paul Knottnerus et Sander Scholtus

Les formules largement utilisées pour la variance de l’estimateur par le ratio peuvent mener à une sérieuse sous-estimation quand l’échantillon est de petite taille; voir Sukhatme (1954), Koop (1968), Rao (1969) et Cochran (1977, pages 163 et 164). Nous proposons ici comme solution à ce problème classique de nouveaux estimateurs de la variance et de l’erreur quadratique moyenne de l’estimateur par le ratio qui ne sont pas entachés d’un important biais négatif. Des formules d’estimation semblables peuvent s’obtenir pour d’autres estimateurs par le ratio, comme il en est question dans Tin (1965). Nous comparons trois estimateurs de l’erreur quadratique moyenne de l’estimateur par le ratio dans une étude par simulation.

Article complet Version PDF


Date de modification :