Statistiques par sujet – Réponse et non-réponse

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Autres ressources disponibles pour appuyer vos recherches.

Aide pour trier les résultats
Explorer notre base centrale des principaux concepts normalisés, définitions, sources de données et méthodes.
En cours de chargement
Chargement en cours, veuillez patienter...
Tout (86)

Tout (86) (25 of 86 results)

  • Articles et rapports : 12-001-X201700114820
    Description :

    Les erreurs de mesure peuvent provoquer un biais de l’estimation des transitions, donnant lieu à des conclusions erronées au sujet de la dynamique du marché du travail. La littérature traditionnelle sur l’estimation des mouvements bruts est basée sur la supposition que les erreurs de mesure ne sont pas corrélées au fil du temps. Cette supposition n’est pas réaliste dans bien des contextes, en raison du plan d’enquête et des stratégies de collecte de données. Dans le présent document, nous utilisons une approche basée sur un modèle pour corriger les mouvements bruts observés des erreurs de classification au moyen de modèles markoviens à classes latentes. Nous nous reportons aux données recueillies dans le cadre de l’enquête italienne continue sur la population active, qui est transversale et trimestrielle et qui comporte un plan de renouvellement de type 2-2-2. Le questionnaire nous permet d’utiliser plusieurs indicateurs des états de la population active pour chaque trimestre : deux recueillis au cours de la première interview, et un troisième recueilli un an plus tard. Notre approche fournit une méthode pour estimer la mobilité sur le marché du travail, en tenant compte des erreurs corrélées et du plan par renouvellement de l’enquête. Le modèle qui convient le mieux est un modèle markovien mixte à classes latentes, avec des covariables touchant les transitions latentes et des erreurs corrélées parmi les indicateurs; les composantes mixtes sont de type mobile-stable. Le caractère plus approprié de la spécification du modèle mixte est attribuable à des transitions latentes estimées avec une plus grande précision.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201600214677
    Description :

    Comment savoir si les ajustements de la pondération réduisent ou non le biais de non-réponse ? Si une variable est mesurée pour toutes les unités de l’échantillon sélectionné, on peut calculer une estimation approximativement sans biais de la moyenne ou du total de population pour cette variable en se servant des poids de sondage. Une seconde estimation de la moyenne ou du total de population peut être obtenue en se basant uniquement sur les répondants à l’enquête et en utilisant des poids ajustés pour tenir compte de la non-réponse. Si les deux estimations ne concordent pas, il y a des raisons de penser que les ajustements des poids n’ont peut-être pas éliminé le biais de non-réponse pour la variable en question. Dans le présent article, nous développons les propriétés théoriques des estimateurs de variance par linéarisation et par jackknife en vue d’évaluer le biais d’une estimation de la moyenne ou du total de population par comparaison des estimations obtenues pour des sous-ensembles chevauchants des mêmes données avec différents ensembles de poids, quand la poststratification ou la pondération par l’inverse de la propension à répondre servent à ajuster les poids pour tenir compte de la non-réponse. Nous donnons les conditions suffisantes sur la population, l’échantillon et le mécanisme de réponse pour que les estimateurs de variance soient convergents, et démontrons les propriétés de ces derniers pour un petit échantillon au moyen d’une étude par simulation.

    Date de diffusion : 2016-12-20

  • Articles et rapports : 12-001-X201600214661
    Description :

    Un exemple présenté par Jean-Claude Deville en 2005 est soumis à trois méthodes d’estimation : la méthode des moments, la méthode du maximum de vraisemblance et le calage généralisé. Les trois méthodes donnent exactement les mêmes résultats pour les deux modèles de non-réponse. On discute ensuite de la manière de choisir le modèle le plus adéquat

    Date de diffusion : 2016-12-20

  • Produits techniques : 11-522-X201700014715
    Description :

    En vue du Recensement de 2021 au Royaume-Uni, l'Office for National Statistics (ONS) s’est engagée à mener un programme de recherche exhaustif, afin d’explorer comment les données administratives couplées peuvent servir à appuyer les processus statistiques conventionnels. Le contrôle et l’imputation (C et I) au niveau de la question joueront un rôle important pour l’ajustement de la base de données du Recensement de 2021. Toutefois, l’incertitude associée à l’exactitude et à la qualité des données administratives disponibles jette des doutes sur l’efficacité d’une approche intégrée fondée sur des données du recensement et des données administratives en ce qui a trait au C et I. Les contraintes actuelles, qui dictent une approche anonymisée de la « clef » pour le couplage des enregistrements, afin d’assurer la confidentialité, accentuent cette incertitude. Nous fournissons les résultats préliminaires d’une étude de simulation comparant l’exactitude prédictive et l’exactitude de la distribution de la stratégie conventionnelle de C et I mise en œuvre au moyen du SCANCIR pour le Recensement de 2011 au Royaume-Uni, à celles d’une approche intégrée reposant sur des données administratives synthétiques, comme données auxiliaires, avec une erreur qui augmente de façon systématique. À cette étape initiale de la recherche, nous mettons l’accent sur l’imputation d’une année d’âge. L’objectif de l’étude est de déterminer si les données auxiliaires découlant des données administratives peuvent améliorer les estimations de l’imputation, et où se situent les différentes stratégies dans un continuum d’exactitude.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 12-001-X201500114173
    Description :

    La non-réponse est présente dans presque toutes les enquêtes et peut fortement biaiser les estimations. On distingue habituellement la non-réponse totale et la non-réponse partielle. En notant que pour une variable d’enquête en particulier, nous avons uniquement des valeurs observées et des valeurs inobservées, nous exploitons dans la présente étude le lien entre la non-réponse totale et la non-réponse partielle. En particulier, nous supposons que les facteurs qui sous-tendent la réponse totale sont les mêmes que ceux qui sous-tendent la réponse partielle pour les variables d’intérêt choisies. Nous estimons alors les probabilités de réponse en utilisant une covariable latente qui mesure la volonté de répondre à l’enquête et qui peut expliquer, en partie, le comportement inconnu d’une unité en ce qui concerne la participation à l’enquête. Nous estimons cette covariable latente en nous servant de modèles à traits latents. Cette approche convient particulièrement bien pour les questions sensibles et, par conséquent, permet de traiter la non-réponse non ignorable. L’information auxiliaire connue pour les répondants et les non-répondants peut être incluse dans le modèle à variables latentes ou dans le processus d’estimation de la probabilité de réponse. L’approche peut également être utilisée quand on ne dispose pas d’information auxiliaire, et nous nous concentrons ici sur ce cas. Nous proposons une estimation au moyen d’un système de repondération basé sur la covariable latente précédente quand aucune autre information auxiliaire observée n’est disponible. Les résultats d’études par simulation en vue d’évaluer sa performance en se servant de données réelles ainsi que simulées sont encourageants.

    Date de diffusion : 2015-06-29

  • Produits techniques : 11-522-X201300014277
    Description :

    Le présent article donne un aperçu des éléments d’un plan de sondage adaptatif introduit de la quatrième vague à la septième vague de l’enquête par panel PASS. L’exposé porte principalement sur les interventions expérimentales aux dernières phases du travail sur le terrain. Ces interventions visent à équilibrer l’échantillon en donnant la priorité aux membres de l’échantillon ayant une faible propension à répondre. À la septième vague, les intervieweurs ont reçu une double prime pour les interviews de cas ayant une faible propension à répondre achevées à la phase finale du travail sur le terrain. Cette prime a été limitée à une moitié, sélectionnée aléatoirement, des cas qui avaient une faible propension à répondre et n’ayant pas reçu de code d’état final après quatre mois de travail sur le terrain. Cette prime a effectivement intensifié l’effort déployé par les intervieweurs, mais n’a abouti à aucune augmentation significative des taux de réponse.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014262
    Description :

    Bien que l’erreur de mesure soit une source de biais en analyse statistique, ses conséquences possibles sont pour la plupart ignorées. Les modèles à effets fixes représentent une classe de modèles sur lesquels l’erreur de mesure peut avoir une incidence particulière. La validation des réponses recueillies lors de cinq vagues d’une enquête par panel sur les prestations d’aide sociale au moyen de données de registre a permis de déterminer la taille et la forme de l’erreur de mesure longitudinale. L’étude montre que l’erreur de mesure des prestations d’aide sociale est autocorrélée et non différentielle. Toutefois, si l’on estime les coefficients des modèles à effets fixes longitudinaux des prestations d’aide sociale en fonction de l’état de santé subjectif pour les hommes et pour les femmes, les coefficients ne sont biaisés que pour la sous-population masculine.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014263
    Description :

    Recueillir des données par Internet ou par la poste auprès d’unités échantillonnées est plus économique que le faire par interview. Ces méthodes font de l’autodénombrement une approche de collecte des données intéressante pour les enquêtes et les recensements. En dépit de ses avantages, la collecte de données par autodénombrement, en particulier la collecte de données par Internet, peut produire des taux de réponse plus faibles que ceux obtenus par interview. Pour accroître les taux de réponse, on soumet les non-répondants à un mode mixte de traitements de suivi, qui influent sur la probabilité résultante de réponse, afin de les encourager à participer. Les analyses de régression comprennent habituellement des facteurs et des interactions qui ont une incidence importante sur l’interprétation des modèles statistiques. Comme l’occurrence d’une réponse est intrinsèquement conditionnelle, nous commençons par enregistrer l’occurrence des réponses en intervalles discrets, et nous caractérisons la probabilité de réponse comme étant un risque en temps discret. Cette approche facilite l’examen du moment où une réponse est la plus susceptible d’avoir lieu et de la façon dont la probabilité de réponse varie au fil du temps. Le biais de non-réponse peut être évité en multipliant le poids d’échantillonnage des répondants par l’inverse d’une estimation de la probabilité de réponse. Les estimateurs des paramètres du modèle, ainsi que des paramètres de la population finie sont présentés. Les résultats de simulations en vue d’évaluer la performance des estimateurs proposés sont également présentés.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 12-001-X201200211754
    Description :

    La méthode d'ajustement sur le score de propension est souvent adoptée pour traiter le biais de sélection dans les sondages, y compris la non-réponse totale et le sous-dénombrement. Le score de propension est calculé en se servant de variables auxiliaires observées dans tout l'échantillon. Nous discutons de certaines propriétés asymptotiques des estimateurs ajustés sur le score de propension et dérivons des estimateurs optimaux fondés sur un modèle de régression pour la population finie. Un estimateur ajusté sur le score de propension optimal peut être réalisé en se servant d'un modèle de score de propension augmenté. Nous discutons de l'estimation de la variance et présentons les résultats de deux études par simulation.

    Date de diffusion : 2012-12-19

  • Articles et rapports : 12-001-X201200211755
    Description :

    La question de la non-réponse dans les études longitudinales est abordée en évaluant l'exactitude des modèles de propension à répondre construits pour distinguer et prédire les divers types de non-réponse. Une attention particulière est accordée aux mesures sommaires dérivées des courbes de la fonction d'efficacité du receveur, ou courbes ROC (de l'anglais receiver operating characteristics), ainsi que des courbes de type logit sur rangs. Les concepts sont appliqués à des données provenant de la Millennium Cohort Study du Royaume-Uni. Selon les résultats, la capacité de faire la distinction entre les divers types de non-répondants et de les prévoir n'est pas grande. Les poids produits au moyen des modèles de propension à répondre ne donnent lieu qu'à de faibles corrections des transitions entre situations d'emploi. Des conclusions sont tirées quant aux possibilités d'intervention en vue de prévenir la non-réponse.

    Date de diffusion : 2012-12-19

  • Articles et rapports : 12-001-X201200111686
    Description :

    Nous présentons une approche fondée sur des équations d'estimation généralisées pour estimer le coefficient de corrélation de concordance et le coefficient kappa d'après des données d'enquête. Les estimations ainsi que leurs erreurs-types doivent tenir compte correctement du plan d'échantillonnage. Nous présentons des mesures pondérées du coefficient de corrélation de concordance et du coefficient kappa, ainsi que la variance de ces mesures tenant compte du plan d'échantillonnage. Nous utilisons la méthode de linéarisation par série de Taylor et la procédure du jackknife pour estimer les erreurs-types des estimations résultantes des paramètres. Des mesures anthropométriques et des données sur la santé buccodentaire provenant de la Third National Health and Nutrition Examination Survey sont utilisées pour illustrer cette méthodologie.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 12-001-X201200111689
    Description :

    En cas de non-réponse totale d'une unité dans un échantillon tiré suivant les principes de l'échantillonnage probabiliste, une pratique courante consiste à diviser l'échantillon en groupes mutuellement exclusifs de manière qu'il soit raisonnable de supposer que toutes les unités échantillonnées dans un groupe ont la même probabilité de ne pas répondre. De cette façon, la réponse d'une unité peut être traitée comme une phase supplémentaire de l'échantillonnage probabiliste en se servant de l'inverse de la probabilité de réponse estimée d'une unité dans un groupe comme facteur de correction pour calculer les poids finaux pour les répondants du groupe. Si l'objectif est d'estimer la moyenne de population d'une variable d'enquête qui se comporte plus ou moins comme une variable aléatoire dont la moyenne est constante dans chaque groupe indépendamment des poids de sondage originaux, il est habituellement plus efficace d'intégrer les poids de sondage dans les facteurs de correction que de ne pas le faire. En fait, si la variable d'enquête se comportait exactement comme une telle variable aléatoire, l'estimation de la moyenne de population calculée en se servant des facteurs de correction pondérés selon le plan de sondage serait presque sans biais dans un certain sens (c'est-à-dire sous la combinaison du mécanisme d'échantillonnage probabiliste original et d'un modèle de prédiction), même si les unités échantillonnées dans un groupe n'ont pas toutes la même probabilité de répondre.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 12-001-X201200111688
    Description :

    Nous étudions le problème de la non-réponse non ignorable dans un tableau de contingence bidimensionnel qui peut être créé individuellement pour plusieurs petits domaines en présence de non-réponse partielle ainsi que totale. En général, le fait de prendre en considération les deux types de non-réponse dans les données sur les petits domaines accroît considérablement la complexité de l'estimation des paramètres du modèle. Dans le présent article, nous conceptualisons le tableau complet des données pour chaque domaine comme étant constitué d'un tableau contenant les données complètes et de trois tableaux supplémentaires pour les données de ligne manquantes, les données de colonne manquantes et les données de ligne et de colonne manquantes, respectivement. Dans des conditions de non-réponse non ignorable, les probabilités totales de cellule peuvent varier en fonction du domaine, de la cellule et de ces trois types de « données manquantes ». Les probabilités de cellule sous-jacentes (c'est-à-dire celles qui s'appliqueraient s'il était toujours possible d'obtenir une classification complète) sont produites pour chaque domaine à partir d'une loi commune et leur similarité entre les domaines est quantifiée paramétriquement. Notre approche est une extension de l'approche de sélection sous non-réponse non ignorable étudiée par Nandram et Choi (2002a, b) pour les données binaires ; cette extension crée une complexité supplémentaire qui découle de la nature multivariée des données et de la structure des petits domaines. Comme dans les travaux antérieurs, nous utilisons un modèle d'extension centré sur un modèle de non-réponse ignorable de sorte que la probabilité totale de cellule dépend de la catégorie qui représente la réponse. Notre étude s'appuie sur des modèles hiérarchiques bayésiens et des méthodes Monte Carlo par chaîne de Markov pour l'inférence a posteriori. Nous nous servons de données provenant de la troisième édition de la National Health and Nutrition Examination Survey pour illustrer les modèles et les méthodes.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 12-001-X201100111443
    Description :

    Les enquêtes téléphoniques à base de sondage double deviennent fréquentes aux États-Unis en raison de l'incomplétude de la liste de numéros de téléphone fixe causée par l'adoption progressive du téléphone mobile. Le présent article traite des erreurs non dues à l'échantillonnage dans les enquêtes téléphoniques à base de sondage double. Alors que la plupart des publications sur les bases de sondage doubles ne tiennent pas compte des erreurs non dues à l'échantillonnage, nous constatons que ces dernières peuvent, dans certaines conditions, causer des biais importants dans les enquêtes téléphoniques à base de sondage double. Nous examinons en particulier les biais dus à la non-réponse et à l'erreur de mesure dans ces enquêtes. En vue de réduire le biais résultant de ces erreurs, nous proposons des méthodes d'échantillonnage à base de sondage double et de pondération. Nous montrons que le facteur de composition utilisé pour combiner les estimations provenant de deux bases de sondage joue un rôle important dans la réduction du biais de non-réponse.

    Date de diffusion : 2011-06-29

  • Articles et rapports : 12-001-X201000211380
    Description :

    Diverses formes d'estimateurs de variance par linéarisation pour les estimateurs par calage généralisé sont définies en choisissant différents poids à appliquer a) aux résidus et b) aux coefficients de régression estimés utilisés dans le calcul des résidus. Des éléments de théorie sont présentés pour trois formes de l'estimateur par calage généralisé, à savoir l'estimateur par ratissage croisé classique, l'estimateur par calage basé sur le « maximum de vraisemblance » et l'estimateur par la régression généralisée, ainsi que pour les estimateurs de variance par linéarisation connexes. Une étude par simulation est effectuée en se servant des données d'une enquête sur la population active et d'une enquête sur les revenus et dépenses. Les propriétés des estimateurs sont évaluées en fonction de l'échantillonnage ainsi que de la non-réponse. L'étude révèle peu de différences entre les propriétés des divers estimateurs par calage pour un plan d'échantillonnage et un modèle de non-réponse donnés. En ce qui concerne les estimateurs de variance, l'approche consistant à pondérer les résidus par les poids de sondage peut être fortement biaisée en présence de non-réponse. L'approche de pondération des résidus par les poids calés a tendance à produire un biais nettement plus faible. Le choix de différents types de poids pour produire les coefficients de régression a peu d'incidence.

    Date de diffusion : 2010-12-21

  • Articles et rapports : 12-001-X201000211384
    Description :

    Le ralentissement économique aux États-Unis pourrait rendre incertain le maintien de stratégies coûteuses dans les opérations des enquêtes. Dans le Behavioral Risk Factor Surveillance System (BRFSS), une période de collecte de données mensuelle de 31 jours seulement pourrait être une solution de rechange moins coûteuse. Toutefois, elle pourrait exclure une partie des interviews menées après 31 jours (répondants tardifs) et les caractéristiques de ces répondants pourraient être différentes à de nombreux égards de celles des répondants qui ont participé à l'enquête dans les 31 jours (répondants hâtifs). Nous avons tâché de déterminer s'il existe entre les répondants hâtifs et les répondants tardifs des différences d'ordre démographique ou en ce qui a trait à la couverture des soins de santé, à l'état de santé général, aux comportements posant un risque pour la santé et aux maladies ou problèmes de santé chroniques. Nous avons utilisé les données du BRFSS 2007, où un échantillon représentatif de la population adulte aux États-Unis ne vivant pas en établissement a été sélectionné au moyen d'une méthode de composition aléatoire. Les répondants tardifs étaient significativement plus susceptibles d'être de sexe masculin ; de déclarer leur race ou origine ethnique comme étant hispanique ; d'avoir un revenu annuel de plus de 50 000 $ ; d'avoir moins de 45 ans ; d'avoir un niveau de scolarité inférieur au diplôme d'études secondaires ; de bénéficier d'une couverture des soins de santé ; d'être significativement plus susceptibles de déclarer être en bonne santé ; d'être significativement moins susceptibles de déclarer faire de l'hypertension, souffrir de diabète ou être obèses. Les différences observées entre les répondants hâtifs et les répondants tardifs dans les estimations d'enquête pourraient influer à peine sur les estimations nationales et au niveau de l'État. Étant donné que la proportion de répondants tardifs pourrait augmenter à l'avenir, il y a lieu d'examiner son incidence sur les estimations découlant de la surveillance avant de l'exclure de l'analyse. Dans l'analyse portant sur les répondants tardifs, il devrait suffire de combiner plusieurs années de données pour produire des estimations fiables.

    Date de diffusion : 2010-12-21

  • Articles et rapports : 12-001-X201000211376
    Description :

    Le présent article décrit l'élaboration d'outils de calcul, appelés indicateurs, qui permettent de juger de l'efficacité de l'information auxiliaire utilisée pour contrôler le biais de non-réponse dans les estimations par sondage, obtenues ici par calage. L'étude est motivée par le contexte dans lequel sont réalisés les sondages dans plusieurs pays, surtout en Europe du Nord, où de nombreuses variables auxiliaires possibles concernant les ménages et les particuliers sont tirées de registres administratifs fiables. Un grand nombre de vecteurs auxiliaires pouvant donc être composés, il est nécessaire de les comparer afin de déterminer dans quelle mesure ils peuvent réduire le biais. Les indicateurs décrits dans le présent article sont conçus pour répondre à ce besoin. Ils sont utilisés dans les enquêtes réalisées par Statistics Sweden. Nous considérons des conditions générales d'enquête où un échantillon probabiliste est tiré de la population finie selon un plan d'échantillonnage arbitraire et où des cas de non réponse se produisent. La probabilité d'inclusion dans l'échantillon est connue pour chaque unité de la population ; la probabilité de réponse est inconnue, ce qui cause un biais. La variable étudiée (variable y) n'est observée que pour l'ensemble de répondants. Quel que soit le vecteur auxiliaire utilisé dans un estimateur par calage (ou dans toute autre méthode d'estimation), un biais résiduel persiste systématiquement. Le choix du vecteur auxiliaire (le meilleur possible) est guidé par les indicateurs proposés dans le présent article. Dans les premières sections, nous décrivons le contexte de leur élaboration et leurs caractéristiques de calcul, puis nous exposons leur contexte théorique. Les dernières sections sont consacrées aux études empiriques. L'une de ces études illustre la sélection des variables auxiliaires dans une enquête réalisée par Statistics Sweden. Une deuxième illustration empirique consiste en une simulation à partir d'une population finie synthétique ; un certain nombre de vecteurs auxiliaires possibles sont classés par ordre de préférence à l'aide des indicateurs.

    Date de diffusion : 2010-12-21

  • Articles et rapports : 12-001-X201000111252
    Description :

    Le biais dû à la non-réponse est un problème examiné de longue date dans le domaine de la recherche sur les enquêtes (Brehm 1993 ; Dillman, Eltinge, Groves et Little 2002), et de nombreuses études ont eu pour objectif de préciser les facteurs qui ont une influence sur la non-réponse partielle ainsi que totale. Dans le but de contribuer à la réalisation de l'objectif plus général consistant à réduire au minimum la non-réponse aux enquêtes, nous examinons dans la présente étude plusieurs facteurs pouvant avoir une incidence sur cette non-réponse, en utilisant les données de l'Animal Welfare Survey de 2007 réalisée en Ohio, aux États-Unis. En particulier, nous examinons la mesure dans laquelle l'intérêt du sujet et les primes d'incitation influent sur la participation aux enquêtes et sur la non-réponse partielle, en nous inspirant de la théorie du levier et de la saillance (leverage-saliency theory) (Groves, Singer et Corning 2000). Nous constatons que la participation à une enquête est influencée par le contexte du sujet (car celui-ci exerce un effet de levier positif ou négatif sur les unités échantillonnées) et par les primes d'incitation prépayées, ce qui est en harmonie avec la théorie du levier et de la saillance. La constatation que la non-réponse partielle, notre mesure indirecte de la qualité de la réponse, varie en fonction de la proximité par rapport à l'agriculture et l'environnement (lieu de résidence, connaissances sur la production des aliments et opinions quant à l'importance du bien être des animaux) confirme aussi nos attentes. Cependant, les données laissent entendre que la non-réponse partielle ne varie pas selon qu'un répondant reçoit ou non une prime d'incitation.

    Date de diffusion : 2010-06-29

  • Articles et rapports : 12-001-X201000111245
    Description :

    La connaissance des causes des erreurs de mesure dans les enquêtes auprès des entreprises est limitée, même si ces erreurs peuvent compromettre l'exactitude des microdonnées et des indicateurs économiques qui en découlent. Le présent article, qui est fondé sur une étude empirique axée sur le point de vue des entreprises, présente de nouveaux résultats de recherche sur le processus de réponse aux enquêtes auprès des entreprises. Il propose le modèle multidimensionnel intégral de réponse aux enquêtes auprès des entreprises (MMIREE) comme outil pour examiner le processus de réponse et expliquer ses résultats, et comme base d'une stratégie visant à réduire et à prévenir les erreurs de mesure.

    Date de diffusion : 2010-06-29

  • Articles et rapports : 12-001-X200900211043
    Description :

    Les enquêtes-entreprises sont souvent réalisées selon un plan d'échantillonnage aléatoire simple stratifié à un degré sans remise comportant certaines strates à tirage complet. Bien que l'on recoure habituellement à l'ajustement de la pondération pour traiter la non-réponse totale, la variabilité due à la non-réponse est parfois omise en pratique quand on estime les variances. Cette situation pose surtout problème lorsqu'il existe des strates à tirage complet. Nous élaborons des estimateurs de variance qui sont convergents quand le nombre d'unités échantillonnées est grand dans chaque classe de pondération, en utilisant les méthodes du jackknife, de la linéarisation et du jackknife modifié. Nous commençons par appliquer les estimateurs ainsi obtenus à des données empiriques provenant de l'Annual Capital Expenditures Survey réalisé par le U.S. Census Bureau, puis nous examinons leur performance dans une étude en simulation.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200900211038
    Description :

    Nous cherchons à corriger la surestimation causée par la non-réponse de lien dans l'échantillonnage indirect lorsque l'on utilise la méthode généralisée de partage des poids (MGPP). Nous avons élaboré quelques méthodes de correction pour tenir compte de la non-réponse de lien dans la MGPP applicables lorsque l'on dispose ou non de variables auxiliaires. Nous présentons une étude par simulation de certaines de ces méthodes de correction fondée sur des données d'enquête longitudinale. Les résultats des simulations révèlent que les corrections proposées de la MGPP réduisent bien le biais et la variance d'estimation. L'accroissement de la réduction du biais est significatif.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200900211037
    Description :

    Les stratégies fondées sur la réponse aléatoire, qui ont été élaborées au départ à titre de méthodes statistiques destinées à réduire la non-réponse ainsi que la réponse mensongère, peuvent aussi être appliquées dans le domaine du contrôle de la divulgation statistique dans les fichiers de microdonnées à grande diffusion. Le présent article décrit une standardisation des méthodes de réponse aléatoire en vue d'estimer des proportions pour des attributs identificatoires ou sensibles. Les propriétés statistiques de l'estimateur standardisé sont établies dans le cas de l'échantillonnage probabiliste général. Afin d'analyser l'effet du choix des « paramètres de plan » implicites de la méthode sur la performance de l'estimateur, nous incluons dans l'étude des mesures de la protection de la vie privée. Nous obtenons ainsi des paramètres de plan qui optimisent la variance, sachant le niveau de protection de la vie privée. Pour cela, les variables doivent être classées dans diverses catégories de sensibilité. Un exemple fondé sur des données réelles illustre l'application de la méthode à une enquête sur la tricherie chez les étudiants.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200900211039
    Description :

    La pondération par la propension à répondre est une méthode de rajustement pour tenir compte de la non-réponse totale dans les enquêtes. Une forme de mise en oeuvre de cette méthode consiste à diviser les poids d'échantillonnage par les estimations de la probabilité que les unités échantillonnées répondent à l'enquête. Habituellement, ces estimations sont obtenues par ajustement de modèles paramétriques, tels qu'une régression logistique. Les estimateurs corrigés résultants peuvent devenir biaisés si les modèles paramétriques sont spécifiés incorrectement. Afin d'éviter les erreurs de spécification du modèle, nous considérons l'estimation non paramétrique des probabilités de réponse par la régression par polynômes locaux. Nous étudions les propriétés asymptotiques de l'estimateur résultant sous quasi randomisation. Nous évaluons en pratique le comportement de la méthode proposée de correction de la non-réponse en nous servant de données de la NHANES.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200900211041
    Description :

    L'estimation de la composition sur petits domaines peut poser un problème de données manquantes informatives, si la probabilité que les données manquent varie d'une catégorie d'intérêt à l'autre, ainsi que d'un petit domaine à l'autre. Nous élaborons une approche de modélisation mixte double qui combine un modèle mixte à effets aléatoires pour les données complètes sous-jacentes et un modèle mixte à effets aléatoires du mécanisme de création différentielle de données manquantes. L'effet du plan d'échantillonnage peut être intégré au moyen d'un modèle d'échantillonnage sous quasi-vraisemblance. L'erreur quadratique moyenne conditionnelle de prédiction associée est approximée sous forme d'une décomposition en trois parties, correspondant à une variance de prédiction naïve, une correction positive qui tient compte de l'incertitude hypothétique de l'estimation des paramètres basée sur les données complètes latentes et une autre correction positive pour la variation supplémentaire due aux données manquantes. Nous illustrons notre approche en l'appliquant à l'estimation de la composition des ménages des municipalités au moyen des données sur les ménages tirées des registres norvégiens, qui présentent un sous-enregistrement informatif du numéro d'identification du logement.

    Date de diffusion : 2009-12-23

  • Produits techniques : 11-522-X200800010952
    Description :

    Dans une enquête où les résultats ont été estimés par des moyennes simples, nous comparons les incidences qu'ont sur les résultats un suivi des cas de non-réponse et une pondération fondée sur les derniers dix pour cent de répondants. Les données utilisées proviennent de l'Enquête sur les conditions de vie des immigrants en Norvège qui a été réalisée en 2006.

    Date de diffusion : 2009-12-03

Données (0)

Données (0) (Aucun résultat)

Votre recherche pour «» n’a donné aucun résultat dans la présente section du site.

Vous pouvez essayer :

Analyses (53)

Analyses (53) (25 of 53 results)

  • Articles et rapports : 12-001-X201700114820
    Description :

    Les erreurs de mesure peuvent provoquer un biais de l’estimation des transitions, donnant lieu à des conclusions erronées au sujet de la dynamique du marché du travail. La littérature traditionnelle sur l’estimation des mouvements bruts est basée sur la supposition que les erreurs de mesure ne sont pas corrélées au fil du temps. Cette supposition n’est pas réaliste dans bien des contextes, en raison du plan d’enquête et des stratégies de collecte de données. Dans le présent document, nous utilisons une approche basée sur un modèle pour corriger les mouvements bruts observés des erreurs de classification au moyen de modèles markoviens à classes latentes. Nous nous reportons aux données recueillies dans le cadre de l’enquête italienne continue sur la population active, qui est transversale et trimestrielle et qui comporte un plan de renouvellement de type 2-2-2. Le questionnaire nous permet d’utiliser plusieurs indicateurs des états de la population active pour chaque trimestre : deux recueillis au cours de la première interview, et un troisième recueilli un an plus tard. Notre approche fournit une méthode pour estimer la mobilité sur le marché du travail, en tenant compte des erreurs corrélées et du plan par renouvellement de l’enquête. Le modèle qui convient le mieux est un modèle markovien mixte à classes latentes, avec des covariables touchant les transitions latentes et des erreurs corrélées parmi les indicateurs; les composantes mixtes sont de type mobile-stable. Le caractère plus approprié de la spécification du modèle mixte est attribuable à des transitions latentes estimées avec une plus grande précision.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201600214677
    Description :

    Comment savoir si les ajustements de la pondération réduisent ou non le biais de non-réponse ? Si une variable est mesurée pour toutes les unités de l’échantillon sélectionné, on peut calculer une estimation approximativement sans biais de la moyenne ou du total de population pour cette variable en se servant des poids de sondage. Une seconde estimation de la moyenne ou du total de population peut être obtenue en se basant uniquement sur les répondants à l’enquête et en utilisant des poids ajustés pour tenir compte de la non-réponse. Si les deux estimations ne concordent pas, il y a des raisons de penser que les ajustements des poids n’ont peut-être pas éliminé le biais de non-réponse pour la variable en question. Dans le présent article, nous développons les propriétés théoriques des estimateurs de variance par linéarisation et par jackknife en vue d’évaluer le biais d’une estimation de la moyenne ou du total de population par comparaison des estimations obtenues pour des sous-ensembles chevauchants des mêmes données avec différents ensembles de poids, quand la poststratification ou la pondération par l’inverse de la propension à répondre servent à ajuster les poids pour tenir compte de la non-réponse. Nous donnons les conditions suffisantes sur la population, l’échantillon et le mécanisme de réponse pour que les estimateurs de variance soient convergents, et démontrons les propriétés de ces derniers pour un petit échantillon au moyen d’une étude par simulation.

    Date de diffusion : 2016-12-20

  • Articles et rapports : 12-001-X201600214661
    Description :

    Un exemple présenté par Jean-Claude Deville en 2005 est soumis à trois méthodes d’estimation : la méthode des moments, la méthode du maximum de vraisemblance et le calage généralisé. Les trois méthodes donnent exactement les mêmes résultats pour les deux modèles de non-réponse. On discute ensuite de la manière de choisir le modèle le plus adéquat

    Date de diffusion : 2016-12-20

  • Articles et rapports : 12-001-X201500114173
    Description :

    La non-réponse est présente dans presque toutes les enquêtes et peut fortement biaiser les estimations. On distingue habituellement la non-réponse totale et la non-réponse partielle. En notant que pour une variable d’enquête en particulier, nous avons uniquement des valeurs observées et des valeurs inobservées, nous exploitons dans la présente étude le lien entre la non-réponse totale et la non-réponse partielle. En particulier, nous supposons que les facteurs qui sous-tendent la réponse totale sont les mêmes que ceux qui sous-tendent la réponse partielle pour les variables d’intérêt choisies. Nous estimons alors les probabilités de réponse en utilisant une covariable latente qui mesure la volonté de répondre à l’enquête et qui peut expliquer, en partie, le comportement inconnu d’une unité en ce qui concerne la participation à l’enquête. Nous estimons cette covariable latente en nous servant de modèles à traits latents. Cette approche convient particulièrement bien pour les questions sensibles et, par conséquent, permet de traiter la non-réponse non ignorable. L’information auxiliaire connue pour les répondants et les non-répondants peut être incluse dans le modèle à variables latentes ou dans le processus d’estimation de la probabilité de réponse. L’approche peut également être utilisée quand on ne dispose pas d’information auxiliaire, et nous nous concentrons ici sur ce cas. Nous proposons une estimation au moyen d’un système de repondération basé sur la covariable latente précédente quand aucune autre information auxiliaire observée n’est disponible. Les résultats d’études par simulation en vue d’évaluer sa performance en se servant de données réelles ainsi que simulées sont encourageants.

    Date de diffusion : 2015-06-29

  • Articles et rapports : 12-001-X201200211754
    Description :

    La méthode d'ajustement sur le score de propension est souvent adoptée pour traiter le biais de sélection dans les sondages, y compris la non-réponse totale et le sous-dénombrement. Le score de propension est calculé en se servant de variables auxiliaires observées dans tout l'échantillon. Nous discutons de certaines propriétés asymptotiques des estimateurs ajustés sur le score de propension et dérivons des estimateurs optimaux fondés sur un modèle de régression pour la population finie. Un estimateur ajusté sur le score de propension optimal peut être réalisé en se servant d'un modèle de score de propension augmenté. Nous discutons de l'estimation de la variance et présentons les résultats de deux études par simulation.

    Date de diffusion : 2012-12-19

  • Articles et rapports : 12-001-X201200211755
    Description :

    La question de la non-réponse dans les études longitudinales est abordée en évaluant l'exactitude des modèles de propension à répondre construits pour distinguer et prédire les divers types de non-réponse. Une attention particulière est accordée aux mesures sommaires dérivées des courbes de la fonction d'efficacité du receveur, ou courbes ROC (de l'anglais receiver operating characteristics), ainsi que des courbes de type logit sur rangs. Les concepts sont appliqués à des données provenant de la Millennium Cohort Study du Royaume-Uni. Selon les résultats, la capacité de faire la distinction entre les divers types de non-répondants et de les prévoir n'est pas grande. Les poids produits au moyen des modèles de propension à répondre ne donnent lieu qu'à de faibles corrections des transitions entre situations d'emploi. Des conclusions sont tirées quant aux possibilités d'intervention en vue de prévenir la non-réponse.

    Date de diffusion : 2012-12-19

  • Articles et rapports : 12-001-X201200111686
    Description :

    Nous présentons une approche fondée sur des équations d'estimation généralisées pour estimer le coefficient de corrélation de concordance et le coefficient kappa d'après des données d'enquête. Les estimations ainsi que leurs erreurs-types doivent tenir compte correctement du plan d'échantillonnage. Nous présentons des mesures pondérées du coefficient de corrélation de concordance et du coefficient kappa, ainsi que la variance de ces mesures tenant compte du plan d'échantillonnage. Nous utilisons la méthode de linéarisation par série de Taylor et la procédure du jackknife pour estimer les erreurs-types des estimations résultantes des paramètres. Des mesures anthropométriques et des données sur la santé buccodentaire provenant de la Third National Health and Nutrition Examination Survey sont utilisées pour illustrer cette méthodologie.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 12-001-X201200111689
    Description :

    En cas de non-réponse totale d'une unité dans un échantillon tiré suivant les principes de l'échantillonnage probabiliste, une pratique courante consiste à diviser l'échantillon en groupes mutuellement exclusifs de manière qu'il soit raisonnable de supposer que toutes les unités échantillonnées dans un groupe ont la même probabilité de ne pas répondre. De cette façon, la réponse d'une unité peut être traitée comme une phase supplémentaire de l'échantillonnage probabiliste en se servant de l'inverse de la probabilité de réponse estimée d'une unité dans un groupe comme facteur de correction pour calculer les poids finaux pour les répondants du groupe. Si l'objectif est d'estimer la moyenne de population d'une variable d'enquête qui se comporte plus ou moins comme une variable aléatoire dont la moyenne est constante dans chaque groupe indépendamment des poids de sondage originaux, il est habituellement plus efficace d'intégrer les poids de sondage dans les facteurs de correction que de ne pas le faire. En fait, si la variable d'enquête se comportait exactement comme une telle variable aléatoire, l'estimation de la moyenne de population calculée en se servant des facteurs de correction pondérés selon le plan de sondage serait presque sans biais dans un certain sens (c'est-à-dire sous la combinaison du mécanisme d'échantillonnage probabiliste original et d'un modèle de prédiction), même si les unités échantillonnées dans un groupe n'ont pas toutes la même probabilité de répondre.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 12-001-X201200111688
    Description :

    Nous étudions le problème de la non-réponse non ignorable dans un tableau de contingence bidimensionnel qui peut être créé individuellement pour plusieurs petits domaines en présence de non-réponse partielle ainsi que totale. En général, le fait de prendre en considération les deux types de non-réponse dans les données sur les petits domaines accroît considérablement la complexité de l'estimation des paramètres du modèle. Dans le présent article, nous conceptualisons le tableau complet des données pour chaque domaine comme étant constitué d'un tableau contenant les données complètes et de trois tableaux supplémentaires pour les données de ligne manquantes, les données de colonne manquantes et les données de ligne et de colonne manquantes, respectivement. Dans des conditions de non-réponse non ignorable, les probabilités totales de cellule peuvent varier en fonction du domaine, de la cellule et de ces trois types de « données manquantes ». Les probabilités de cellule sous-jacentes (c'est-à-dire celles qui s'appliqueraient s'il était toujours possible d'obtenir une classification complète) sont produites pour chaque domaine à partir d'une loi commune et leur similarité entre les domaines est quantifiée paramétriquement. Notre approche est une extension de l'approche de sélection sous non-réponse non ignorable étudiée par Nandram et Choi (2002a, b) pour les données binaires ; cette extension crée une complexité supplémentaire qui découle de la nature multivariée des données et de la structure des petits domaines. Comme dans les travaux antérieurs, nous utilisons un modèle d'extension centré sur un modèle de non-réponse ignorable de sorte que la probabilité totale de cellule dépend de la catégorie qui représente la réponse. Notre étude s'appuie sur des modèles hiérarchiques bayésiens et des méthodes Monte Carlo par chaîne de Markov pour l'inférence a posteriori. Nous nous servons de données provenant de la troisième édition de la National Health and Nutrition Examination Survey pour illustrer les modèles et les méthodes.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 12-001-X201100111443
    Description :

    Les enquêtes téléphoniques à base de sondage double deviennent fréquentes aux États-Unis en raison de l'incomplétude de la liste de numéros de téléphone fixe causée par l'adoption progressive du téléphone mobile. Le présent article traite des erreurs non dues à l'échantillonnage dans les enquêtes téléphoniques à base de sondage double. Alors que la plupart des publications sur les bases de sondage doubles ne tiennent pas compte des erreurs non dues à l'échantillonnage, nous constatons que ces dernières peuvent, dans certaines conditions, causer des biais importants dans les enquêtes téléphoniques à base de sondage double. Nous examinons en particulier les biais dus à la non-réponse et à l'erreur de mesure dans ces enquêtes. En vue de réduire le biais résultant de ces erreurs, nous proposons des méthodes d'échantillonnage à base de sondage double et de pondération. Nous montrons que le facteur de composition utilisé pour combiner les estimations provenant de deux bases de sondage joue un rôle important dans la réduction du biais de non-réponse.

    Date de diffusion : 2011-06-29

  • Articles et rapports : 12-001-X201000211380
    Description :

    Diverses formes d'estimateurs de variance par linéarisation pour les estimateurs par calage généralisé sont définies en choisissant différents poids à appliquer a) aux résidus et b) aux coefficients de régression estimés utilisés dans le calcul des résidus. Des éléments de théorie sont présentés pour trois formes de l'estimateur par calage généralisé, à savoir l'estimateur par ratissage croisé classique, l'estimateur par calage basé sur le « maximum de vraisemblance » et l'estimateur par la régression généralisée, ainsi que pour les estimateurs de variance par linéarisation connexes. Une étude par simulation est effectuée en se servant des données d'une enquête sur la population active et d'une enquête sur les revenus et dépenses. Les propriétés des estimateurs sont évaluées en fonction de l'échantillonnage ainsi que de la non-réponse. L'étude révèle peu de différences entre les propriétés des divers estimateurs par calage pour un plan d'échantillonnage et un modèle de non-réponse donnés. En ce qui concerne les estimateurs de variance, l'approche consistant à pondérer les résidus par les poids de sondage peut être fortement biaisée en présence de non-réponse. L'approche de pondération des résidus par les poids calés a tendance à produire un biais nettement plus faible. Le choix de différents types de poids pour produire les coefficients de régression a peu d'incidence.

    Date de diffusion : 2010-12-21

  • Articles et rapports : 12-001-X201000211384
    Description :

    Le ralentissement économique aux États-Unis pourrait rendre incertain le maintien de stratégies coûteuses dans les opérations des enquêtes. Dans le Behavioral Risk Factor Surveillance System (BRFSS), une période de collecte de données mensuelle de 31 jours seulement pourrait être une solution de rechange moins coûteuse. Toutefois, elle pourrait exclure une partie des interviews menées après 31 jours (répondants tardifs) et les caractéristiques de ces répondants pourraient être différentes à de nombreux égards de celles des répondants qui ont participé à l'enquête dans les 31 jours (répondants hâtifs). Nous avons tâché de déterminer s'il existe entre les répondants hâtifs et les répondants tardifs des différences d'ordre démographique ou en ce qui a trait à la couverture des soins de santé, à l'état de santé général, aux comportements posant un risque pour la santé et aux maladies ou problèmes de santé chroniques. Nous avons utilisé les données du BRFSS 2007, où un échantillon représentatif de la population adulte aux États-Unis ne vivant pas en établissement a été sélectionné au moyen d'une méthode de composition aléatoire. Les répondants tardifs étaient significativement plus susceptibles d'être de sexe masculin ; de déclarer leur race ou origine ethnique comme étant hispanique ; d'avoir un revenu annuel de plus de 50 000 $ ; d'avoir moins de 45 ans ; d'avoir un niveau de scolarité inférieur au diplôme d'études secondaires ; de bénéficier d'une couverture des soins de santé ; d'être significativement plus susceptibles de déclarer être en bonne santé ; d'être significativement moins susceptibles de déclarer faire de l'hypertension, souffrir de diabète ou être obèses. Les différences observées entre les répondants hâtifs et les répondants tardifs dans les estimations d'enquête pourraient influer à peine sur les estimations nationales et au niveau de l'État. Étant donné que la proportion de répondants tardifs pourrait augmenter à l'avenir, il y a lieu d'examiner son incidence sur les estimations découlant de la surveillance avant de l'exclure de l'analyse. Dans l'analyse portant sur les répondants tardifs, il devrait suffire de combiner plusieurs années de données pour produire des estimations fiables.

    Date de diffusion : 2010-12-21

  • Articles et rapports : 12-001-X201000211376
    Description :

    Le présent article décrit l'élaboration d'outils de calcul, appelés indicateurs, qui permettent de juger de l'efficacité de l'information auxiliaire utilisée pour contrôler le biais de non-réponse dans les estimations par sondage, obtenues ici par calage. L'étude est motivée par le contexte dans lequel sont réalisés les sondages dans plusieurs pays, surtout en Europe du Nord, où de nombreuses variables auxiliaires possibles concernant les ménages et les particuliers sont tirées de registres administratifs fiables. Un grand nombre de vecteurs auxiliaires pouvant donc être composés, il est nécessaire de les comparer afin de déterminer dans quelle mesure ils peuvent réduire le biais. Les indicateurs décrits dans le présent article sont conçus pour répondre à ce besoin. Ils sont utilisés dans les enquêtes réalisées par Statistics Sweden. Nous considérons des conditions générales d'enquête où un échantillon probabiliste est tiré de la population finie selon un plan d'échantillonnage arbitraire et où des cas de non réponse se produisent. La probabilité d'inclusion dans l'échantillon est connue pour chaque unité de la population ; la probabilité de réponse est inconnue, ce qui cause un biais. La variable étudiée (variable y) n'est observée que pour l'ensemble de répondants. Quel que soit le vecteur auxiliaire utilisé dans un estimateur par calage (ou dans toute autre méthode d'estimation), un biais résiduel persiste systématiquement. Le choix du vecteur auxiliaire (le meilleur possible) est guidé par les indicateurs proposés dans le présent article. Dans les premières sections, nous décrivons le contexte de leur élaboration et leurs caractéristiques de calcul, puis nous exposons leur contexte théorique. Les dernières sections sont consacrées aux études empiriques. L'une de ces études illustre la sélection des variables auxiliaires dans une enquête réalisée par Statistics Sweden. Une deuxième illustration empirique consiste en une simulation à partir d'une population finie synthétique ; un certain nombre de vecteurs auxiliaires possibles sont classés par ordre de préférence à l'aide des indicateurs.

    Date de diffusion : 2010-12-21

  • Articles et rapports : 12-001-X201000111252
    Description :

    Le biais dû à la non-réponse est un problème examiné de longue date dans le domaine de la recherche sur les enquêtes (Brehm 1993 ; Dillman, Eltinge, Groves et Little 2002), et de nombreuses études ont eu pour objectif de préciser les facteurs qui ont une influence sur la non-réponse partielle ainsi que totale. Dans le but de contribuer à la réalisation de l'objectif plus général consistant à réduire au minimum la non-réponse aux enquêtes, nous examinons dans la présente étude plusieurs facteurs pouvant avoir une incidence sur cette non-réponse, en utilisant les données de l'Animal Welfare Survey de 2007 réalisée en Ohio, aux États-Unis. En particulier, nous examinons la mesure dans laquelle l'intérêt du sujet et les primes d'incitation influent sur la participation aux enquêtes et sur la non-réponse partielle, en nous inspirant de la théorie du levier et de la saillance (leverage-saliency theory) (Groves, Singer et Corning 2000). Nous constatons que la participation à une enquête est influencée par le contexte du sujet (car celui-ci exerce un effet de levier positif ou négatif sur les unités échantillonnées) et par les primes d'incitation prépayées, ce qui est en harmonie avec la théorie du levier et de la saillance. La constatation que la non-réponse partielle, notre mesure indirecte de la qualité de la réponse, varie en fonction de la proximité par rapport à l'agriculture et l'environnement (lieu de résidence, connaissances sur la production des aliments et opinions quant à l'importance du bien être des animaux) confirme aussi nos attentes. Cependant, les données laissent entendre que la non-réponse partielle ne varie pas selon qu'un répondant reçoit ou non une prime d'incitation.

    Date de diffusion : 2010-06-29

  • Articles et rapports : 12-001-X201000111245
    Description :

    La connaissance des causes des erreurs de mesure dans les enquêtes auprès des entreprises est limitée, même si ces erreurs peuvent compromettre l'exactitude des microdonnées et des indicateurs économiques qui en découlent. Le présent article, qui est fondé sur une étude empirique axée sur le point de vue des entreprises, présente de nouveaux résultats de recherche sur le processus de réponse aux enquêtes auprès des entreprises. Il propose le modèle multidimensionnel intégral de réponse aux enquêtes auprès des entreprises (MMIREE) comme outil pour examiner le processus de réponse et expliquer ses résultats, et comme base d'une stratégie visant à réduire et à prévenir les erreurs de mesure.

    Date de diffusion : 2010-06-29

  • Articles et rapports : 12-001-X200900211043
    Description :

    Les enquêtes-entreprises sont souvent réalisées selon un plan d'échantillonnage aléatoire simple stratifié à un degré sans remise comportant certaines strates à tirage complet. Bien que l'on recoure habituellement à l'ajustement de la pondération pour traiter la non-réponse totale, la variabilité due à la non-réponse est parfois omise en pratique quand on estime les variances. Cette situation pose surtout problème lorsqu'il existe des strates à tirage complet. Nous élaborons des estimateurs de variance qui sont convergents quand le nombre d'unités échantillonnées est grand dans chaque classe de pondération, en utilisant les méthodes du jackknife, de la linéarisation et du jackknife modifié. Nous commençons par appliquer les estimateurs ainsi obtenus à des données empiriques provenant de l'Annual Capital Expenditures Survey réalisé par le U.S. Census Bureau, puis nous examinons leur performance dans une étude en simulation.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200900211038
    Description :

    Nous cherchons à corriger la surestimation causée par la non-réponse de lien dans l'échantillonnage indirect lorsque l'on utilise la méthode généralisée de partage des poids (MGPP). Nous avons élaboré quelques méthodes de correction pour tenir compte de la non-réponse de lien dans la MGPP applicables lorsque l'on dispose ou non de variables auxiliaires. Nous présentons une étude par simulation de certaines de ces méthodes de correction fondée sur des données d'enquête longitudinale. Les résultats des simulations révèlent que les corrections proposées de la MGPP réduisent bien le biais et la variance d'estimation. L'accroissement de la réduction du biais est significatif.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200900211037
    Description :

    Les stratégies fondées sur la réponse aléatoire, qui ont été élaborées au départ à titre de méthodes statistiques destinées à réduire la non-réponse ainsi que la réponse mensongère, peuvent aussi être appliquées dans le domaine du contrôle de la divulgation statistique dans les fichiers de microdonnées à grande diffusion. Le présent article décrit une standardisation des méthodes de réponse aléatoire en vue d'estimer des proportions pour des attributs identificatoires ou sensibles. Les propriétés statistiques de l'estimateur standardisé sont établies dans le cas de l'échantillonnage probabiliste général. Afin d'analyser l'effet du choix des « paramètres de plan » implicites de la méthode sur la performance de l'estimateur, nous incluons dans l'étude des mesures de la protection de la vie privée. Nous obtenons ainsi des paramètres de plan qui optimisent la variance, sachant le niveau de protection de la vie privée. Pour cela, les variables doivent être classées dans diverses catégories de sensibilité. Un exemple fondé sur des données réelles illustre l'application de la méthode à une enquête sur la tricherie chez les étudiants.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200900211039
    Description :

    La pondération par la propension à répondre est une méthode de rajustement pour tenir compte de la non-réponse totale dans les enquêtes. Une forme de mise en oeuvre de cette méthode consiste à diviser les poids d'échantillonnage par les estimations de la probabilité que les unités échantillonnées répondent à l'enquête. Habituellement, ces estimations sont obtenues par ajustement de modèles paramétriques, tels qu'une régression logistique. Les estimateurs corrigés résultants peuvent devenir biaisés si les modèles paramétriques sont spécifiés incorrectement. Afin d'éviter les erreurs de spécification du modèle, nous considérons l'estimation non paramétrique des probabilités de réponse par la régression par polynômes locaux. Nous étudions les propriétés asymptotiques de l'estimateur résultant sous quasi randomisation. Nous évaluons en pratique le comportement de la méthode proposée de correction de la non-réponse en nous servant de données de la NHANES.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200900211041
    Description :

    L'estimation de la composition sur petits domaines peut poser un problème de données manquantes informatives, si la probabilité que les données manquent varie d'une catégorie d'intérêt à l'autre, ainsi que d'un petit domaine à l'autre. Nous élaborons une approche de modélisation mixte double qui combine un modèle mixte à effets aléatoires pour les données complètes sous-jacentes et un modèle mixte à effets aléatoires du mécanisme de création différentielle de données manquantes. L'effet du plan d'échantillonnage peut être intégré au moyen d'un modèle d'échantillonnage sous quasi-vraisemblance. L'erreur quadratique moyenne conditionnelle de prédiction associée est approximée sous forme d'une décomposition en trois parties, correspondant à une variance de prédiction naïve, une correction positive qui tient compte de l'incertitude hypothétique de l'estimation des paramètres basée sur les données complètes latentes et une autre correction positive pour la variation supplémentaire due aux données manquantes. Nous illustrons notre approche en l'appliquant à l'estimation de la composition des ménages des municipalités au moyen des données sur les ménages tirées des registres norvégiens, qui présentent un sous-enregistrement informatif du numéro d'identification du logement.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200900110887
    Description :

    De nombreux organismes statistiques considèrent le taux de réponse comme étant l'indicateur de la qualité à utiliser en ce qui concerne l'effet du biais de non réponse. Ils prennent donc diverses mesures en vue de réduire la non réponse ou de maintenir la réponse à un niveau jugé acceptable. Cependant, à lui seul, le taux de réponse n'est pas un bon indicateur du biais de non réponse. En général, un taux de réponse élevé n'implique pas que le biais dû à la non réponse est faible. On trouve à cet égard de nombreux exemples dans la littérature (par exemple, Groves et Peytcheva 2006 ; Keeter, Miller, Kohut, Groves et Presser 2000 ; Schouten 2004).

    Nous introduisons un certain nombre de concepts et un nouvel indicateur en vue d'évaluer la similarité entre la réponse à une enquête et l'échantillon de cette enquête. Cet indicateur de la qualité, que nous appelons indicateur R, peut servir de complément aux taux de réponse et est destiné principalement à évaluer le biais de non réponse. Il peut faciliter l'analyse de la réponse aux enquêtes en fonction du temps, ou pour diverses stratégies d'enquête sur le terrain ou divers modes de collecte des données. Nous appliquons l'indicateur R à deux exemples pratiques.

    Date de diffusion : 2009-06-22

  • Articles et rapports : 12-001-X200800110607
    Description :

    L'offre de primes en vue d'encourager la participation aux enquêtes est un moyen utilisé de plus en plus fréquemment pour combattre la chute des taux de réponse et les risques résultant de biais dû à la non réponse. Cette dernière pose tout spécialement un problème dans les enquêtes par panel, car même un faible taux de non réponse d'une vague à l'autre peut entraîner des pertes cumulées importantes et, si la non réponse est différentielle, cette situation peut aboutir à l'accroissement du biais d'une vague à l'autre. Les effets des primes d'encouragement ont été bien étudiés dans le contexte d'enquêtes transversales, mais l'on en sait fort peu quant à leurs effets cumulés sur l'ensemble des vagues d'un panel. Nous fournissons de nouvelles preuves des effets des paiements incitatifs continus sur l'attrition, ou érosion de l'échantillon, sur le biais et sur la non réponse partielle en nous appuyant sur les données d'une expérience d'offre de primes d'encouragement à grande échelle, multivagues, à mode d'interview mixte, intégrée dans une enquête par panel réalisée auprès des jeunes par le gouvernement britannique. Dans cette étude, les primes d'encouragement ont donné lieu à une réduction significative de l'attrition, qui compensait de loin les effets négatifs sur les taux de réponse partiels en ce qui concerne la quantité d'information recueillie dans le cadre de l'enquête par cas émis. Les primes d'encouragement ont eu des effets proportionnels sur les taux de rétention pour une gamme de caractéristiques des répondants et, par conséquent, n'ont pas réduit le biais d'attrition relatif à ces caractéristiques. Les effets des primes d'encouragement sur le taux de rétention étaient plus importants pour les primes inconditionnelles que pour les primes conditionnelles, et plus importants également pour le mode de collecte par la poste que pour celui par téléphone. D'une vague à l'autre, les effets sur l'attrition ont diminué quelque peu, mais les effets sur la non réponse partielle et l'absence d'effet sur le biais sont demeurés constants. Les effets des primes d'encouragement offertes lors de vagues plus tardives semblent avoir été indépendants des traitements relatifs aux primes et des modes de collecte des données appliqués lors de vagues antérieures.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X20070019855
    Description :

    Dans les sondages en grappes, la non réponse concernant une variable dépend souvent d'un effet aléatoire au niveau de la grappe et n'est donc pas ignorable. Les estimateurs de la moyenne de population obtenus par imputation par la moyenne ou par repondération sous l'hypothèse de non réponse ignorable sont alors biaisés. Nous proposons un estimateur sans biais de la moyenne de population obtenu par imputation ou par repondération dans chaque grappe échantillonnée ou dans un groupe de grappes échantillonnées ayant une caractéristique commune. Nous présentons certains résultats obtenus par simulation en vue d'étudier les propriétés de l'estimateur proposé.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20000025538
    Description :

    Cochran (1977, p.374) a proposé certains estimateurs par quotient ou par régression de la moyenne de population fondés sur la méthode de Hansen et Hurwitz (1946) consistant à sous-échantillonner les non-répondants en supposant que l'on connaît la moyenne de population de la variable auxiliaire. Le présent article décrit certains estimateurs par quotient ou par régression axés sur un échantillonnage double (à deux phases) applicables aux cas où l'on ne connaît pas la moyenne de population de la variable auxiliaire. On y compare aussi la performance de ces estimateurs à celle de l'estimateur proposé par Hansen et Hurwitz (1946).

    Date de diffusion : 2001-02-28

  • Articles et rapports : 12-001-X20000025532
    Description :

    Lorsque le mécanisme de réponse dans une enquête dépend d'une variable d'intérêt mesurée dans cette même enquête et qui n'est observée que pour une partie de l'échantillon seulement, on dit qu'on est en présence de non-réponse non-ignorable. Dans une telle situation, ne pas tenir compte de la non-réponse peut engendrer un biais important dans l'estimation d'une moyenne ou d'un total. Pour contrer ce problème, on peut modéliser conjointement le mécanisme de réponse et la variable d'intérêt et effectuer l'estimation par la méthode du maximum de vraisemblance. La critique principale de cette méthode est que l'estimation par la méthode du maximum de vraisemblance est basée sur l'hypothèse difficilement vérifiable de normalité des erreurs pour le modèle impliquant la variable d'intérêt. Dans cet article, on propose une méthode d'estimation robuste par rapport à l'hypothèse de normalité puisqu'elle est construite de telle sorte qu'elle n'exige pas de spécifier la distribution des erreurs. La méthode est évaluée au moyen de simulations de Monte Carlo. On propose également une méthode simple permettant de vérifier la validité de l'hypothèse de normalité des erreurs quand la non-réponse n'est pas ignorable.

    Date de diffusion : 2001-02-28

Références (33)

Références (33) (25 of 33 results)

  • Produits techniques : 11-522-X201700014715
    Description :

    En vue du Recensement de 2021 au Royaume-Uni, l'Office for National Statistics (ONS) s’est engagée à mener un programme de recherche exhaustif, afin d’explorer comment les données administratives couplées peuvent servir à appuyer les processus statistiques conventionnels. Le contrôle et l’imputation (C et I) au niveau de la question joueront un rôle important pour l’ajustement de la base de données du Recensement de 2021. Toutefois, l’incertitude associée à l’exactitude et à la qualité des données administratives disponibles jette des doutes sur l’efficacité d’une approche intégrée fondée sur des données du recensement et des données administratives en ce qui a trait au C et I. Les contraintes actuelles, qui dictent une approche anonymisée de la « clef » pour le couplage des enregistrements, afin d’assurer la confidentialité, accentuent cette incertitude. Nous fournissons les résultats préliminaires d’une étude de simulation comparant l’exactitude prédictive et l’exactitude de la distribution de la stratégie conventionnelle de C et I mise en œuvre au moyen du SCANCIR pour le Recensement de 2011 au Royaume-Uni, à celles d’une approche intégrée reposant sur des données administratives synthétiques, comme données auxiliaires, avec une erreur qui augmente de façon systématique. À cette étape initiale de la recherche, nous mettons l’accent sur l’imputation d’une année d’âge. L’objectif de l’étude est de déterminer si les données auxiliaires découlant des données administratives peuvent améliorer les estimations de l’imputation, et où se situent les différentes stratégies dans un continuum d’exactitude.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201300014277
    Description :

    Le présent article donne un aperçu des éléments d’un plan de sondage adaptatif introduit de la quatrième vague à la septième vague de l’enquête par panel PASS. L’exposé porte principalement sur les interventions expérimentales aux dernières phases du travail sur le terrain. Ces interventions visent à équilibrer l’échantillon en donnant la priorité aux membres de l’échantillon ayant une faible propension à répondre. À la septième vague, les intervieweurs ont reçu une double prime pour les interviews de cas ayant une faible propension à répondre achevées à la phase finale du travail sur le terrain. Cette prime a été limitée à une moitié, sélectionnée aléatoirement, des cas qui avaient une faible propension à répondre et n’ayant pas reçu de code d’état final après quatre mois de travail sur le terrain. Cette prime a effectivement intensifié l’effort déployé par les intervieweurs, mais n’a abouti à aucune augmentation significative des taux de réponse.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014262
    Description :

    Bien que l’erreur de mesure soit une source de biais en analyse statistique, ses conséquences possibles sont pour la plupart ignorées. Les modèles à effets fixes représentent une classe de modèles sur lesquels l’erreur de mesure peut avoir une incidence particulière. La validation des réponses recueillies lors de cinq vagues d’une enquête par panel sur les prestations d’aide sociale au moyen de données de registre a permis de déterminer la taille et la forme de l’erreur de mesure longitudinale. L’étude montre que l’erreur de mesure des prestations d’aide sociale est autocorrélée et non différentielle. Toutefois, si l’on estime les coefficients des modèles à effets fixes longitudinaux des prestations d’aide sociale en fonction de l’état de santé subjectif pour les hommes et pour les femmes, les coefficients ne sont biaisés que pour la sous-population masculine.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014263
    Description :

    Recueillir des données par Internet ou par la poste auprès d’unités échantillonnées est plus économique que le faire par interview. Ces méthodes font de l’autodénombrement une approche de collecte des données intéressante pour les enquêtes et les recensements. En dépit de ses avantages, la collecte de données par autodénombrement, en particulier la collecte de données par Internet, peut produire des taux de réponse plus faibles que ceux obtenus par interview. Pour accroître les taux de réponse, on soumet les non-répondants à un mode mixte de traitements de suivi, qui influent sur la probabilité résultante de réponse, afin de les encourager à participer. Les analyses de régression comprennent habituellement des facteurs et des interactions qui ont une incidence importante sur l’interprétation des modèles statistiques. Comme l’occurrence d’une réponse est intrinsèquement conditionnelle, nous commençons par enregistrer l’occurrence des réponses en intervalles discrets, et nous caractérisons la probabilité de réponse comme étant un risque en temps discret. Cette approche facilite l’examen du moment où une réponse est la plus susceptible d’avoir lieu et de la façon dont la probabilité de réponse varie au fil du temps. Le biais de non-réponse peut être évité en multipliant le poids d’échantillonnage des répondants par l’inverse d’une estimation de la probabilité de réponse. Les estimateurs des paramètres du modèle, ainsi que des paramètres de la population finie sont présentés. Les résultats de simulations en vue d’évaluer la performance des estimateurs proposés sont également présentés.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X200800010952
    Description :

    Dans une enquête où les résultats ont été estimés par des moyennes simples, nous comparons les incidences qu'ont sur les résultats un suivi des cas de non-réponse et une pondération fondée sur les derniers dix pour cent de répondants. Les données utilisées proviennent de l'Enquête sur les conditions de vie des immigrants en Norvège qui a été réalisée en 2006.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010957
    Description :

    Les enquêtes menées auprès d'entreprises diffèrent des enquêtes menées auprès de la population ou des ménages à bien des égards. Deux des plus importantes différences sont : (a) les répondants aux enquêtes-entreprises ne répondent pas à des questions sur des caractéristiques les concernant (leurs expériences, leurs comportements, leurs attitudes et leurs sentiments), mais sur des caractéristiques de leur organisation (taille, revenu, politiques, stratégies, etc.) et (b) les répondants aux questions parlent au nom d'une organisation. Les enquêtes-entreprises théoriques diffèrent pour leur part des autres enquêtes-entreprises, comme celles des bureaux nationaux de la statistique, à bien des égards aussi. Le fait que les enquêtes-entreprises théoriques ne visent habituellement pas la production de statistiques descriptives mais plutôt la réalisation de tests d'hypothèses (relations entre variables) constitue la plus importante différence. Les taux de réponse aux enquêtes-entreprises théoriques sont très faibles, ce qui suppose un risque énorme de biais de non-réponse. Aucune tentative n'est habituellement faite pour évaluer l'importance du biais attribuable à la non-réponse, et les résultats publiés peuvent par conséquent ne pas refléter fidèlement les vraies relations au sein de la population, ce qui augmente par ricochet la probabilité que les résultats des tests soient incorrects.

    Les auteurs de la communication analysent la façon dont le risque de biais dû à la non-réponse est étudié dans les documents de recherche publiés dans les grandes revues de gestion. Ils montrent que ce biais n'est pas suffisamment évalué et que la correction du biais est difficile ou très coûteux dans la pratique, si tant est que des tentatives sont faites en ce sens. Trois façons de traiter ce problème sont examinées :(a) réunir des données par d'autres moyens que des questionnaires;(b) mener des enquêtes auprès de très petites populations;(c) mener des enquêtes avec de très petits échantillons.

    Les auteurs examinent les raisons pour lesquelles ces méthodes constituent des moyens appropriés de mise à l'essai d'hypothèses dans les populations. Les compromis concernant le choix d'une méthode sont aussi examinés.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010983
    Description :

    Le U.S. Census Bureau mène des enquêtes mensuelles, trimestrielles et annuelles sur l'économie américaine, ainsi qu'un recensement quinquennal. Ces programmes imposent un effort considérable aux entreprises. Les nouvelles technologies, les nouvelles formes d'organisation et l'amenuisement des ressources influent sur la capacité des entreprises de répondre aux enquêtes. Ces changements influencent également les attentes des entreprises à l'égard du Census Bureau, les systèmes internes de l'organisme et ses relations bilatérales avec les entreprises.

    Depuis plusieurs années, le Census Bureau prend des mesures spéciales pour aider les grandes entreprises à se préparer au recensement. Dans tous nos programmes, nous avons également instauré une communication centrée sur les entreprises. Nous avons ainsi établi un modèle de relation qui met l'accent sur l'infrastructure et les pratiques opérationnelles et qui permet au Census Bureau d'être plus réceptif.

    Le présent exposé porte sur les communications et les systèmes du Census Bureau, centrés sur les entreprises. Nous décrivons des initiatives et des difficultés importantes ainsi que leur incidence sur les pratiques du Census Bureau et sur le comportement des répondants.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800011000
    Description :

    Le présent rapport décrit les résultats d'une expérience d'envoi par la poste qui a eu lieu dans le cadre d'un projet de démonstration à grande échelle. Une carte postale et des autocollants ont été envoyés à un groupe aléatoire de participants au projet durant la période entre un appel de prise de contact et une enquête. Les chercheurs ont émis l'hypothèse qu'à cause de l'envoi par la poste supplémentaire (le traitement), les taux de réponse à l'enquête à venir augmenteraient. Toutefois, aucune différence n'a été observée entre les taux de réponse du groupe de traitement ayant reçu l'envoi par la poste supplémentaire et ceux du groupe témoin. Dans les conditions particulières de l'expérience d'envoi par la poste, expédier une carte postale et des autocollants aux participants au projet pour leur rappeler l'enquête à venir et leur participation au projet pilote n'a pas été un moyen efficace d'accroître les taux de réponse.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800011005
    Description :

    En 2006, Statistics New Zealand a entrepris d'élaborer une stratégie de coordination des initiatives nouvelles et existantes centrées sur le fardeau imposé au répondant. L'élaboration de cette stratégie a duré plus d'un an, et l'engagement qu'a ensuite pris l'organisme de réduire le fardeau de réponse l'a obligé à résoudre un certain nombre de questions ayant une incidence sur la façon dont il exécute ses enquêtes.

    Le prochain défi que doit relever Statistics New Zealand est de passer des initiatives axées sur des projets décrits dans la stratégie à la gestion continue du fardeau de réponse.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010940
    Description :

    Afin de permettre la collecte de données de bonne qualité, la section de la méthodologie de collecte des données (DCM pour Data Collection Methodology) offre des conseils et un appui d'expert en ce qui concerne la conception des questionnaires, les méthodes d'évaluation et l'obtention de la participation des répondants. La DCM aide ses clients à se perfectionner, entreprend des travaux de recherche et dirige des projets novateurs portant sur les méthodes de collecte des données. Toutes ces activités ont lieu dans un contexte exigeant de changement organisationnel et de ressources limitées. Le présent article décrit comment la DCM « fait affaire » avec ses clients et, plus globalement, avec le monde de la méthodologie en vue d'atteindre ses objectifs.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800011006
    Description :

    L'Office for National Statistics (ONS) est tenu de mesurer le fardeau de réponse des entreprises participant aux enquêtes qu'il mène et de produire un rapport annuel à ce sujet. Il existe aussi des cibles pour la réduction des coûts des entreprises qui se conforment aux règlements gouvernementaux, dans le cadre de l'Administrative Burdens Reduction Project (ABRP) de 2005, coordonné par le Better Regulation Executive (BRE).

    Les coûts économiques des entreprises servent à mesurer le fardeau de réponse. La méthode de mesure utilisée a changé avec le temps, la plus récente étant l'élaboration et la mise à l'essai d'un modèle des coûts standard (MCS).

    Couramment utilisé en Europe, le MCS vise à mesurer les fardeaux administratifs objectifs associés à toutes les demandes gouvernementales de renseignements (déclarations de revenus, taxe sur la valeur ajoutée, etc.) et à la participation aux enquêtes. Cette méthode n'a donc pas été mise au point précisément pour mesurer le fardeau de réponse aux enquêtes statistiques. Le MCS est axé sur les activités, c'est-à-dire que le coût et le temps requis pour répondre aux exigences sont ventilés par activité.

    Dans le cadre de cette méthode, les données sont habituellement recueillies au moyen d'interviews sur place. La méthode exige donc beaucoup de main-d'oeuvre, tant du point de vue de la collecte que de l'analyse des données, mais elle permet de réunir des renseignements détaillés. La technique élaborée et mise à l'essai par l'ONS utilise des questionnaires papier à remplir soi-même.

    L'objectif de la communication est de fournir un aperçu du fardeau de réponse et des cibles visées, ainsi que de passer en revue les différentes méthodes qu'a utilisées l'ONS pour mesurer le fardeau de réponse du point de vue de l'échantillonnage ainsi que de la collecte, de l'analyse et de l'utilité des données.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010975
    Description :

    Un problème important dans le domaine de la statistique officielle est l'accès à des mesures objectives permettant de prendre des décisions fondées sur des données factuelles. Istat a mis en place un système d'information en vue d'évaluer la qualité des enquêtes. Entre autres indicateurs standard de la qualité, les taux de non-réponse sont calculés et sauvegardés systématiquement pour toutes les enquêtes. Cette riche base d'information permet d'effecteur des analyses au cours du temps et des comparaisons entre enquêtes. Le présent article porte sur l'analyse des interdépendances entre le mode de collecte des données, ainsi que d'autres caractéristiques des enquêtes et la non-réponse totale. Une attention particulière est accordée à la mesure dans laquelle la collecte de données multimode améliore les taux de réponse.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010953
    Description :

    Alors que les spécialistes de la recherche sur les enquêtes s'efforcent de maintenir les taux de réponse à leur niveau habituellement élevé, les répondants réticents font croître les coûts de collecte des données. Cette réticence à répondre peut être liée au temps qu'il faut pour achever l'interview dans les enquêtes omnibus à grande échelle, telles que la National Survey of Recent College Graduates (NSRCG). Reconnaissant que le fardeau de réponse ou la longueur du questionnaire peut contribuer à la baisse des taux de réponse, en 2003, après plusieurs mois de collecte des données conformément au protocole de collecte standard, l'équipe de la NSRCG a offert des incitations monétaires à ses répondants environ deux mois avant la fin de la période de collecte des données. Parallèlement à l'offre d'incitation, elle a également donné aux non-répondants persistants l'occasion de répondre à un questionnaire considérablement abrégé ne comportant que quelques questions essentielles. Les répondants tardifs qui ont achevé l'interview en raison de l'incitation monétaire et du questionnaire ne contenant que les questions essentielles peuvent fournir certains éclaircissements en ce qui concerne le biais de non-réponse et la probabilité qu'ils soient demeurés des non-répondants à l'enquête si les efforts susmentionnés de conversion des refus n'avaient pas été faits.

    Dans le présent article, nous entendons par « répondants réticents » ceux qui n'ont répondu à l'enquête qu'après le déploiement d'efforts allant au-delà de ceux planifiés au départ dans le protocole standard de collecte des données. Plus précisément, les répondants réticents à la NSRCG de 2003 sont ceux qui ont répondu au questionnaire ordinaire ou abrégé après l'offre d'une incitation. Notre hypothèse était que le comportement des répondants réticents serait plus semblable à celui des non-répondants qu'à celui des répondants aux enquêtes. Le présent article décrit une étude des répondants réticents et de la mesure dans laquelle ils diffèrent des répondants ordinaires. Nous comparons différents groupes de réponse en ce qui concerne les estimations pour plusieurs variables clés de l'enquête. Cette comparaison nous permettra de mieux comprendre le biais dû à la non-réponse à la NSRCG et les caractéristiques des non-répondants proprement dits, ce qui servira de fondement à la modification du système de pondération ou aux procédures d'estimation de la NSRCG dans l'avenir.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010994
    Description :

    La difficulté grandissante à joindre les répondants affecte, de façon générale, la non-réponse des enquêtes téléphoniques, et particulièrement les enquêtes qui utilisent les techniques de composition aléatoire (CA) comme l'Enquête sociale générale (ESG). L'ESG est une enquête annuelle à sujets multiples effectuée auprès de 25 000 répondants. Ses objectifs sont de surveiller les caractéristiques et les modifications importantes de la structure sociale canadienne. Le cycle 21 (2007) de l'ESG porte sur la famille, le soutien social et la retraite et vise la population âgée de 45 ans et plus vivant dans les 10 provinces canadiennes. Pour cibler plus efficacement cette population, une partie de l'échantillon provient d'un suivi auprès des répondants du cycle 20 (2006) de l'ESG qui portait sur les transitions familiales. Il est complété par un nouvel échantillon obtenu par CA. Dans cet article, nous présentons d'abord le plan de sondage de l'enquête et la méthode de composition aléatoire utilisée. Nous décrivons ensuite les défis reliés au calcul du taux de non-réponse dans une enquête à composition aléatoire qui cible un sous-ensemble d'une population, pour lequel la population dans le champ de l'enquête doit être estimée ou modélisée. Ceci est fait notamment avec l'utilisation de paradonnées. La méthodologie utilisée au cycle 21 de l'ESG est présentée en détail.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010951
    Description :

    Les valeurs manquantes attribuables à la non-réponse constituent un type d'erreur non due à l'échantillonnage. Le rejet de cas comportant des valeurs manquantes dans des analyses statistiques peut entraîner des estimations biaisées en raison des différences entre les répondants pour lesquels des valeurs sont manquantes et les autres. De plus, lorsque des variables présentent différentes structures de valeurs manquantes parmi les cas échantillonnés et lorsque les cas comportant des valeurs manquantes sont rejetés des analyses statistiques, celles-ci peuvent produire des résultats incohérents puisqu'elles reposent sur des sous-ensembles différents de cas échantillonnés pouvant ne pas être comparables. Cependant, les analyses qui rejettent des cas avec valeurs manquantes peuvent être valides à la condition que ces valeurs soient manquantes entièrement au hasard. Or, est-ce bien le cas?

    En guise de compensation, les valeurs manquantes sont souvent imputées ou les poids de l'enquête sont ajustés à l'aide de méthodes de catégories de poids. Les analyses subséquentes peuvent être valides à condition que les valeurs soient manquantes au hasard dans chaque catégorie de données que supposent les variables indépendantes des modèles qui reposent sur des techniques d'ajustement. Or, peut-on dire que les valeurs sont manquantes au hasard?

    Comme les valeurs manquantes ne sont pas observées, les hypothèses sur les valeurs manquantes entièrement au hasard et les valeurs manquantes au hasard formulées dans les analyses ne sont pas souvent examinées. La communication décrit un modèle de sélection à partir duquel des tests d'hypothèse concernant les valeurs manquantes entièrement au hasard et les valeurs manquantes au hasard peuvent être réalisés même si les valeurs manquantes ne sont pas observées. Les données de la National Immunization Survey menée par le Department of Health and Human Services des États-Unis sont utilisées pour illustrer ces méthodes.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800011004
    Description :

    L'idée de réduire le fardeau de réponse n'est pas nouvelle. Statistics Sweden cherche par plusieurs moyens à réduire le fardeau de réponse et les coûts administratifs liés à la collecte de données auprès d'entreprises et d'organisations. En vertu de la loi, Statistics Sweden est tenu de réduire le fardeau de réponse des entreprises; cette tâche constitue donc une priorité. L'État a décidé de réduire les coûts administratifs des enquêtes auprès des entreprises de 25 % d'ici 2010. Cet objectif vaut également pour la collecte de données à des fins statistiques. Les enquêtes visées sont celles auxquelles la participation est obligatoire en vertu de la loi, ainsi que bon nombre d'autres enquêtes pour lesquelles il faut mesurer et réduire le fardeau de réponse. Afin de mesurer, d'analyser et de réduire le fardeau de réponse, Statistics Sweden a mis au point le Registre des fournisseurs de données concernant les entreprises et les organisations (le registre ULR), dont l'objectif est double : mesurer et analyser le fardeau de réponse au niveau agrégé et fournir à chaque entreprise des renseignements sur les enquêtes auxquelles elle participe.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010976
    Description :

    Bon nombre d’organismes statistiques considèrent le taux de réponse comme un indicateur de la qualité des données d’enquête. Ils mettent donc en oeuvre diverses mesures pour réduire la non-réponse ou pour maintenir un niveau de réponse acceptable. Toutefois, le taux de réponse ne constitue pas nécessairement un bon indicateur du biais de non-réponse. Un taux de réponse élevé ne suppose pas un faible biais de non-réponse. Ce qui compte, c’est l’écart entre la composition de la réponse et celle de l’ensemble de l’échantillon. Dans le présent exposé, nous décrivons le concept des indicateurs R pour évaluer les écarts possibles entre l’échantillon et la réponse. Ces indicateurs peuvent faciliter l’analyse de la réponse aux enquêtes au fil du temps, quels que soient les stratégies d’enquête sur le terrain ou les modes de collecte des données. Nous présentons des exemples tirés de la pratique.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X20050019445
    Description :

    La communication décrit une application novatrice de l'exploration des données à des données de réponses et des métadonnées pour dépister, caractériser et prévenir la falsification sur le terrain par les intervieweurs de la National Survey on Drug Use and Health (NSDUH). La falsification des données par l'intervieweur est la création délibérée de réponses par l'intervieweur sans intervention du répondant.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019457
    Description :

    La réduction du fardeau de réponse de la petite / moyenne entreprise a diminué grâce au projet de l'utilisation des données administratives. Nous continuons ce travail et élargissons nos horizons pour maximiser l'utilisation de ces données. De plus, en explorant la méthode « guichet unique de déclaration » "single window reporting", nous visons à réduire le fardeau de réponse de l'entreprise complexe, tout en s'assurant que la collecte se fasse de façon cohérente. Nous allons devoir surmonter de grands défis, et certains peut-être d'ordre méthodologique. Voyons ce que l'avenir nous réserve!

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019447
    Description :

    Afin de comprendre les biais de sélection dans l'estimation d'un modèle lors de l'utilisation de microdonnées tirées d'une enquête longitudinale portant sur un panel, nous nous penchons sur un modèle composé de trois équations liées à la non-attrition / réponse, à l'emploi et aux salaires. Les trois équations sont corrélées librement.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019462
    Description :

    La façon habituelle de présenter l'information sur la variance aux utilisateurs de données consiste à publier des estimations de la variance ou de statistiques connexes, comme les écarts types, les coefficients de variation, les limites de confiance ou de simples systèmes de classement. La communication porte sur les sources éventuelles de variance, comme le plan de sondage, la répartition de l'échantillon, la sélection de l'échantillon et la non réponse, et sur les meilleures mesures qui pourraient être prises pour réduire la variance. Enfin, elle donne une brève évaluation des coûts financiers qu'occasionne aux producteurs et aux utilisateurs de données le fait de réduire ou de ne pas réduire la variance et décrit comment un compromis pourrait être établi entre les coûts associés à la production de statistiques plus exactes et les avantages financiers d'une plus grande précision.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019471
    Description :

    La gestion active consiste à planifier une méthode visant à maximiser le « succès » de la collecte de données. L'un des objectifs de la gestion active consiste à cerner les problèmes de collecte le plus rapidement possible et à mettre en oeuvre un plan d'action pertinent pour corriger la situation.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019446
    Description :

    Une méthode utilisée pour examiner l'effet de la non réponse consiste à comparer les personnes dont la participation à une enquête demande moins d'effort de la part des intervieweurs à celles dont l'obtention de la participation nécessite plus d'effort. L'un des problèmes qui continuent de se poser aux chercheurs est celui des critères qu'il convient d'utiliser pour déterminer l'appartenance au groupe nécessitant un grand effort.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019461
    Description :

    On propose une généralisation du coefficient de variation habituel (CV) pour solutionner certains des problèmes connus lorsqu'il est utilisé pour mesurer la qualité des estimations Certains problèmes associés au CV comprennent notamment l'interprétation lorsque l'estimation se rapproche de zéro, et l'incohérence de l'interprétation quant à la précision lorsqu'elle est générée en vue de transformations individuelles monotones différentes.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019463
    Description :

    Les statisticiens définissent de nouveaux concepts pour communiquer les erreurs liées aux estimations. Bon nombre de ces concepts sont faciles à comprendre pour les statisticiens, mais sont encore plus difficiles à expliquer aux utilisateurs que le traditionnel intervalle de confiance. La solution proposée, pour communiquer avec des non-statisticiens, consiste à améliorer les estimations de façon à réduire au minimum la nécessité d'expliquer les erreurs. On évite ainsi de déconcerter l'utilisateur en lui fournissant trop de chiffres à comprendre.

    Date de diffusion : 2007-03-02

Date de modification :