Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Enquête ou programme statistique

2 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (39)

Tout (39) (0 à 10 de 39 résultats)

  • Articles et rapports : 12-001-X202300200001
    Description : Lorsqu’un fournisseur de soins de santé de Medicare est soupçonné de fraude liée à la facturation, on isole une population de paiements X versés à ce fournisseur sur une certaine période. Un examinateur médical agréé peut, dans un long processus, établir le trop-payé Y = X - (montant justifié par la preuve) pour chaque paiement. En temps normal, il y aura trop de paiements dans une population pour que chacun soit examiné avec soin, aussi prélève-t-on un échantillon probabiliste. Les trop-payés de cet échantillon servent alors à calculer une borne inférieure de l’intervalle de confiance de 90 % pour le trop-payé total de cette population. La borne correspond au montant exigé en recouvrement auprès du fournisseur. Malheureusement, les méthodes classiques de calcul de cette borne ne permettent parfois pas de dégager le niveau de confiance de 90 %, plus particulièrement lorsqu’on utilise un échantillon stratifié.

    Dans le présent document, nous présentons et décrivons 166 échantillons épurés tirés des enquêtes au sujet de l’intégrité de Medicare qui comportent 156 populations de paiements correspondantes. Les 7 588 paires échantillonnées (Y, X) indiquent 1) que les vérifications réalisées au sein de Medicare affichent des taux d’erreur élevés : plus de 76 % des paiements en question sont considérés comme étant des erreurs. Elles indiquent aussi 2) que les configurations de ces échantillons vont dans le sens d’un modèle de mélange « tout ou rien » pour (Y, X) qui est déjà défini dans les études spécialisées. Nous analysons des procédures de test de Monte Carlo fondées sur un modèle pour les plans de sondage de Medicare, ainsi que des méthodes de stratification fondées sur les moments anticipés du modèle. Pour la viabilité (atteinte d’un niveau de confiance de 90 %), nous définissons dans le présent article une nouvelle méthode de stratification qui rivalise avec les meilleures parmi de nombreuses méthodes existantes et qui semble moins sensible au choix de paramètres d’exploitation. Pour ce qui est du recouvrement des trop-payés (ce qui équivaut à une mesure de la précision), la nouvelle méthode se compare aussi aux meilleures parmi les nombreuses méthodes expérimentées. Malheureusement, aucun algorithme de stratification mis à l’essai ne s’est révélé viable pour plus de la moitié environ des 104 populations visées par l’essai.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 12-001-X202300200008
    Description : Dans cet article, nous utilisons une version légèrement simplifiée de la méthode de Fickus, Mixon et Poteet (2013) pour définir une paramétrisation maniable des noyaux des plans de sondages déterminantaux à probabilités d’inclusion simple fixées. Pour des valeurs spécifiques du paramètre multidimensionnel, nous retrouvons une matrice de la famille PII de Loonis et Mary (2019). Nous conjecturons que, parmi les plans déterminantaux à probabilités d’inclusion fixées la variance minimale de l’estimateur d’Horvitz et Thompson (1952) d’une variable d’intérêt, s’exprime en fonction de PII. Nous mettons à disposition des programmes R expérimentaux facilitant l’appropriation de différentes notions présentées dans l’article, et dont certaines sont qualifiées de non-triviales par Fickus et coll. (2013). Une version longue de cet article, contenant les démonstrations et une présentation plus détaillée des plans déterminantaux, est également mise à disposition.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 75F0002M2023005
    Description : Lors de la diffusion des estimations pour l'année de référence 2021, des améliorations ont été apportées aux méthodes et aux systèmes utilisés dans le cadre de l'Enquête canadienne sur le revenu (ECR) pour produire les estimations du revenu. Cet article décrit les changements effectués et présente le résultat net approximatif de ces changements sur les estimations de revenu à l'aide des données de 2019 et de 2020. Les changements décrits dans cet article soulignent les façons dont la qualité des données a été améliorée, tout en ayant une incidence minimale sur les principales estimations et tendances de l'ECR.
    Date de diffusion : 2023-08-29

  • Articles et rapports : 12-001-X202100200008
    Description :

    Les enquêtes à bases de sondage multiples, dans lesquelles des échantillons probabilistes indépendants sont sélectionnés dans chacune des Q bases de sondage, servent depuis longtemps à améliorer la couverture, réduire les coûts ou augmenter la taille des échantillons de sous-populations d’intérêt. Une grande partie de la théorie a été développée en supposant que (1) l’union des bases de sondage couvre la population d’intérêt, (2) un échantillon probabiliste avec réponse complète est sélectionné dans chaque base de sondage, (3) les variables d’intérêt sont mesurées dans chaque échantillon sans erreur de mesure, et (4) il existe suffisamment d’information pour tenir compte du chevauchement des bases de sondage lors du calcul des estimations. Après avoir passé en revue la conception, l’estimation et le calage des enquêtes effectuées à partir de bases de sondage multiples traditionnelles, je considère des modifications aux hypothèses qui permettent à une structure de bases de sondage multiples de servir de principe d’organisation pour d’autres méthodes de combinaison de données telles que l’imputation massive, l’appariement d’échantillons, l’estimation sur petits domaines et l’estimation par techniques de saisie-ressaisie. Enfin, je discute la façon dont les résultats de la recherche sur les enquêtes à l’aide de bases de sondage multiples peuvent être utilisés lors de la conception et de l’évaluation des systèmes de collecte de données qui intègrent plusieurs sources de données.

    Date de diffusion : 2022-01-06

  • Articles et rapports : 12-001-X201900300004
    Description :

    Dans les études sociales ou économiques, il faut souvent adopter une vue d’ensemble de la société. Dans les études en agriculture par exemple, on peut établir un lien entre les caractéristiques des exploitations et les activités sociales des particuliers. On devrait donc étudier un phénomène en considérant les variables d’intérêt et en se reportant à cette fin à diverses populations cibles liées entre elles. Pour se renseigner sur un phénomène, on se doit de faire des observations en toute intégration, les unités d’une population devant être observées conjointement avec les unités liées d’une autre. Dans l’exemple de l’agriculture, cela veut dire qu’on devrait prélever un échantillon de ménages ruraux qui serait lié de quelque manière à l’échantillon d’exploitations à utiliser aux fins de l’étude. Il existe plusieurs façons de prélever des échantillons intégrés. Nous analysons ici le problème de la définition d’une stratégie optimale d’échantillonnage dans cette optique. La solution proposée doit réduire le coût d’échantillonnage au minimum et satisfaire une précision préétablie de l’estimation des variables d’intérêt (dans l’une et/ou l’autre des populations) décrivant le phénomène. L’échantillonnage indirect dresse un cadre naturel pour un tel réglage, car les unités appartenant à une population peuvent être porteuses d’une information sur l’autre population visée par l’enquête. Nous étudions ce problème selon divers contextes caractérisant l’information sur les liens disponibles à l’étape du plan de sondage, que les liens entre les unités soient connus à ce stade ou que l’information dont nous disposons sur ces mêmes liens laisse très nettement à désirer. Nous présentons ici une étude empirique de données agricoles pour un pays en développement. On peut y voir combien il est efficace de prendre en compte les probabilités d’inclusion au stade du plan de sondage à l’aide de l’information disponible (sur les liens en l’occurrence) et à quel point on peut ainsi nettement réduire les erreurs des estimations pour la population indirectement observée. Nous démontrons enfin la nécessité de disposer de bons modèles pour la prédiction des variables ou des liens inconnus.

    Date de diffusion : 2019-12-17

  • Articles et rapports : 12-001-X201400214096
    Description :

    Afin d’obtenir une meilleure couverture de la population d’intérêt et de réduire les coûts, un certain nombre d’enquêtes s’appuient sur un plan à base de sondage double, suivant lequel des échantillons indépendants sont tirés de deux bases de sondage chevauchantes. La présente étude porte sur les tests du khi-carré dans les enquêtes à base de sondage double en présence de données catégoriques. Nous étendons le test de Wald généralisé (Wald 1943), ainsi que les tests avec correction d’ordre un et correction d’ordre deux de Rao-Scott (Rao et Scott 1981) pour passer d’une enquête à base de sondage unique à une enquête à base de sondage double, et nous déterminons les distributions asymptotiques. Des simulations montrent que les deux tests avec correction de type Rao-Scott donnent de bons résultats, et il est donc recommandé de les utiliser dans les enquêtes à base de sondage double. Un exemple sert à illustrer l’utilisation des tests élaborés.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 12-001-X201300111824
    Description :

    Dans la plupart des enquêtes, le même traitement est réservé à toutes les unités échantillonnées et les mêmes caractéristiques de plan de collecte des données s'appliquent à toutes les personnes et à tous les ménages sélectionnés. Le présent article explique comment les plans de collecte des données peuvent être adaptés en vue d'optimiser la qualité, étant donné des contraintes de coûts. Ces types de plans sont appelés plans de collecte adaptatifs. Les éléments fondamentaux de ce genre de plans sont présentés, discutés et illustrés au moyen de divers exemples.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 12-001-X201300111829
    Description :

    On recourt au sondage indirect quand la base de sondage ne coïncide pas avec la population cible, mais est reliée à celle-ci. L'estimation se fait alors par la Méthode généralisée du partage des poids (MGPP) qui est une procédure sans biais (voir Lavallée 2002, 2007). Dans le cas des enquêtes économiques, le sondage indirect s'applique comme suit : la base de sondage comprend les établissements, tandis que la population cible comprend les entreprises. Les entreprises sont sélectionnées au travers de leurs établissements. Cela permet de procéder à une stratification en fonction des caractéristiques des établissements au lieu de celles des entreprises. Comme les distributions des variables d'intérêt des établissements sont généralement très asymétriques (une faible proportion des établissements couvre la majeure partie de l'économie), la MGPP produit des estimations sans biais, mais dont la variance peut être importante. L'objectif du présent article est de proposer certaines corrections des poids en vue de réduire la variance des estimations dans le contexte des populations asymétriques, tout en maintenant l'absence de biais de la méthode. Après un court aperçu du sondage indirect et de la MGPP, nous décrivons les corrections qu'il faut apporter à cette dernière. Nous comparons les estimations obtenues en appliquant ces corrections à celles que donne la MGPP originale en nous servant d'un petit exemple numérique et de données réelles tirées du Registre des entreprises de Statistique Canada.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 12-001-X201100211608
    Description :

    Les plans de sondage et les estimateurs des enquêtes à base de sondage unique utilisés à l'heure actuelle par les organismes gouvernementaux américains ont été élaborés en réponse à des problèmes pratiques. Les programmes d'enquêtes-ménages fédéraux doivent faire face aujourd'hui à la diminution des taux de réponse et de la couverture des bases de sondage, à la hausse des coûts de collecte des données et à l'accroissement de la demande de statistiques pour des petits domaines. Les enquêtes à bases de sondage multiples, dans lesquelles des échantillons indépendants sont tirés de bases de sondage distinctes, peuvent être utilisées en vue de relever certains de ces défis. La combinaison d'une liste et d'une base de sondage aréolaire ou l'utilisation de deux bases de sondage pour échantillonner les ménages ayant une ligne de téléphone fixe et ceux ayant une ligne de téléphone mobile en sont des exemples. Nous passons en revue les estimateurs ponctuels et les ajustements de la pondération qui peuvent être utilisés pour analyser les données d'enquête à bases de sondage multiples au moyen de logiciels standard et nous résumons la construction des poids de rééchantillonnage pour l'estimation de la variance. Étant donné leur complexité croissante, les enquêtes à bases de sondage multiples obligent à résoudre des difficultés qui ne se posent pas dans le cas des enquêtes à base de sondage simple. Nous étudions le biais dû à l'erreur de classification dans les enquêtes à bases de sondage multiples et proposons une méthode pour corriger ce biais quand les probabilités d'erreur de classification sont connues. Enfin, nous discutons des travaux de recherche nécessaires en ce qui concerne les erreurs non dues à l'échantillonnage dans les enquêtes à bases de sondage multiples.

    Date de diffusion : 2011-12-21

  • Articles et rapports : 12-001-X201000111243
    Description :

    La National Assessment of Adult Literacy (NAAL) de 2003 et l'Enquête internationale sur la littératie et les compétences des adultes (ELCA) comportaient chacune un plan d'échantillonnage aréolaire stratifié à plusieurs degrés. Le dernier degré consistait à dresser la liste des membres du ménage, à déterminer la situation d'admissibilité de chaque individu et à appeler la procédure de sélection pour sélectionner aléatoirement une ou deux personnes admissibles dans le ménage. L'objectif du présent article est d'évaluer les règles de sélection dans les ménages sous un plan d'échantillonnage à plusieurs degrés en vue d'améliorer la procédure dans de futures enquêtes sur la littératie. L'analyse est fondée sur la distribution courante des ménages américains selon leur taille et sur les coefficients de corrélation intra-grappe en utilisant les données sur la littératie des adultes. Nous étudions plusieurs règles de sélection dans les ménages, en prenant en considération les effets de la mise en grappes, des taux d'échantillonnage différentiels, du coût par interview et du fardeau de réponse au niveau du ménage. Dans ce contexte, nous étendons une évaluation de l'échantillonnage dans les ménages sous un plan à deux degrés à un plan à quatre degrés et nous procédons à certaines généralisations aux échantillons à plusieurs degrés pour divers rapports de coûts.

    Date de diffusion : 2010-06-29
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (36)

Analyses (36) (0 à 10 de 36 résultats)

  • Articles et rapports : 12-001-X202300200001
    Description : Lorsqu’un fournisseur de soins de santé de Medicare est soupçonné de fraude liée à la facturation, on isole une population de paiements X versés à ce fournisseur sur une certaine période. Un examinateur médical agréé peut, dans un long processus, établir le trop-payé Y = X - (montant justifié par la preuve) pour chaque paiement. En temps normal, il y aura trop de paiements dans une population pour que chacun soit examiné avec soin, aussi prélève-t-on un échantillon probabiliste. Les trop-payés de cet échantillon servent alors à calculer une borne inférieure de l’intervalle de confiance de 90 % pour le trop-payé total de cette population. La borne correspond au montant exigé en recouvrement auprès du fournisseur. Malheureusement, les méthodes classiques de calcul de cette borne ne permettent parfois pas de dégager le niveau de confiance de 90 %, plus particulièrement lorsqu’on utilise un échantillon stratifié.

    Dans le présent document, nous présentons et décrivons 166 échantillons épurés tirés des enquêtes au sujet de l’intégrité de Medicare qui comportent 156 populations de paiements correspondantes. Les 7 588 paires échantillonnées (Y, X) indiquent 1) que les vérifications réalisées au sein de Medicare affichent des taux d’erreur élevés : plus de 76 % des paiements en question sont considérés comme étant des erreurs. Elles indiquent aussi 2) que les configurations de ces échantillons vont dans le sens d’un modèle de mélange « tout ou rien » pour (Y, X) qui est déjà défini dans les études spécialisées. Nous analysons des procédures de test de Monte Carlo fondées sur un modèle pour les plans de sondage de Medicare, ainsi que des méthodes de stratification fondées sur les moments anticipés du modèle. Pour la viabilité (atteinte d’un niveau de confiance de 90 %), nous définissons dans le présent article une nouvelle méthode de stratification qui rivalise avec les meilleures parmi de nombreuses méthodes existantes et qui semble moins sensible au choix de paramètres d’exploitation. Pour ce qui est du recouvrement des trop-payés (ce qui équivaut à une mesure de la précision), la nouvelle méthode se compare aussi aux meilleures parmi les nombreuses méthodes expérimentées. Malheureusement, aucun algorithme de stratification mis à l’essai ne s’est révélé viable pour plus de la moitié environ des 104 populations visées par l’essai.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 12-001-X202300200008
    Description : Dans cet article, nous utilisons une version légèrement simplifiée de la méthode de Fickus, Mixon et Poteet (2013) pour définir une paramétrisation maniable des noyaux des plans de sondages déterminantaux à probabilités d’inclusion simple fixées. Pour des valeurs spécifiques du paramètre multidimensionnel, nous retrouvons une matrice de la famille PII de Loonis et Mary (2019). Nous conjecturons que, parmi les plans déterminantaux à probabilités d’inclusion fixées la variance minimale de l’estimateur d’Horvitz et Thompson (1952) d’une variable d’intérêt, s’exprime en fonction de PII. Nous mettons à disposition des programmes R expérimentaux facilitant l’appropriation de différentes notions présentées dans l’article, et dont certaines sont qualifiées de non-triviales par Fickus et coll. (2013). Une version longue de cet article, contenant les démonstrations et une présentation plus détaillée des plans déterminantaux, est également mise à disposition.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 75F0002M2023005
    Description : Lors de la diffusion des estimations pour l'année de référence 2021, des améliorations ont été apportées aux méthodes et aux systèmes utilisés dans le cadre de l'Enquête canadienne sur le revenu (ECR) pour produire les estimations du revenu. Cet article décrit les changements effectués et présente le résultat net approximatif de ces changements sur les estimations de revenu à l'aide des données de 2019 et de 2020. Les changements décrits dans cet article soulignent les façons dont la qualité des données a été améliorée, tout en ayant une incidence minimale sur les principales estimations et tendances de l'ECR.
    Date de diffusion : 2023-08-29

  • Articles et rapports : 12-001-X202100200008
    Description :

    Les enquêtes à bases de sondage multiples, dans lesquelles des échantillons probabilistes indépendants sont sélectionnés dans chacune des Q bases de sondage, servent depuis longtemps à améliorer la couverture, réduire les coûts ou augmenter la taille des échantillons de sous-populations d’intérêt. Une grande partie de la théorie a été développée en supposant que (1) l’union des bases de sondage couvre la population d’intérêt, (2) un échantillon probabiliste avec réponse complète est sélectionné dans chaque base de sondage, (3) les variables d’intérêt sont mesurées dans chaque échantillon sans erreur de mesure, et (4) il existe suffisamment d’information pour tenir compte du chevauchement des bases de sondage lors du calcul des estimations. Après avoir passé en revue la conception, l’estimation et le calage des enquêtes effectuées à partir de bases de sondage multiples traditionnelles, je considère des modifications aux hypothèses qui permettent à une structure de bases de sondage multiples de servir de principe d’organisation pour d’autres méthodes de combinaison de données telles que l’imputation massive, l’appariement d’échantillons, l’estimation sur petits domaines et l’estimation par techniques de saisie-ressaisie. Enfin, je discute la façon dont les résultats de la recherche sur les enquêtes à l’aide de bases de sondage multiples peuvent être utilisés lors de la conception et de l’évaluation des systèmes de collecte de données qui intègrent plusieurs sources de données.

    Date de diffusion : 2022-01-06

  • Articles et rapports : 12-001-X201900300004
    Description :

    Dans les études sociales ou économiques, il faut souvent adopter une vue d’ensemble de la société. Dans les études en agriculture par exemple, on peut établir un lien entre les caractéristiques des exploitations et les activités sociales des particuliers. On devrait donc étudier un phénomène en considérant les variables d’intérêt et en se reportant à cette fin à diverses populations cibles liées entre elles. Pour se renseigner sur un phénomène, on se doit de faire des observations en toute intégration, les unités d’une population devant être observées conjointement avec les unités liées d’une autre. Dans l’exemple de l’agriculture, cela veut dire qu’on devrait prélever un échantillon de ménages ruraux qui serait lié de quelque manière à l’échantillon d’exploitations à utiliser aux fins de l’étude. Il existe plusieurs façons de prélever des échantillons intégrés. Nous analysons ici le problème de la définition d’une stratégie optimale d’échantillonnage dans cette optique. La solution proposée doit réduire le coût d’échantillonnage au minimum et satisfaire une précision préétablie de l’estimation des variables d’intérêt (dans l’une et/ou l’autre des populations) décrivant le phénomène. L’échantillonnage indirect dresse un cadre naturel pour un tel réglage, car les unités appartenant à une population peuvent être porteuses d’une information sur l’autre population visée par l’enquête. Nous étudions ce problème selon divers contextes caractérisant l’information sur les liens disponibles à l’étape du plan de sondage, que les liens entre les unités soient connus à ce stade ou que l’information dont nous disposons sur ces mêmes liens laisse très nettement à désirer. Nous présentons ici une étude empirique de données agricoles pour un pays en développement. On peut y voir combien il est efficace de prendre en compte les probabilités d’inclusion au stade du plan de sondage à l’aide de l’information disponible (sur les liens en l’occurrence) et à quel point on peut ainsi nettement réduire les erreurs des estimations pour la population indirectement observée. Nous démontrons enfin la nécessité de disposer de bons modèles pour la prédiction des variables ou des liens inconnus.

    Date de diffusion : 2019-12-17

  • Articles et rapports : 12-001-X201400214096
    Description :

    Afin d’obtenir une meilleure couverture de la population d’intérêt et de réduire les coûts, un certain nombre d’enquêtes s’appuient sur un plan à base de sondage double, suivant lequel des échantillons indépendants sont tirés de deux bases de sondage chevauchantes. La présente étude porte sur les tests du khi-carré dans les enquêtes à base de sondage double en présence de données catégoriques. Nous étendons le test de Wald généralisé (Wald 1943), ainsi que les tests avec correction d’ordre un et correction d’ordre deux de Rao-Scott (Rao et Scott 1981) pour passer d’une enquête à base de sondage unique à une enquête à base de sondage double, et nous déterminons les distributions asymptotiques. Des simulations montrent que les deux tests avec correction de type Rao-Scott donnent de bons résultats, et il est donc recommandé de les utiliser dans les enquêtes à base de sondage double. Un exemple sert à illustrer l’utilisation des tests élaborés.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 12-001-X201300111824
    Description :

    Dans la plupart des enquêtes, le même traitement est réservé à toutes les unités échantillonnées et les mêmes caractéristiques de plan de collecte des données s'appliquent à toutes les personnes et à tous les ménages sélectionnés. Le présent article explique comment les plans de collecte des données peuvent être adaptés en vue d'optimiser la qualité, étant donné des contraintes de coûts. Ces types de plans sont appelés plans de collecte adaptatifs. Les éléments fondamentaux de ce genre de plans sont présentés, discutés et illustrés au moyen de divers exemples.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 12-001-X201300111829
    Description :

    On recourt au sondage indirect quand la base de sondage ne coïncide pas avec la population cible, mais est reliée à celle-ci. L'estimation se fait alors par la Méthode généralisée du partage des poids (MGPP) qui est une procédure sans biais (voir Lavallée 2002, 2007). Dans le cas des enquêtes économiques, le sondage indirect s'applique comme suit : la base de sondage comprend les établissements, tandis que la population cible comprend les entreprises. Les entreprises sont sélectionnées au travers de leurs établissements. Cela permet de procéder à une stratification en fonction des caractéristiques des établissements au lieu de celles des entreprises. Comme les distributions des variables d'intérêt des établissements sont généralement très asymétriques (une faible proportion des établissements couvre la majeure partie de l'économie), la MGPP produit des estimations sans biais, mais dont la variance peut être importante. L'objectif du présent article est de proposer certaines corrections des poids en vue de réduire la variance des estimations dans le contexte des populations asymétriques, tout en maintenant l'absence de biais de la méthode. Après un court aperçu du sondage indirect et de la MGPP, nous décrivons les corrections qu'il faut apporter à cette dernière. Nous comparons les estimations obtenues en appliquant ces corrections à celles que donne la MGPP originale en nous servant d'un petit exemple numérique et de données réelles tirées du Registre des entreprises de Statistique Canada.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 12-001-X201100211608
    Description :

    Les plans de sondage et les estimateurs des enquêtes à base de sondage unique utilisés à l'heure actuelle par les organismes gouvernementaux américains ont été élaborés en réponse à des problèmes pratiques. Les programmes d'enquêtes-ménages fédéraux doivent faire face aujourd'hui à la diminution des taux de réponse et de la couverture des bases de sondage, à la hausse des coûts de collecte des données et à l'accroissement de la demande de statistiques pour des petits domaines. Les enquêtes à bases de sondage multiples, dans lesquelles des échantillons indépendants sont tirés de bases de sondage distinctes, peuvent être utilisées en vue de relever certains de ces défis. La combinaison d'une liste et d'une base de sondage aréolaire ou l'utilisation de deux bases de sondage pour échantillonner les ménages ayant une ligne de téléphone fixe et ceux ayant une ligne de téléphone mobile en sont des exemples. Nous passons en revue les estimateurs ponctuels et les ajustements de la pondération qui peuvent être utilisés pour analyser les données d'enquête à bases de sondage multiples au moyen de logiciels standard et nous résumons la construction des poids de rééchantillonnage pour l'estimation de la variance. Étant donné leur complexité croissante, les enquêtes à bases de sondage multiples obligent à résoudre des difficultés qui ne se posent pas dans le cas des enquêtes à base de sondage simple. Nous étudions le biais dû à l'erreur de classification dans les enquêtes à bases de sondage multiples et proposons une méthode pour corriger ce biais quand les probabilités d'erreur de classification sont connues. Enfin, nous discutons des travaux de recherche nécessaires en ce qui concerne les erreurs non dues à l'échantillonnage dans les enquêtes à bases de sondage multiples.

    Date de diffusion : 2011-12-21

  • Articles et rapports : 12-001-X201000111243
    Description :

    La National Assessment of Adult Literacy (NAAL) de 2003 et l'Enquête internationale sur la littératie et les compétences des adultes (ELCA) comportaient chacune un plan d'échantillonnage aréolaire stratifié à plusieurs degrés. Le dernier degré consistait à dresser la liste des membres du ménage, à déterminer la situation d'admissibilité de chaque individu et à appeler la procédure de sélection pour sélectionner aléatoirement une ou deux personnes admissibles dans le ménage. L'objectif du présent article est d'évaluer les règles de sélection dans les ménages sous un plan d'échantillonnage à plusieurs degrés en vue d'améliorer la procédure dans de futures enquêtes sur la littératie. L'analyse est fondée sur la distribution courante des ménages américains selon leur taille et sur les coefficients de corrélation intra-grappe en utilisant les données sur la littératie des adultes. Nous étudions plusieurs règles de sélection dans les ménages, en prenant en considération les effets de la mise en grappes, des taux d'échantillonnage différentiels, du coût par interview et du fardeau de réponse au niveau du ménage. Dans ce contexte, nous étendons une évaluation de l'échantillonnage dans les ménages sous un plan à deux degrés à un plan à quatre degrés et nous procédons à certaines généralisations aux échantillons à plusieurs degrés pour divers rapports de coûts.

    Date de diffusion : 2010-06-29
Références (3)

Références (3) ((3 résultats))

  • Enquêtes et programmes statistiques — Documentation : 75F0002M1992007
    Description :

    L'interview préliminaire sera menée auprès du premier panel de l'EDTR, en janvier 1993, en guise de supplément à l'Enquête sur la population active. Le premier panel est formé d'environ 20 000 ménages, soit ceux qui terminent leur période de six mois dans l'échantillon de l'Enquête sur la population active, en janvier ou en février 1993. Le présent document vise à décrire l'objet de l'interview préliminair e de l'EDTR et les questions qui doivent être posées.

    Date de diffusion : 2008-02-29

  • Enquêtes et programmes statistiques — Documentation : 75F0002M2005002
    Description :

    Le présent document décrit les modifications apportées à la structure des données géographiques de l'EDTR depuis l'année de référence 1999. Le document traite des raisons pour lesquelles il y a eu des modifications en fonction des données géographiques du Recensement de 2001, montre comment est traité le chevauchement entre les concepts géographiques des recensements de 1991 et de 2001, explique en détail la manière dont les concepts géographiques sont appliqués, analyse une nouvelle procédure d'imputation, puis illustre en conclusion l'effet de ces modifications sur certains tableaux.

    Date de diffusion : 2005-03-31

  • Enquêtes et programmes statistiques — Documentation : 75F0002M1993019
    Description :

    Dans ce document, on examine les questions et les procédures élaborées en vue de maintenir un échantillon représentatif de la population pour l'Enquête sur la dynamique du travail et du revenu (EDTR).

    Date de diffusion : 1995-12-30
Date de modification :