Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (11)

Tout (11) (0 à 10 de 11 résultats)

  • Articles et rapports : 12-001-X200900211036
    Description :

    Souvent, les enquêtes doivent permettre de produire des estimations pour une ou plusieurs sous-populations en plus de l'ensemble de la population. Lorsque l'appartenance à une sous-population (ou domaine) rare peut être déterminée d'après l'information contenue dans la base de sondage, le choix de la taille de l'échantillon du domaine est relativement simple. Le principal problème consiste alors à déterminer l'ampleur requise du suréchantillonnage quand des estimations doivent être produites pour plusieurs domaines ainsi que pour l'ensemble de la population. En revanche, l'échantillonnage et le suréchantillonnage de domaines rares dont les membres ne peuvent pas être identifiés d'avance posent un défi important. Diverses méthodes ont été utilisées dans cette situation. En plus de la présélection à grande échelle, elles comptent l'échantillonnage stratifié disproportionné, l'échantillonnage à deux phases, l'utilisation de plusieurs bases de sondage, l'échantillonnage par réseaux, les enquêtes par panel et les enquêtes polyvalentes. Le présent article décrit l'application de ces méthodes à une gamme d'enquêtes sociales.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200900211037
    Description :

    Les stratégies fondées sur la réponse aléatoire, qui ont été élaborées au départ à titre de méthodes statistiques destinées à réduire la non-réponse ainsi que la réponse mensongère, peuvent aussi être appliquées dans le domaine du contrôle de la divulgation statistique dans les fichiers de microdonnées à grande diffusion. Le présent article décrit une standardisation des méthodes de réponse aléatoire en vue d'estimer des proportions pour des attributs identificatoires ou sensibles. Les propriétés statistiques de l'estimateur standardisé sont établies dans le cas de l'échantillonnage probabiliste général. Afin d'analyser l'effet du choix des « paramètres de plan » implicites de la méthode sur la performance de l'estimateur, nous incluons dans l'étude des mesures de la protection de la vie privée. Nous obtenons ainsi des paramètres de plan qui optimisent la variance, sachant le niveau de protection de la vie privée. Pour cela, les variables doivent être classées dans diverses catégories de sensibilité. Un exemple fondé sur des données réelles illustre l'application de la méthode à une enquête sur la tricherie chez les étudiants.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 11-522-X200800010971
    Description :

    Discours principal

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-522-X200800010988
    Description :

    La collecte des données en ligne a commencé en 1995. Il s'agissait alors d'une solution de rechange pour mener certains types de recherche auprès des consommateurs, mais elle a pris de l'ampleur en 2008. Cette croissance a surtout été observée dans les études qui utilisent des méthodes d'échantillonnage non probabiliste. Bien que l'échantillonnage en ligne ait acquis de la crédibilité pour ce qui est de certaines applications de recherche, de sérieuses questions demeurent concernant le bien-fondé des échantillons prélevés en ligne dans le cas des recherches exigent des mesures volumétriques précises du comportement de la population des États-Unis, notamment en ce qui a trait aux voyages. Dans le présent exposé, nous passons en revue la documentation et comparons les résultats d'études fondées sur des échantillons probabilistes et des échantillons prélevés en ligne pour comprendre les différences entre ces deux méthodes d'échantillonnage. Nous montrons aussi que les échantillons prélevés en ligne sous-estiment d'importants types de voyages, même après pondération en fonction de données démographiques et géographiques.

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-522-X200800010989
    Description :

    À première vue, les enquêtes en ligne semblent constituer une façon intéressante et attrayante de recueillir des données. Elles permettent d'avoir un accès simple, économique et rapide à un grand nombre de personnes. Il y a cependant un revers à cette médaille. Compte tenu des problèmes d'ordre méthodologique qu'elles posent, les enquêtes en ligne peuvent produire des résultats fortement biaisés, surtout si elles ont recours à la méthode d'autosélection des répondants plutôt qu'à l'échantillonnage probabiliste, comme cela devrait être le cas. Le sous-dénombrement constitue également un grave problème. On peut alors se demander si les enquêtes en ligne conviennent à la collecte des données pour les besoins de la statistique officielle. La présente communication porte sur les problèmes du sous-dénombrement et de l'autosélection dans les enquêtes en ligne et tente de montrer comment on peut intégrer la collecte des données par Internet aux pratiques courantes de collecte des données pour les besoins de la statistique officielle.

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-522-X200800010990
    Description :

    L'Enquête sur la satisfaction des usagers à l'égard des services de santé et des services sociaux du Québec a pour objectif de fournir des estimations sur la satisfaction selon trois lieux de consultation (hôpital, clinique médicale et CLSC). Puisqu'un usager peut avoir consulté de un à trois lieux, et que le questionnaire ne peut porter que sur un seul de ces lieux, un mécanisme de sélection aléatoire du lieu de consultation a été mis en place. Nécessitant des probabilités de sélection variables, ce mécanisme de sélection a la particularité d'avoir été modifié en cours de collecte pour s'adapter de plus en plus aux disparités régionales, quant à l'utilisation des services de santé et des services sociaux.

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-536-X200900110809
    Description :

    L'échantillonnage par grappes et l'échantillonnage à plusieurs degrés nécessitent l'échantillonnage d'unités auprès de plus d'une population. Il y a habituellement de l'information auxiliaire disponible sur la population et sur l'échantillon à chacun de ces niveaux. Les poids de calage d'un échantillon sont généralement produits uniquement au moyen de l'information auxiliaire à ce niveau. Cette approche laisse de côté de l'information disponible aux autres niveaux. En outre, il est souvent utile de coupler les poids de calage entre les échantillons à différents niveaux. Grâce à la pondération intégrée de l'échantillonnage par grappes, les poids des unités d'une grappe sont tous identiques et équivalents au poids de la grappe. On présente une généralisation de la pondération intégrée aux plans d'échantillonnage à plusieurs degrés. Ce processus s'appelle la pondération couplée.

    Date de diffusion : 2009-08-11

  • Articles et rapports : 11-536-X200900110810
    Description :

    La post-stratification est souvent utilisée pour améliorer la précision des estimateurs d'enquêtes lorsqu'on dispose d'information auxiliaire catégorique de sources à l'extérieur de l'enquête. Dans les enquêtes sur les ressources naturelles, de tels renseignements sont souvent obtenus des données de télédétection, classés en catégories et affichés sous forme de tables de pixels. Ces tables peuvent être construites en fonction des modèles de classification adaptés aux données-échantillons. La post-stratification des données-échantillons fondée sur les catégories dérivées des données-échantillons (« post-stratification endogène ») contrevient à plusieurs hypothèses de la post-stratification standard, et est généralement considérée comme non valide en tant que méthode d'estimation fondée sur le plan. Dans la présentation, les propriétés de l'estimateur de post-stratification endogène sont dérivées dans le cas d'un modèle linéaire généralisé adapté à l'échantillon. La cohérence du plan de l'estimateur de post-stratification endogène est établie conformément à certaines conditions modérées. On établit la cohérence et la normalité asymptotique de l'estimateur de post-stratification endogène dans le cadre d'un modèle de superpopulation. Des exercices de simulation démontrent que l'effet pratique de l'adaptation d'un modèle aux données d'enquête avant la post-stratification est faible, même dans le cas des échantillons relativement petits.

    Date de diffusion : 2009-08-11

  • Articles et rapports : 12-001-X200900110880
    Description :

    Le présent article décrit un cadre pour l'estimation par calage sous les plans d'échantillonnage à deux phases. Les travaux présentés découlent de la poursuite du développement de logiciels généralisés d'estimation à Statistique Canada. Un objectif important de ce développement est d'offrir une grande gamme d'options en vue d'utiliser efficacement l'information auxiliaire dans différents plans d'échantillonnage. Cet objectif est reflété dans la méthodologie générale pour les plans d'échantillonnage à deux phases exposée dans le présent article.

    Nous considérons le plan d'échantillonnage à deux phases classique. Un échantillon de première phase est tiré à partir d'une population finie, puis un échantillon de deuxième phase est tiré en tant que sous échantillon du premier. La variable étudiée, dont le total de population inconnu doit être estimé, est observée uniquement pour les unités contenues dans l'échantillon de deuxième phase. Des plans d'échantillonnage arbitraires sont permis à chaque phase de l'échantillonnage. Divers types d'information auxiliaire sont identifiés pour le calcul des poids de calage à chaque phase. Les variables auxiliaires et les variables étudiées peuvent être continues ou catégoriques.

    L'article apporte une contribution à quatre domaines importants dans le contexte général du calage pour les plans d'échantillonnage à deux phases :1) nous dégageons trois grands types d'information auxiliaire pour les plans à deux phases et les utilisons dans l'estimation. L'information est intégrée dans les poids en deux étapes : un calage de première phase et un calage de deuxième phase. Nous discutons de la composition des vecteurs auxiliaires appropriés pour chaque étape et utilisons une méthode de linéarisation pour arriver aux résidus qui déterminent la variance asymptotique de l'estimateur par calage ;2) nous examinons l'effet de divers choix de poids de départ pour le calage. Les deux choix « naturels » produisent généralement des estimateurs légèrement différents. Cependant, sous certaines conditions, ces deux estimateurs ont la même variance asymptotique ;3) nous réexaminons l'estimation de la variance pour l'estimateur par calage à deux phases. Nous proposons une nouvelle méthode qui peut représenter une amélioration considérable par rapport à la technique habituelle de conditionnement sur l'échantillon de première phase. Une simulation décrite à la section 10 sert à valider les avantages de cette nouvelle méthode ;4) nous comparons l'approche par calage à la méthode de régression assistée par modèle classique qui comporte l'ajustement d'un modèle de régression linéaire à deux niveaux. Nous montrons que l'estimateur assisté par modèle a des propriétés semblables à celles d'un estimateur par calage à deux phases.

    Date de diffusion : 2009-06-22

  • Articles et rapports : 12-001-X200900110886
    Description :

    La variabilité d'intervieweur est une composante importante de la variabilité des statistiques produites par sondage. Diverses stratégies liées au format et à la formulation des questions, ainsi qu'à la formation, à la charge de travail, à l'expérience et à l'affectation des intervieweurs sont employées pour essayer de réduire la variabilité d'intervieweur. La formule classique de mesure de la variabilité d'intervieweur, souvent appelée effet d'intervieweur, est donnée par ieff := deff_int = 1 + (n bar sub int - 1) rho sub int, où rho sub int et n bar sub int sont, respectivement, la corrélation intra intervieweur et la moyenne simple des charges de travail d'intervieweur. Dans le présent article, nous donnons une justification assistée par modèle de cette formule bien connue pour les méthodes d'échantillonnage avec probabilités égales (EPE) quand il n'existe pas de grappes spatiales dans l'échantillon et que les charges de travail des intervieweurs sont égales. Toutefois, les grappes spatiales ainsi que la pondération inégale sont très fréquentes dans les enquêtes à grande échelle. Dans le contexte d'un plan d'échantillonnage complexe, nous obtenons une formule appropriée de la variabilité d'intervieweur qui tient compte des probabilités inégales de sélection et des grappes spatiales. Notre formule fournit une évaluation plus exacte des effets d'intervieweur et permet donc d'affecter un budget plus raisonnable au contrôle de la variabilité d'intervieweur. Nous proposons aussi une décomposition de l'effet global en effets dus à la pondération, aux grappes spatiales et aux intervieweurs. Cette décomposition aide à comprendre différents moyens de réduire la variance totale.

    Date de diffusion : 2009-06-22
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (11)

Analyses (11) (0 à 10 de 11 résultats)

  • Articles et rapports : 12-001-X200900211036
    Description :

    Souvent, les enquêtes doivent permettre de produire des estimations pour une ou plusieurs sous-populations en plus de l'ensemble de la population. Lorsque l'appartenance à une sous-population (ou domaine) rare peut être déterminée d'après l'information contenue dans la base de sondage, le choix de la taille de l'échantillon du domaine est relativement simple. Le principal problème consiste alors à déterminer l'ampleur requise du suréchantillonnage quand des estimations doivent être produites pour plusieurs domaines ainsi que pour l'ensemble de la population. En revanche, l'échantillonnage et le suréchantillonnage de domaines rares dont les membres ne peuvent pas être identifiés d'avance posent un défi important. Diverses méthodes ont été utilisées dans cette situation. En plus de la présélection à grande échelle, elles comptent l'échantillonnage stratifié disproportionné, l'échantillonnage à deux phases, l'utilisation de plusieurs bases de sondage, l'échantillonnage par réseaux, les enquêtes par panel et les enquêtes polyvalentes. Le présent article décrit l'application de ces méthodes à une gamme d'enquêtes sociales.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 12-001-X200900211037
    Description :

    Les stratégies fondées sur la réponse aléatoire, qui ont été élaborées au départ à titre de méthodes statistiques destinées à réduire la non-réponse ainsi que la réponse mensongère, peuvent aussi être appliquées dans le domaine du contrôle de la divulgation statistique dans les fichiers de microdonnées à grande diffusion. Le présent article décrit une standardisation des méthodes de réponse aléatoire en vue d'estimer des proportions pour des attributs identificatoires ou sensibles. Les propriétés statistiques de l'estimateur standardisé sont établies dans le cas de l'échantillonnage probabiliste général. Afin d'analyser l'effet du choix des « paramètres de plan » implicites de la méthode sur la performance de l'estimateur, nous incluons dans l'étude des mesures de la protection de la vie privée. Nous obtenons ainsi des paramètres de plan qui optimisent la variance, sachant le niveau de protection de la vie privée. Pour cela, les variables doivent être classées dans diverses catégories de sensibilité. Un exemple fondé sur des données réelles illustre l'application de la méthode à une enquête sur la tricherie chez les étudiants.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 11-522-X200800010971
    Description :

    Discours principal

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-522-X200800010988
    Description :

    La collecte des données en ligne a commencé en 1995. Il s'agissait alors d'une solution de rechange pour mener certains types de recherche auprès des consommateurs, mais elle a pris de l'ampleur en 2008. Cette croissance a surtout été observée dans les études qui utilisent des méthodes d'échantillonnage non probabiliste. Bien que l'échantillonnage en ligne ait acquis de la crédibilité pour ce qui est de certaines applications de recherche, de sérieuses questions demeurent concernant le bien-fondé des échantillons prélevés en ligne dans le cas des recherches exigent des mesures volumétriques précises du comportement de la population des États-Unis, notamment en ce qui a trait aux voyages. Dans le présent exposé, nous passons en revue la documentation et comparons les résultats d'études fondées sur des échantillons probabilistes et des échantillons prélevés en ligne pour comprendre les différences entre ces deux méthodes d'échantillonnage. Nous montrons aussi que les échantillons prélevés en ligne sous-estiment d'importants types de voyages, même après pondération en fonction de données démographiques et géographiques.

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-522-X200800010989
    Description :

    À première vue, les enquêtes en ligne semblent constituer une façon intéressante et attrayante de recueillir des données. Elles permettent d'avoir un accès simple, économique et rapide à un grand nombre de personnes. Il y a cependant un revers à cette médaille. Compte tenu des problèmes d'ordre méthodologique qu'elles posent, les enquêtes en ligne peuvent produire des résultats fortement biaisés, surtout si elles ont recours à la méthode d'autosélection des répondants plutôt qu'à l'échantillonnage probabiliste, comme cela devrait être le cas. Le sous-dénombrement constitue également un grave problème. On peut alors se demander si les enquêtes en ligne conviennent à la collecte des données pour les besoins de la statistique officielle. La présente communication porte sur les problèmes du sous-dénombrement et de l'autosélection dans les enquêtes en ligne et tente de montrer comment on peut intégrer la collecte des données par Internet aux pratiques courantes de collecte des données pour les besoins de la statistique officielle.

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-522-X200800010990
    Description :

    L'Enquête sur la satisfaction des usagers à l'égard des services de santé et des services sociaux du Québec a pour objectif de fournir des estimations sur la satisfaction selon trois lieux de consultation (hôpital, clinique médicale et CLSC). Puisqu'un usager peut avoir consulté de un à trois lieux, et que le questionnaire ne peut porter que sur un seul de ces lieux, un mécanisme de sélection aléatoire du lieu de consultation a été mis en place. Nécessitant des probabilités de sélection variables, ce mécanisme de sélection a la particularité d'avoir été modifié en cours de collecte pour s'adapter de plus en plus aux disparités régionales, quant à l'utilisation des services de santé et des services sociaux.

    Date de diffusion : 2009-12-03

  • Articles et rapports : 11-536-X200900110809
    Description :

    L'échantillonnage par grappes et l'échantillonnage à plusieurs degrés nécessitent l'échantillonnage d'unités auprès de plus d'une population. Il y a habituellement de l'information auxiliaire disponible sur la population et sur l'échantillon à chacun de ces niveaux. Les poids de calage d'un échantillon sont généralement produits uniquement au moyen de l'information auxiliaire à ce niveau. Cette approche laisse de côté de l'information disponible aux autres niveaux. En outre, il est souvent utile de coupler les poids de calage entre les échantillons à différents niveaux. Grâce à la pondération intégrée de l'échantillonnage par grappes, les poids des unités d'une grappe sont tous identiques et équivalents au poids de la grappe. On présente une généralisation de la pondération intégrée aux plans d'échantillonnage à plusieurs degrés. Ce processus s'appelle la pondération couplée.

    Date de diffusion : 2009-08-11

  • Articles et rapports : 11-536-X200900110810
    Description :

    La post-stratification est souvent utilisée pour améliorer la précision des estimateurs d'enquêtes lorsqu'on dispose d'information auxiliaire catégorique de sources à l'extérieur de l'enquête. Dans les enquêtes sur les ressources naturelles, de tels renseignements sont souvent obtenus des données de télédétection, classés en catégories et affichés sous forme de tables de pixels. Ces tables peuvent être construites en fonction des modèles de classification adaptés aux données-échantillons. La post-stratification des données-échantillons fondée sur les catégories dérivées des données-échantillons (« post-stratification endogène ») contrevient à plusieurs hypothèses de la post-stratification standard, et est généralement considérée comme non valide en tant que méthode d'estimation fondée sur le plan. Dans la présentation, les propriétés de l'estimateur de post-stratification endogène sont dérivées dans le cas d'un modèle linéaire généralisé adapté à l'échantillon. La cohérence du plan de l'estimateur de post-stratification endogène est établie conformément à certaines conditions modérées. On établit la cohérence et la normalité asymptotique de l'estimateur de post-stratification endogène dans le cadre d'un modèle de superpopulation. Des exercices de simulation démontrent que l'effet pratique de l'adaptation d'un modèle aux données d'enquête avant la post-stratification est faible, même dans le cas des échantillons relativement petits.

    Date de diffusion : 2009-08-11

  • Articles et rapports : 12-001-X200900110880
    Description :

    Le présent article décrit un cadre pour l'estimation par calage sous les plans d'échantillonnage à deux phases. Les travaux présentés découlent de la poursuite du développement de logiciels généralisés d'estimation à Statistique Canada. Un objectif important de ce développement est d'offrir une grande gamme d'options en vue d'utiliser efficacement l'information auxiliaire dans différents plans d'échantillonnage. Cet objectif est reflété dans la méthodologie générale pour les plans d'échantillonnage à deux phases exposée dans le présent article.

    Nous considérons le plan d'échantillonnage à deux phases classique. Un échantillon de première phase est tiré à partir d'une population finie, puis un échantillon de deuxième phase est tiré en tant que sous échantillon du premier. La variable étudiée, dont le total de population inconnu doit être estimé, est observée uniquement pour les unités contenues dans l'échantillon de deuxième phase. Des plans d'échantillonnage arbitraires sont permis à chaque phase de l'échantillonnage. Divers types d'information auxiliaire sont identifiés pour le calcul des poids de calage à chaque phase. Les variables auxiliaires et les variables étudiées peuvent être continues ou catégoriques.

    L'article apporte une contribution à quatre domaines importants dans le contexte général du calage pour les plans d'échantillonnage à deux phases :1) nous dégageons trois grands types d'information auxiliaire pour les plans à deux phases et les utilisons dans l'estimation. L'information est intégrée dans les poids en deux étapes : un calage de première phase et un calage de deuxième phase. Nous discutons de la composition des vecteurs auxiliaires appropriés pour chaque étape et utilisons une méthode de linéarisation pour arriver aux résidus qui déterminent la variance asymptotique de l'estimateur par calage ;2) nous examinons l'effet de divers choix de poids de départ pour le calage. Les deux choix « naturels » produisent généralement des estimateurs légèrement différents. Cependant, sous certaines conditions, ces deux estimateurs ont la même variance asymptotique ;3) nous réexaminons l'estimation de la variance pour l'estimateur par calage à deux phases. Nous proposons une nouvelle méthode qui peut représenter une amélioration considérable par rapport à la technique habituelle de conditionnement sur l'échantillon de première phase. Une simulation décrite à la section 10 sert à valider les avantages de cette nouvelle méthode ;4) nous comparons l'approche par calage à la méthode de régression assistée par modèle classique qui comporte l'ajustement d'un modèle de régression linéaire à deux niveaux. Nous montrons que l'estimateur assisté par modèle a des propriétés semblables à celles d'un estimateur par calage à deux phases.

    Date de diffusion : 2009-06-22

  • Articles et rapports : 12-001-X200900110886
    Description :

    La variabilité d'intervieweur est une composante importante de la variabilité des statistiques produites par sondage. Diverses stratégies liées au format et à la formulation des questions, ainsi qu'à la formation, à la charge de travail, à l'expérience et à l'affectation des intervieweurs sont employées pour essayer de réduire la variabilité d'intervieweur. La formule classique de mesure de la variabilité d'intervieweur, souvent appelée effet d'intervieweur, est donnée par ieff := deff_int = 1 + (n bar sub int - 1) rho sub int, où rho sub int et n bar sub int sont, respectivement, la corrélation intra intervieweur et la moyenne simple des charges de travail d'intervieweur. Dans le présent article, nous donnons une justification assistée par modèle de cette formule bien connue pour les méthodes d'échantillonnage avec probabilités égales (EPE) quand il n'existe pas de grappes spatiales dans l'échantillon et que les charges de travail des intervieweurs sont égales. Toutefois, les grappes spatiales ainsi que la pondération inégale sont très fréquentes dans les enquêtes à grande échelle. Dans le contexte d'un plan d'échantillonnage complexe, nous obtenons une formule appropriée de la variabilité d'intervieweur qui tient compte des probabilités inégales de sélection et des grappes spatiales. Notre formule fournit une évaluation plus exacte des effets d'intervieweur et permet donc d'affecter un budget plus raisonnable au contrôle de la variabilité d'intervieweur. Nous proposons aussi une décomposition de l'effet global en effets dus à la pondération, aux grappes spatiales et aux intervieweurs. Cette décomposition aide à comprendre différents moyens de réduire la variance totale.

    Date de diffusion : 2009-06-22
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :