Statistiques par sujet – Méthodes statistiques

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Auteur(s)

130 facettes affichées. 1 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Auteur(s)

130 facettes affichées. 1 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Auteur(s)

130 facettes affichées. 1 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Auteur(s)

130 facettes affichées. 1 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Autres ressources disponibles pour appuyer vos recherches.

Aide pour trier les résultats
Explorer notre base centrale des principaux concepts normalisés, définitions, sources de données et méthodes.
En cours de chargement
Chargement en cours, veuillez patienter...
Tout (174)

Tout (174) (25 of 174 results)

  • Articles et rapports : 12-001-X201700114820
    Description :

    Les erreurs de mesure peuvent provoquer un biais de l’estimation des transitions, donnant lieu à des conclusions erronées au sujet de la dynamique du marché du travail. La littérature traditionnelle sur l’estimation des mouvements bruts est basée sur la supposition que les erreurs de mesure ne sont pas corrélées au fil du temps. Cette supposition n’est pas réaliste dans bien des contextes, en raison du plan d’enquête et des stratégies de collecte de données. Dans le présent document, nous utilisons une approche basée sur un modèle pour corriger les mouvements bruts observés des erreurs de classification au moyen de modèles markoviens à classes latentes. Nous nous reportons aux données recueillies dans le cadre de l’enquête italienne continue sur la population active, qui est transversale et trimestrielle et qui comporte un plan de renouvellement de type 2-2-2. Le questionnaire nous permet d’utiliser plusieurs indicateurs des états de la population active pour chaque trimestre : deux recueillis au cours de la première interview, et un troisième recueilli un an plus tard. Notre approche fournit une méthode pour estimer la mobilité sur le marché du travail, en tenant compte des erreurs corrélées et du plan par renouvellement de l’enquête. Le modèle qui convient le mieux est un modèle markovien mixte à classes latentes, avec des covariables touchant les transitions latentes et des erreurs corrélées parmi les indicateurs; les composantes mixtes sont de type mobile-stable. Le caractère plus approprié de la spécification du modèle mixte est attribuable à des transitions latentes estimées avec une plus grande précision.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201700114823
    Description :

    L’obtention d’estimateurs dans un processus de calage à plusieurs phases requiert le calcul séquentiel des estimateurs et des poids calés des phases antérieures afin d’obtenir ceux de phases ultérieures. Déjà après deux phases de calage, les estimateurs et leurs variances comprennent des facteurs de calage provenant des deux phases, et les formules deviennent lourdes et non informatives. Par conséquent, les études publiées jusqu’à présent traitent principalement du calage à deux phases, tandis que le calage à trois phases ou plus est rarement envisagé. Dans certains cas, l’analyse s’applique à un plan de sondage particulier et aucune méthodologie complète n’est élaborée pour la construction d’estimateurs calés ni, tâche plus difficile, pour l’estimation de leur variance en trois phases ou plus. Nous fournissons une expression explicite pour calculer la variance d’estimateurs calés en plusieurs phases qui tient pour n’importe quel nombre de phases. En spécifiant une nouvelle représentation des poids calés en plusieurs phases, il est possible de construire des estimateurs calés qui ont la forme d’estimateurs par la régression multivariée, ce qui permet de calculer un estimateur convergent de leur variance. Ce nouvel estimateur de variance est non seulement général pour tout nombre de phases, mais possède aussi certaines caractéristiques favorables. Nous présentons une comparaison à d’autres estimateurs dans le cas particulier du calage à deux phases, ainsi qu’une étude indépendante pour le cas à trois phases.

    Date de diffusion : 2017-06-22

  • Produits techniques : 11-522-X201700014749
    Description :

    Dans le cadre du remaniement du Programme de la statistique du tourisme, Statistique Canada élabore l’Enquête nationale sur les voyages (ENV), qui recueillera de l’information relativement aux voyages effectués par les voyageurs canadiens. Cette nouvelle enquête remplacera l’actuelle Enquête sur les voyages des résidents du Canada, de même que la composante reliée aux voyages des résidents canadiens de l’Enquête sur les voyages internationaux. L’ENV tirera parti des bases de sondage communes de Statistique Canada et des outils de traitement communs, tout en maximisant l’utilisation des données administratives. Dans cette communication, on montrera comment les données administratives, comme celles provenant des fichiers de Passeport Canada, de l’Agence des services frontaliers du Canada et de l’Agence du revenu du Canada, pourraient servir à améliorer l’efficacité du plan de sondage de l’ENV.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014729
    Description :

    Les ensembles de données administratives servent de plus en plus couramment de sources de données en statistique officielle dans le cadre d’efforts visant à produire plus efficacement un plus grand nombre de produits. De nombreux produits résultent du couplage de deux ensembles de données ou plus, souvent réalisé en plusieurs phases en appliquant différentes méthodes et règles. Dans ces situations, nous aimerions pouvoir évaluer la qualité du couplage, ce qui comprend une certaine réévaluation des liens ainsi que des non-liens. Dans le présent article, nous discutons de méthodes d’échantillonnage en vue d’obtenir des estimations du nombre de faux négatifs et de faux positifs, en exerçant un contrôle raisonnable sur l’exactitude des estimations ainsi que sur les coûts. Des approches de stratification des liens (non-liens) pour l’échantillonnage sont évaluées en utilisant des données provenant du recensement de la population de l’Angleterre et du Pays de Galles de 2011.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014752
    Description :

    Le présent article décrit une nouvelle méthode de calcul des indices de prix pour le traitement des données issues de transactions électroniques (données de lecteurs optiques). Les indices de prix sont calculés sous forme du ratio d’un indice du chiffre d’affaires et d’un indice pondéré de quantité. Les pondérations de produits des quantités vendues sont calculées à partir des prix corrigés de l’inflation pour chaque mois de l’année de publication courante. Les nouveaux produits peuvent être incorporés en temps voulu, sans imputation de prix, de manière à ce que toutes les transactions puissent être traitées. Les pondérations des produits sont mises à jour mensuellement et sont utilisées afin de calculer les indices directs par rapport à un mois de base fixe. Les indices des prix construits de cette façon sont exempts du problème de « chain drift » (biais de chaînage). Les résultats sont robustes avec des écarts des choix méthodologiques. La méthode fait partie du programme de l’IPC des Pays-Bas depuis janvier 2016, quand elle a été appliquée pour la première fois aux téléphones mobiles.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014746
    Description :

    Les recherches sur les paradonnées ont tenté de trouver des occasions d’améliorer la collecte de données d’un point de vue stratégique qui soient viables au niveau opérationnel, qui améliorent la qualité des données ou qui permettent de réaliser des économies. À cet égard, Statistique Canada a élaboré et mis en œuvre une stratégie de plan de collecte adaptatif (PCA) pour les enquêtes auprès des ménages utilisant les interviews téléphoniques assistées par ordinateur (ITAO), afin de maximiser la qualité et de potentiellement réduire les coûts. Le PCA est une approche adaptative pour la collecte de données d’enquêtes qui utilise l’information disponible avant et pendant la collecte des données, afin de rajuster la stratégie de collecte pour le reste des cas en cours. En pratique, les gestionnaires d’enquête contrôlent et analysent les progrès de la collecte par rapport à un ensemble d’indicateurs prédéterminés, à deux fins : déterminer les étapes essentielles de la collecte des données pour lesquelles des changements significatifs doivent être apportés à l’approche de la collecte, et rajuster les stratégies de collecte afin d’utiliser le plus efficacement possible les ressources qui demeurent disponibles. Dans le contexte du PCA, de nombreuses considérations entrent en jeu lorsqu’il faut déterminer les aspects de la collecte des données qui doivent être rajustés et la façon de procéder. Les sources de paradonnées jouent un rôle essentiel dans la planification, l’élaboration et la mise en œuvre de la gestion active dans le cadre des enquêtes fondées sur le PCA. Depuis 2009, Statistique Canada a mené plusieurs enquêtes à l’aide du PCA. Le présent document décrit les expériences de Statistique Canada lors de la mise en œuvre et de la surveillance de ces enquêtes.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014721
    Description :

    L’accès aux données ouvertes s’inscrit de plus en plus dans les attentes des Canadiens, des chercheurs et des concepteurs. Apprenez comment et pourquoi le gouvernement du Canada a créé le portail « ouvert.canada.ca » afin de centraliser l’accès à toutes ses données ouvertes et en quoi cette initiative continuera de favoriser l’utilisation de renseignements statistiques.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014754
    Description :

    Contexte : Il existe un intérêt croissant à l’égard de la mesure et de l’étalonnage du rendement du système de santé. Nous avons comparé le système de santé du Canada, tant à l’échelle nationale que provinciale, avec celui d’autres pays de l’Organisation de coopération et de développement économiques (OCDE), pour 50 indicateurs du rendement. Cette analyse peut aider les provinces à déterminer les domaines possibles d’amélioration, compte tenu de la présence d’un comparateur optimal pour les comparaisons internationales. Méthodes : Les données sur la santé de l’OCDE pour 2013 ont servi à comparer les résultats du Canada avec ceux d’autres pays. Nous avons aussi calculé les résultats provinciaux pour les indicateurs du rendement du système de santé de l’OCDE, au moyen de la méthodologie de cet organisme. Nous avons normalisé les résultats des indicateurs, en vue de présenter plusieurs indicateurs sur la même échelle, et nous les avons comparés à la moyenne pour l’OCDE, ainsi qu’au 25e et au 75e centiles. Résultats : La présentation de valeurs normalisées permet la comparaison des résultats du Canada selon plusieurs indicateurs de l’OCDE, sur la même échelle. Aucun pays ni province n’affiche des résultats supérieurs aux autres de façon uniforme. Pour la plupart des indicateurs, les résultats canadiens sont similaires à ceux d’autres pays, mais il subsiste des domaines où le Canada réussit particulièrement bien (p. ex. taux de tabagisme) ou moins bien (p. ex. sécurité des patients). Ces données ont été présentées dans un outil électronique interactif. Conclusion : La comparaison des données des provinces canadiennes avec celles d’autres pays peut faire ressortir les domaines où une amélioration est nécessaire et peut aider à déterminer des stratégies possibles d’amélioration.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014756
    Description :

    Comment pouvons-nous regrouper des données multidimensionnelles sur le rendement du système de santé de façon simple, afin qu’il soit facile d’y accéder et de fournir des renseignements comparables et exploitables pour accélérer les améliorations des soins de santé? L’Institut canadien d’information sur la santé a élaboré un ensemble d’outils pour répondre aux besoins de divers auditoires en matière de mesures de rendement, déterminer les priorités au chapitre des améliorations, comprendre comment les régions et les établissements se comparent les uns aux autres, et appuyer la transparence et la reddition de comptes. Les outils pancanadiens de [Votre système de santé (VSS)] consolident les rapports de 45 indicateurs clés du rendement de façon structurée, et sont comparables au fil du temps et à divers niveaux géographiques. Le présent document rend compte de l’élaboration et des approches et considérations méthodologiques qui ont servi à créer un outil dynamique qui facilite l’étalonnage et les comparaisons significatives pour l’amélioration du rendement du système de santé.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014708
    Description :

    Le programme de bases de sondage pour les enquêtes auprès des ménages (BSEM) de Statistique Canada fournit différents produits qui peuvent être utilisés seuls ou en combinaison afin d’améliorer la conception d’enquêtes au niveau de l’échantillonnage, de la collecte et du traitement et ce, selon le modèle traditionnel dans lequel on contacte un ménage. Alors que les enquêtes migrent toujours vers cet ensemble de produits de base, le programme de BSEM commence à planifier les changements qui seront requis à l’infrastructure, à l’organisation et aux liens avec d’autres sources de données de Statistique Canada afin de permettre l’évolution vers une utilisation accrue d’une multitude de sources de données administratives en tant qu’intrants au programme des statistiques sociales. La présentation fournira d’abord un aperçu du programme courant de BSEM. Elle identifiera ensuite les concepts de base qui devront être mis en œuvre dans le but d’augmenter le potentiel de couplage des enregistrements et se conclura en présentant la recherche stratégique qui sera menée d’ici au recensement de 2021.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 12-001-X201500214250
    Description :

    L’évaluation de l’impact des effets de mode sur les estimations d’enquête est devenue un objectif de recherche crucial en raison de l’utilisation croissante des plans de sondage à modes mixtes. Malgré les avantages inhérents aux plans de ce genre, comme la réduction des coûts et l’augmentation de la couverture, il y a une évidence manifeste à l’effet que le mode d’enquête peut avoir des effets importants relativement à la précision d’une enquête. Ces effets risquent d’aboutir à des statistiques qui ne sont pas comparables dans le temps ou entre des sous-groupes de population et d’accroître le biais. Les plans de collecte adaptatifs offrent un cadre mathématique souple qui permet d’optimiser l’équilibre entre la qualité et les coûts de l’enquête. Dans cet article, nous utilisons des plans adaptatifs afin de minimiser les effets de mode. Nous illustrons notre modèle d’optimisation au moyen de l’étude du cas de l’Enquête sur la population active des Pays-Bas. Nous mettons l’accent sur les effets de mode dépendant des items et nous évaluons l’impact sur la qualité des enquêtes par comparaison avec une norme de référence.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500214230
    Description :

    Le présent article décrit l’élaboration de méthodes de répartition pour des enquêtes par sondage avec stratification quand l’utilisation d’estimateurs sur petits domaines composites est une priorité et que les domaines servent de strates. Longford (2006) a proposé pour cette situation un critère objectif fondé sur une combinaison pondérée des erreurs quadratiques moyennes des moyennes de petit domaine et d’une moyenne globale. Ici, nous redéfinissons cette approche dans un cadre assisté par modèle, ce qui permet l’utilisation de variables explicatives et une interprétation plus naturelle des résultats en utilisant un paramètre de corrélation intraclasse. Nous considérons aussi plusieurs utilisations de la répartition exponentielle et permettons l’application d’autres contraintes, telle une valeur maximale de la racine carrée relative de l’erreur quadratique moyenne, aux estimateurs de strate. Nous constatons qu’une répartition exponentielle simple peut donner des résultats très près d’être aussi bons que le plan optimal, même quand l’objectif est de minimiser le critère de Longford (2006).

    Date de diffusion : 2015-12-17

  • Articles et rapports : 82-003-X201500714205
    Description :

    Il est bien connu qu’il existe des divergences entre l’activité physique autodéclarée et l’activité physique mesurée objectivement. Aux fins de validation, les auteurs comparent les résultats d’un nouveau questionnaire sur l’activité physique autodéclarée avec ceux d’un questionnaire existant et avec des données d’accélérométrie.

    Date de diffusion : 2015-07-15

  • Articles et rapports : 82-003-X201500614196
    Description :

    La présente étude examine la faisabilité et la validité de l’utilisation des numéros d’assurance-maladie personnels pour coupler de façon déterministe le Registre canadien du cancer la Base de données sur les congés des patients, afin d’obtenir des données sur les hospitalisations des personnes atteintes d’un cancer primaire.

    Date de diffusion : 2015-06-17

  • Produits techniques : 12-002-X201500114147
    Description :

    En régression logistique, les observations influentes sont celles qui ont un effet notable sur certains aspects de l’adéquation du modèle. Une grande taille d’échantillon ne permet pas, à elle seule, d’écarter cette préoccupation; il demeure important d’examiner les observations qui pourraient être influentes, surtout dans les données d’enquêtes complexes. Le présent article décrit un algorithme simple pour rechercher les observations influentes potentielles dans les données d’enquête complexes en utilisant le logiciel SAS. Cet algorithme a été appliqué dans le cadre d’une étude fondée sur des données de l’Enquête sur la santé dans les collectivités canadiennes de 2005 en vue de déterminer les facteurs associés à l’utilisation des services des médecins de famille par les adolescents.

    Date de diffusion : 2015-03-25

  • Articles et rapports : 12-001-X201400214110
    Description :

    Quand nous élaborons le plan de sondage d’une enquête, nous essayons de produire un bon plan compte tenu du budget disponible. L’information sur les coûts peut être utilisée pour établir des plans de sondage qui minimisent la variance d’échantillonnage d’un estimateur du total pour un coût fixe. Les progrès dans le domaine des systèmes de gestion d’enquête signifient qu’aujourd’hui, il est parfois possible d’estimer le coût d’inclusion de chaque unité dans l’échantillon. Le présent article décrit l’élaboration d’approches relativement simples pour déterminer si les avantages pouvant découler de l’utilisation de cette information sur les coûts au niveau de l’unité sont susceptibles d’avoir une utilité pratique. Nous montrons que le facteur important est le ratio du coefficient de variation du coût sur le coefficient de variation de l’erreur relative des coefficients de coût estimés.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 12-001-X201400214128
    Description :

    Les utilisateurs et les fournisseurs de statistiques officielles, ainsi que ceux qui en assurent le financement, veulent des estimations « plus vastes, plus approfondies, plus rapides, de meilleure qualité et moins coûteuses » (selon Tim Holt, ancien chef de l’Office for National Statistics du Royaume-Uni), attributs auxquels j’ajouterais « plus pertinentes » et « moins fastidieuses ». Depuis la Deuxième Guerre mondiale, nous dépendons dans une large mesure des enquêtes sur échantillon probabiliste - celles-ci étant très bonnes dans les faits - pour atteindre ces objectifs pour les estimations dans de nombreux domaines, y compris le revenu des ménages et le chômage, l’état de santé autodéclaré, l’emploi du temps, les victimes d’actes criminels, l’activité des entreprises, les flux de produits, les dépenses des consommateurs et des entreprises, etc. Par suite des taux de plus en plus faibles de réponse totale et partielle et des preuves d’erreur de déclaration, nous avons réagi de nombreuses façons, y compris en utilisant des modes d’enquête multiples, des méthodes de pondération et d’imputation plus raffinées, l’échantillonnage adaptable, des essais cognitifs des questions d’enquête et d’autres méthodes pour maintenir la qualité des données. Dans le cas des statistiques sur le secteur des entreprises, afin de réduire le fardeau et les coûts, nous avons cessé depuis longtemps de recourir uniquement à des enquêtes pour produire les estimations nécessaires, mais jusqu’à présent, nous ne l’avons pas fait pour les enquêtes auprès des ménages, du moins pas aux États-Unis. Je soutiens que nous pouvons et que nous devons passer du paradigme de production des meilleures estimations possible à partir d’une enquête à la production des meilleures estimations possible pour répondre aux besoins des utilisateurs, à partir de sources de données multiples. Ces sources comprennent les dossiers administratifs et, de plus en plus, des données sur les transactions et des données en ligne. Je me sers de deux exemples - ceux du revenu des ménages et des installations de plomberie - pour illustrer ma thèse. Je propose des moyens d’inculquer une culture de la statistique officielle dont l’objectif est d’aboutir à des statistiques pertinentes, à jour, exactes et peu coûteuses, et qui traite les enquêtes, de même que les autres sources de données, comme des moyens d’atteindre cet objectif.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 12-001-X201400214090
    Description :

    Lorsqu'on s'intéresse à une population finie, il arrive qu'il soit nécessaire de tirer des échantillons dans plusieurs bases de sondage pour représenter l'ensemble des individus. Nous nous intéressons ici au cas de deux échantillons sélectionnés selon un plan à deux degrés, avec un premier degré de tirage commun. Nous appliquons les méthodes de Hartley (1962), Bankier (1986), et Kalton et Anderson (1986), et nous montrons que ces méthodes peuvent être appliquées conditionnellement au premier degré de tirage. Nous comparons également la performance de plusieurs estimateurs dans le cadre d'une étude par simulations. Nos résultats suggèrent que le choix d'un estimateur en présence de bases de sondage multiples se fasse de façon prudente, et qu'un estimateur simple est parfois préférable même s'il n'utilise qu'une partie de l'information collectée.

    Date de diffusion : 2014-12-19

  • Produits techniques : 11-522-X201300014286
    Description :

    L’Etude Longitudinale Française depuis l’Enfance (Elfe), démarrée en 2011, compte plus de 18 300 nourrissons dont les parents ont consenti à leur inclusion en maternité. Cette cohorte, consacrée au suivi des enfants, de la naissance à l’âge adulte, aborde les multiples aspects de la vie de l’enfant sous l’angle des sciences sociales, de la santé et de la santé-environnement. Dans chacune des maternités tirées aléatoirement, tous les nourrissons de la population cible, nés durant l’un des 25 jours répartis parmi les quatre saisons, ont été sélectionnés. Cet échantillon est le résultat d’un plan de sondage non standard que nous appellons échantillonnage produit. Il se présente pour cette enquête sous la forme du croisement de deux échantillonnages indépendants: celui des maternités et celui des jours. Si l’on peut facilement imaginer un effet grappe dû à l’échantillonnage de maternités, on peut symétriquement imaginer un effet grappe dû à l’échantillonnage des jours. La dimension temporelle du plan ne pourra alors être négligée si les estimations recherchées sont susceptibles de variations journalières ou saisonnières. Si ce plan non standard peut être vu comme un plan à deux phases bien particulier, il s’avère nécessaire de le définir dans un cadre plus adapté. Après une comparaison entre le plan produit et un plan classique à deux degrés, seront proposés des estimateurs de variance adaptés à ce plan de sondage. Une étude par simulations illustrera nos propos.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014272
    Description :

    Deux tendances convergentes soulèvent des questions concernant l’avenir des enquêtes probabilistes à grande échelle menées par ou pour des instituts nationaux de statistique (INS). Tout d’abord, l’augmentation des coûts et des taux de non-réponse menace potentiellement la rentabilité et la valeur inférentielle des enquêtes. En deuxième lieu, l’intérêt est de plus en plus grand à l’égard des mégadonnées en remplacement des enquêtes. Il existe de nombreux types différents de mégadonnées, mais je mettrai l’accent particulièrement sur les données produites par l’entremise des médias sociaux. Le présent document complète et met à jour un document antérieur sur le sujet (Couper, 2013). Je passerai en revue certaines des préoccupations concernant les mégadonnées, particulièrement dans la perspective des enquêtes. Je soutiens qu’il y a place pour des enquêtes de grande qualité et des analyses de mégadonnées dans les travaux des INS. Même s’il est peu probable que les mégadonnées remplacent les enquêtes de grande qualité, je crois que les deux méthodes peuvent remplir des fonctions complémentaires. Je tente de déterminer certains des critères qui doivent être satisfaits, ainsi que les questions auxquelles on doit répondre, avant que les mégadonnées puissent être utilisées pour des inférences fiables au niveau de la population.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014251
    Description :

    Dans la perspective d’un modélisateur, je décris la situation actuelle en matière d’inférence fondée sur les enquêtes pour la production de statistiques officielles. Ce faisant, je tente de dégager les forces et les faiblesses des approches inférentielles fondées sur le plan de sondage, d’une part, et sur un modèle, d’autre part, appliquées aujourd’hui à l’échantillonnage, du moins en ce qui concerne les statistiques officielles. Je termine par un exemple tiré d’un plan de collecte adaptatif qui illustre pourquoi l’adoption d’une perspective fondée sur un modèle (fréquentiste ou bayésien) représente le meilleur moyen pour les statistiques officielles d’éviter la « schizophrénie inférentielle » débilitante qui semble inévitable si l’on applique les méthodes actuelles pour répondre aux nouvelles demandes d’information du monde d’aujourd’hui (et peut-être même de demain).

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014289
    Description :

    Cet article donne un aperçu des principales nouveautés qui seront intégrées au modèle de projections par microsimulation Demosim, dont une version partant des microdonnées de l'Enquête nationale auprès des ménages de 2011 est en cours de préparation. Dans un premier temps, les ajouts à la population de base sont présentés; il s’agit essentiellement de nouvelles variables, certaines étant ajoutées aux données de l'Enquête nationale auprès des ménages par le biais d’appariement de fichiers. Les méthodes envisagées pour la projection des variables linguistiques, la citoyenneté et la religion sont ensuite brièvement présentées à titre d’exemples de nouveautés relatives aux événements simulés par le modèle.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 82-003-X201401014098
    Description :

    La présente analyse compare une approche fondée sur un registre et une approche non fondée sur un registre pour apparier les données du Recensement de la population de 2006 et les données d’hôpital provenant de la Base de données sur les congés de patients pour le Manitoba et l’Ontario.

    Date de diffusion : 2014-10-15

  • Articles et rapports : 12-001-X201400114004
    Description :

    En 2009, deux enquêtes importantes réalisées par la division des administrations publiques du U.S. Census Bureau ont été remaniées afin de réduire la taille de l’échantillon, d’économiser des ressources et d’améliorer la précision des estimations (Cheng, Corcoran, Barth et Hogue 2009). Sous le nouveau plan de sondage, chaque strate habituelle, définie par l’État et le type d’administration publique, qui contient un nombre suffisant d’unités (administrations publiques) est divisée en deux sous strates en fonction de la masse salariale totale de chaque unité afin de tirer un plus petit échantillon de la sous strate des unités de petite taille. L’approche assistée par modèle est adoptée pour estimer les totaux de population. Des estimateurs par la régression utilisant des variables auxiliaires sont obtenus soit pour chaque sous strate ainsi créée soit pour la strate originale en regroupant des deux sous strates. Cheng, Slud et Hogue (2010) ont proposé une méthode fondée sur un test de décision qui consiste à appliquer un test d’hypothèse pour décider quel estimateur par la régression sera utilisé pour chaque strate originale. La convergence et la normalité asymptotique de ces estimateurs assistés par modèle sont établies ici sous un cadre asymptotique fondé sur le plan de sondage ou assisté par modèle. Nos résultats asymptotiques suggèrent aussi deux types d’estimateurs de variance convergents, l’un obtenu par substitution des quantités inconnues dans les variances asymptotiques et l’autre en appliquant la méthode du bootstrap. La performance de tous les estimateurs des totaux et des estimateurs de leur variance est examinée au moyen d’études empiriques. L’Annual Survey of Public Employment and Payroll (ASPEP) des États Unis est utilisé pour motiver et illustrer notre étude.

    Date de diffusion : 2014-06-27

  • Articles et rapports : 12-001-X201300211871
    Description :

    Les modèles de régression sont utilisés couramment pour analyser les données d'enquête lorsque l'on souhaite déterminer quels sont les facteurs influents associés à certains indices comportementaux, sociaux ou économiques au sein d'une population cible. Lorsque des données sont recueillies au moyen d'enquêtes complexes, il convient de réexaminer les propriétés des approches classiques de sélection des variables élaborées dans des conditions i.i.d. ne faisant pas appel au sondage. Dans le présent article, nous dérivons un critère BIC fondé sur la pseudovraisemblance pour la sélection des variables dans l'analyse des données d'enquête et proposons une approche de vraisemblance pénalisée dans des conditions de sondage pour sa mise en oeuvre. Les poids de sondage sont attribués comme il convient pour corriger le biais de sélection causé par la distorsion entre l'échantillon et la population cible. Dans un cadre de randomisation conjointe, nous établissons la cohérence de la procédure de sélection proposée. Les propriétés en échantillon fini de l'approche sont évaluées par des analyses et des simulations informatiques en se servant de données provenant de la composante de l'hypertension de l'Enquête sur les personnes ayant une maladie chronique au Canada de 2009.

    Date de diffusion : 2014-01-15

Données (0)

Données (0) (Aucun résultat)

Votre recherche pour «» n’a donné aucun résultat dans la présente section du site.

Vous pouvez essayer :

Analyses (94)

Analyses (94) (25 of 94 results)

  • Articles et rapports : 12-001-X201700114820
    Description :

    Les erreurs de mesure peuvent provoquer un biais de l’estimation des transitions, donnant lieu à des conclusions erronées au sujet de la dynamique du marché du travail. La littérature traditionnelle sur l’estimation des mouvements bruts est basée sur la supposition que les erreurs de mesure ne sont pas corrélées au fil du temps. Cette supposition n’est pas réaliste dans bien des contextes, en raison du plan d’enquête et des stratégies de collecte de données. Dans le présent document, nous utilisons une approche basée sur un modèle pour corriger les mouvements bruts observés des erreurs de classification au moyen de modèles markoviens à classes latentes. Nous nous reportons aux données recueillies dans le cadre de l’enquête italienne continue sur la population active, qui est transversale et trimestrielle et qui comporte un plan de renouvellement de type 2-2-2. Le questionnaire nous permet d’utiliser plusieurs indicateurs des états de la population active pour chaque trimestre : deux recueillis au cours de la première interview, et un troisième recueilli un an plus tard. Notre approche fournit une méthode pour estimer la mobilité sur le marché du travail, en tenant compte des erreurs corrélées et du plan par renouvellement de l’enquête. Le modèle qui convient le mieux est un modèle markovien mixte à classes latentes, avec des covariables touchant les transitions latentes et des erreurs corrélées parmi les indicateurs; les composantes mixtes sont de type mobile-stable. Le caractère plus approprié de la spécification du modèle mixte est attribuable à des transitions latentes estimées avec une plus grande précision.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201700114823
    Description :

    L’obtention d’estimateurs dans un processus de calage à plusieurs phases requiert le calcul séquentiel des estimateurs et des poids calés des phases antérieures afin d’obtenir ceux de phases ultérieures. Déjà après deux phases de calage, les estimateurs et leurs variances comprennent des facteurs de calage provenant des deux phases, et les formules deviennent lourdes et non informatives. Par conséquent, les études publiées jusqu’à présent traitent principalement du calage à deux phases, tandis que le calage à trois phases ou plus est rarement envisagé. Dans certains cas, l’analyse s’applique à un plan de sondage particulier et aucune méthodologie complète n’est élaborée pour la construction d’estimateurs calés ni, tâche plus difficile, pour l’estimation de leur variance en trois phases ou plus. Nous fournissons une expression explicite pour calculer la variance d’estimateurs calés en plusieurs phases qui tient pour n’importe quel nombre de phases. En spécifiant une nouvelle représentation des poids calés en plusieurs phases, il est possible de construire des estimateurs calés qui ont la forme d’estimateurs par la régression multivariée, ce qui permet de calculer un estimateur convergent de leur variance. Ce nouvel estimateur de variance est non seulement général pour tout nombre de phases, mais possède aussi certaines caractéristiques favorables. Nous présentons une comparaison à d’autres estimateurs dans le cas particulier du calage à deux phases, ainsi qu’une étude indépendante pour le cas à trois phases.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201500214250
    Description :

    L’évaluation de l’impact des effets de mode sur les estimations d’enquête est devenue un objectif de recherche crucial en raison de l’utilisation croissante des plans de sondage à modes mixtes. Malgré les avantages inhérents aux plans de ce genre, comme la réduction des coûts et l’augmentation de la couverture, il y a une évidence manifeste à l’effet que le mode d’enquête peut avoir des effets importants relativement à la précision d’une enquête. Ces effets risquent d’aboutir à des statistiques qui ne sont pas comparables dans le temps ou entre des sous-groupes de population et d’accroître le biais. Les plans de collecte adaptatifs offrent un cadre mathématique souple qui permet d’optimiser l’équilibre entre la qualité et les coûts de l’enquête. Dans cet article, nous utilisons des plans adaptatifs afin de minimiser les effets de mode. Nous illustrons notre modèle d’optimisation au moyen de l’étude du cas de l’Enquête sur la population active des Pays-Bas. Nous mettons l’accent sur les effets de mode dépendant des items et nous évaluons l’impact sur la qualité des enquêtes par comparaison avec une norme de référence.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500214230
    Description :

    Le présent article décrit l’élaboration de méthodes de répartition pour des enquêtes par sondage avec stratification quand l’utilisation d’estimateurs sur petits domaines composites est une priorité et que les domaines servent de strates. Longford (2006) a proposé pour cette situation un critère objectif fondé sur une combinaison pondérée des erreurs quadratiques moyennes des moyennes de petit domaine et d’une moyenne globale. Ici, nous redéfinissons cette approche dans un cadre assisté par modèle, ce qui permet l’utilisation de variables explicatives et une interprétation plus naturelle des résultats en utilisant un paramètre de corrélation intraclasse. Nous considérons aussi plusieurs utilisations de la répartition exponentielle et permettons l’application d’autres contraintes, telle une valeur maximale de la racine carrée relative de l’erreur quadratique moyenne, aux estimateurs de strate. Nous constatons qu’une répartition exponentielle simple peut donner des résultats très près d’être aussi bons que le plan optimal, même quand l’objectif est de minimiser le critère de Longford (2006).

    Date de diffusion : 2015-12-17

  • Articles et rapports : 82-003-X201500714205
    Description :

    Il est bien connu qu’il existe des divergences entre l’activité physique autodéclarée et l’activité physique mesurée objectivement. Aux fins de validation, les auteurs comparent les résultats d’un nouveau questionnaire sur l’activité physique autodéclarée avec ceux d’un questionnaire existant et avec des données d’accélérométrie.

    Date de diffusion : 2015-07-15

  • Articles et rapports : 82-003-X201500614196
    Description :

    La présente étude examine la faisabilité et la validité de l’utilisation des numéros d’assurance-maladie personnels pour coupler de façon déterministe le Registre canadien du cancer la Base de données sur les congés des patients, afin d’obtenir des données sur les hospitalisations des personnes atteintes d’un cancer primaire.

    Date de diffusion : 2015-06-17

  • Articles et rapports : 12-001-X201400214110
    Description :

    Quand nous élaborons le plan de sondage d’une enquête, nous essayons de produire un bon plan compte tenu du budget disponible. L’information sur les coûts peut être utilisée pour établir des plans de sondage qui minimisent la variance d’échantillonnage d’un estimateur du total pour un coût fixe. Les progrès dans le domaine des systèmes de gestion d’enquête signifient qu’aujourd’hui, il est parfois possible d’estimer le coût d’inclusion de chaque unité dans l’échantillon. Le présent article décrit l’élaboration d’approches relativement simples pour déterminer si les avantages pouvant découler de l’utilisation de cette information sur les coûts au niveau de l’unité sont susceptibles d’avoir une utilité pratique. Nous montrons que le facteur important est le ratio du coefficient de variation du coût sur le coefficient de variation de l’erreur relative des coefficients de coût estimés.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 12-001-X201400214128
    Description :

    Les utilisateurs et les fournisseurs de statistiques officielles, ainsi que ceux qui en assurent le financement, veulent des estimations « plus vastes, plus approfondies, plus rapides, de meilleure qualité et moins coûteuses » (selon Tim Holt, ancien chef de l’Office for National Statistics du Royaume-Uni), attributs auxquels j’ajouterais « plus pertinentes » et « moins fastidieuses ». Depuis la Deuxième Guerre mondiale, nous dépendons dans une large mesure des enquêtes sur échantillon probabiliste - celles-ci étant très bonnes dans les faits - pour atteindre ces objectifs pour les estimations dans de nombreux domaines, y compris le revenu des ménages et le chômage, l’état de santé autodéclaré, l’emploi du temps, les victimes d’actes criminels, l’activité des entreprises, les flux de produits, les dépenses des consommateurs et des entreprises, etc. Par suite des taux de plus en plus faibles de réponse totale et partielle et des preuves d’erreur de déclaration, nous avons réagi de nombreuses façons, y compris en utilisant des modes d’enquête multiples, des méthodes de pondération et d’imputation plus raffinées, l’échantillonnage adaptable, des essais cognitifs des questions d’enquête et d’autres méthodes pour maintenir la qualité des données. Dans le cas des statistiques sur le secteur des entreprises, afin de réduire le fardeau et les coûts, nous avons cessé depuis longtemps de recourir uniquement à des enquêtes pour produire les estimations nécessaires, mais jusqu’à présent, nous ne l’avons pas fait pour les enquêtes auprès des ménages, du moins pas aux États-Unis. Je soutiens que nous pouvons et que nous devons passer du paradigme de production des meilleures estimations possible à partir d’une enquête à la production des meilleures estimations possible pour répondre aux besoins des utilisateurs, à partir de sources de données multiples. Ces sources comprennent les dossiers administratifs et, de plus en plus, des données sur les transactions et des données en ligne. Je me sers de deux exemples - ceux du revenu des ménages et des installations de plomberie - pour illustrer ma thèse. Je propose des moyens d’inculquer une culture de la statistique officielle dont l’objectif est d’aboutir à des statistiques pertinentes, à jour, exactes et peu coûteuses, et qui traite les enquêtes, de même que les autres sources de données, comme des moyens d’atteindre cet objectif.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 12-001-X201400214090
    Description :

    Lorsqu'on s'intéresse à une population finie, il arrive qu'il soit nécessaire de tirer des échantillons dans plusieurs bases de sondage pour représenter l'ensemble des individus. Nous nous intéressons ici au cas de deux échantillons sélectionnés selon un plan à deux degrés, avec un premier degré de tirage commun. Nous appliquons les méthodes de Hartley (1962), Bankier (1986), et Kalton et Anderson (1986), et nous montrons que ces méthodes peuvent être appliquées conditionnellement au premier degré de tirage. Nous comparons également la performance de plusieurs estimateurs dans le cadre d'une étude par simulations. Nos résultats suggèrent que le choix d'un estimateur en présence de bases de sondage multiples se fasse de façon prudente, et qu'un estimateur simple est parfois préférable même s'il n'utilise qu'une partie de l'information collectée.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 82-003-X201401014098
    Description :

    La présente analyse compare une approche fondée sur un registre et une approche non fondée sur un registre pour apparier les données du Recensement de la population de 2006 et les données d’hôpital provenant de la Base de données sur les congés de patients pour le Manitoba et l’Ontario.

    Date de diffusion : 2014-10-15

  • Articles et rapports : 12-001-X201400114004
    Description :

    En 2009, deux enquêtes importantes réalisées par la division des administrations publiques du U.S. Census Bureau ont été remaniées afin de réduire la taille de l’échantillon, d’économiser des ressources et d’améliorer la précision des estimations (Cheng, Corcoran, Barth et Hogue 2009). Sous le nouveau plan de sondage, chaque strate habituelle, définie par l’État et le type d’administration publique, qui contient un nombre suffisant d’unités (administrations publiques) est divisée en deux sous strates en fonction de la masse salariale totale de chaque unité afin de tirer un plus petit échantillon de la sous strate des unités de petite taille. L’approche assistée par modèle est adoptée pour estimer les totaux de population. Des estimateurs par la régression utilisant des variables auxiliaires sont obtenus soit pour chaque sous strate ainsi créée soit pour la strate originale en regroupant des deux sous strates. Cheng, Slud et Hogue (2010) ont proposé une méthode fondée sur un test de décision qui consiste à appliquer un test d’hypothèse pour décider quel estimateur par la régression sera utilisé pour chaque strate originale. La convergence et la normalité asymptotique de ces estimateurs assistés par modèle sont établies ici sous un cadre asymptotique fondé sur le plan de sondage ou assisté par modèle. Nos résultats asymptotiques suggèrent aussi deux types d’estimateurs de variance convergents, l’un obtenu par substitution des quantités inconnues dans les variances asymptotiques et l’autre en appliquant la méthode du bootstrap. La performance de tous les estimateurs des totaux et des estimateurs de leur variance est examinée au moyen d’études empiriques. L’Annual Survey of Public Employment and Payroll (ASPEP) des États Unis est utilisé pour motiver et illustrer notre étude.

    Date de diffusion : 2014-06-27

  • Articles et rapports : 12-001-X201300211871
    Description :

    Les modèles de régression sont utilisés couramment pour analyser les données d'enquête lorsque l'on souhaite déterminer quels sont les facteurs influents associés à certains indices comportementaux, sociaux ou économiques au sein d'une population cible. Lorsque des données sont recueillies au moyen d'enquêtes complexes, il convient de réexaminer les propriétés des approches classiques de sélection des variables élaborées dans des conditions i.i.d. ne faisant pas appel au sondage. Dans le présent article, nous dérivons un critère BIC fondé sur la pseudovraisemblance pour la sélection des variables dans l'analyse des données d'enquête et proposons une approche de vraisemblance pénalisée dans des conditions de sondage pour sa mise en oeuvre. Les poids de sondage sont attribués comme il convient pour corriger le biais de sélection causé par la distorsion entre l'échantillon et la population cible. Dans un cadre de randomisation conjointe, nous établissons la cohérence de la procédure de sélection proposée. Les propriétés en échantillon fini de l'approche sont évaluées par des analyses et des simulations informatiques en se servant de données provenant de la composante de l'hypertension de l'Enquête sur les personnes ayant une maladie chronique au Canada de 2009.

    Date de diffusion : 2014-01-15

  • Articles et rapports : 12-001-X201300211888
    Description :

    Lorsque les variables étudiées sont fonctionnelles et que les capacités de stockage sont limitées ou que les coûts de transmission sont élevés, les sondages, qui permettent de sélectionner une partie des observations de la population, sont des alternatives intéressantes aux techniques de compression du signal. Notre étude est motivée, dans ce contexte fonctionnel, par l'estimation de la courbe de charge électrique moyenne sur une période d'une semaine. Nous comparons différentes stratégies d'estimation permettant de prendre en compte une information auxiliaire telle que la consommation moyenne de la période précédente. Une première stratégie consiste à utiliser un plan de sondage aléatoire simple sans remise, puis de prendre en compte l'information auxiliaire dans l'estimateur en introduisant un modèle linéaire fonctionnel. La seconde approche consiste à incorporer l'information auxiliaire dans les plans de sondage en considérant des plans à probabilités inégales tels que les plans stratifiés et les plans pi. Nous considérons ensuite la question de la construction de bandes de confiance pour ces estimateurs de la moyenne. Lorsqu'on dispose d'estimateurs performants de leur fonction de covariance et si l'estimateur de la moyenne satisfait un théorème de la limite centrale fonctionnel, il est possible d'utiliser une technique rapide de construction de bandes de confiance qui repose sur la simulation de processus Gaussiens. Cette approche est comparée avec des techniques de bootstrap qui ont été adaptées afin de tenir compte du caractère fonctionnel des données.

    Date de diffusion : 2014-01-15

  • Articles et rapports : 12-001-X201300111824
    Description :

    Dans la plupart des enquêtes, le même traitement est réservé à toutes les unités échantillonnées et les mêmes caractéristiques de plan de collecte des données s'appliquent à toutes les personnes et à tous les ménages sélectionnés. Le présent article explique comment les plans de collecte des données peuvent être adaptés en vue d'optimiser la qualité, étant donné des contraintes de coûts. Ces types de plans sont appelés plans de collecte adaptatifs. Les éléments fondamentaux de ce genre de plans sont présentés, discutés et illustrés au moyen de divers exemples.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 12-001-X201300111828
    Description :

    Une question fréquente concernant les enquêtes longitudinales est celle de savoir comment combiner les différentes cohortes. Dans le présent article, nous présentons une nouvelle méthode qui permet de combiner différentes cohortes et d'utiliser toutes les données à notre disposition dans une enquête longitudinale pour estimer les paramètres d'un modèle semi-paramétrique qui relie la variable réponse à un jeu de covariables. La procédure s'appuie sur la méthode des équations d'estimation généralisées pondérées pour traiter les données manquantes pour certaines vagues dans les enquêtes longitudinales. Notre méthode s'appuie, pour l'estimation des paramètres du modèle, sur un cadre de randomisation conjointe qui tient compte à la fois du modèle de superpopulation et de la sélection aléatoire selon le plan de sondage. Nous proposons aussi une méthode d'estimation de la variance sous le plan et sous randomisation conjointe. Pour illustrer la méthode, nous l'appliquons à l'enquête Survey of Doctorate Recipients réalisée par la National Science Foundation des États-Unis.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 12-001-X201200211755
    Description :

    La question de la non-réponse dans les études longitudinales est abordée en évaluant l'exactitude des modèles de propension à répondre construits pour distinguer et prédire les divers types de non-réponse. Une attention particulière est accordée aux mesures sommaires dérivées des courbes de la fonction d'efficacité du receveur, ou courbes ROC (de l'anglais receiver operating characteristics), ainsi que des courbes de type logit sur rangs. Les concepts sont appliqués à des données provenant de la Millennium Cohort Study du Royaume-Uni. Selon les résultats, la capacité de faire la distinction entre les divers types de non-répondants et de les prévoir n'est pas grande. Les poids produits au moyen des modèles de propension à répondre ne donnent lieu qu'à de faibles corrections des transitions entre situations d'emploi. Des conclusions sont tirées quant aux possibilités d'intervention en vue de prévenir la non-réponse.

    Date de diffusion : 2012-12-19

  • Articles et rapports : 12-001-X201200211758
    Description :

    Le présent article décrit l'élaboration de deux méthodes bayésiennes d'inférence au sujet des quantiles de variables d'intérêt continues d'une population finie sous échantillonnage avec probabilités inégales. La première de ces méthodes consiste à estimer les fonctions de répartition des variables étudiées continues en ajustant un certain nombre de modèles de régression probit avec splines pénalisées sur les probabilités d'inclusion. Les quantiles de population finie sont alors obtenus par inversion des fonctions de répartition estimées. Cette méthode demande considérablement de calculs. La deuxième méthode consiste à prédire les valeurs pour les unités non échantillonnées en supposant qu'il existe une relation variant de façon lisse entre la variable étudiée continue et la probabilité d'inclusion, en modélisant la fonction moyenne ainsi que de la fonction de variance en se servant de splines. Les deux estimateurs bayésiens fondés sur un modèle avec splines donnent un compromis désirable entre la robustesse et l'efficacité. Des études par simulation montrent que les deux méthodes produisent une racine carrée de l'erreur quadratique moyenne plus faible que l'estimateur pondéré par les poids de sondage et que les estimateurs par le ratio et par différence décrits dans Rao, Kovar et Mantel (RKM 1990), et qu'ils sont plus robustes à la spécification incorrecte du modèle que l'estimateur fondé sur un modèle de régression passant par l'origine décrit dans Chambers et Dunstan (1986). Lorsque la taille de l'échantillon est petite, les intervalles de crédibilité à 95 % des deux nouvelles méthodes ont une couverture plus proche du niveau nominal que l'estimateur pondéré par les poids de sondage.

    Date de diffusion : 2012-12-19

  • Articles et rapports : 12-001-X201200111682
    Description :

    Les questions concernant la répartition de l'échantillon sont étudiées dans le contexte de l'estimation des moyennes de sous-population (strate ou domaine), ainsi que de la moyenne de population agrégée sous-échantillonnage aléatoire simple stratifié. Une méthode de programmation non linéaire est utilisée pour obtenir la répartition « optimale » de l'échantillon entre les strates qui minimise la taille totale d'échantillon sous la contrainte des tolérances spécifiées pour les coefficients de variation des estimateurs des moyennes de strate et de la moyenne de population. La taille totale d'échantillon résultante est alors utilisée pour déterminer les répartitions de l'échantillon par les méthodes de Costa, Satorra et Ventura (2004) s'appuyant sur une répartition intermédiaire ou de compromis et de Longford (2006) fondée sur des « priorités inférencielles » spécifiées. En outre, nous étudions la répartition de l'échantillon entre les strates quand sont également spécifiées des exigences de fiabilité pour des domaines qui recoupent les strates. Les propriétés des trois méthodes sont étudiées au moyen de données provenant de l'Enquête mensuelle sur le commerce de détail (EMCD) menée par Statistique Canada auprès d'établissements uniques.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 12-001-X201200111683
    Description :

    Nous considérons diverses options de remplacement de la poststratification dans le cas de données croisées à deux dimensions pour lesquelles la fréquence d'au moins l'une des cellules du tableau à double entrée est trop faible pour permettre la poststratification en se basant sur cette classification double. Dans le jeu de données utilisé pour l'étude, la fréquence prévue dans la cellule la plus petite est de 0,36. Une approche consiste simplement à regrouper certaine cellules. Néanmoins, il est probable que cela détruise la structure de la classification double. Les approches de remplacement que nous proposons permettent de maintenir la classification à double entrée originale des données. Elles sont fondées sur l'étude du calage de Chang et Kott (2008). Nous choisissons des ajustements des pondérations qui dépendent des classifications marginales (mais non de la classification croisée complète) pour minimiser une fonction d'objectif correspondant aux différences entre les fréquences dans la population et dans les cellules du tableau à double entrée et leurs estimations sur échantillon. Selon la terminologie de Chang et Kott (2008), si les classifications par ligne et par colonne comprennent I et J cellules, respectivement, on obtient IJ variables de référence et I + J - 1 variables du modèle. Nous étudions les propriétés de ces estimateurs en créant des échantillons aléatoires simples pour la simulation d'après les données du Quarterly Census of Employment and Wages de 2005 tenues à jour par le Bureau of Labor Statistics. Nous procédons à la classification croisée de l'État et du groupe d'industries. Dans notre étude, comparativement à l'estimateur sans biais, les approches de calage introduisent un biais asymptotiquement négligeable, mais donnent une réduction de l'EQM pouvant aller jusqu'à 20 % pour un petit échantillon.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 82-003-X201200111633
    Description :

    Le présent document explique la méthode servant à créer les géozones, qui représentent des seuils de caractéristiques de population fondés sur la région géographique, à partir des données du recensement, et qui peuvent servir à l'analyse des différences sociales ou économiques au chapitre de la santé et de l'utilisation des services de santé.

    Date de diffusion : 2012-03-21

  • Articles et rapports : 12-001-X201100211604
    Description :

    Nous proposons une méthode d'estimation de l'erreur quadratique moyenne (EQM) pour les estimateurs des moyennes de domaine en population finie qui peuvent être exprimés sous une forme pseudo-linéaire, c'est-à-dire comme une somme pondérée des valeurs d'échantillon. En particulier, la méthode proposée peut être utilisée pour estimer l'EQM du meilleur prédicteur linéaire sans biais empirique, de l'estimateur direct fondé sur un modèle et du prédicteur du M-quantile. Elle représente une extension des idées de Royall et Cumberland (1978) et mène à des estimateurs de l'EQM qui sont plus simples à mettre en oeuvre et éventuellement plus robustes au biais que ceux proposés dans la littérature sur les petits domaines. Cependant, il convient de souligner que les estimateurs de l'EQM définis en utilisant cette méthode peuvent également présenter une grande variabilité quand les tailles d'échantillon de domaine sont très petites. Nous illustrons les propriétés de la méthode à l'aide de simulations à grande échelle sous un modèle et sous un plan de sondage, dans ce dernier cas en nous fondant sur deux ensembles de données d'enquête réels contenant des données sur des petits domaines.

    Date de diffusion : 2011-12-21

  • Articles et rapports : 82-003-X201100311534
    Description :

    Au moyen des données provenant de l'Enquête canadienne sur les mesures de la santé menée de 2007 à 2009, on examine dans la présente étude le biais qui existe lorsque la taille, le poids et l'indice de masse corporelle sont fondés sur les valeurs déclarées par les parents. Les facteurs associés à l'erreur de déclaration sont utilisés pour déterminer s'il est possible d'établir des équations de correction afin d'ajuster les estimations déclarées par les parents.

    Date de diffusion : 2011-08-17

  • Articles et rapports : 82-003-X201100311533
    Description :

    L'étude compare le biais dans les valeurs autodéclarées de taille, de poids et d'indice de masse corporelle provenant des cycles de 2008 et de 2005 de l'Enquête sur la santé dans les collectivités canadiennes et de l'Enquête canadienne sur les mesures de la santé menée de 2007 à 2009. On évalue la faisabilité de l'emploi d'équations de correction pour ajuster les valeurs autodéclarées à l'Enquête sur la santé dans les collectivités canadiennes de 2008 afin qu'elles s'approchent davantage des valeurs mesurées.

    Date de diffusion : 2011-08-17

  • Articles et rapports : 12-001-X201100111444
    Description :

    L'appariement des données consiste à jumeler des enregistrements issus de deux fichiers ou plus que l'on pense appartenir à une même unité (par exemple une personne ou une entreprise). Il s'agit d'un moyen très courant de renforcer la dimension temporelle ou des aspects tels que la portée ou la profondeur des détails. Souvent, le processus d'appariement des données n'est pas exempt d'erreur et peut aboutir à la formation d'une paire d'enregistrements qui n'appartiennent pas à la même unité. Alors que le nombre d'applications d'appariement d'enregistrements croît exponentiellement, peu de travaux ont porté sur la qualité des analyses effectuées en se servant des fichiers de données ainsi appariées. Traiter naïvement ces fichiers comme s'ils ne contenaient pas d'erreurs mène, en général, à des estimations biaisées. Le présent article décrit l'élaboration d'un estimateur du maximum de vraisemblance pour les tableaux de contingence et la régression logistique en présence de données incorrectement appariées. Simple, cette méthode d'estimation est appliquée en utilisant l'algorithme EM bien connu. Dans le contexte qui nous occupe, l'appariement probabiliste des données est une méthode reconnue. Le présent article démontre l'efficacité des estimateurs proposés au moyen d'une étude empirique s'appuyant sur cet appariement probabiliste.

    Date de diffusion : 2011-06-29

  • Articles et rapports : 12-001-X201100111446
    Description :

    L'estimation sur petits domaines fondée sur des modèles linéaires mixtes est parfois inefficace quand les relations sous-jacentes ne sont pas linéaires. Nous présentons des techniques d'estimation sur petits domaines pour des variables qui peuvent être modélisées linéairement après une transformation non linéaire. En particulier, nous étendons l'estimateur direct fondé sur un modèle de Chandra et Chambers (2005, 2009) à des données qui concordent avec un modèle linéaire mixte sur l'échelle logarithmique, en utilisant le calage sur un modèle pour définir des poids pouvant être utilisés dans cet estimateur. Nos résultats montrent que l'estimateur fondé sur la transformation que nous obtenons est à la fois efficace et robuste à la distribution des effets aléatoires dans le modèle. Une application à des données d'enquêtes auprès des entreprises démontre la performance satisfaisante de la méthode.

    Date de diffusion : 2011-06-29

Références (80)

Références (80) (25 of 80 results)

  • Produits techniques : 11-522-X201700014749
    Description :

    Dans le cadre du remaniement du Programme de la statistique du tourisme, Statistique Canada élabore l’Enquête nationale sur les voyages (ENV), qui recueillera de l’information relativement aux voyages effectués par les voyageurs canadiens. Cette nouvelle enquête remplacera l’actuelle Enquête sur les voyages des résidents du Canada, de même que la composante reliée aux voyages des résidents canadiens de l’Enquête sur les voyages internationaux. L’ENV tirera parti des bases de sondage communes de Statistique Canada et des outils de traitement communs, tout en maximisant l’utilisation des données administratives. Dans cette communication, on montrera comment les données administratives, comme celles provenant des fichiers de Passeport Canada, de l’Agence des services frontaliers du Canada et de l’Agence du revenu du Canada, pourraient servir à améliorer l’efficacité du plan de sondage de l’ENV.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014729
    Description :

    Les ensembles de données administratives servent de plus en plus couramment de sources de données en statistique officielle dans le cadre d’efforts visant à produire plus efficacement un plus grand nombre de produits. De nombreux produits résultent du couplage de deux ensembles de données ou plus, souvent réalisé en plusieurs phases en appliquant différentes méthodes et règles. Dans ces situations, nous aimerions pouvoir évaluer la qualité du couplage, ce qui comprend une certaine réévaluation des liens ainsi que des non-liens. Dans le présent article, nous discutons de méthodes d’échantillonnage en vue d’obtenir des estimations du nombre de faux négatifs et de faux positifs, en exerçant un contrôle raisonnable sur l’exactitude des estimations ainsi que sur les coûts. Des approches de stratification des liens (non-liens) pour l’échantillonnage sont évaluées en utilisant des données provenant du recensement de la population de l’Angleterre et du Pays de Galles de 2011.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014752
    Description :

    Le présent article décrit une nouvelle méthode de calcul des indices de prix pour le traitement des données issues de transactions électroniques (données de lecteurs optiques). Les indices de prix sont calculés sous forme du ratio d’un indice du chiffre d’affaires et d’un indice pondéré de quantité. Les pondérations de produits des quantités vendues sont calculées à partir des prix corrigés de l’inflation pour chaque mois de l’année de publication courante. Les nouveaux produits peuvent être incorporés en temps voulu, sans imputation de prix, de manière à ce que toutes les transactions puissent être traitées. Les pondérations des produits sont mises à jour mensuellement et sont utilisées afin de calculer les indices directs par rapport à un mois de base fixe. Les indices des prix construits de cette façon sont exempts du problème de « chain drift » (biais de chaînage). Les résultats sont robustes avec des écarts des choix méthodologiques. La méthode fait partie du programme de l’IPC des Pays-Bas depuis janvier 2016, quand elle a été appliquée pour la première fois aux téléphones mobiles.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014746
    Description :

    Les recherches sur les paradonnées ont tenté de trouver des occasions d’améliorer la collecte de données d’un point de vue stratégique qui soient viables au niveau opérationnel, qui améliorent la qualité des données ou qui permettent de réaliser des économies. À cet égard, Statistique Canada a élaboré et mis en œuvre une stratégie de plan de collecte adaptatif (PCA) pour les enquêtes auprès des ménages utilisant les interviews téléphoniques assistées par ordinateur (ITAO), afin de maximiser la qualité et de potentiellement réduire les coûts. Le PCA est une approche adaptative pour la collecte de données d’enquêtes qui utilise l’information disponible avant et pendant la collecte des données, afin de rajuster la stratégie de collecte pour le reste des cas en cours. En pratique, les gestionnaires d’enquête contrôlent et analysent les progrès de la collecte par rapport à un ensemble d’indicateurs prédéterminés, à deux fins : déterminer les étapes essentielles de la collecte des données pour lesquelles des changements significatifs doivent être apportés à l’approche de la collecte, et rajuster les stratégies de collecte afin d’utiliser le plus efficacement possible les ressources qui demeurent disponibles. Dans le contexte du PCA, de nombreuses considérations entrent en jeu lorsqu’il faut déterminer les aspects de la collecte des données qui doivent être rajustés et la façon de procéder. Les sources de paradonnées jouent un rôle essentiel dans la planification, l’élaboration et la mise en œuvre de la gestion active dans le cadre des enquêtes fondées sur le PCA. Depuis 2009, Statistique Canada a mené plusieurs enquêtes à l’aide du PCA. Le présent document décrit les expériences de Statistique Canada lors de la mise en œuvre et de la surveillance de ces enquêtes.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014721
    Description :

    L’accès aux données ouvertes s’inscrit de plus en plus dans les attentes des Canadiens, des chercheurs et des concepteurs. Apprenez comment et pourquoi le gouvernement du Canada a créé le portail « ouvert.canada.ca » afin de centraliser l’accès à toutes ses données ouvertes et en quoi cette initiative continuera de favoriser l’utilisation de renseignements statistiques.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014754
    Description :

    Contexte : Il existe un intérêt croissant à l’égard de la mesure et de l’étalonnage du rendement du système de santé. Nous avons comparé le système de santé du Canada, tant à l’échelle nationale que provinciale, avec celui d’autres pays de l’Organisation de coopération et de développement économiques (OCDE), pour 50 indicateurs du rendement. Cette analyse peut aider les provinces à déterminer les domaines possibles d’amélioration, compte tenu de la présence d’un comparateur optimal pour les comparaisons internationales. Méthodes : Les données sur la santé de l’OCDE pour 2013 ont servi à comparer les résultats du Canada avec ceux d’autres pays. Nous avons aussi calculé les résultats provinciaux pour les indicateurs du rendement du système de santé de l’OCDE, au moyen de la méthodologie de cet organisme. Nous avons normalisé les résultats des indicateurs, en vue de présenter plusieurs indicateurs sur la même échelle, et nous les avons comparés à la moyenne pour l’OCDE, ainsi qu’au 25e et au 75e centiles. Résultats : La présentation de valeurs normalisées permet la comparaison des résultats du Canada selon plusieurs indicateurs de l’OCDE, sur la même échelle. Aucun pays ni province n’affiche des résultats supérieurs aux autres de façon uniforme. Pour la plupart des indicateurs, les résultats canadiens sont similaires à ceux d’autres pays, mais il subsiste des domaines où le Canada réussit particulièrement bien (p. ex. taux de tabagisme) ou moins bien (p. ex. sécurité des patients). Ces données ont été présentées dans un outil électronique interactif. Conclusion : La comparaison des données des provinces canadiennes avec celles d’autres pays peut faire ressortir les domaines où une amélioration est nécessaire et peut aider à déterminer des stratégies possibles d’amélioration.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014756
    Description :

    Comment pouvons-nous regrouper des données multidimensionnelles sur le rendement du système de santé de façon simple, afin qu’il soit facile d’y accéder et de fournir des renseignements comparables et exploitables pour accélérer les améliorations des soins de santé? L’Institut canadien d’information sur la santé a élaboré un ensemble d’outils pour répondre aux besoins de divers auditoires en matière de mesures de rendement, déterminer les priorités au chapitre des améliorations, comprendre comment les régions et les établissements se comparent les uns aux autres, et appuyer la transparence et la reddition de comptes. Les outils pancanadiens de [Votre système de santé (VSS)] consolident les rapports de 45 indicateurs clés du rendement de façon structurée, et sont comparables au fil du temps et à divers niveaux géographiques. Le présent document rend compte de l’élaboration et des approches et considérations méthodologiques qui ont servi à créer un outil dynamique qui facilite l’étalonnage et les comparaisons significatives pour l’amélioration du rendement du système de santé.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014708
    Description :

    Le programme de bases de sondage pour les enquêtes auprès des ménages (BSEM) de Statistique Canada fournit différents produits qui peuvent être utilisés seuls ou en combinaison afin d’améliorer la conception d’enquêtes au niveau de l’échantillonnage, de la collecte et du traitement et ce, selon le modèle traditionnel dans lequel on contacte un ménage. Alors que les enquêtes migrent toujours vers cet ensemble de produits de base, le programme de BSEM commence à planifier les changements qui seront requis à l’infrastructure, à l’organisation et aux liens avec d’autres sources de données de Statistique Canada afin de permettre l’évolution vers une utilisation accrue d’une multitude de sources de données administratives en tant qu’intrants au programme des statistiques sociales. La présentation fournira d’abord un aperçu du programme courant de BSEM. Elle identifiera ensuite les concepts de base qui devront être mis en œuvre dans le but d’augmenter le potentiel de couplage des enregistrements et se conclura en présentant la recherche stratégique qui sera menée d’ici au recensement de 2021.

    Date de diffusion : 2016-03-24

  • Produits techniques : 12-002-X201500114147
    Description :

    En régression logistique, les observations influentes sont celles qui ont un effet notable sur certains aspects de l’adéquation du modèle. Une grande taille d’échantillon ne permet pas, à elle seule, d’écarter cette préoccupation; il demeure important d’examiner les observations qui pourraient être influentes, surtout dans les données d’enquêtes complexes. Le présent article décrit un algorithme simple pour rechercher les observations influentes potentielles dans les données d’enquête complexes en utilisant le logiciel SAS. Cet algorithme a été appliqué dans le cadre d’une étude fondée sur des données de l’Enquête sur la santé dans les collectivités canadiennes de 2005 en vue de déterminer les facteurs associés à l’utilisation des services des médecins de famille par les adolescents.

    Date de diffusion : 2015-03-25

  • Produits techniques : 11-522-X201300014286
    Description :

    L’Etude Longitudinale Française depuis l’Enfance (Elfe), démarrée en 2011, compte plus de 18 300 nourrissons dont les parents ont consenti à leur inclusion en maternité. Cette cohorte, consacrée au suivi des enfants, de la naissance à l’âge adulte, aborde les multiples aspects de la vie de l’enfant sous l’angle des sciences sociales, de la santé et de la santé-environnement. Dans chacune des maternités tirées aléatoirement, tous les nourrissons de la population cible, nés durant l’un des 25 jours répartis parmi les quatre saisons, ont été sélectionnés. Cet échantillon est le résultat d’un plan de sondage non standard que nous appellons échantillonnage produit. Il se présente pour cette enquête sous la forme du croisement de deux échantillonnages indépendants: celui des maternités et celui des jours. Si l’on peut facilement imaginer un effet grappe dû à l’échantillonnage de maternités, on peut symétriquement imaginer un effet grappe dû à l’échantillonnage des jours. La dimension temporelle du plan ne pourra alors être négligée si les estimations recherchées sont susceptibles de variations journalières ou saisonnières. Si ce plan non standard peut être vu comme un plan à deux phases bien particulier, il s’avère nécessaire de le définir dans un cadre plus adapté. Après une comparaison entre le plan produit et un plan classique à deux degrés, seront proposés des estimateurs de variance adaptés à ce plan de sondage. Une étude par simulations illustrera nos propos.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014272
    Description :

    Deux tendances convergentes soulèvent des questions concernant l’avenir des enquêtes probabilistes à grande échelle menées par ou pour des instituts nationaux de statistique (INS). Tout d’abord, l’augmentation des coûts et des taux de non-réponse menace potentiellement la rentabilité et la valeur inférentielle des enquêtes. En deuxième lieu, l’intérêt est de plus en plus grand à l’égard des mégadonnées en remplacement des enquêtes. Il existe de nombreux types différents de mégadonnées, mais je mettrai l’accent particulièrement sur les données produites par l’entremise des médias sociaux. Le présent document complète et met à jour un document antérieur sur le sujet (Couper, 2013). Je passerai en revue certaines des préoccupations concernant les mégadonnées, particulièrement dans la perspective des enquêtes. Je soutiens qu’il y a place pour des enquêtes de grande qualité et des analyses de mégadonnées dans les travaux des INS. Même s’il est peu probable que les mégadonnées remplacent les enquêtes de grande qualité, je crois que les deux méthodes peuvent remplir des fonctions complémentaires. Je tente de déterminer certains des critères qui doivent être satisfaits, ainsi que les questions auxquelles on doit répondre, avant que les mégadonnées puissent être utilisées pour des inférences fiables au niveau de la population.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014251
    Description :

    Dans la perspective d’un modélisateur, je décris la situation actuelle en matière d’inférence fondée sur les enquêtes pour la production de statistiques officielles. Ce faisant, je tente de dégager les forces et les faiblesses des approches inférentielles fondées sur le plan de sondage, d’une part, et sur un modèle, d’autre part, appliquées aujourd’hui à l’échantillonnage, du moins en ce qui concerne les statistiques officielles. Je termine par un exemple tiré d’un plan de collecte adaptatif qui illustre pourquoi l’adoption d’une perspective fondée sur un modèle (fréquentiste ou bayésien) représente le meilleur moyen pour les statistiques officielles d’éviter la « schizophrénie inférentielle » débilitante qui semble inévitable si l’on applique les méthodes actuelles pour répondre aux nouvelles demandes d’information du monde d’aujourd’hui (et peut-être même de demain).

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014289
    Description :

    Cet article donne un aperçu des principales nouveautés qui seront intégrées au modèle de projections par microsimulation Demosim, dont une version partant des microdonnées de l'Enquête nationale auprès des ménages de 2011 est en cours de préparation. Dans un premier temps, les ajouts à la population de base sont présentés; il s’agit essentiellement de nouvelles variables, certaines étant ajoutées aux données de l'Enquête nationale auprès des ménages par le biais d’appariement de fichiers. Les méthodes envisagées pour la projection des variables linguistiques, la citoyenneté et la religion sont ensuite brièvement présentées à titre d’exemples de nouveautés relatives aux événements simulés par le modèle.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X200800011001
    Description :

    Présentement en cours, l'Enquête québécoise sur la santé de la population (EQSP), dont la collecte se terminera en février 2009, offre l'opportunité, de par l'envergure de son échantillon, d'évaluer l'impact de l'envoi de lettres d'information aux répondants sur le taux de réponse, et ce, dans un environnement contrôlé. En effet, avec plus de 38 000 répondants attendus, une partie de l'échantillon de cette enquête téléphonique à portée régionale a pu être utilisée pour permettre cette étude, sans toutefois avoir un impact trop important sur le taux de réponse global de l'enquête. Dans les enquêtes à génération aléatoire de numéro de téléphone (GANT), telle que l'EQSP, un des principaux défis de l'envoi d'une lettre d'information est l'atteinte de l'unité enquêtée. Or, cette réussite dépend en grande partie de notre capacité à associer une adresse aux unités échantillonnées et de la qualité de celle-ci.

    Cet article décrit l'étude contrôlée mise de l'avant par l'Institut de la statistique du Québec pour mesurer l'incidence de l'envoi de lettres d'information aux répondants sur le taux de réponse de l'enquête.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800011011
    Description :

    Le Système de rapports sur la qualité de vie (SRQDV) de la Fédération canadienne des municipalités (FCM) offre un moyen de mesurer et de surveiller la qualité de vie dans les municipalités canadiennes et d'en rendre compte. Pour relever le défi que représente la collecte de données administratives auprès des diverses municipalités membres, l'équipe technique du SRQDV a collaboré au développement de l'Outil de collecte de données municipales (OCDM) qui est devenu une composante clé de la méthodologie d'acquisition de données du SRQDV. Soumis en tant qu'étude de cas de la collecte des données administratives, le présent article soutient que le lancement récent de l'OCDM a permis à la FCM d'avoir accès à des données administratives municipales pancanadiennes fiables pour le SRQDV.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010963
    Description :

    ContexteLes chercheurs ont été réticents à réaliser des études avec des enfants sur le continent africain (plutôt que des études sur les enfants). Plusieurs d'entre eux l'ont fait, toujours en tenant compte de considérations d'ordre éthique et confidentiel. L'ACHWRP est une étude longitudinale menée auprès de 725 enfants âgés de 9 à 15 ans au KwaZulu-Natal, en Afrique du Sud. Les chercheurs ont aussi fait face aux mêmes difficultés.

    MéthodesLes méthodes de collecte de données utilisées dans le cadre de l'ACHWRP sont des groupes de discussion et des questionnaires à remplir soi-même. L'un des objectifs de l'enquête est d'examiner les conséquences de la mort du parent ou du fournisseur de soins sur la santé et le bien-être des orphelins du district d'Amajuba du KwaZulu-Natal. Deux conseils de révision chargés de questions éthiques ont autorisé la réalisation de l'enquête.

    Leçons tirées de l'expérienceLes questions d'ordre éthique comprenaient des problèmes de coercition concernant la participation des enfants, les rôles d'observateur et de partenaire, l'obtention du consentement et de l'assentiment, le recrutement et le système d'aiguillage.Les questions concernant la confidentialité comprenaient les techniques de collecte de données, la curiosité et la destruction par les membres de la famille pendant les interviews, l'endroit où les interviews avaient lieu, les aspects logistiques et la possibilité que la méthode de recrutement compromette la confidentialité.Résolutions - Des formulaires détaillés de consentement et d'assentiment, comprenant tous les renseignements pertinents, sont nécessaires. Une sélection attentive des partenaires est essentielle. Il est nécessaire de choisir un endroit éloigné de la collectivité, et il faut aussi s'assurer que les coûts de déplacement des participants sont payés.

    ConclusionPour réaliser des travaux de recherche avec des enfants, il faut investir davantage de temps et d'attention à l'étape de la planification.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800011003
    Description :

    Le but de la présente étude est d'examiner la possibilité d'élaborer des facteurs de correction pour rajuster les mesures de l'indice de masse corporelle fondées sur des données autodéclarées afin d'obtenir des valeurs plus proches de celles calculées d'après des données mesurées. Les données proviennent de l'Enquête sur la santé dans les collectivités canadiennes de 2005 (ESCC) dans le cadre de laquelle on a demandé aux répondants d'indiquer leur taille et leur poids, lesquels ont ensuite été mesurés. Des analyses par régression ont été effectuées pour déterminer quelles caractéristiques sociodémographiques et relatives à la santé sont associées aux écarts entre les valeurs fondées sur des données autodéclarées et des données mesurées. L'échantillon a ensuite été divisé en deux groupes. Pour le premier, on a procédé à la régression de l'indice de masse corporelle (IMC) fondé sur des données autodéclarées et des prédicteurs des écarts sur l'IMC fondé sur des données mesurées. Des équations de correction ont été établies en utilisant toutes les variables explicatives ayant un effet significatif au seuil de signification de p<0,05. Puis, ces équations de correction ont été testées dans le deuxième groupe afin de calculer des estimations de la sensibilité, de la spécificité et de la prévalence de l'obésité. La relation entre l'IMC fondé sur des données mesurées, déclarées et corrigées, d'une part, et les problèmes de santé liés à l'obésité, d'autre part, a été examinée par régression logistique. Les estimations corrigées ont produit des mesures plus exactes de la prévalence de l'obésité, de l'IMC moyen et des niveaux de sensibilité. Les données autodéclarées exagéraient la relation entre l'IMC et les problèmes de santé, tandis que dans la plupart des cas, les estimations corrigées produisaient des rapports de cotes plus semblables à ceux obtenus pour l'IMC fondé sur des données mesurées.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800011002
    Description :

    La présente étude s'appuie sur un échantillon représentatif de la population canadienne pour quantifier le biais dû à l'utilisation de données autodéclarées sur la taille, le poids et l'indice de masse corporelle (IMC) au lieu de mesures directes. Nous comparons les associations entre les catégories d'IMC et certains problèmes de santé afin de déterminer si les erreurs de classification résultant de l'utilisation de données autodéclarées modifient les associations entre l'obésité et les problèmes de santé. L'analyse est fondée sur 4 567 répondants à l'Enquête sur la santé dans les collectivités canadiennes (ESCC) de 2005 qui, durant une interview sur place, ont déclaré leur taille et leur poids, puis ont été mesurés et pesés par un intervieweur ayant reçu une formation appropriée. En se basant sur les données autodéclarées, une proportion importante de personnes ayant un excès de poids ont été classées incorrectement dans des catégories d'IMC plus faible. Ces erreurs de classification se sont soldées par des associations plus fortes entre l'excès de poids ou l'obésité et la morbidité.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010986
    Description :

    Dans le cadre du Recensement de 2006, des modifications majeures ont été apportées à la collecte des données. Au nombre de ces modifications, on trouve l'option de réponse par Internet qui est désormais offerte à tous les ménages privés du Canada. Près d'un ménage sur cinq a choisi de remplir et de retourner son questionnaire en ligne. De plus, une nouvelle méthodologie visant à promouvoir ce mode de réponse a été mise à l'essai. Il s'agit de l'étude de la promotion de la réponse par Internet (PRI). Cette méthodologie s'est révélée très efficace pour augmenter le taux de réponse en ligne. La planification du Recensement de 2011, qui est en cours, prévoit employer une stratégie de collecte par vague dont la première vague serait la méthode utilisée lors de la PRI. Ce document présente une vue d'ensemble de la collecte des données du Recensement de 2006 par Internet - évaluations, résultats, leçons apprises - ainsi que la méthodologie qui sera utilisée lors du prochain recensement, en 2011.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010994
    Description :

    La difficulté grandissante à joindre les répondants affecte, de façon générale, la non-réponse des enquêtes téléphoniques, et particulièrement les enquêtes qui utilisent les techniques de composition aléatoire (CA) comme l'Enquête sociale générale (ESG). L'ESG est une enquête annuelle à sujets multiples effectuée auprès de 25 000 répondants. Ses objectifs sont de surveiller les caractéristiques et les modifications importantes de la structure sociale canadienne. Le cycle 21 (2007) de l'ESG porte sur la famille, le soutien social et la retraite et vise la population âgée de 45 ans et plus vivant dans les 10 provinces canadiennes. Pour cibler plus efficacement cette population, une partie de l'échantillon provient d'un suivi auprès des répondants du cycle 20 (2006) de l'ESG qui portait sur les transitions familiales. Il est complété par un nouvel échantillon obtenu par CA. Dans cet article, nous présentons d'abord le plan de sondage de l'enquête et la méthode de composition aléatoire utilisée. Nous décrivons ensuite les défis reliés au calcul du taux de non-réponse dans une enquête à composition aléatoire qui cible un sous-ensemble d'une population, pour lequel la population dans le champ de l'enquête doit être estimée ou modélisée. Ceci est fait notamment avec l'utilisation de paradonnées. La méthodologie utilisée au cycle 21 de l'ESG est présentée en détail.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010976
    Description :

    Bon nombre d’organismes statistiques considèrent le taux de réponse comme un indicateur de la qualité des données d’enquête. Ils mettent donc en oeuvre diverses mesures pour réduire la non-réponse ou pour maintenir un niveau de réponse acceptable. Toutefois, le taux de réponse ne constitue pas nécessairement un bon indicateur du biais de non-réponse. Un taux de réponse élevé ne suppose pas un faible biais de non-réponse. Ce qui compte, c’est l’écart entre la composition de la réponse et celle de l’ensemble de l’échantillon. Dans le présent exposé, nous décrivons le concept des indicateurs R pour évaluer les écarts possibles entre l’échantillon et la réponse. Ces indicateurs peuvent faciliter l’analyse de la réponse aux enquêtes au fil du temps, quels que soient les stratégies d’enquête sur le terrain ou les modes de collecte des données. Nous présentons des exemples tirés de la pratique.

    Date de diffusion : 2009-12-03

  • Produits techniques : 12-002-X200900110692
    Description :

    Les chercheurs peuvent examiner l'évolution des tendances dans le temps en procédant à l'examen des réponses aux questions posées à maintes reprises aux mêmes répondants durant plusieurs cycles de données longitudinales. L'utilisation de ces réponses mesurées à maintes reprises peut souvent être difficile. Le présent article examine les tendances dans les activités de bénévolat des jeunes à l'aide des données de l'Enquête longitudinale nationale sur les enfants et les jeunes, afin de faire ressortir plusieurs questions dont les chercheurs devraient tenir compte en utilisant les mesures itératives.

    Date de diffusion : 2009-04-22

  • Produits techniques : 11-522-X200600110418
    Description :

    L'usage courant des modèles multiniveaux pour examiner les effets du contexte environnant sur les résultats en matière de santé témoigne de leur valeur en tant que méthode statistique d'analyse de données groupées. Cependant, l'application de la modélisation multiniveaux à des données provenant d'enquêtes à l'échelle de la population est souvent limitée par le petit nombre de cas par unité de deuxième niveau, si bien que l'on relève dans la littérature sur les effets du quartier une tendance récente à appliquer des méthodes d'analyse par grappes, ou classification automatique, pour contourner le problème de la dispersion des données. Dans le présent article, nous utilisons des simulations de Monte Carlo pour étudier les effets des tailles marginales de groupe et des méthodes d'analyse par grappes sur la validité des estimations des paramètres dans les modèles multiniveaux linéaires ainsi que non linéaires.

    Date de diffusion : 2008-03-17

  • Produits techniques : 11-522-X200600110427
    Description :

    La National Health and Nutrition Examination Survey (NHANES) fait partie d'une série de programmes ayant trait à la santé parrainés par le National Center for Health Statistics des États-Unis. Une caractéristique unique de la NHANES est que tous les répondants de l'échantillon sont soumis à un examen médial complet. Afin de normaliser la façon dont ils sont effectués, ces examens se déroulent dans des centres d'examen mobiles (CEM). L'examen comprend des mesures physiques, des tests tels que l'examen de la vue et des dents, ainsi que le prélèvement d'échantillons de sang et d'urine pour des analyses biologiques. La NHANES est une enquête annuelle continue sur la santé effectuées auprès de la population civile des États-Unis ne résidant pas en établissement. Les principaux objectifs analytiques comprennent l'estimation du nombre et du pourcentage de personnes dans la population des États-Unis et dans des sous groupes désignés qui présentent certaines maladies et certains facteurs de risque. Le plan d'échantillonnage de la NHANES doit permettre d'établir un juste équilibre entre les exigences liées à l'obtention d'échantillons annuels et pluriannuels efficaces et la souplesse requise pour pouvoir modifier les paramètres essentiels du plan afin de mieux adapter l'enquête au besoin des chercheurs et des décideurs qui élaborent les politiques en matière de santé. Le présent article décrit les défis associés à la conception et à la mise en oeuvre d'un processus d'échantillonnage permettant d'atteindre les objectifs de la NHANES.

    Date de diffusion : 2008-03-17

  • Produits techniques : 11-522-X200600110443
    Description :

    La population du Brésil vieillit puisque le nombre de personnes âgées a augmenté. Des instruments ont été élaborés pour mesurer la qualité de vie de ces personnes. Un questionnaire composé de différents instruments validés et d'une question ouverte a donc été appliqué à un groupe de personnes âgées de la ville de Botucatu, SP, au Brésil. L'analyse des réponses à la question ouverte, évaluées selon des méthodes qualitatives, a permis d'obtenir onze catégories d'opinions des personnes âgées sur la qualité de vie, et une analyse par grappes des réponses a permis de diviser les personnes âgées en trois groupes. L'étude visait ainsi à valider les catégories obtenues à l'aide de la question ouverte par les questions fermées de l'instrument au moyen d'associations et de l'application de tests du chi carré au niveau de signification de 5 %. On a observé que l'analyse qualitative permet de déterminer les phénomènes sans égard à la saturation de catégories. En revanche, la méthode quantitative montre le poids de chaque catégorie dans un ensemble, c'est à dire globalement.

    Date de diffusion : 2008-03-17

Date de modification :