Statistiques par sujet – Méthodes statistiques

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Auteur(s)

86 facettes affichées. 1 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Auteur(s)

86 facettes affichées. 1 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Auteur(s)

86 facettes affichées. 1 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Type d’information

2 facettes affichées. 0 facettes sélectionnées.

Auteur(s)

86 facettes affichées. 1 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Autres ressources disponibles pour appuyer vos recherches.

Aide pour trier les résultats
Explorer notre base centrale des principaux concepts normalisés, définitions, sources de données et méthodes.
En cours de chargement
Chargement en cours, veuillez patienter...
Tout (116)

Tout (116) (25 of 116 results)

  • Articles et rapports : 82-003-X201700614829
    Description :

    Le POHEM-IMC est un outil de microsimulation comprenant un modèle de l’IMC chez les adultes et un modèle des antécédents en matière d’IMC pendant l’enfance. Cet aperçu décrit l’élaboration de modèles de prédiction de l’IMC chez les adultes et des antécédents en matière d’IMC pendant l’enfance, et compare les estimations de l’IMC projetées aux estimations issues de données d’enquête représentatives de la population canadienne pour en établir la validité.

    Date de diffusion : 2017-06-21

  • Articles et rapports : 82-003-X201601014665
    Description :

    La présente analyse avait pour but d’élaborer, à partir des données de l’Enquête canadienne sur les mesures de la santé pour la période allant de 2007 à 2013, des équations de référence pour évaluer la force de préhension maximale de la main droite et de la main gauche des Canadiens de 6 à 79 ans, d’après une population en santé représentative à l’échelle nationale. Ces équations peuvent servir à déterminer les valeurs de référence aux fins d’évaluation de la force de préhension d’une personne en particulier.

    Date de diffusion : 2016-10-19

  • Produits techniques : 11-522-X201700014741
    Description :

    Le mandat de Statistique Canada comprend la production de données statistiques en vue de faire la lumière sur les questions d’actualité touchant les entreprises. Le couplage des enregistrements de données d’entreprises est un aspect important de l’élaboration, de la production, de l’évaluation et de l’analyse de ces données statistiques. Comme le couplage d’enregistrements peut faire intrusion dans la vie privée, Statistique Canada n’y recourt que si l’intérêt public est manifeste et l’emporte sur les inconvénients de l’intrusion. Le couplage d’enregistrements connaît un renouveau déclenché par un usage plus important de données administratives par un grand nombre de programmes statistiques. Le couplage d’enregistrements de données d’entreprises pose de nombreux défis. Par exemple, plusieurs fichiers administratifs ne contiennent pas d’identificateurs communs, les données sont consignées dans des formats non normalisés, certaines données contiennent des erreurs typographiques, les fichiers de données administratives sont habituellement de grande taille, et enfin, l’évaluation de multiples paires d’enregistrements rend les comparaisons absolues difficiles, voire parfois impossibles. Étant donné l’importance et les défis du couplage d’enregistrements, Statistique Canada a élaboré une norme en vue d’aider les utilisateurs à optimiser leur processus de couplage d’enregistrements de données d’entreprises. Ainsi, ce processus comprend l’exploitation d’une stratégie de groupement des enregistrements qui réduit le nombre de paires d’enregistrements à comparer et à apparier, l’utilisation d’un logiciel interne de Statistique Canada pour procéder à des couplages déterministes et probabilistes, et la création de champs standardisés pour le nom et l’adresse des entreprises dans le Registre des entreprises de Statistique Canada. Le présent article donne un aperçu de la méthode de couplage d’enregistrements de données d’entreprises et examine divers projets économiques qui font appel au couplage d’enregistrements à Statistique Canada, notamment dans les domaines des Comptes nationaux, du commerce international, de l’agriculture et du Registre des entreprises.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014733
    Description :

    La valeur sociale des collectes de données est améliorée de façon marquée par la vaste diffusion des fichiers de recherche et l’augmentation en découlant de la productivité scientifique. À l’heure actuelle, la plupart des études sont conçues en vue de recueillir des données utiles et exactes au niveau analytique, en se préoccupant peu de la façon dont elles seront mises en commun. Tant les ouvrages publiés que la pratique reposent sur le principe que l’analyse de la divulgation aura lieu après la collecte. Toutefois, pour produire des données à grande diffusion comportant la plus grande utilité analytique possible pour le groupe d’utilisateurs le plus important, on doit tenir compte du risque de divulgation au début du processus de recherche. À partir de cadres théoriques de décisions économiques et statistiques et de recherches en méthodes d’enquête, cette communication vise à améliorer la productivité scientifique des données de recherche partagées en décrivant comment le risque de divulgation peut être résolu aux étapes les plus précoces de la recherche, grâce à la formulation de « plans sécuritaires » et de « simulations de divulgation », une approche statistique appliquée ayant été adoptée pour : 1) l’élaboration et la validation de modèles qui prédisent la composition des données d’enquête selon différents plans d’échantillonnage; 2) la sélection et/ou l’élaboration de mesures et de méthodes utilisées pour déterminer le risque de divulgation, l’utilité analytique et les coûts de la divulgation des données d’enquête qui conviennent le mieux pour l’évaluation des plans d’échantillonnage et de bases de données; et 3) la tenue de simulations pour recueillir des estimations du risque, de l’utilité et du coût des études comportant une vaste gamme de caractéristiques d’échantillonnage et de conception de bases de données.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014744
    Description :

    La présentation débutera avec un résumé de la recherche réalisée sur la qualité et l’utilité des paradonnées recueillies dans le cadre de la National Survey of Family Growth (NSFG) aux États Unis. La NSFG est une grande enquête nationale sur la fécondité aux États Unis qui est, pour les décideurs, une source importante de données sur l’activité sexuelle, le comportement sexuel et la santé génésique. Depuis de nombreuses années, la NSFG a permis de recueillir diverses formes de paradonnées, y compris les données issues de frappes au clavier (p. ex., Couper et Kreuter 2013), les renseignements du registre des appels, les renseignements détaillés sur les décisions concernant les cas, et les observations des intervieweurs associées aux principales mesures de la NSFG (p. ex., West 2013). Ensuite, certains défis que pose l’utilisation de ces données seront discutés, ainsi que des preuves de leur utilité pour la correction de la non réponse, l’évaluation des intervieweurs et/ou l’utilisation de plans de collecte adaptatifs. Troisièmement, des travaux de recherche seront présentés portant sur l’utilisation des paradonnées recueillies dans le cadre de deux enquêtes par panel, à savoir la Medical Expenditure Panel Survey (MEPS) réalisée aux États Unis et la Panel Labour Market and Social Security (PASS) réalisée en Allemagne. Dans les deux enquêtes, l’information émanant des prises de contact lors de vagues antérieures a été utilisée expérimentalement en vue d’améliorer les taux de prise de contact et de réponse lors des vagues subséquentes. On présentera aussi des travaux de recherche portant sur la PASS dans le cadre desquels des données d’observation des intervieweurs concernant d’importantes variables de résultats ont été recueillies en vue de prendre des décisions quant à la correction de la non réponse ou l’utilisation d’un plan de collecte adaptatif. Cette présentation ne couvrira pas seulement des résultats de la recherche, mais aussi des défis pratiques liés à la mise en œuvre de la collecte et à l’utilisation des deux ensembles de paradonnées.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014731
    Description :

    Cette communication décrit divers facteurs qui posent un problème lorsque l’on évalue le risque de divulgation de microdonnées contextualisées, ainsi que certaines des étapes empiriques qui sont comprises dans leur évaluation. À partir d’ensembles synthétiques de répondants d’enquête, nous illustrons comment différents postulats modulent l’évolution du risque lorsque l’on tient compte : 1) des probabilités estimées que des régions géographiques non identifiées soient représentées dans une enquête; 2) du nombre de personnes dans la population qui partagent les mêmes identificateurs personnels et contextuels qu’un répondant; et 3) de l’ampleur prévue de l’erreur de couverture dans les chiffres de population du recensement et les fichiers existants qui fournissent des données d’identification (p. ex., le nom, l’adresse).

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014708
    Description :

    Le programme de bases de sondage pour les enquêtes auprès des ménages (BSEM) de Statistique Canada fournit différents produits qui peuvent être utilisés seuls ou en combinaison afin d’améliorer la conception d’enquêtes au niveau de l’échantillonnage, de la collecte et du traitement et ce, selon le modèle traditionnel dans lequel on contacte un ménage. Alors que les enquêtes migrent toujours vers cet ensemble de produits de base, le programme de BSEM commence à planifier les changements qui seront requis à l’infrastructure, à l’organisation et aux liens avec d’autres sources de données de Statistique Canada afin de permettre l’évolution vers une utilisation accrue d’une multitude de sources de données administratives en tant qu’intrants au programme des statistiques sociales. La présentation fournira d’abord un aperçu du programme courant de BSEM. Elle identifiera ensuite les concepts de base qui devront être mis en œuvre dans le but d’augmenter le potentiel de couplage des enregistrements et se conclura en présentant la recherche stratégique qui sera menée d’ici au recensement de 2021.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014748
    Description :

    Cette communication décrit la constitution d'une base de données élaborée en Suisse en vue de l’analyse de la migration et de l’intégration structurelle de la population d’origine étrangère. Cette base de données repose sur différents registres (registre des habitants, des assurances sociales, du chômage) et enquêtes et couvre 15 années (1998 à 2013). Des informations sur le statut migratoire et les caractéristiques socioéconomiques sont ainsi disponibles pour près de 4 millions d'étrangers ayant séjourné en Suisse entre 1998 et 2013. Cette base de données est le fruit d’une collaboration entre l’Office fédéral de la statistique et des chercheurs du NCCR On the Move.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 82-003-X201600114306
    Description :

    Le présent article donne un aperçu de la création, du contenu et de la qualité de la Base de données sur la cohorte canadienne de naissance du Recensement de 2006.

    Date de diffusion : 2016-01-20

  • Articles et rapports : 12-001-X201500214237
    Description :

    La bonne conception d’une enquête téléphonique par composition aléatoire (CA) à partir d’une base de sondage double requiert de choisir entre de nombreuses options, en faisant la part des différences de coût, de précision, et de couverture, afin d’optimiser la réalisation des objectifs de l’étude. L’un des éléments à prendre en considération est celui de savoir s’il faut présélectionner les ménages équipés de téléphones mobiles et n’interroger que ceux utilisant exclusivement des téléphones mobiles (ménages EXM), donc écarter ceux qui se servent d’un téléphone fixe ainsi que d’un téléphone mobile (ménages F-et-M), ou s’il faut, au contraire, interroger toutes les unités de l’échantillon de ménages équipés de téléphones mobiles. Nous présentons un cadre pour comparer les avantages et les inconvénients de ces deux options, ainsi qu’une méthode pour sélectionner le plan de sondage optimal. Nous établissons la répartition optimale de la taille de l’échantillon entre les deux bases de sondage et en discutons, et nous abordons le choix de la valeur optimale du paramètre de composition p pour le domaine des usagers d’un téléphone fixe ainsi que d’un téléphone mobile (F-et-M). Nous illustrons nos méthodes en les appliquant à la National Immunization Survey commanditée par les Centers for Disease Control and Prevention.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500114192
    Description :

    Nous nous intéressons à l’estimation linéaire optimale des moyennes pour des éditions subséquentes d’une enquête sous renouvellement de l’échantillon, où l’évolution temporelle des échantillons est conçue selon un schéma en cascade. Depuis la publication de l’article fondamental de Patterson (1950), on sait que, si les unités n’ont pas le droit de revenir dans l’échantillon après en être sorties pendant une certaine période (pas d’intervalles dans les schémas de renouvellement), la récursion en une étape tient pour l’estimateur optimal. Cependant, dans certaines enquêtes réelles importantes, par exemple, la Current Population Survey aux États-Unis ou l’Enquête sur la population active dans de nombreux pays européens, les unités reviennent dans l’échantillon après en avoir été absentes pendant plusieurs éditions de l’enquête (existence d’intervalles dans les schémas de renouvellement). Le cas échéant, la question de la forme de la récurrence pour l’estimateur optimal devient considérablement plus difficile. Ce problème n’a pas encore été résolu. On a plutôt élaboré des approches sous-optimales de rechange, comme l’estimation composite K (voir, par exemple, Hansen, Hurwitz, Nisselson et Steinberg (1955)), l’estimation composite AK (voir, par exemple, Gurney et Daly (1965)) ou l’approche des séries chronologiques (voir, par exemple, Binder et Hidiroglou (1988)).

    Dans le présent article, nous surmontons cette difficulté de longue date, autrement dit, nous présentons des formules de récurrence analytiques pour l’estimateur linéaire optimal de la moyenne pour des schémas de renouvellement contenant des intervalles. Ces formules sont obtenues sous certaines conditions techniques, à savoir l’HYPOTHÈSE I et l’HYPOTHÈSE II (des expériences numériques donnent à penser que ces hypothèses pourraient être universellement satisfaites). Pour atteindre l’objectif, nous élaborons une approche par opérateurs algébriques qui permet de réduire le problème de récursion pour l’estimateur linéaire optimal à deux questions : 1) la localisation des racines (éventuellement complexes) d’un polynôme Qp défini en fonction du schéma de renouvellement (le polynôme Qp s’exprime de façon pratique au moyen de polynômes de Tchebychev de la première espèce) et 2) le rang d’une matrice définie en fonction du schéma de renouvellement et des racines du polynôme Qp. En particulier, nous montrons que l’ordre de la récurrence est égal à un plus la taille de l’intervalle le plus grand dans le schéma de renouvellement. Nous donnons les formules exactes de calcul des coefficients de récurrence – naturellement, pour les utiliser il faut confirmer (dans de nombreux cas, numériquement) que les HYPOTHÈSES I et II sont satisfaites. Nous illustrons la solution à l’aide de plusieurs exemples de schémas de renouvellement tirés d’enquêtes réelles.

    Date de diffusion : 2015-06-29

  • Articles et rapports : 82-003-X201500614196
    Description :

    La présente étude examine la faisabilité et la validité de l’utilisation des numéros d’assurance-maladie personnels pour coupler de façon déterministe le Registre canadien du cancer la Base de données sur les congés des patients, afin d’obtenir des données sur les hospitalisations des personnes atteintes d’un cancer primaire.

    Date de diffusion : 2015-06-17

  • Articles et rapports : 12-001-X201400214092
    Description :

    Les méthodologistes d’enquête étudient depuis longtemps les effets des intervieweurs sur la variance des estimations d’enquête. Les modèles statistiques tenant compte des effets aléatoires des intervieweurs sont souvent intégrés à ce genre d’études, et l’intérêt de la recherche repose sur l’ampleur de la composante de la variance de l’intervieweur. Une question peut se poser au cours d’une étude méthodologique : différents groupes d’intervieweurs (p. ex. ceux ayant de l’expérience relative à une enquête donnée par rapport aux nouvelles recrues, ou les intervieweurs IPAO par rapport aux intervieweurs ITAO) ont-ils des composantes de variance considérablement différentes dans ces modèles? Des écarts importants peuvent indiquer un besoin de formation supplémentaire pour certains sous-groupes, les propriétés moins optimales de différents modes ou styles d’interview pour certaines questions d’enquête (en ce qui concerne l’erreur quadratique moyenne globale des estimations d’enquête). Les chercheurs d’enquête désirant des réponses à ces types de questions disposent de différents outils statistiques. Le présent article cherche à fournir un aperçu des approches fréquentiste et bayésienne de rechange de la comparaison des composantes de la variance dans différents groupes d’intervieweurs d’enquête, au moyen d’un cadre de modélisation linéaire généralisée hiérarchique qui tient compte de différents types de variables d’enquête. Nous considérons d’abord les avantages et les limites de chaque approche, en comparant les méthodes utilisées pour l’estimation et l’inférence. Nous présentons ensuite une étude de simulation, en évaluant de façon empirique la capacité de chaque approche d’estimer efficacement les différences entre les composantes de la variance. Nous appliquons alors les deux approches à une analyse des données d’enquête réelles recueillies dans le cadre de la National Survey of Family Growth (NSFG) aux États-Unis. Nous concluons que les deux approches ont tendance à donner des inférences très semblables et nous présentons des suggestions à mettre en pratique, compte tenu des différences subtiles observées.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 12-001-X201400214118
    Description :

    L’agrégation bootstrap est une puissante méthode de calcul utilisée pour améliorer la performance des estimateurs inefficaces. Le présent article est le premier à explorer l’utilisation de l’agrégation bootstrap dans l’estimation par sondage. Nous y examinons les effets de l’agrégation bootstrap sur les estimateurs d’enquête non différenciables, y compris les fonctions de répartition de l’échantillon et les quantiles. Les propriétés théoriques des estimateurs d’enquête agrégés par bootstrap sont examinées sous le régime fondé sur le plan de sondage et le régime fondé sur le modèle. En particulier, nous montrons la convergence par rapport au plan des estimateurs agrégés par bootstrap et obtenons la normalité asymptotique des estimateurs dans un contexte fondé sur le modèle. L’article explique comment la mise en oeuvre de l’agrégation bootstrap des estimateurs d’enquête peut tirer parti des répliques produites pour l’estimation par sondage de la variance, facilitant l’application de l’agrégation bootstrap dans les enquêtes existantes. Un autre défi important dans la mise en oeuvre de l’agrégation bootstrap en contexte d’enquête est l’estimation de la variance pour les estimateurs agrégés par bootstrap eux-mêmes, et nous examinons deux façons possibles d’estimer la variance. Les expériences par simulation révèlent une amélioration de l’estimateur par agrégation bootstrap proposé par rapport à l’estimateur original et comparent les deux approches d’estimation de la variance.

    Date de diffusion : 2014-12-19

  • Produits techniques : 11-522-X201300014278
    Description :

    En janvier et février 2014, Statistique Canada a réalisé un essai en vue de mesurer l’efficacité des diverses stratégies de collecte au moyen d’une enquête en ligne fondée sur l’autodéclaration. On a communiqué avec les unités échantillonnées en leur envoyant des lettres de présentation par la poste et on leur a demandé de répondre à l’enquête en ligne, sans contact avec un intervieweur. L’essai visait à mesurer les taux de participation à une enquête en ligne, ainsi que les profils des répondants et des non-répondants. On a mis à l’essai différents échantillons et lettres, afin de déterminer l’efficacité relative des diverses méthodes. Les résultats du projet serviront à renseigner les responsables de diverses enquêtes sociales qui se préparent à ajouter à leurs enquêtes la possibilité d’y répondre par Internet. Le document présentera la méthode générale de l’essai, ainsi que les résultats observés pendant la collecte et l’analyse des profils.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014258
    Description :

    L’Enquête sur la consommation de carburant (ECC) a été créée en 2013 et est une enquête nationale trimestrielle qui est conçue pour analyser la distance parcourue et la consommation d’essence des véhicules de passagers et d’autres véhicules pesant moins de 4 500 kilogrammes. La base de sondage est constituée de véhicules extraits des fichiers d’immatriculation de véhicules qui sont conservés par les ministères provinciaux. L’ECC utilise des puces de voiture comme mode de collecte pour une partie des unités échantillonnées, afin de recueillir des données sur les déplacements et l’essence consommée. L’utilisation de cette nouvelle technologie comporte de nombreux avantages, par exemple, la réduction du fardeau de réponse, des coûts de collecte et des effets sur la qualité des données. Pour les trimestres de 2013, 95 % des unités échantillonnées ont reçu des questionnaires papier, et 5 %, des puces de voiture, et au T1 de 2014, les données de 40 % des unités échantillonnées ont été recueillies au moyen de puces de voiture. Cette étude décrit la méthodologie du processus d’enquête, examine les avantages et les défis du traitement et de l’imputation pour les deux modes de collecte, présente certains résultats initiaux et conclut avec un sommaire des leçons apprises.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014291
    Description :

    En Allemagne, le codage des professions est effectué principalement en utilisant des dictionnaires suivies d'une révision manuelle des cas qui n'ont pas pu être codés. Puisque le codage manuel est coûteux, il est souhaitable de coder le plus de cas possible automatiquement. Parallèlement, le codage automatique doit atteindre au moins le même niveau de qualité que le codage manuel. À titre de solution possible, nous employons divers algorthmes d'apprentissage automatique pour effectuer la tâche en utilisant une quantité importante de professions codées manuellement dans le cadre d'études récentes comme données d'apprentissage. Nous déterminons la faisabilité de ces méthodes en évaluant la performance et la qualité des algorithmes.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 12-001-X201400114004
    Description :

    En 2009, deux enquêtes importantes réalisées par la division des administrations publiques du U.S. Census Bureau ont été remaniées afin de réduire la taille de l’échantillon, d’économiser des ressources et d’améliorer la précision des estimations (Cheng, Corcoran, Barth et Hogue 2009). Sous le nouveau plan de sondage, chaque strate habituelle, définie par l’État et le type d’administration publique, qui contient un nombre suffisant d’unités (administrations publiques) est divisée en deux sous strates en fonction de la masse salariale totale de chaque unité afin de tirer un plus petit échantillon de la sous strate des unités de petite taille. L’approche assistée par modèle est adoptée pour estimer les totaux de population. Des estimateurs par la régression utilisant des variables auxiliaires sont obtenus soit pour chaque sous strate ainsi créée soit pour la strate originale en regroupant des deux sous strates. Cheng, Slud et Hogue (2010) ont proposé une méthode fondée sur un test de décision qui consiste à appliquer un test d’hypothèse pour décider quel estimateur par la régression sera utilisé pour chaque strate originale. La convergence et la normalité asymptotique de ces estimateurs assistés par modèle sont établies ici sous un cadre asymptotique fondé sur le plan de sondage ou assisté par modèle. Nos résultats asymptotiques suggèrent aussi deux types d’estimateurs de variance convergents, l’un obtenu par substitution des quantités inconnues dans les variances asymptotiques et l’autre en appliquant la méthode du bootstrap. La performance de tous les estimateurs des totaux et des estimateurs de leur variance est examinée au moyen d’études empiriques. L’Annual Survey of Public Employment and Payroll (ASPEP) des États Unis est utilisé pour motiver et illustrer notre étude.

    Date de diffusion : 2014-06-27

  • Articles et rapports : 82-003-X201301011873
    Description :

    On a élaboré un modèle de simulation informatique de l'activité physique pour la population adulte canadienne à partir des données longitudinales de l'Enquête nationale sur la santé de la population et des données transversales de l'Enquête sur la santé dans les collectivités canadiennes. Ce modèle est basé sur la plateforme du Modèle de santé de la population (POHEM), élaboré par Statistique Canada. Le présent article donne un aperçu du POHEM et une description des ajouts qui y ont été faits pour créer le module de l'activité physique (POHEM-PA). Ces ajouts comprennent l'évolution du niveau dMactivité physique dans le temps et la relation entre les niveaux d'activité physique et l'espérance de vie ajustée sur la santé, l'espérance de vie et l'apparition de certains problèmes de santé chroniques. Des estimations tirées de projections obtenues par simulation sont comparées avec des données d'enquête représentatives à l'échelle nationale, fournissant ainsi une indication de la validité du POHEM-PA.

    Date de diffusion : 2013-10-16

  • Articles et rapports : 12-001-X201300111826
    Description :

    Il est courant que les organismes d'enquête fournissent des poids de rééchantillonnage dans les fichiers de données d'enquête. Ces poids de rééchantillonnage servent à produire de manière simple et systématique des estimations valides et efficaces de la variance pour divers estimateurs. Cependant, la plupart des méthodes existantes de construction de poids de rééchantillonnage ne sont valides que pour des plans d'échantillonnage particuliers et nécessitent habituellement un très grand nombre de répliques. Dans le présent article, nous montrons d'abord comment produire les poids de rééchantillonnage en se basant sur la méthode décrite dans Fay (1984) de manière que l'estimateur de la variance par rééchantillonnage résultant soit algébriquement équivalent à l'estimateur de la variance par linéarisation entièrement efficace pour tout plan d'échantillonnage donné. Puis, nous proposons une nouvelle méthode de calage des poids afin que l'estimation soit simultanément efficace et parcimonieuse au sens où un petit nombre de jeux de poids de rééchantillonnage peuvent produire des estimateurs de la variance par rééchantillonnage valides et efficaces pour les paramètres de population importants. La méthode que nous proposons peut être conjuguée aux méthodes de rééchantillonnage existantes pour les enquêtes complexes à grande échelle. Nous discutons également de la validité des méthodes proposées et de leur extension à certains plans d'échantillonnage équilibrés. Les résultats de simulations montrent que les estimateurs de variance que nous proposons suivent très bien les probabilités de couverture des intervalles de confiance. Les stratégies que nous proposons auront vraisemblablement des répercussions sur la façon de produire les fichiers de données d'enquête à grande diffusion et d'analyser ces ensembles de données.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 82-003-X201300511792
    Description :

    Le présent document décrit la mise en oeuvre de la composante sur l'air intérieur de l'Enquête canadienne sur les mesures de la santé et présente de l'information sur les taux de réponse et les résultats des échantillons de contrôle de la qualité sur le terrain.

    Date de diffusion : 2013-05-15

  • Articles et rapports : 12-001-X201200111686
    Description :

    Nous présentons une approche fondée sur des équations d'estimation généralisées pour estimer le coefficient de corrélation de concordance et le coefficient kappa d'après des données d'enquête. Les estimations ainsi que leurs erreurs-types doivent tenir compte correctement du plan d'échantillonnage. Nous présentons des mesures pondérées du coefficient de corrélation de concordance et du coefficient kappa, ainsi que la variance de ces mesures tenant compte du plan d'échantillonnage. Nous utilisons la méthode de linéarisation par série de Taylor et la procédure du jackknife pour estimer les erreurs-types des estimations résultantes des paramètres. Des mesures anthropométriques et des données sur la santé buccodentaire provenant de la Third National Health and Nutrition Examination Survey sont utilisées pour illustrer cette méthodologie.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 82-003-X201200111625
    Description :

    La présente étude compare les estimations de la prévalence de l'usage de la cigarette fondées sur des données autodéclarées aux estimations fondées sur les concentrations de cotinine urinaire. Les données proviennent de l'Enquête canadienne sur les mesures de la santé réalisée de 2007 à 2009, dans le cadre de laquelle ont été recueillies des données sur la situation d'usage du tabac autodéclarée et effectuées des mesures de la concentration de cotinine urinaire pour la première fois représentatives de la population nationale.

    Date de diffusion : 2012-02-15

  • Articles et rapports : 11-010-X201100611501
    Description :

    Un exposé détaillé sur la manière dont la croissance trimestrielle influe sur le taux de croissance annuel moyen, ce qui comprend un examen de l'importance relative des trimestres dans la détermination de la croissance. Ces principes de base sont appliqués tant à la croissance mensuelle qu'à la croissance trimestrielle.

    Date de diffusion : 2011-06-16

  • Articles et rapports : 12-001-X201000211383
    Description :

    La collecte de données en vue d'évaluer la pauvreté en Afrique prend du temps, est coûteuse et peut présenter de nombreux obstacles. Dans le présent article, nous décrivons une procédure de collecte des données auprès de ménages vivant de la pêche continentale artisanale, ainsi que d'activités agricoles. Un plan d'échantillonnage a été établi afin de tenir compte de l'hétérogénéité des conditions écologiques et de la saisonnalité des moyens de subsistance possibles. Ce plan d'échantillonnage comprend une enquête par panel en trois points auprès de 300 ménages. Les répondants appartiennent à quatre groupes ethniques distincts sélectionnés aléatoirement parmi trois strates, chacune représentant une zone écologique différente. La première partie de l'article donne des renseignements contextuels sur les objectifs de la recherche, le lieu de l'étude et le plan de sondage, qui ont orienté le processus de collecte des données. La deuxième partie de l'article offre une discussion des obstacles qui entravent habituellement les travaux empiriques en Afrique subsaharienne et montre comment divers problèmes ont été résolus. Ces leçons pourraient aider les chercheurs à concevoir des enquêtes socioéconomiques appropriées dans des conditions comparables.

    Date de diffusion : 2010-12-21

Données (0)

Données (0) (Aucun résultat)

Votre recherche pour «» n’a donné aucun résultat dans la présente section du site.

Vous pouvez essayer :

Analyses (58)

Analyses (58) (25 of 58 results)

  • Articles et rapports : 82-003-X201700614829
    Description :

    Le POHEM-IMC est un outil de microsimulation comprenant un modèle de l’IMC chez les adultes et un modèle des antécédents en matière d’IMC pendant l’enfance. Cet aperçu décrit l’élaboration de modèles de prédiction de l’IMC chez les adultes et des antécédents en matière d’IMC pendant l’enfance, et compare les estimations de l’IMC projetées aux estimations issues de données d’enquête représentatives de la population canadienne pour en établir la validité.

    Date de diffusion : 2017-06-21

  • Articles et rapports : 82-003-X201601014665
    Description :

    La présente analyse avait pour but d’élaborer, à partir des données de l’Enquête canadienne sur les mesures de la santé pour la période allant de 2007 à 2013, des équations de référence pour évaluer la force de préhension maximale de la main droite et de la main gauche des Canadiens de 6 à 79 ans, d’après une population en santé représentative à l’échelle nationale. Ces équations peuvent servir à déterminer les valeurs de référence aux fins d’évaluation de la force de préhension d’une personne en particulier.

    Date de diffusion : 2016-10-19

  • Articles et rapports : 82-003-X201600114306
    Description :

    Le présent article donne un aperçu de la création, du contenu et de la qualité de la Base de données sur la cohorte canadienne de naissance du Recensement de 2006.

    Date de diffusion : 2016-01-20

  • Articles et rapports : 12-001-X201500214237
    Description :

    La bonne conception d’une enquête téléphonique par composition aléatoire (CA) à partir d’une base de sondage double requiert de choisir entre de nombreuses options, en faisant la part des différences de coût, de précision, et de couverture, afin d’optimiser la réalisation des objectifs de l’étude. L’un des éléments à prendre en considération est celui de savoir s’il faut présélectionner les ménages équipés de téléphones mobiles et n’interroger que ceux utilisant exclusivement des téléphones mobiles (ménages EXM), donc écarter ceux qui se servent d’un téléphone fixe ainsi que d’un téléphone mobile (ménages F-et-M), ou s’il faut, au contraire, interroger toutes les unités de l’échantillon de ménages équipés de téléphones mobiles. Nous présentons un cadre pour comparer les avantages et les inconvénients de ces deux options, ainsi qu’une méthode pour sélectionner le plan de sondage optimal. Nous établissons la répartition optimale de la taille de l’échantillon entre les deux bases de sondage et en discutons, et nous abordons le choix de la valeur optimale du paramètre de composition p pour le domaine des usagers d’un téléphone fixe ainsi que d’un téléphone mobile (F-et-M). Nous illustrons nos méthodes en les appliquant à la National Immunization Survey commanditée par les Centers for Disease Control and Prevention.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500114192
    Description :

    Nous nous intéressons à l’estimation linéaire optimale des moyennes pour des éditions subséquentes d’une enquête sous renouvellement de l’échantillon, où l’évolution temporelle des échantillons est conçue selon un schéma en cascade. Depuis la publication de l’article fondamental de Patterson (1950), on sait que, si les unités n’ont pas le droit de revenir dans l’échantillon après en être sorties pendant une certaine période (pas d’intervalles dans les schémas de renouvellement), la récursion en une étape tient pour l’estimateur optimal. Cependant, dans certaines enquêtes réelles importantes, par exemple, la Current Population Survey aux États-Unis ou l’Enquête sur la population active dans de nombreux pays européens, les unités reviennent dans l’échantillon après en avoir été absentes pendant plusieurs éditions de l’enquête (existence d’intervalles dans les schémas de renouvellement). Le cas échéant, la question de la forme de la récurrence pour l’estimateur optimal devient considérablement plus difficile. Ce problème n’a pas encore été résolu. On a plutôt élaboré des approches sous-optimales de rechange, comme l’estimation composite K (voir, par exemple, Hansen, Hurwitz, Nisselson et Steinberg (1955)), l’estimation composite AK (voir, par exemple, Gurney et Daly (1965)) ou l’approche des séries chronologiques (voir, par exemple, Binder et Hidiroglou (1988)).

    Dans le présent article, nous surmontons cette difficulté de longue date, autrement dit, nous présentons des formules de récurrence analytiques pour l’estimateur linéaire optimal de la moyenne pour des schémas de renouvellement contenant des intervalles. Ces formules sont obtenues sous certaines conditions techniques, à savoir l’HYPOTHÈSE I et l’HYPOTHÈSE II (des expériences numériques donnent à penser que ces hypothèses pourraient être universellement satisfaites). Pour atteindre l’objectif, nous élaborons une approche par opérateurs algébriques qui permet de réduire le problème de récursion pour l’estimateur linéaire optimal à deux questions : 1) la localisation des racines (éventuellement complexes) d’un polynôme Qp défini en fonction du schéma de renouvellement (le polynôme Qp s’exprime de façon pratique au moyen de polynômes de Tchebychev de la première espèce) et 2) le rang d’une matrice définie en fonction du schéma de renouvellement et des racines du polynôme Qp. En particulier, nous montrons que l’ordre de la récurrence est égal à un plus la taille de l’intervalle le plus grand dans le schéma de renouvellement. Nous donnons les formules exactes de calcul des coefficients de récurrence – naturellement, pour les utiliser il faut confirmer (dans de nombreux cas, numériquement) que les HYPOTHÈSES I et II sont satisfaites. Nous illustrons la solution à l’aide de plusieurs exemples de schémas de renouvellement tirés d’enquêtes réelles.

    Date de diffusion : 2015-06-29

  • Articles et rapports : 82-003-X201500614196
    Description :

    La présente étude examine la faisabilité et la validité de l’utilisation des numéros d’assurance-maladie personnels pour coupler de façon déterministe le Registre canadien du cancer la Base de données sur les congés des patients, afin d’obtenir des données sur les hospitalisations des personnes atteintes d’un cancer primaire.

    Date de diffusion : 2015-06-17

  • Articles et rapports : 12-001-X201400214092
    Description :

    Les méthodologistes d’enquête étudient depuis longtemps les effets des intervieweurs sur la variance des estimations d’enquête. Les modèles statistiques tenant compte des effets aléatoires des intervieweurs sont souvent intégrés à ce genre d’études, et l’intérêt de la recherche repose sur l’ampleur de la composante de la variance de l’intervieweur. Une question peut se poser au cours d’une étude méthodologique : différents groupes d’intervieweurs (p. ex. ceux ayant de l’expérience relative à une enquête donnée par rapport aux nouvelles recrues, ou les intervieweurs IPAO par rapport aux intervieweurs ITAO) ont-ils des composantes de variance considérablement différentes dans ces modèles? Des écarts importants peuvent indiquer un besoin de formation supplémentaire pour certains sous-groupes, les propriétés moins optimales de différents modes ou styles d’interview pour certaines questions d’enquête (en ce qui concerne l’erreur quadratique moyenne globale des estimations d’enquête). Les chercheurs d’enquête désirant des réponses à ces types de questions disposent de différents outils statistiques. Le présent article cherche à fournir un aperçu des approches fréquentiste et bayésienne de rechange de la comparaison des composantes de la variance dans différents groupes d’intervieweurs d’enquête, au moyen d’un cadre de modélisation linéaire généralisée hiérarchique qui tient compte de différents types de variables d’enquête. Nous considérons d’abord les avantages et les limites de chaque approche, en comparant les méthodes utilisées pour l’estimation et l’inférence. Nous présentons ensuite une étude de simulation, en évaluant de façon empirique la capacité de chaque approche d’estimer efficacement les différences entre les composantes de la variance. Nous appliquons alors les deux approches à une analyse des données d’enquête réelles recueillies dans le cadre de la National Survey of Family Growth (NSFG) aux États-Unis. Nous concluons que les deux approches ont tendance à donner des inférences très semblables et nous présentons des suggestions à mettre en pratique, compte tenu des différences subtiles observées.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 12-001-X201400214118
    Description :

    L’agrégation bootstrap est une puissante méthode de calcul utilisée pour améliorer la performance des estimateurs inefficaces. Le présent article est le premier à explorer l’utilisation de l’agrégation bootstrap dans l’estimation par sondage. Nous y examinons les effets de l’agrégation bootstrap sur les estimateurs d’enquête non différenciables, y compris les fonctions de répartition de l’échantillon et les quantiles. Les propriétés théoriques des estimateurs d’enquête agrégés par bootstrap sont examinées sous le régime fondé sur le plan de sondage et le régime fondé sur le modèle. En particulier, nous montrons la convergence par rapport au plan des estimateurs agrégés par bootstrap et obtenons la normalité asymptotique des estimateurs dans un contexte fondé sur le modèle. L’article explique comment la mise en oeuvre de l’agrégation bootstrap des estimateurs d’enquête peut tirer parti des répliques produites pour l’estimation par sondage de la variance, facilitant l’application de l’agrégation bootstrap dans les enquêtes existantes. Un autre défi important dans la mise en oeuvre de l’agrégation bootstrap en contexte d’enquête est l’estimation de la variance pour les estimateurs agrégés par bootstrap eux-mêmes, et nous examinons deux façons possibles d’estimer la variance. Les expériences par simulation révèlent une amélioration de l’estimateur par agrégation bootstrap proposé par rapport à l’estimateur original et comparent les deux approches d’estimation de la variance.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 12-001-X201400114004
    Description :

    En 2009, deux enquêtes importantes réalisées par la division des administrations publiques du U.S. Census Bureau ont été remaniées afin de réduire la taille de l’échantillon, d’économiser des ressources et d’améliorer la précision des estimations (Cheng, Corcoran, Barth et Hogue 2009). Sous le nouveau plan de sondage, chaque strate habituelle, définie par l’État et le type d’administration publique, qui contient un nombre suffisant d’unités (administrations publiques) est divisée en deux sous strates en fonction de la masse salariale totale de chaque unité afin de tirer un plus petit échantillon de la sous strate des unités de petite taille. L’approche assistée par modèle est adoptée pour estimer les totaux de population. Des estimateurs par la régression utilisant des variables auxiliaires sont obtenus soit pour chaque sous strate ainsi créée soit pour la strate originale en regroupant des deux sous strates. Cheng, Slud et Hogue (2010) ont proposé une méthode fondée sur un test de décision qui consiste à appliquer un test d’hypothèse pour décider quel estimateur par la régression sera utilisé pour chaque strate originale. La convergence et la normalité asymptotique de ces estimateurs assistés par modèle sont établies ici sous un cadre asymptotique fondé sur le plan de sondage ou assisté par modèle. Nos résultats asymptotiques suggèrent aussi deux types d’estimateurs de variance convergents, l’un obtenu par substitution des quantités inconnues dans les variances asymptotiques et l’autre en appliquant la méthode du bootstrap. La performance de tous les estimateurs des totaux et des estimateurs de leur variance est examinée au moyen d’études empiriques. L’Annual Survey of Public Employment and Payroll (ASPEP) des États Unis est utilisé pour motiver et illustrer notre étude.

    Date de diffusion : 2014-06-27

  • Articles et rapports : 82-003-X201301011873
    Description :

    On a élaboré un modèle de simulation informatique de l'activité physique pour la population adulte canadienne à partir des données longitudinales de l'Enquête nationale sur la santé de la population et des données transversales de l'Enquête sur la santé dans les collectivités canadiennes. Ce modèle est basé sur la plateforme du Modèle de santé de la population (POHEM), élaboré par Statistique Canada. Le présent article donne un aperçu du POHEM et une description des ajouts qui y ont été faits pour créer le module de l'activité physique (POHEM-PA). Ces ajouts comprennent l'évolution du niveau dMactivité physique dans le temps et la relation entre les niveaux d'activité physique et l'espérance de vie ajustée sur la santé, l'espérance de vie et l'apparition de certains problèmes de santé chroniques. Des estimations tirées de projections obtenues par simulation sont comparées avec des données d'enquête représentatives à l'échelle nationale, fournissant ainsi une indication de la validité du POHEM-PA.

    Date de diffusion : 2013-10-16

  • Articles et rapports : 12-001-X201300111826
    Description :

    Il est courant que les organismes d'enquête fournissent des poids de rééchantillonnage dans les fichiers de données d'enquête. Ces poids de rééchantillonnage servent à produire de manière simple et systématique des estimations valides et efficaces de la variance pour divers estimateurs. Cependant, la plupart des méthodes existantes de construction de poids de rééchantillonnage ne sont valides que pour des plans d'échantillonnage particuliers et nécessitent habituellement un très grand nombre de répliques. Dans le présent article, nous montrons d'abord comment produire les poids de rééchantillonnage en se basant sur la méthode décrite dans Fay (1984) de manière que l'estimateur de la variance par rééchantillonnage résultant soit algébriquement équivalent à l'estimateur de la variance par linéarisation entièrement efficace pour tout plan d'échantillonnage donné. Puis, nous proposons une nouvelle méthode de calage des poids afin que l'estimation soit simultanément efficace et parcimonieuse au sens où un petit nombre de jeux de poids de rééchantillonnage peuvent produire des estimateurs de la variance par rééchantillonnage valides et efficaces pour les paramètres de population importants. La méthode que nous proposons peut être conjuguée aux méthodes de rééchantillonnage existantes pour les enquêtes complexes à grande échelle. Nous discutons également de la validité des méthodes proposées et de leur extension à certains plans d'échantillonnage équilibrés. Les résultats de simulations montrent que les estimateurs de variance que nous proposons suivent très bien les probabilités de couverture des intervalles de confiance. Les stratégies que nous proposons auront vraisemblablement des répercussions sur la façon de produire les fichiers de données d'enquête à grande diffusion et d'analyser ces ensembles de données.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 82-003-X201300511792
    Description :

    Le présent document décrit la mise en oeuvre de la composante sur l'air intérieur de l'Enquête canadienne sur les mesures de la santé et présente de l'information sur les taux de réponse et les résultats des échantillons de contrôle de la qualité sur le terrain.

    Date de diffusion : 2013-05-15

  • Articles et rapports : 12-001-X201200111686
    Description :

    Nous présentons une approche fondée sur des équations d'estimation généralisées pour estimer le coefficient de corrélation de concordance et le coefficient kappa d'après des données d'enquête. Les estimations ainsi que leurs erreurs-types doivent tenir compte correctement du plan d'échantillonnage. Nous présentons des mesures pondérées du coefficient de corrélation de concordance et du coefficient kappa, ainsi que la variance de ces mesures tenant compte du plan d'échantillonnage. Nous utilisons la méthode de linéarisation par série de Taylor et la procédure du jackknife pour estimer les erreurs-types des estimations résultantes des paramètres. Des mesures anthropométriques et des données sur la santé buccodentaire provenant de la Third National Health and Nutrition Examination Survey sont utilisées pour illustrer cette méthodologie.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 82-003-X201200111625
    Description :

    La présente étude compare les estimations de la prévalence de l'usage de la cigarette fondées sur des données autodéclarées aux estimations fondées sur les concentrations de cotinine urinaire. Les données proviennent de l'Enquête canadienne sur les mesures de la santé réalisée de 2007 à 2009, dans le cadre de laquelle ont été recueillies des données sur la situation d'usage du tabac autodéclarée et effectuées des mesures de la concentration de cotinine urinaire pour la première fois représentatives de la population nationale.

    Date de diffusion : 2012-02-15

  • Articles et rapports : 11-010-X201100611501
    Description :

    Un exposé détaillé sur la manière dont la croissance trimestrielle influe sur le taux de croissance annuel moyen, ce qui comprend un examen de l'importance relative des trimestres dans la détermination de la croissance. Ces principes de base sont appliqués tant à la croissance mensuelle qu'à la croissance trimestrielle.

    Date de diffusion : 2011-06-16

  • Articles et rapports : 12-001-X201000211383
    Description :

    La collecte de données en vue d'évaluer la pauvreté en Afrique prend du temps, est coûteuse et peut présenter de nombreux obstacles. Dans le présent article, nous décrivons une procédure de collecte des données auprès de ménages vivant de la pêche continentale artisanale, ainsi que d'activités agricoles. Un plan d'échantillonnage a été établi afin de tenir compte de l'hétérogénéité des conditions écologiques et de la saisonnalité des moyens de subsistance possibles. Ce plan d'échantillonnage comprend une enquête par panel en trois points auprès de 300 ménages. Les répondants appartiennent à quatre groupes ethniques distincts sélectionnés aléatoirement parmi trois strates, chacune représentant une zone écologique différente. La première partie de l'article donne des renseignements contextuels sur les objectifs de la recherche, le lieu de l'étude et le plan de sondage, qui ont orienté le processus de collecte des données. La deuxième partie de l'article offre une discussion des obstacles qui entravent habituellement les travaux empiriques en Afrique subsaharienne et montre comment divers problèmes ont été résolus. Ces leçons pourraient aider les chercheurs à concevoir des enquêtes socioéconomiques appropriées dans des conditions comparables.

    Date de diffusion : 2010-12-21

  • Articles et rapports : 12-001-X201000211382
    Description :

    Aux États-Unis, la taille de la population dotée d'un téléphone mobile seulement a augmenté rapidement ces dernières années et, par conséquent, les chercheurs ont commencé à expérimenter l'échantillonnage et l'interview des abonnés à la téléphonie mobile. Nous discutons des problèmes statistiques que posent les étapes de l'établissement du plan d'échantillonnage et de l'estimation des études par téléphone mobile. Les travaux sont exposés principalement dans le contexte d'une enquête à deux bases de sondage non chevauchantes dans laquelle une base et un échantillon sont employés pour la population possédant un téléphone fixe et une deuxième base de sondage et un deuxième échantillon, pour la population possédant seulement un téléphone mobile. Nous discutons également des aspects supplémentaires dont il faut tenir compte dans le cas d'une enquête à deux bases de sondage chevauchantes (où la base de sondage et l'échantillon pour la téléphonie mobile comprennent certains membres de la population dotée d'un téléphone fixe). Pour illustrer les méthodes, nous utilisons le plan de sondage de la National Immunization Survey (NIS) conçue pour surveiller les taux de vaccination chez les enfants de 19 à 35 mois et les adolescents de 13 à 17 ans. La NIS est une enquête téléphonique nationale, suivie d'une vérification des dossiers des fournisseurs de service, réalisée par les Centers for Disease Control and Prevention.

    Date de diffusion : 2010-12-21

  • Articles et rapports : 11-010-X201001111370
    Description :

    Un aperçu de la manière dont ces différentes mesures sont liées les unes aux autres, du moment auquel elles devraient être utilisées et des raisons pour lesquelles les agences statistiques ont élaboré des mesures plus sophistiquées pour les données en volume.

    Date de diffusion : 2010-11-12

  • Articles et rapports : 11-010-X201000311141
    Description :

    Un examen de la désaisonnalisation et de la manière dont elle peut aider les analystes à se concentrer sur les mouvements récents de la tendance sous-jacente des données économiques.

    Date de diffusion : 2010-03-18

  • Articles et rapports : 12-001-X200900211046
    Description :

    Nous élaborons un modèle de régression semiparamétrique pour les enquêtes complexes. Dans ce modèle, les variables explicatives sont représentées séparément sous forme d'une partie non paramétrique et d'une partie linéaire paramétrique. Les méthodes d'estimation combinent l'estimation par la régression polynomiale locale non paramétrique et l'estimation par les moindres carrés. Nous élaborons également des résultats asymptotiques, tels que la convergence et la normalité des estimateurs des coefficients de régression et des fonctions de régression. Nous recourrons à la simulation et à des exemples empiriques tirés de l'Enquête sur la santé en Ontario de 1990 pour illustrer la performance de la méthode et les propriétés des estimations.

    Date de diffusion : 2009-12-23

  • Articles et rapports : 82-003-X200900110795
    Description :

    Cet article décrit des méthodes de combinaison des divers cycles de l'Enquête sur la santé dans les collectivités canadiennes et discute des problèmes dont il convient de tenir compte si ces données sont combinées.

    Date de diffusion : 2009-02-18

  • Articles et rapports : 12-001-X200800210756
    Description :

    Dans les enquêtes longitudinales, la non-réponse survient souvent selon un schéma non monotone. Nous considérons l'estimation des moyennes dépendantes du temps sous l'hypothèse que le mécanisme de non-réponse dépend de la dernière valeur. Puisque cette dernière valeur peut elle-même manquer quand la non-réponse est non monotone, le mécanisme de non-réponse examiné est non ignorable. Nous proposons une méthode d'imputation qui consiste à établir d'abord certains modèles d'imputation par la régression en fonction du mécanisme de non-réponse, puis à appliquer l'imputation par la régression non paramétrique. Nous supposons que les données longitudinales suivent une chaîne de Markov admettant des moments finis de deuxième ordre. Aucune autre contrainte n'est imposée à la distribution conjointe des données longitudinales et à leurs indicateurs de non-réponse. La variance est estimée par une méthode du bootstrap. Nous présentons certains résultats de simulation et un exemple concernant une enquête sur l'emploi.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 12-001-X200800110613
    Description :

    L'enquête réalisée par la Chine dans le cadre du projet International Tobacco Control (ITC) Policy Evaluation Survey comprend un plan d'échantillonnage à plusieurs degrés avec probabilités inégales où les grappes du niveau supérieur sont sélectionnées par la méthode d'échantillonnage PPT systématique randomisé. Durant l'exécution de l'enquête, il faut résoudre le problème suivant : plusieurs grappes de niveau supérieur échantillonnées refusent de participer à l'enquête et doivent être remplacées par des unités de substitution sélectionnées parmi les unités non incluses dans l'échantillon initial, de nouveau par la méthode d'échantillonnage PPT systématique randomisé. Dans de telles conditions, les probabilités d'inclusion de premier ordre des unités finales sélectionnées sont très difficiles à calculer et la détermination des probabilités d'inclusion de deuxième ordre devient pratiquement impossible. Dans le présent article, nous élaborons une méthode fondée sur la simulation pour calculer les probabilités d'inclusion de premier et de deuxième ordre lorsque le calcul direct est prohibitif ou impossible. Nous démontrons l'efficacité et la faisabilité de la méthode que nous proposons en nous appuyant sur des considérations théoriques et des exemples numériques. Nous incluons plusieurs fonctions et codes R/S PLUS pour la procédure proposée. La méthode peut être étendue à des situations de refus/substitution plus complexes susceptibles de survenir en pratique.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 12-001-X200800110619
    Description :

    La prédiction sur petits domaines fondée sur des effets aléatoires, appelée (MPLSBE), est une méthode de construction d'estimations pour de petites régions géographiques ou de petites sous populations en utilisant les données d'enquête existantes. Souvent, le total des prédicteurs sur petits domaines est forcé d'être égal à l'estimation par sondage directe et ces prédicteurs sont alors dits calés. Nous passons en revue plusieurs prédicteurs calés et présentons un critère qui unifie leur calcul. Nous dérivons celui qui est l'unique meilleur prédicteur linéaire sans biais sous ce critère et discutons de l'erreur quadratique moyenne des prédicteurs calés. L'imposition de la contrainte comporte implicitement la possibilité que le modèle de petit domaine soit spécifié incorrectement et que les prédicteurs présentent un biais. Nous étudions des modèles augmentés contenant une variable explicative supplémentaire pour lesquels les prédicteurs sur petits domaines ordinaires présentent la propriété d'autocalage. Nous démontrons à l'aide de simulations que les prédicteurs calés ont un biais un peu plus faible que le prédicteur MPLSBE habituel. Cependant, si le biais est une préoccupation, une meilleure approche consiste à utiliser un modèle augmenté contenant une variable auxiliaire supplémentaire qui est fonction de la taille du domaine. Dans les simulations, les prédicteurs fondés sur le modèle augmenté ont une EQM plus petite que MPLSBE quand le modèle incorrect est utilisé pour la prédiction. De surcroît, l'EQM augmente très légèrement comparativement à celle de MPLSBE si la variable auxiliaire est ajoutée au modèle correct.

    Date de diffusion : 2008-06-26

  • Articles et rapports : 82-003-S200700010366
    Description :

    Le présent article décrit certaines des exigences et procédures logistiques et opérationnelles relatives aux activités menées en clinique aux fins de l' Enquête canadienne sur les mesures de la santé.

    Date de diffusion : 2007-12-05

Références (58)

Références (58) (25 of 58 results)

  • Produits techniques : 11-522-X201700014741
    Description :

    Le mandat de Statistique Canada comprend la production de données statistiques en vue de faire la lumière sur les questions d’actualité touchant les entreprises. Le couplage des enregistrements de données d’entreprises est un aspect important de l’élaboration, de la production, de l’évaluation et de l’analyse de ces données statistiques. Comme le couplage d’enregistrements peut faire intrusion dans la vie privée, Statistique Canada n’y recourt que si l’intérêt public est manifeste et l’emporte sur les inconvénients de l’intrusion. Le couplage d’enregistrements connaît un renouveau déclenché par un usage plus important de données administratives par un grand nombre de programmes statistiques. Le couplage d’enregistrements de données d’entreprises pose de nombreux défis. Par exemple, plusieurs fichiers administratifs ne contiennent pas d’identificateurs communs, les données sont consignées dans des formats non normalisés, certaines données contiennent des erreurs typographiques, les fichiers de données administratives sont habituellement de grande taille, et enfin, l’évaluation de multiples paires d’enregistrements rend les comparaisons absolues difficiles, voire parfois impossibles. Étant donné l’importance et les défis du couplage d’enregistrements, Statistique Canada a élaboré une norme en vue d’aider les utilisateurs à optimiser leur processus de couplage d’enregistrements de données d’entreprises. Ainsi, ce processus comprend l’exploitation d’une stratégie de groupement des enregistrements qui réduit le nombre de paires d’enregistrements à comparer et à apparier, l’utilisation d’un logiciel interne de Statistique Canada pour procéder à des couplages déterministes et probabilistes, et la création de champs standardisés pour le nom et l’adresse des entreprises dans le Registre des entreprises de Statistique Canada. Le présent article donne un aperçu de la méthode de couplage d’enregistrements de données d’entreprises et examine divers projets économiques qui font appel au couplage d’enregistrements à Statistique Canada, notamment dans les domaines des Comptes nationaux, du commerce international, de l’agriculture et du Registre des entreprises.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014733
    Description :

    La valeur sociale des collectes de données est améliorée de façon marquée par la vaste diffusion des fichiers de recherche et l’augmentation en découlant de la productivité scientifique. À l’heure actuelle, la plupart des études sont conçues en vue de recueillir des données utiles et exactes au niveau analytique, en se préoccupant peu de la façon dont elles seront mises en commun. Tant les ouvrages publiés que la pratique reposent sur le principe que l’analyse de la divulgation aura lieu après la collecte. Toutefois, pour produire des données à grande diffusion comportant la plus grande utilité analytique possible pour le groupe d’utilisateurs le plus important, on doit tenir compte du risque de divulgation au début du processus de recherche. À partir de cadres théoriques de décisions économiques et statistiques et de recherches en méthodes d’enquête, cette communication vise à améliorer la productivité scientifique des données de recherche partagées en décrivant comment le risque de divulgation peut être résolu aux étapes les plus précoces de la recherche, grâce à la formulation de « plans sécuritaires » et de « simulations de divulgation », une approche statistique appliquée ayant été adoptée pour : 1) l’élaboration et la validation de modèles qui prédisent la composition des données d’enquête selon différents plans d’échantillonnage; 2) la sélection et/ou l’élaboration de mesures et de méthodes utilisées pour déterminer le risque de divulgation, l’utilité analytique et les coûts de la divulgation des données d’enquête qui conviennent le mieux pour l’évaluation des plans d’échantillonnage et de bases de données; et 3) la tenue de simulations pour recueillir des estimations du risque, de l’utilité et du coût des études comportant une vaste gamme de caractéristiques d’échantillonnage et de conception de bases de données.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014744
    Description :

    La présentation débutera avec un résumé de la recherche réalisée sur la qualité et l’utilité des paradonnées recueillies dans le cadre de la National Survey of Family Growth (NSFG) aux États Unis. La NSFG est une grande enquête nationale sur la fécondité aux États Unis qui est, pour les décideurs, une source importante de données sur l’activité sexuelle, le comportement sexuel et la santé génésique. Depuis de nombreuses années, la NSFG a permis de recueillir diverses formes de paradonnées, y compris les données issues de frappes au clavier (p. ex., Couper et Kreuter 2013), les renseignements du registre des appels, les renseignements détaillés sur les décisions concernant les cas, et les observations des intervieweurs associées aux principales mesures de la NSFG (p. ex., West 2013). Ensuite, certains défis que pose l’utilisation de ces données seront discutés, ainsi que des preuves de leur utilité pour la correction de la non réponse, l’évaluation des intervieweurs et/ou l’utilisation de plans de collecte adaptatifs. Troisièmement, des travaux de recherche seront présentés portant sur l’utilisation des paradonnées recueillies dans le cadre de deux enquêtes par panel, à savoir la Medical Expenditure Panel Survey (MEPS) réalisée aux États Unis et la Panel Labour Market and Social Security (PASS) réalisée en Allemagne. Dans les deux enquêtes, l’information émanant des prises de contact lors de vagues antérieures a été utilisée expérimentalement en vue d’améliorer les taux de prise de contact et de réponse lors des vagues subséquentes. On présentera aussi des travaux de recherche portant sur la PASS dans le cadre desquels des données d’observation des intervieweurs concernant d’importantes variables de résultats ont été recueillies en vue de prendre des décisions quant à la correction de la non réponse ou l’utilisation d’un plan de collecte adaptatif. Cette présentation ne couvrira pas seulement des résultats de la recherche, mais aussi des défis pratiques liés à la mise en œuvre de la collecte et à l’utilisation des deux ensembles de paradonnées.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014731
    Description :

    Cette communication décrit divers facteurs qui posent un problème lorsque l’on évalue le risque de divulgation de microdonnées contextualisées, ainsi que certaines des étapes empiriques qui sont comprises dans leur évaluation. À partir d’ensembles synthétiques de répondants d’enquête, nous illustrons comment différents postulats modulent l’évolution du risque lorsque l’on tient compte : 1) des probabilités estimées que des régions géographiques non identifiées soient représentées dans une enquête; 2) du nombre de personnes dans la population qui partagent les mêmes identificateurs personnels et contextuels qu’un répondant; et 3) de l’ampleur prévue de l’erreur de couverture dans les chiffres de population du recensement et les fichiers existants qui fournissent des données d’identification (p. ex., le nom, l’adresse).

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014708
    Description :

    Le programme de bases de sondage pour les enquêtes auprès des ménages (BSEM) de Statistique Canada fournit différents produits qui peuvent être utilisés seuls ou en combinaison afin d’améliorer la conception d’enquêtes au niveau de l’échantillonnage, de la collecte et du traitement et ce, selon le modèle traditionnel dans lequel on contacte un ménage. Alors que les enquêtes migrent toujours vers cet ensemble de produits de base, le programme de BSEM commence à planifier les changements qui seront requis à l’infrastructure, à l’organisation et aux liens avec d’autres sources de données de Statistique Canada afin de permettre l’évolution vers une utilisation accrue d’une multitude de sources de données administratives en tant qu’intrants au programme des statistiques sociales. La présentation fournira d’abord un aperçu du programme courant de BSEM. Elle identifiera ensuite les concepts de base qui devront être mis en œuvre dans le but d’augmenter le potentiel de couplage des enregistrements et se conclura en présentant la recherche stratégique qui sera menée d’ici au recensement de 2021.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014748
    Description :

    Cette communication décrit la constitution d'une base de données élaborée en Suisse en vue de l’analyse de la migration et de l’intégration structurelle de la population d’origine étrangère. Cette base de données repose sur différents registres (registre des habitants, des assurances sociales, du chômage) et enquêtes et couvre 15 années (1998 à 2013). Des informations sur le statut migratoire et les caractéristiques socioéconomiques sont ainsi disponibles pour près de 4 millions d'étrangers ayant séjourné en Suisse entre 1998 et 2013. Cette base de données est le fruit d’une collaboration entre l’Office fédéral de la statistique et des chercheurs du NCCR On the Move.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201300014278
    Description :

    En janvier et février 2014, Statistique Canada a réalisé un essai en vue de mesurer l’efficacité des diverses stratégies de collecte au moyen d’une enquête en ligne fondée sur l’autodéclaration. On a communiqué avec les unités échantillonnées en leur envoyant des lettres de présentation par la poste et on leur a demandé de répondre à l’enquête en ligne, sans contact avec un intervieweur. L’essai visait à mesurer les taux de participation à une enquête en ligne, ainsi que les profils des répondants et des non-répondants. On a mis à l’essai différents échantillons et lettres, afin de déterminer l’efficacité relative des diverses méthodes. Les résultats du projet serviront à renseigner les responsables de diverses enquêtes sociales qui se préparent à ajouter à leurs enquêtes la possibilité d’y répondre par Internet. Le document présentera la méthode générale de l’essai, ainsi que les résultats observés pendant la collecte et l’analyse des profils.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014258
    Description :

    L’Enquête sur la consommation de carburant (ECC) a été créée en 2013 et est une enquête nationale trimestrielle qui est conçue pour analyser la distance parcourue et la consommation d’essence des véhicules de passagers et d’autres véhicules pesant moins de 4 500 kilogrammes. La base de sondage est constituée de véhicules extraits des fichiers d’immatriculation de véhicules qui sont conservés par les ministères provinciaux. L’ECC utilise des puces de voiture comme mode de collecte pour une partie des unités échantillonnées, afin de recueillir des données sur les déplacements et l’essence consommée. L’utilisation de cette nouvelle technologie comporte de nombreux avantages, par exemple, la réduction du fardeau de réponse, des coûts de collecte et des effets sur la qualité des données. Pour les trimestres de 2013, 95 % des unités échantillonnées ont reçu des questionnaires papier, et 5 %, des puces de voiture, et au T1 de 2014, les données de 40 % des unités échantillonnées ont été recueillies au moyen de puces de voiture. Cette étude décrit la méthodologie du processus d’enquête, examine les avantages et les défis du traitement et de l’imputation pour les deux modes de collecte, présente certains résultats initiaux et conclut avec un sommaire des leçons apprises.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X201300014291
    Description :

    En Allemagne, le codage des professions est effectué principalement en utilisant des dictionnaires suivies d'une révision manuelle des cas qui n'ont pas pu être codés. Puisque le codage manuel est coûteux, il est souhaitable de coder le plus de cas possible automatiquement. Parallèlement, le codage automatique doit atteindre au moins le même niveau de qualité que le codage manuel. À titre de solution possible, nous employons divers algorthmes d'apprentissage automatique pour effectuer la tâche en utilisant une quantité importante de professions codées manuellement dans le cadre d'études récentes comme données d'apprentissage. Nous déterminons la faisabilité de ces méthodes en évaluant la performance et la qualité des algorithmes.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X200800011010
    Description :

    L'Enquête sur l'emploi, la rémunération et les heures de travail (EERH) est une enquête mensuelle qui utilise deux sources de données : un recensement des formulaires de retenues sur la paye (PD7) (données administratives) et une enquête auprès des établissements. Le présent document est axé sur le traitement des données administratives, de la réception hebdomadaire des données de l'Agence du revenu du Canada à la production d'estimations mensuelles par les responsables de l'EERH.

    Les méthodes de contrôle et d'imputation utilisées pour traiter les données administratives ont été révisées au cours des dernières années. Les objectifs de ce remaniement étaient principalement d'améliorer la qualité des données et l'uniformité avec une autre source de données administratives (T4), qui constitue une mesure repère pour les responsables du Système de comptabilité nationale de Statistique Canada. On visait en outre à s'assurer que le nouveau processus serait plus facile à comprendre et à modifier, au besoin. Par conséquent, un nouveau module de traitement a été élaboré pour contrôler et imputer les formulaires PD7, avant l'agrégation des données au niveau mensuel.

    Le présent document comporte un aperçu des processus actuel et nouveau, y compris une description des défis auxquels nous avons fait face pendant l'élaboration. L'amélioration de la qualité est démontrée à la fois au niveau conceptuel (grâce à des exemples de formulaires PD7 et à leur traitement au moyen de l'ancien et du nouveau systèmes) et quantitativement (en comparaison avec les données T4).

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010946
    Description :

    Au milieu des années 1990, l'Office for National Statistics (ONS) du Royaume-Uni a créé sa première unité de mise à l'essai des questions. L'objectif principal était d'élaborer et de tester les questions et le questionnaire du Recensement de 2001. Depuis, le domaine a été élargi et l'unité est devenue un centre d'expertise en Méthodologie de collecte des données (MCD) qui fait maintenant partie de la Direction générale de la méthodologie. Le centre comprend trois branches qui appuient les travaux relatifs à la MCD pour les enquêtes sociales, les enquêtes-entreprises, le recensement et les organismes externes.

    Au cours des dix dernières années, le centre MCD a eu à son actif diverses réalisations. Par exemple, il a fait participer les méthodologistes d'enquête à l'élaboration et à la mise à l'essai des questions ou questionnaires des enquêtes-entreprises, a adopté une approche basée sur une combinaison de méthodes pour l'élaboration des questions et des questionnaires, a élaboré et appliqué des normes, notamment pour le questionnaire et les cartes-guides du Recensement de 2011, et a préparé et donné des séances de formation en MCD.

    La présente communication donnera une vue d'ensemble de la méthodologie de collecte des données à l'ONS sous l'angle des réalisations et des défis. Elle portera sur des domaines tels que les méthodes, la dotation en personnel (p. ex. recrutement, perfectionnement professionnel et sécurité sur le terrain) et l'intégration dans le processus d'enquête.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010941
    Description :

    Avant 2004, la conception et l'élaboration des fonctions de collecte à Statistics New Zealand relevaient d'une équipe centralisée de méthodologistes spécialistes de la collecte de données. En 2004, on s'est demandé, lors d'un examen organisationnel, si ces fonctions étaient conçues et élaborées de la façon la plus efficace possible. Un des principaux éléments à prendre en considération était le coût croissant des enquêtes dans le processus de transition des questionnaires sur support papier à la collecte de données par voie électronique. L'examen s'est traduit par la décentralisation de certaines fonctions de collecte. Toutefois, une petite équipe centralisée de méthodologistes responsables de la collecte de données a été maintenue pour travailler avec différents secteurs spécialisés de Statistics New Zealand.

    La communication examine la stratégie retenue par la petite équipe centralisée de méthodologistes responsables de la collecte de données pour fournir des services de soutien aux services spécialisés. Cette stratégie comprend trois grands volets. L'élaboration de normes relatives aux pratiques exemplaires et l'établissement d'un dépôt central de normes constituent le premier volet. La prestation de services de formation et la mise sur pied de forums de partage des connaissances représentent le deuxième volet de la stratégie. Le troisième volet prend la forme de la prestation d'avis et de la réalisation d'examens indépendants à l'intention des secteurs spécialisés chargés de concevoir et d'élaborer des instruments de collecte.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010970
    Description :

    RTI International mène une étude longitudinale sur l'éducation. L'un des volets de l'étude consistait à recueillir des relevés de notes et des catalogues de cours auprès des écoles secondaires fréquentées par les personnes comprises dans l'échantillon. Il fallait aussi saisir et coder les renseignements tirés de ces documents. Le défi était de taille puisque les relevés et les catalogues, dont le contenu et la présentation variaient grandement, ont été recueillis auprès de différents types d'écoles, dont des écoles publiques, privées et religieuses de tout le pays. La difficulté consistait à concevoir un système perfectionné pouvant être utilisé simultanément par de nombreux utilisateurs. RTI a mis au point un système de saisie et de codage des données tirées des relevés de notes et des catalogues de cours d'études secondaires. Doté de toutes les caractéristiques d'un système de saisie et de codage haut de gamme, évolué, multi-utilisateur, multitâche, convivial et d'entretien peu coûteux, le système est basé sur le Web et possède trois grandes fonctions : la saisie et le codage des données des relevés et des catalogues, le contrôle de la qualité des données à l'étape de la saisie (par les opérateurs) et le contrôle de la qualité des données à l'étape du codage (par les gestionnaires). Compte tenu de la nature complexe de la saisie et du codage des données des relevés et des catalogues, le système a été conçu pour être souple et pour permettre le transport des données saisies et codées dans tout le système afin de réduire le temps de saisie. Il peut aussi guider logiquement les utilisateurs dans toutes les pages liées à un type d'activité, afficher l'information nécessaire pour faciliter la saisie et suivre toutes les activités de saisie, de codage et de contrôle de la qualité. Les données de centaines de catalogues et de milliers de relevés de notes ont été saisies, codées et vérifiées à l'aide du système. La présente communication aborde les besoins et la conception du système, les problèmes de mise en oeuvre et les solutions adoptées, ainsi que les leçons tirées de cette expérience.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800011006
    Description :

    L'Office for National Statistics (ONS) est tenu de mesurer le fardeau de réponse des entreprises participant aux enquêtes qu'il mène et de produire un rapport annuel à ce sujet. Il existe aussi des cibles pour la réduction des coûts des entreprises qui se conforment aux règlements gouvernementaux, dans le cadre de l'Administrative Burdens Reduction Project (ABRP) de 2005, coordonné par le Better Regulation Executive (BRE).

    Les coûts économiques des entreprises servent à mesurer le fardeau de réponse. La méthode de mesure utilisée a changé avec le temps, la plus récente étant l'élaboration et la mise à l'essai d'un modèle des coûts standard (MCS).

    Couramment utilisé en Europe, le MCS vise à mesurer les fardeaux administratifs objectifs associés à toutes les demandes gouvernementales de renseignements (déclarations de revenus, taxe sur la valeur ajoutée, etc.) et à la participation aux enquêtes. Cette méthode n'a donc pas été mise au point précisément pour mesurer le fardeau de réponse aux enquêtes statistiques. Le MCS est axé sur les activités, c'est-à-dire que le coût et le temps requis pour répondre aux exigences sont ventilés par activité.

    Dans le cadre de cette méthode, les données sont habituellement recueillies au moyen d'interviews sur place. La méthode exige donc beaucoup de main-d'oeuvre, tant du point de vue de la collecte que de l'analyse des données, mais elle permet de réunir des renseignements détaillés. La technique élaborée et mise à l'essai par l'ONS utilise des questionnaires papier à remplir soi-même.

    L'objectif de la communication est de fournir un aperçu du fardeau de réponse et des cibles visées, ainsi que de passer en revue les différentes méthodes qu'a utilisées l'ONS pour mesurer le fardeau de réponse du point de vue de l'échantillonnage ainsi que de la collecte, de l'analyse et de l'utilité des données.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010999
    Description :

    Dans une enquête téléphonique, le choix du nombre de tentatives d'appel représente une décision importante. Un grand nombre de tentatives rend la collecte des données longue et dispendieuse, tandis qu'un petit nombre réduit l'ensemble de réponses sur lequel sont fondées les conclusions et accroît la variance. La décision peut aussi avoir une incidence sur le biais de non-réponse. Dans le présent article, nous examinons les effets du nombre de tentatives d'appel sur le taux de non-réponse et sur le biais dû à la non-réponse dans deux enquêtes réalisées par Statistics Sweden, à savoir la Labour Force Survey (LFS) et la Household Finances (HF).

    Au moyen de paradonnées, nous calculons le taux de réponse en fonction du nombre de tentatives d'appel. Pour estimer le biais de non-réponse, nous utilisons les estimations de certaines variables de registre, pour lesquelles des observations sont disponibles pour les répondants ainsi que les non-répondants. Nous calculons aussi les estimations de certains paramètres d'enquête réels en fonction d'un nombre variable de tentatives d'appel. Les résultats indiquent qu'il est possible de réduire le nombre courant de tentatives d'appel sans accroître le biais de non-réponse.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-522-X200800010994
    Description :

    La difficulté grandissante à joindre les répondants affecte, de façon générale, la non-réponse des enquêtes téléphoniques, et particulièrement les enquêtes qui utilisent les techniques de composition aléatoire (CA) comme l'Enquête sociale générale (ESG). L'ESG est une enquête annuelle à sujets multiples effectuée auprès de 25 000 répondants. Ses objectifs sont de surveiller les caractéristiques et les modifications importantes de la structure sociale canadienne. Le cycle 21 (2007) de l'ESG porte sur la famille, le soutien social et la retraite et vise la population âgée de 45 ans et plus vivant dans les 10 provinces canadiennes. Pour cibler plus efficacement cette population, une partie de l'échantillon provient d'un suivi auprès des répondants du cycle 20 (2006) de l'ESG qui portait sur les transitions familiales. Il est complété par un nouvel échantillon obtenu par CA. Dans cet article, nous présentons d'abord le plan de sondage de l'enquête et la méthode de composition aléatoire utilisée. Nous décrivons ensuite les défis reliés au calcul du taux de non-réponse dans une enquête à composition aléatoire qui cible un sous-ensemble d'une population, pour lequel la population dans le champ de l'enquête doit être estimée ou modélisée. Ceci est fait notamment avec l'utilisation de paradonnées. La méthodologie utilisée au cycle 21 de l'ESG est présentée en détail.

    Date de diffusion : 2009-12-03

  • Produits techniques : 11-536-X200900110806
    Description :

    Les travaux récents qui utilisent la méthode du maximum de vraisemblance pseudo-empirique pour des inférences pour populations finies avec données d'enquêtes complexes se sont d'abord concentrées sur un échantillon d'enquête simple, non stratifié ou stratifié, avec de considérables efforts sur les procédures de calcul. Dans cet exposé, nous présentons une approche d'inférence par maximum de vraisemblance pseudo-empirique pour des enquêtes multiples et des enquêtes à bases multiples, deux problèmes souvent rencontrés en pratique dans les enquêtes. Nous montrons qu'il est possible de faire l'inférence à propos du paramètre d'intérêt commum et d'utiliser efficacement les divers types d'information auxiliaire de façon pratique par la maximisation sous contrainte de la fonction du maximum de vraisemblance pseudo-empirique. Nous obtenons les résultats asymptotiques qui sont utilisés pour construire des intervalles de confiance de ratio de maximum de vraisemblance pseudo-empiriques, soit en utilisant une approximation du chi-deux, soit en utilisant une calibration bootstrap. Tous les problèmes de calcul reliés peuvent être résolus en utilisant des algorithmes d'échantillonnage stratifié existants après avoir reformulé le problème de façon appropriée.

    Date de diffusion : 2009-08-11

  • Produits techniques : 11-522-X200600110424
    Description :

    L'enquête réalisée par la Chine dans le cadre du programme de lutte internationale contre le tabagisme (ITC pour International Tobacco Control) comprend un plan d'échantillonnage à plusieurs degrés avec probabilités inégales où les grappes du niveau supérieur sont sélectionnées par la méthode d'échantillonnage PPT systématique randomisé. Durant l'exécution de l'enquête, il faut résoudre le problème suivant : plusieurs grappes de niveau supérieur échantillonnées refusent de participer et doivent être remplacées par des unités de substitution sélectionnées parmi les unités non incluses dans l'échantillon initial, de nouveau par la méthode d'échantillonnage PPT systématique randomisé. Dans de telles conditions, les probabilités d'inclusion de premier ordre des unités finales sélectionnées sont très difficiles à calculer et la détermination des probabilités d'inclusion de deuxième ordre devient virtuellement impossible. Dans le présent article, nous élaborons une méthode fondée sur la simulation pour calculer les probabilités d'inclusion de premier et de deuxième ordre lorsque le calcul direct est prohibitif ou impossible. Nous démontrons l'efficacité de la méthode que nous proposons en nous appuyant sur des considérations théoriques et des exemples numériques. Nous incluons plusieurs fonctions et codes R/S PLUS pour la procédure proposée. La méthode peut être étendue à des situations de refus/substitution plus complexes susceptibles de survenir en pratique.

    Date de diffusion : 2008-06-26

  • Produits techniques : 11-522-X200600110418
    Description :

    L'usage courant des modèles multiniveaux pour examiner les effets du contexte environnant sur les résultats en matière de santé témoigne de leur valeur en tant que méthode statistique d'analyse de données groupées. Cependant, l'application de la modélisation multiniveaux à des données provenant d'enquêtes à l'échelle de la population est souvent limitée par le petit nombre de cas par unité de deuxième niveau, si bien que l'on relève dans la littérature sur les effets du quartier une tendance récente à appliquer des méthodes d'analyse par grappes, ou classification automatique, pour contourner le problème de la dispersion des données. Dans le présent article, nous utilisons des simulations de Monte Carlo pour étudier les effets des tailles marginales de groupe et des méthodes d'analyse par grappes sur la validité des estimations des paramètres dans les modèles multiniveaux linéaires ainsi que non linéaires.

    Date de diffusion : 2008-03-17

  • Produits techniques : 11-522-X200600110435
    Description :

    En 1999, la première enquête représentative à l'échelle nationale de la santé mentale des enfants et des jeunes de 5 à 15 ans a été menée en Grande-Bretagne. Une deuxième enquête a été réalisée en 2004. Ces enquêtes avaient trois objectifs : estimer la prévalence des troubles mentaux chez les jeunes, examiner leur utilisation des services de santé, des services sociaux et des services éducatifs et analyser les facteurs de risque liés aux troubles mentaux. On a mené respectivement 10 500 et 8 000 interviews. Il a fallu aborder certaines questions essentielles concernant un grand nombre d'enjeux méthodologiques et prendre des décisions en tenant compte des facteurs étudiés dans le présent document.

    Date de diffusion : 2008-03-17

  • Produits techniques : 11-522-X200600110451
    Description :

    Les taux de réponse des ménages à de nombreuses enquêtes sociales de grande portée ne cessent de baisser. Dans le cas de la Health Survey for England, le taux a diminué de neuf points de pourcentage sur une période de onze ans. Des données provenant d'autres études donnent à penser que l'offre sans condition d'une récompense, ou incitatif, ayant une faible valeur pécuniaire peut améliorer les taux de coopération. Une expérience avec des incitatifs intégrée dans la Health Survey for England visait à reproduire les résultats d'une expérience antérieure intégrée dans la Family Resources Study indiquant un accroissement significatif du taux de réponse des ménages ayant reçu un carnet de timbres poste avec la lettre envoyée préalablement. Toutefois, l'expérience avec des incitatifs de la HSE n'a révélé aucune différence significative entre les taux de réponse des ménages, les taux de réponse à d'autres stades de l'enquête et les profils des répondants selon les deux conditions expérimentales (timbres poste inclus avec la lettre préalable, signet inclus avec la lettre) et le groupe témoin (lettre préalable uniquement).

    Date de diffusion : 2008-03-17

  • Produits techniques : 11-522-X200600110400
    Description :

    On peut obtenir des estimations du nombre attribuable de décès (DA), toutes causes confondues, en commençant par estimer le risque attribuable corrigé (RA) au sein de la population pour tenir compte des covariables confusionnelles, puis en multipliant le RA par le nombre de décès, déterminé d'après les statistiques de l'état civil sur la mortalité, survenus pendant une période de référence précise. Nous obtenons par la méthode de régression à risques proportionnels des estimations des risques relatifs corrigés basées sur des données sur la mortalité provenant du suivi d'une cohorte ou d'une enquête que nous combinons à une distribution conjointe du facteur de risque et des covariables confusionnelles pour calculer un risque attribuable (RA) corrigé. Nous examinons deux estimateurs du RA corrigé, qui se distinguent par la population de référence d'après laquelle la distribution conjointe du facteur de risque et des variables confusionnelles est obtenue. Les deux populations de référence considérées sont : i) la population qui est représentée par la cohorte de référence et : ii) une population extérieure à la cohorte. Nous appliquons des méthodes fondées sur la théorie de la fonction d'influence pour obtenir des expressions permettant d'estimer la variance de l'estimateur du nombre attribuable de décès (DA). Ces estimateurs de la variance peuvent être appliqués à des données recueillies auprès d'échantillons allant de l'échantillon aléatoire simple à l'échantillon en grappes stratifié à plusieurs degrés pondéré par les poids de sondage utilisés pour réaliser les enquêtes nationales auprès des ménages. Nous illustrons l'estimation de la variance du nombre attribuable de décès au moyen d'une analyse de la surmortalité liée à l'indice de masse corporelle non idéal dans une population réalisée sur des données provenant de la deuxième étude de la mortalité basée sur la National Health and Examination Survey (NHANES) et de la NHANES de 1999-2002. Ces méthodes peuvent également être utilisées pour estimer le nombre attribuable de décès par cause d'une maladie ou de nouveaux cas ainsi que leurs erreurs types, lorsque la période de référence est brève.

    Date de diffusion : 2008-03-17

  • Produits techniques : 11-522-X200600110402
    Description :

    Dans cet article, nous expliquons comment joindre les données sommaires du recensement par région à des données d'enquête ou à des données administratives. Nous citons des exemples d'ensembles de données présents dans les Centres de données de recherche de Statistique Canada, mais les méthodes valent aussi pour des ensembles extérieurs, notamment les ensembles de données administratives. À l'aide de quatre exemples, nous illustrons des situations courantes dans lesquelles se trouvent les chercheurs : (1) cas où les données d'enquête (ou les données administratives) et les données du recensement contiennent des identificateurs géographiques de même niveau et sont codés selon la même année de référence du découpage géographique aux fins du recensement (par exemple, si les deux ont des données 2001 AD); (2) cas où les deux fichiers contiennent des identificateurs géographiques pour la même année de référence, mais pour des niveaux différents de découpage géographique du recensement (par exemple, 1996 SD dans l'enquête, mais 1996 SR dans les données du recensement); (3) cas où les deux fichiers contiennent des données codées pour des années de référence différentes de géographie telles que 1996 SD pour l'enquête, mais 2001 AD pour le recensement); (4) cas où les données d'enquête n'ont pas d'identificateurs géographiques, ceux-ci devant d'abord être produits à partir des codes postaux du fichier d'enquête. Ces exemples sont présentés en syntaxe SAS, mais les principes s'appliquent à d'autres langages de programmation ou progiciels statistiques.

    Date de diffusion : 2008-03-17

  • Produits techniques : 11-522-X200600110417
    Description :

    Les coefficients des équations de régression sont souvent des paramètres d'intérêt dans le cas des enquêtes sur la santé et ces dernières sont habituellement réalisées selon un plan de sondage complexe avec l'utilisation des taux d'échantillonnage différentiels. Nous présentons des estimateurs des coefficients de régression applicables aux enquêtes complexes qui sont supérieurs aux estimateurs à facteur d'extension ordinaires selon le modèle en question, mais retiennent aussi les propriétés souhaitables du plan. Nous présentons les propriétés théoriques et celles qui sont simulées par la méthode Monte Carlo.

    Date de diffusion : 2008-03-17

  • Produits techniques : 11-522-X20050019462
    Description :

    La façon habituelle de présenter l'information sur la variance aux utilisateurs de données consiste à publier des estimations de la variance ou de statistiques connexes, comme les écarts types, les coefficients de variation, les limites de confiance ou de simples systèmes de classement. La communication porte sur les sources éventuelles de variance, comme le plan de sondage, la répartition de l'échantillon, la sélection de l'échantillon et la non réponse, et sur les meilleures mesures qui pourraient être prises pour réduire la variance. Enfin, elle donne une brève évaluation des coûts financiers qu'occasionne aux producteurs et aux utilisateurs de données le fait de réduire ou de ne pas réduire la variance et décrit comment un compromis pourrait être établi entre les coûts associés à la production de statistiques plus exactes et les avantages financiers d'une plus grande précision.

    Date de diffusion : 2007-03-02

Date de modification :