Statistiques par sujet – Méthodes statistiques

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Enquête ou programme statistique

37 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Enquête ou programme statistique

37 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Enquête ou programme statistique

37 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Enquête ou programme statistique

37 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Autres ressources disponibles pour appuyer vos recherches.

Aide pour trier les résultats
Explorer notre base centrale des principaux concepts normalisés, définitions, sources de données et méthodes.
En cours de chargement
Chargement en cours, veuillez patienter...
Tout (1 571)

Tout (1 571) (25 of 1,571 results)

  • Articles et rapports : 11-630-X2016003
    Description :

    La présente édition des Mégatendances canadiennes porte sur les changements dans les causes de décès de 1950 à 2012.

    Date de diffusion : 2016-03-21

  • Articles et rapports : 82-003-X201600314338
    Description :

    Le présent document décrit les méthodes et les données utilisées pour l’élaboration et la mise en oeuvre du métamodèle POHEM – Maladies neurologiques.

    Date de diffusion : 2016-03-16

  • Produits techniques : 91-528-X
    Description :

    Ce manuel offre des descriptions détaillées des sources de données et des méthodes utilisées par Statistique Canada pour produire des estimations de la population. Elles comportent : les estimations postcensitaires et intercensitaires de la population; la population de départ; les naissances et les décès; l'immigration; les émigrations; les résidents non permanents; la migration interprovinciale; les estimations infraprovinciales de la population; les estimations de la population selon l'âge, le sexe et l'état matrimonial et les estimations des familles de recensement. Un glossaire des termes courants est inclus à la fin du manuel, suivi de la notation normalisée utilisée.

    Auparavant, la documentation sur les changements méthodologiques pour le calcul des estimations était éparpillée dans plusieurs publications et documents d'information de Statistique Canada. Ce manuel offre aux utilisateurs de statistiques démographiques un recueil exhaustif des procédures actuelles utilisées par Statistique Canada pour élaborer des estimations de la population et des familles.

    Date de diffusion : 2016-03-03

  • Articles et rapports : 89-654-X2016003
    Description :

    Cet article décrit le processus qui a mené à la création des nouvelles Questions d’identification des incapacités (QII), développées conjointement par Statistique Canada et Emploi et développement social Canada. Les QII forment un nouveau module qui peut être placé sur des enquêtes s’adressant à la population générale, pour permettre de comparer les personnes avec et sans incapacité. L’article explique pourquoi il existe deux versions des QII — une longue et une courte — , la différence entre les deux et comment chaque version peut être utilisée.

    Date de diffusion : 2016-02-29

  • Articles et rapports : 11-630-X2016002
    Description :

    Dans la présente édition des Mégatendances canadiennes nous examinons la hausse de l'espérance de vie des Canadiens de 1920-1922 à 2009-2011.

    Date de diffusion : 2016-02-26

  • Classification : 12-603-X
    Description :

    La Classification canadienne des unités et secteurs institutionnels (CCUSI) 2012 est la norme générale pour le classement des unités et secteurs institutionnels. Cette classification est utilisée pour les statistiques économiques et comprend des définitions pour ses 171 classes. CCUSI 2012 a été élaborée par suite de la mise en œuvre des recommandations internationales publiées dans le manuel Système de comptabilité nationale 2008 (SCN 2008).

    Date de diffusion : 2016-02-11

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2016-02-11

  • Articles et rapports : 11-630-X2016001
    Description :

    La présente édition des Mégatendances canadiennes examine l'évolution du bilinguisme français-anglais au Canada de 1901 à 2011.

    Date de diffusion : 2016-01-28

  • Articles et rapports : 82-003-X201600114307
    Description :

    À partir de l’Enquête auprès des peuples autochtones de 2012, la présente étude examine les propriétés psychométriques de l’échelle de détresse psychologique à 10 questions de Kessler (une mesure abrégée de la détresse psychologique non spécifique) appliquée aux Premières Nations vivant à l’extérieur des réserves, aux Métis et aux Inuits âgés de 15 ans et plus.

    Date de diffusion : 2016-01-20

  • Articles et rapports : 82-003-X201600114306
    Description :

    Le présent article donne un aperçu de la création, du contenu et de la qualité de la Base de données sur la cohorte canadienne de naissance du Recensement de 2006.

    Date de diffusion : 2016-01-20

  • Articles et rapports : 11-630-X2015009
    Description :

    Dans la présente édition des Mégatendances canadiennes nous examinons la participation croissante des femmes dans le milieu de travail rémunéré depuis les années 1950.

    Date de diffusion : 2015-12-17

  • Produits techniques : 75F0002M2015003
    Description :

    Cette note porte sur les estimations révisées du revenu tirées de l’Enquête sur la dynamique du travail et du revenu (EDTR). Les révisions aux estimations de l’EDTR permettent de comparer les résultats de l’Enquête canadienne sur le revenu (ECR) à ceux des années précédentes puisqu’elles offrent une solution aux problèmes associés aux différences méthodologiques entre l’EDTR et l’ECR.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500214231
    Description :

    Les instituts nationaux de statistique font une grande utilisation des panels rotatifs, par exemple pour produire des statistiques officielles sur la population active. Les procédures d’estimation se fondent généralement sur les approches traditionnelles fondées sur le plan de sondage conformes à la théorie classique de l’échantillonnage. Un inconvénient important des estimateurs de cette classe est que les petites tailles d’échantillon entraînent de grandes erreurs-types et qu’ils ne sont pas robustes au biais de mesure. Deux exemples où les effets de biais de mesure deviennent apparents sont le biais de groupe de renouvellement dans les panels rotatifs et les différences systématiques dans les résultats d’une enquête dues à un remaniement important du processus sous-jacent. Dans cet article, nous appliquons un modèle de séries chronologiques structurel multivarié à l’enquête sur la population active des Pays-Bas pour produire des données mensuelles sur la population active qui se fondent sur un modèle. Le modèle réduit les erreurs-types des estimations en tirant parti des renseignements sur l’échantillon recueillis au cours des périodes précédentes, tient compte du biais de groupe de renouvellement et de l’autocorrélation induite par le panel rotatif, et modélise les discontinuités dues au remaniement de l’enquête. Nous examinons également l’utilisation des séries auxiliaires corrélées du modèle, qui vise à améliorer davantage l’exactitude des estimations du modèle. Statistics Netherlands utilise cette méthode pour produire des statistiques mensuelles officielles exactes sur la population active qui sont convergentes dans le temps, malgré le remaniement du processus d’enquête.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500214238
    Description :

    Félix-Medina et Thompson (2004) ont proposé une variante de l’échantillonnage par dépistage de liens pour échantillonner des populations humaines cachées ou difficiles à joindre, comme les toxicomanes et les travailleurs de l’industrie du sexe. Dans cette variante, on commence par sélectionner un échantillon d’emplacements, puis on demande aux personnes trouvées dans les lieux échantillonnés de nommer d’autres membres de la population à inclure dans l’échantillon. Ces auteurs ont établi des estimateurs du maximum de vraisemblance de la taille de la population sous l’hypothèse que la probabilité qu’une personne soit nommée par une autre dans un lieu échantillonné (probabilité de lien) ne dépend pas de la personne nommée (hypothèse d’homogénéité). Dans le présent travail, nous étendons leur recherche au cas où les probabilités de lien sont hétérogènes et dérivons des estimateurs du maximum de vraisemblance inconditionnel et conditionnel de la taille de la population. Nous proposons aussi des intervalles de confiance par vraisemblance profilée et par bootstrap pour la taille de la population. Les résultats de nos études en simulation montrent qu’en présence de probabilités de lien hétérogènes, les estimateurs proposés donnent d’assez bons résultats à condition que les fractions d’échantillonnage soient relativement grandes, disons supérieures à 0,5, tandis que la performance des estimateurs calculés sous l’hypothèse d’homogénéité n’est pas bonne. Les résultats montrent aussi que les intervalles de confiance proposés ne sont pas très robustes aux écarts par rapport aux modèles supposés.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500214249
    Description :

    Le problème de la répartition optimale des échantillons dans les enquêtes basées sur un plan d’échantillonnage stratifié a été abordé pour la première fois par Neyman en 1934. Depuis, de nombreux chercheurs ont étudié le problème de la répartition des échantillons dans les enquêtes à plusieurs variables, et plusieurs méthodes ont été proposées. Ces méthodes se divisent essentiellement en deux catégories. La première catégorie englobe les méthodes de répartition qui réduisent les coûts des enquêtes tout en maintenant les coefficients de variation des estimateurs de totaux sous des seuils spécifiés pour toutes les variables d’enquête d’intérêt. La seconde catégorie de méthodes vise à minimiser une moyenne pondérée des variances relatives des estimateurs des totaux étant donné une taille globale maximale d’échantillon ou un coût maximum. Cet article propose une nouvelle approche d’optimisation pour régler le problème de la répartition des échantillons dans les enquêtes à plusieurs variables. Cette approche se fonde sur une formulation de la programmation en nombres entiers binaires. Plusieurs expériences numériques ont démontré que l’approche proposée offre des solutions efficaces à ce problème, qui permettent d’améliorer un « algorithme classique » et peuvent être plus efficaces que l’algorithme de Bethel (1985, 1989).

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500214236
    Description :

    Nous proposons une extension assistée par modèle des mesures de l’effet de plan dû à la pondération. Nous élaborons une statistique de niveau sommaire pour différentes variables d’intérêt, sous échantillonnage à un degré et ajustement des poids par calage. La mesure de l’effet de plan que nous proposons traduit les effets conjoints d’un plan d’échantillonnage avec probabilités de sélection inégales, des poids inégaux produits en utilisant des ajustements par calage et de la force de l’association entre la variable d’analyse et les variables auxiliaires utilisées pour le calage. Nous comparons la mesure proposée aux mesures existantes de l’effet de plan au moyen de simulations en utilisant des variables semblables à celles pour lesquelles des données sont recueillies dans les enquêtes auprès des établissements et dans les enquêtes téléphoniques auprès des ménages.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500214250
    Description :

    L’évaluation de l’impact des effets de mode sur les estimations d’enquête est devenue un objectif de recherche crucial en raison de l’utilisation croissante des plans de sondage à modes mixtes. Malgré les avantages inhérents aux plans de ce genre, comme la réduction des coûts et l’augmentation de la couverture, il y a une évidence manifeste à l’effet que le mode d’enquête peut avoir des effets importants relativement à la précision d’une enquête. Ces effets risquent d’aboutir à des statistiques qui ne sont pas comparables dans le temps ou entre des sous-groupes de population et d’accroître le biais. Les plans de collecte adaptatifs offrent un cadre mathématique souple qui permet d’optimiser l’équilibre entre la qualité et les coûts de l’enquête. Dans cet article, nous utilisons des plans adaptatifs afin de minimiser les effets de mode. Nous illustrons notre modèle d’optimisation au moyen de l’étude du cas de l’Enquête sur la population active des Pays-Bas. Nous mettons l’accent sur les effets de mode dépendant des items et nous évaluons l’impact sur la qualité des enquêtes par comparaison avec une norme de référence.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500214229
    Description :

    L’estimation autopondérée au moyen de méthodes d’échantillonnage avec probabilités égales (epsem pour equal probability selection methods) est souhaitable pour des raisons d’efficacité relativement à la variance. Habituellement, pour obtenir la propriété epsem pour des plans de sondage à deux degrés (et à une phase) en vue d’estimer des paramètres au niveau de la population, on utilise le chiffre de population de chaque unité primaire d’échantillonnage (UPE) comme mesure de taille pour la sélection des UPE, ainsi que l’attribution d’une taille d’échantillon égale aux UPE sous échantillonnage aléatoire simple (EAS) des unités élémentaires. Cependant, si l’on souhaite des estimations autopondérées pour les paramètres correspondant à de multiples domaines sous une répartition préétablie de l’échantillon entre les domaines, Folsom, Potter et Williams (1987) ont montré que l’on peut utiliser une mesure composite de taille pour sélectionner les UPE afin d’obtenir des plans epsem quand on suppose qu’outre les chiffres de population des UPE au niveau des domaines (c’est à dire la répartition de la population entre les domaines dans les UPE), les identificateurs de domaines pour les unités élémentaires sont également disponibles dans la base de sondage. Le terme depsem-A sera utilisé pour désigner ce genre de plan de sondage à deux degrés (et à une phase) pour obtenir l’estimation epsem au niveau du domaine. Folsom et coll. ont également considéré des plans d’échantillonnage à deux phases et à deux degrés quand les chiffres de population des UPE au niveau des domaines sont inconnus, mais que les dénombrements d’UPE entières sont connus. Pour ces plans (que nous désignerons depsem-B) avec les UPE sélectionnées avec probabilité proportionnelle à la mesure de taille habituelle (c’est à dire la population totale de l’UPE) au premier degré, toutes les unités élémentaires dans chaque UPE sélectionnée font d’abord l’objet d’une présélection en vue de les classer par domaine à la première phase de collecte des données, avant la sélection par EAS au deuxième degré d’échantillonnage. Des échantillons stratifiés par domaine sont ensuite sélectionnés dans les UPE en appliquant des taux d’échantillonnage de domaine choisis de manière appropriée pour que les tailles d’échantillon de domaine obtenues soient celles souhaitées et que le plan d’échantillonnage résultant soit autopondéré. Dans le présent article, nous commençons par donner une justification simple des mesures composites de taille pour le plan depsem-A et des taux d’échantillonnage de domaine pour le plan depsem-B. Puis, pour les plans depsem-A et -B, nous proposons des généralisations, premièrement aux cas pour lesquels les identificateurs de domaine pour les unités élémentaires ne sont pas disponibles dans la base de sondage et les chiffres de population des UPE au niveau des domaines ne sont connus qu’approximativement à partir d’autres sources, et deuxièmement, aux cas pour lesquels les mesures de taille des UPE sont préétablies en se basant sur d’autres considérations pratiques et souhaitables de suréchantillonnage ou de sous-échantillonnage de certains domaines. Nous présentons aussi une généralisation supplémentaire en présence de sous-échantillonnage des unités élémentaires et de non-réponse dans certaines UPE à la première phase, avant la sélection des unités élémentaires de deuxième phase dans les domaines à l’intérieur de chaque UPE sélectionnée. Cette dernière généralisation du plan depsem-B est illustrée pour un échantillon aréolaire de logements.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500214230
    Description :

    Le présent article décrit l’élaboration de méthodes de répartition pour des enquêtes par sondage avec stratification quand l’utilisation d’estimateurs sur petits domaines composites est une priorité et que les domaines servent de strates. Longford (2006) a proposé pour cette situation un critère objectif fondé sur une combinaison pondérée des erreurs quadratiques moyennes des moyennes de petit domaine et d’une moyenne globale. Ici, nous redéfinissons cette approche dans un cadre assisté par modèle, ce qui permet l’utilisation de variables explicatives et une interprétation plus naturelle des résultats en utilisant un paramètre de corrélation intraclasse. Nous considérons aussi plusieurs utilisations de la répartition exponentielle et permettons l’application d’autres contraintes, telle une valeur maximale de la racine carrée relative de l’erreur quadratique moyenne, aux estimateurs de strate. Nous constatons qu’une répartition exponentielle simple peut donner des résultats très près d’être aussi bons que le plan optimal, même quand l’objectif est de minimiser le critère de Longford (2006).

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500214237
    Description :

    La bonne conception d’une enquête téléphonique par composition aléatoire (CA) à partir d’une base de sondage double requiert de choisir entre de nombreuses options, en faisant la part des différences de coût, de précision, et de couverture, afin d’optimiser la réalisation des objectifs de l’étude. L’un des éléments à prendre en considération est celui de savoir s’il faut présélectionner les ménages équipés de téléphones mobiles et n’interroger que ceux utilisant exclusivement des téléphones mobiles (ménages EXM), donc écarter ceux qui se servent d’un téléphone fixe ainsi que d’un téléphone mobile (ménages F-et-M), ou s’il faut, au contraire, interroger toutes les unités de l’échantillon de ménages équipés de téléphones mobiles. Nous présentons un cadre pour comparer les avantages et les inconvénients de ces deux options, ainsi qu’une méthode pour sélectionner le plan de sondage optimal. Nous établissons la répartition optimale de la taille de l’échantillon entre les deux bases de sondage et en discutons, et nous abordons le choix de la valeur optimale du paramètre de composition p pour le domaine des usagers d’un téléphone fixe ainsi que d’un téléphone mobile (F-et-M). Nous illustrons nos méthodes en les appliquant à la National Immunization Survey commanditée par les Centers for Disease Control and Prevention.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201500214248
    Description :

    L’utilisation de modèles de population au niveau de l’unité pour estimer des totaux et des moyennes de petit domaine en se fondant sur un modèle est fréquente, mais il se peut que le modèle ne soit pas vérifié pour l’échantillon si le plan d’échantillonnage est informatif pour le modèle. Par conséquent, les méthodes d’estimation classiques, qui supposent que le modèle est vérifié pour l’échantillon, peuvent donner des estimateurs biaisés. Nous étudions d’autres méthodes comprenant l’utilisation d’une fonction appropriée de la probabilité de sélection des unités en tant que variable auxiliaire supplémentaire dans le modèle de l’échantillon. Nous présentons les résultats d’une étude en simulation du biais et de l’erreur quadratique moyenne (EQM) des estimateurs proposés des moyennes de petit domaine et du biais relatif des estimateurs de l’EQM connexes, en utilisant des plans d’échantillonnage informatifs pour générer les échantillons. D’autres méthodes, fondées sur la modélisation de l’espérance conditionnelle du poids de sondage sous forme d’une fonction des covariables du modèle et de la réponse, sont également incluses dans l’étude en simulation.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 82-003-X201501214295
    Description :

    À l’aide du modèle de microsimulation du cancer du sein mis au point par le Cancer Intervention and Surveillance Monitoring Network de l’Université du Wisconsin adapté au contexte canadien, on a évalué 11 stratégies de dépistage par mammographie sur le plan des coûts et des années de vie ajustées en fonction de la qualité. Ces stratégies, qui s’adressent à la population générale, diffèrent selon l’âge au début et à la fin du dépistage ainsi que la fréquence des examens de dépistage. Des rapports coût/efficacité différentiels sont présentés, et des analyses de sensibilité servent à évaluer la robustesse des conclusions du modèle.

    Date de diffusion : 2015-12-16

  • Articles et rapports : 11-630-X2015008
    Description :

    La présente édition de Mégatendances canadiennes examine les changements dans la taille des ménages de 1941 à 2011.

    Date de diffusion : 2015-11-23

  • Articles et rapports : 11-627-M2015005
    Description :

    Cette infographie présente le parcours des données d’enquête et montre comment les réponses des répondants sont transformées en données utiles qui serviront à prendre des décisions éclairées. L’infographie présente des résultats pour l’Enquête sur la population active (EPA), l’Enquête sur les dépenses des ménages (EDM) et l’Enquête sur la santé dans les collectivités canadiennes (ESCC).

    Date de diffusion : 2015-11-23

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2015-11-23

Données (8)

Données (8) (8 of 8 results)

  • Microdonnées à grande diffusion : 89F0002X
    Description :

    La BD/MSPS est un modèle de microsimulation statique qui sert à l'analyse des interactions financières entre les gouvernements et les particuliers au Canada. Elle permet de calculer les impôts payés aux gouvernements et les transferts monétaires reçus de ceux-ci. Elle est formée d'une base de données, d'une série d'algorithmes et de modèles relatifs aux impôts et aux transferts, d'un logiciel d'analyse et de la documentation de l'utilisateur.

    Date de diffusion : 2016-12-05

  • Tableau : 53-500-X
    Description :

    Dans ce rapport, on présente les résultats d'une enquête pilote menée par Statistique Canada pour mesurer la consommation de carburant des véhicules sur route immatriculés au Canada. Cette étude a été réalisée au moyen de l'Enquête sur les véhicules au Canada (EVC), qui permet de recueillir des données sur les activités routières tels que les distances parcourues, le nombre de passagers et la raison de chaque déplacement.

    Date de diffusion : 2004-10-21

  • Tableau : 95F0495X2001012
    Description :

    Ce tableau renferme des données tirées du Recensement de 2001 pour la Classification des secteurs statistiques (CSS). Une CSS regroupe les subdivisions de recensement selon qu'elles font partie d'une région métropolitaine de recensement, d'une agglomération de recensement, d'une zone d'influence des régions métropolitaines de recensement et des agglomérations de recensement (ZIM forte, ZIM modérée, ZIM faible ou ZIM sans influence) ou des territoires (Territoires du Nord-Ouest, Territoire du Yukon et Nunavut). La CSS est utilisée aux fins de la diffusion des données.

    Les caractéristiques des données présentées pour la CSS comprennent l'âge, l'état matrimonial, les groupes de minorité visible, l'immigration, la langue maternelle, le niveai de scolarité, le revenu, l'emploi, les familles et les logements. Ces données sont présentées pour le Canada, les provinces et les territoires. Les caractéristiques des données présentées dans ce tableau peuvent être différentes de celles d'autres produits de la série « Profils ».

    Date de diffusion : 2004-02-27

  • Tableau : 53-222-X19980006587
    Description :

    Le but principal de cet article est de présenter la nouvelle série chronologique de données et d'en démontrer le potentiel analytique et non pas de fournir une analyse détaillée de ces données. L'analyse présentée à la section 5.2.4 portera principalement sur les tendances des variables importantes en rapport au trafic intérieur et transfrontalier.

    Date de diffusion : 2000-03-07

  • Tableau : 75M0007X
    Description :

    L'Enquête sur l'absence du travail fournit aux ministères des renseignements importants sur le temps perdu au travail par les Canadiens pour des raisons de santé. Ces renseignements contribuent également à l'élaboration de programmes d'aide à l'intention des employés qui s'absentent du travail. Par exemple, le régime restreint d'assurance-salaire tire des renseignements essentiels des données sur l'absence du travail. Ce régime s'adresse aux employeurs qui offrent à leurs salariés une assurance contre les pertes de salaire attribuable à la maladie, etc. Ces employeurs bénéficient d'une réduction des contributions qu'ils versent à la Commission d'assurance-emploi. Les réponses obtenues permettront également d'aider à déterminer les taux de réduction applicables à ces employeurs. Bien que l'enquête sur l'absence du travail recueille des renseignements sur les absences pour cause de maladie, d'accident ou de grossesse, elle ne constitue pas une représentation exhaustive des personnes qui ont été absentes du travail pour ces raisons, car les concepts et les définitions ont été élaborés spécialement pour répondre aux besoins du client. Aux fins de cette enquête, l'absence est, par définition, de deux semaines au moins, et on ne demande aux répondants que de citer les trois raisons de leur absence la plus récente et de celle qui l'a précédée.

    Date de diffusion : 1999-06-29

  • Tableau : 82-567-X
    Description :

    L'Enquête nationale sur la santé de la population a pout but d'améliorer la compréhension des différents processus affectant la santé. L'enquête collecte les données transversales ainsi que longitudinales. En 1994-1995, l'enquête portait sur un échantillon de 17 276 répondants qui ont été interviewés une deuxième fois en 1996-1997. Le taux de réponse fut de 96 % en 1996-1997. La collecte des données de cet échantillon se poursuivra durant une vingtaine d'années. Dans le but d'obtenir des données transversales, un total de 81 000 résidents de ménages ont été interviewés dans toutes les provinces (exepté les gens vivant dans les réserves Indiennes ou dans les Forces Armées Canadiennes) en 1996-1997.

    Voici quelques exemples de la variété d'informations disponibles que l'on peut obtenit grâce à l'enquête: perception de la santé, les conditions chroniques de santé, les blessures, les mouvements répétitifs, la dépression, le tabagisme, la consommation d'alcool, les activités physiques, la consommation de médicaments, l'utilisation des soins de santé et la médecine douce.

    Date de diffusion : 1998-07-29

  • Tableau : 62-010-X19970023422
    Description :

    La période de base officielle de l'indice des prix à la consommation (IPC) est actuellement 1986=100. Cette période de base a été utilisée pour la première fois au moment de la diffusion des données de l'IPC pour juin 1990. Statistique Canada s'apprête à convertir toutes les séries des indices de prix à la période de base 1992=100. Par conséquent, toutes les séries en dollars constants seront aussi converties en dollars de 1992. L'IPC adoptera la nouvelle période de base lorsque paraîtront les données de l'indice pour janvier 1998 dès le 27 février 1998.

    Date de diffusion : 1997-11-17

  • Microdonnées à grande diffusion : 89M0005X
    Description :

    Résumé à venir

    Date de diffusion : 1996-10-21

Analyses (865)

Analyses (865) (25 of 865 results)

  • Revues et périodiques : 11-633-X
    Description :

    Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.

    Date de diffusion : 2017-11-09

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-10-11

  • Articles et rapports : 11F0019M2017399
    Description :

    Le Canada est une nation commerçante qui produit des quantités importantes d’extrants liées aux ressources. Ainsi, le comportement des prix des ressources qui revêtent de l’importance pour le Canada est pertinent, afin de comprendre les progrès de la croissance des revenus réels et la prospérité du pays et des provinces. Les brusques variations de la demande et de l’offre ou les changements à la politique monétaire sur les marchés internationaux peuvent avoir une énorme influence sur le prix des ressources. Les fluctuations sont un facteur important de transmission des bouleversements externes au sein de l’économie nationale. Le présent document comporte des estimations historiques de l’indice des prix des produits de base de la Banque du Canada (IPPB) et les couple à des estimations modernes. Au moyen d’un ensemble de sources de données historiques, il évalue les poids et les prix d’une manière suffisamment cohérente pour permettre l’établissement d’estimations à long terme qui pourraient être couplées à l’IPPB de Fisher moderne.

    Date de diffusion : 2017-10-11

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-10-06

  • Articles et rapports : 13-605-X201700114840
    Description :

    Statistique Canada prépare actuellement le système statistique afin de pouvoir déterminer les répercussions de la transition du cannabis récréatif du domaine illégal au domaine légal et d’éclairer les activités économiques et sociales liées à la consommation du cannabis après cette transition. Bien que le système de statistiques sociales permette de recueillir des renseignements sur l’utilisation du cannabis, des mises à jour seront requises pour mesurer plus exactement les effets sur la santé et l’incidence sur le système judiciaire. L’infrastructure statistique actuelle servant à mesurer de façon plus exhaustive l’utilisation et les répercussions des substances comme le tabac et l’alcool pourrait être adaptée pour en faire autant pour le cannabis. Toutefois, les statistiques économiques accessibles ne précisent pas le rôle que jouent les drogues illégales dans l’économie. Tant les statistiques sociales qu’économiques devront être mises à jour pour refléter la légalisation du cannabis, et le défi est particulièrement important pour les statistiques économiques. Le présent document résume les travaux menés actuellement à cette fin.

    Date de diffusion : 2017-09-28

  • Articles et rapports : 11-633-X2017009
    Description :

    Le présent document décrit les procédures d’emploi des sources de données administratives couplées pour estimer les taux d’utilisation des congés parentaux payés au Canada et les problèmes découlant de cet emploi.

    Date de diffusion : 2017-08-29

  • Articles et rapports : 11-633-X2017008
    Description :

    La plateforme de modélisation de microsimulation DYSEM propose un noyau de données démographiques et socioéconomiques qu’on peut utiliser avec facilité pour créer des modèles ou des applications de microsimulation dynamiques personnalisés. Le présent document décrit la plateforme DYSEM et donne un aperçu de ses usages prévus ainsi que des méthodes et données utilisées pour sa conception.

    Date de diffusion : 2017-07-28

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-07-28

  • Revues et périodiques : 12-001-X
    Description :

    La revue publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d'ordre pratique, l'utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l'évaluation des enquêtes, la recherche sur les méthodes d'enquêtes, l'analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l'intégration des données statistiques, les méthodes d'estimation et d'analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l'élaboration et à l'évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles.

    Date de diffusion : 2017-06-22

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201700114819
    Description :

    La modélisation de séries chronologiques structurelle est une puissante technique de réduction des variances pour les estimations sur petits domaines (EPD) reposant sur des enquêtes répétées. Le bureau central de la statistique des Pays-Bas utilise un modèle de séries chronologiques structurel pour la production des chiffres mensuels de l’Enquête sur la population active (EPA) des Pays-Bas. Cependant, ce type de modèle renferme des hyperparamètres inconnus qui doivent être estimés avant que le filtre de Kalman ne puisse être appliqué pour estimer les variables d’état du modèle. Le présent article décrit une simulation visant à étudier les propriétés des estimateurs des hyperparamètres de tels modèles. La simulation des distributions de ces estimateurs selon différentes spécifications de modèle viennent compléter les diagnostics types pour les modèles espace-état. Une autre grande question est celle de l’incertitude entourant les hyperparamètres du modèle. Pour tenir compte de cette incertitude dans les estimations d’erreurs quadratiques moyennes (EQM) de l’EPA, différents modes d’estimation sont pris en compte dans une simulation. En plus de comparer les biais EQM, cet article examine les variances et les EQM des estimateurs EQM envisagés.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201700114820
    Description :

    Les erreurs de mesure peuvent provoquer un biais de l’estimation des transitions, donnant lieu à des conclusions erronées au sujet de la dynamique du marché du travail. La littérature traditionnelle sur l’estimation des mouvements bruts est basée sur la supposition que les erreurs de mesure ne sont pas corrélées au fil du temps. Cette supposition n’est pas réaliste dans bien des contextes, en raison du plan d’enquête et des stratégies de collecte de données. Dans le présent document, nous utilisons une approche basée sur un modèle pour corriger les mouvements bruts observés des erreurs de classification au moyen de modèles markoviens à classes latentes. Nous nous reportons aux données recueillies dans le cadre de l’enquête italienne continue sur la population active, qui est transversale et trimestrielle et qui comporte un plan de renouvellement de type 2-2-2. Le questionnaire nous permet d’utiliser plusieurs indicateurs des états de la population active pour chaque trimestre : deux recueillis au cours de la première interview, et un troisième recueilli un an plus tard. Notre approche fournit une méthode pour estimer la mobilité sur le marché du travail, en tenant compte des erreurs corrélées et du plan par renouvellement de l’enquête. Le modèle qui convient le mieux est un modèle markovien mixte à classes latentes, avec des covariables touchant les transitions latentes et des erreurs corrélées parmi les indicateurs; les composantes mixtes sont de type mobile-stable. Le caractère plus approprié de la spécification du modèle mixte est attribuable à des transitions latentes estimées avec une plus grande précision.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201700114823
    Description :

    L’obtention d’estimateurs dans un processus de calage à plusieurs phases requiert le calcul séquentiel des estimateurs et des poids calés des phases antérieures afin d’obtenir ceux de phases ultérieures. Déjà après deux phases de calage, les estimateurs et leurs variances comprennent des facteurs de calage provenant des deux phases, et les formules deviennent lourdes et non informatives. Par conséquent, les études publiées jusqu’à présent traitent principalement du calage à deux phases, tandis que le calage à trois phases ou plus est rarement envisagé. Dans certains cas, l’analyse s’applique à un plan de sondage particulier et aucune méthodologie complète n’est élaborée pour la construction d’estimateurs calés ni, tâche plus difficile, pour l’estimation de leur variance en trois phases ou plus. Nous fournissons une expression explicite pour calculer la variance d’estimateurs calés en plusieurs phases qui tient pour n’importe quel nombre de phases. En spécifiant une nouvelle représentation des poids calés en plusieurs phases, il est possible de construire des estimateurs calés qui ont la forme d’estimateurs par la régression multivariée, ce qui permet de calculer un estimateur convergent de leur variance. Ce nouvel estimateur de variance est non seulement général pour tout nombre de phases, mais possède aussi certaines caractéristiques favorables. Nous présentons une comparaison à d’autres estimateurs dans le cas particulier du calage à deux phases, ainsi qu’une étude indépendante pour le cas à trois phases.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201700114818
    Description :

    La protection de la confidentialité des données qui figurent dans des tableaux de données quantitatives peut devenir extrêmement difficile lorsqu’on travaille avec des tableaux personnalisés. Une solution relativement simple consiste à perturber au préalable les microdonnées sous-jacentes, mais cela peut avoir un effet négatif excessif sur la précision des agrégats. Nous proposons plutôt une méthode perturbatrice qui vise à mieux concilier les besoins de protection et de précision des données en pareil cas. La méthode consiste à traiter par niveaux les données de chaque cellule en appliquant une perturbation minime, voire nulle, aux valeurs inférieures et une perturbation plus importante aux valeurs supérieures. La méthode vise avant tout à protéger les données personnelles, qui sont généralement moins asymétriques que les données des entreprises.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201700114817
    Description :

    Nous présentons les résultats de notre recherche sur les modes de répartition d’échantillons qui permettent de faire une estimation efficace sur petits domaines par modélisation dans les cas où les domaines d’intérêt coïncident avec les strates. Les méthodes d’estimation assistées d’un modèle et celles fondées sur un modèle sont répandues dans la production de statistiques relatives aux petits domaines, mais l’utilisation du modèle et de la méthode d’estimation sous-jacents est rarement intégrée au plan de répartition de l’échantillon entre les domaines. C’est pourquoi nous avons conçu un nouveau mode de répartition fondée sur un modèle que nous avons appelé répartition g1. Aux fins de comparaison, nous décrivons un autre mode de répartition fondée sur un modèle qui a récemment vu le jour. Ces deux répartitions sont fondées sur une mesure ajustée de l’homogénéité qui se calcule à l’aide d’une variable auxiliaire et constitue une approximation de la corrélation intraclasse à l’intérieur des domaines. Nous avons choisi cinq solutions de répartition par domaine sans modèle, adoptées par le passé dans le cadre d’études spécialisées, comme méthodes de référence. Pour une répartition égale ou proportionnelle, il nous faut connaître le nombre de domaines ainsi que le nombre d’unités statistiques de base dans chacun d’eux. Les répartitions de Neyman et de Bankier et la répartition par programmation non linéaire (PNL), nécessitent des paramètres au niveau du domaine comme l’écart-type, le coefficient de variation ou les totaux. En règle générale, on peut caractériser les méthodes de répartition en fonction des critères d’optimisation et de l’utilisation de données auxiliaires. On évalue alors les propriétés statistiques des diverses méthodes retenues au moyen d’expériences de simulation d’échantillon faisant appel aux données réelles du registre de population. Selon les résultats de simulation, on peut conclure que l’intégration du modèle et de la méthode d’estimation à la méthode de répartition a pour effet d’améliorer les résultats de l’estimation.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201700114822
    Description :

    Nous utilisons une méthode bayésienne pour inférer sur une proportion dans une population finie quand des données binaires sont recueillies selon un plan d’échantillonnage double sur des petits domaines. Le plan d’échantillonnage double correspond à un plan d’échantillonnage en grappes à deux degrés dans chaque domaine. Un modèle bayésien hiérarchique établi antérieurement suppose que, pour chaque domaine, les réponses binaires de premier degré suivent des lois de Bernoulli indépendantes et que les probabilités suivent des lois bêta paramétrisées par une moyenne et un coefficient de corrélation. La moyenne varie selon le domaine, tandis que la corrélation est la même dans tous les domaines. En vue d’accroître la flexibilité de ce modèle, nous l’avons étendu afin de permettre aux corrélations de varier. Les moyennes et les corrélations suivent des lois bêta indépendantes. Nous donnons à l’ancien modèle le nom de modèle homogène et au nouveau, celui de modèle hétérogène. Tous les hyperparamètres possèdent des distributions a priori non informatives appropriées. Une complication supplémentaire tient au fait que certains paramètres sont faiblement identifiés, ce qui rend difficile l’utilisation d’un échantillonneur de Gibbs classique pour les calculs. Donc, nous avons imposé des contraintes unimodales sur les distributions bêta a priori et utilisé un échantillonneur de Gibbs par blocs pour effectuer les calculs. Nous avons comparé les modèles hétérogène et homogène au moyen d’un exemple et d’une étude en simulation. Comme il fallait s’y attendre, le modèle double avec corrélations hétérogènes est celui qui est privilégié.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 12-001-X201700114836
    Description :

    La collecte de données par sondage axée sur le Web, qui consiste à prendre contact avec les enquêtés par la poste pour leur demander de répondre par Internet et à retenir les autres modes de réponse jusqu’à un stade ultérieur du processus de mise en œuvre, a connu un essor rapide au cours de la dernière décennie. Le présent article décrit les raisons pour lesquelles cette combinaison novatrice de modes de prise de contact et de réponse aux enquêtes était nécessaire, les principales étant la diminution de l’efficacité de la téléphonie vocale et l’élaboration plus lente que prévu de méthodes de collecte de données par courriel/Internet uniquement. Les obstacles historiques et institutionnels à cette combinaison de modes d’enquête sont également examinés. Vient ensuite une description de la recherche fondamentale sur l’utilisation des listes d’adresses postales aux États-Unis, ainsi que les effets de la communication auditive et visuelle sur la mesure par sondage, suivie d’une discussion des efforts expérimentaux en vue de créer une méthodologie axée sur le Web comme remplacement viable des enquêtes à réponse par téléphone ou par la poste. De nombreux exemples d’usage courant ou prévu de la collecte de données axée sur le Web sont fournis. L’article se termine par une discussion des promesses et des défis considérables qui résultent du recours plus important aux méthodes d’enquête axées sur le Web.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 82-003-X201700614829
    Description :

    Le POHEM-IMC est un outil de microsimulation comprenant un modèle de l’IMC chez les adultes et un modèle des antécédents en matière d’IMC pendant l’enfance. Cet aperçu décrit l’élaboration de modèles de prédiction de l’IMC chez les adultes et des antécédents en matière d’IMC pendant l’enfance, et compare les estimations de l’IMC projetées aux estimations issues de données d’enquête représentatives de la population canadienne pour en établir la validité.

    Date de diffusion : 2017-06-21

  • Articles et rapports : 11-633-X2017007
    Description :

    La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 30 ans. La BDIM combine des fichiers de données administratives sur les admissions d’immigrants et sur les permis de résidence non permanente provenant d’Immigration, Réfugiés et Citoyenneté Canada (IRCC) à des fichiers de données fiscales provenant de l’Agence du revenu du Canada (ARC). Ces données sont disponibles pour des immigrants déclarants admis à partir de 1980. Les dossiers de déclarants sont disponibles pour les immigrants déclarants depuis 1982.

    Ce rapport vise à discuter des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatifs à l’immigration ainsi que des analyses que permet la BDIM.

    Date de diffusion : 2017-06-16

  • Revues et périodiques : 12-605-X
    Description :

    Le Modèle du processus d'un projet de couplage d'enregistrements (MPPCE) a été développé par Statistique Canada pour identifier les processus et les activités mis en œuvres dans des projets de couplage d'enregistrements. Le MPPCE s'applique aux projets menés aux niveaux tant individuel que de l'entreprise en utilisant diverses sources de données pour créer des nouvelles sources de données.

    Date de diffusion : 2017-06-05

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-05-12

  • Articles et rapports : 18-001-X2017002
    Description :

    Ce document de travail décrit la méthodologie utilisée pour mesurer l’éloignement à l’échelon de la collectivité. La méthode tient compte de résultats de travaux récents sur le sujet et tire avantage de nouvelles possibilités de calcul découlant de l’intégration de statistiques officielles avec des données provenant de sources statistiques non officielles. L’approche adoptée pour le calcul prend en compte de multiples points d’accès aux services. De plus, elle établit un continuum englobant des collectivités dont les infrastructures de transport et le degré d’accès diffèrent, tout en conservant l’information sur les infrastructures de transport des collectivités dans la base de données. Le document présente également une méthode d’ajout de mesures de l’accessibilité à certains services ainsi qu’un exemple du calcul des mesures de l’accessibilité.

    Date de diffusion : 2017-05-09

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-04-21

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-03-16

  • Articles et rapports : 11-633-X2017006
    Description :

    Ce document décrit une méthode d’imputation des codes postaux manquants dans une base de données longitudinale. La base de données Cohorte santé et environnement du Recensement du Canada (CSERCan) de 1991, qui contient des renseignements sur les répondants au questionnaire détaillé du Recensement de 1991, couplée avec les fichiers des déclarations de revenus T1 pour la période allant de 1984 à 2011, est utilisée pour illustrer et valider la méthode. La cohorte contient jusqu’à 28 champs consécutifs de codes postaux de résidences, mais en raison des vides fréquents dans l’historique des codes postaux, les codes postaux manquants doivent être imputés. Pour valider la méthode d’imputation, deux expériences ont été mises au point dans lesquelles 5 % et 10 % de tous les codes postaux issus d’un sous-ensemble comportant des historiques complets ont été effacés de façon aléatoire et imputés.

    Date de diffusion : 2017-03-13

Références (698)

Références (698) (25 of 698 results)

  • Index et guides : 98-500-X
    Description :

    Fournit des renseignements qui permettent aux utilisateurs d’utiliser les données du Recensement de la population de manière efficace, de les mettre en application et de les interpréter. Chaque guide renferme des définitions et des explications sur les concepts du recensement ainsi qu’une rubrique sur la qualité des données et la comparabilité historique. Des renseignements supplémentaires seront inclus pour des variables spécifiques afin d'aider les utilisateurs à mieux comprendre les concepts et les questions utilisés dans le recensement.

    Date de diffusion : 2017-11-29

  • Produits techniques : 84-538-X
    Description :

    Ce document présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires et ce, à partir de la période de référence 1980-1982.

    Date de diffusion : 2017-11-16

  • Produits techniques : 12-206-X
    Description :

    Ce rapport résume les travaux réalisés dans le cadre d'un programme parrainé par les trois divisions de la méthodologie de Statistique Canada. Ce programme couvre les activités de recherche et de développement liées aux méthodes statistiques pouvant être appliquées à grande échelle aux programmes d'enquêtes du Bureau qui, autrement, n'auraient pas été offertes parmi les services de méthodologie de ces programmes d'enquête. Elles comportent aussi des tâches de soutien à l'intention des clients concernant l'application d'exploitations antérieures fructueuses, qui visent à promouvoir l'utilisation des résultats de recherche et des travaux préparatoires.

    Date de diffusion : 2017-11-03

  • Index et guides : 12-606-X
    Description :

    Ceci est une trouse destiné à aider des producteurs et des utilisateurs de données à l'externe de Statistique Canada.

    Date de diffusion : 2017-09-27

  • Produits techniques : 12-586-X
    Description :

    Le Cadre d’assurance de la qualité (CAQ) est l’outil de gouvernance de niveau le plus élevé pour la gestion de la qualité à Statistique Canada. Il fournit un aperçu des stratégies de gestion de la qualité et d’atténuation des risques adoptées par les différents secteurs de programme de l’organisme. Le CAQ est utilisé conjointement avec les pratiques de gestion de Statistique Canada, comme celles décrites dans les Lignes directrices concernant la qualité.

    Date de diffusion : 2017-04-21

  • Produits techniques : 91-621-X2017001
    Date de diffusion : 2017-01-25

  • Produits techniques : 75F0002M
    Description :

    Cette série comprend de la documentation détaillée sur revenu, notamment les problèmes de conception, l'évaluation qualitative des données et les recherches préliminaires.

    Date de diffusion : 2016-07-08

  • Produits techniques : 75F0002M2016003
    Description :

    Les statistiques sur le revenu sont périodiquement mises à jour pour rendre compte des plus récentes estimations de population fondées sur les données du recensement. Ainsi, avec la diffusion des données de 2014 de l’Enquête canadienne sur le revenu, Statistique Canada a révisé les estimations pour la période de 2006 à 2013 en s’appuyant sur les nouveaux chiffres de population du Recensement de 2011. Le présent document fournit des estimations non révisées ainsi que des estimations révisées pour des statistiques de revenus clés, ainsi qu’une description des changements les plus significatifs.

    Date de diffusion : 2016-07-08

  • Produits techniques : 11-522-X
    Description :

    Depuis 1984, un série de conférences annuelles a été parrainé par Statistique Canada. Le recueil de la conférence est disponible depuis 1987.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014735
    Description :

    La diffusion de microdonnées exige habituellement des méthodes de réduction et de modification des données, et le degré d’application de ces méthodes dépend des méthodes de contrôle qui seront nécessaires pour accéder aux données et les utiliser. Le calcul sécurisé est une approche qui, dans certaines circonstances, convient davantage pour accéder aux données à des fins statistiques; il permet le calcul de fonctions analytiques à l’égard de données chiffrées sans qu’il soit nécessaire de déchiffrer les données sources sous-jacentes pour procéder à une analyse statistique. Cette approche permet aussi à plusieurs emplacements de fournir des données, tout en garantissant une protection rigoureuse de la vie privée. De cette façon, les données peuvent être regroupées, et les fournisseurs de données peuvent calculer des fonctions analytiques, sans qu’aucune des parties ne connaisse les entrées des autres. À l’aide de certains résultats théoriques et d’exemples réels issus du domaine des soins de santé, nous expliquerons comment le calcul sécurisé peut être appliqué dans des contextes pratiques.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014749
    Description :

    Dans le cadre du remaniement du Programme de la statistique du tourisme, Statistique Canada élabore l’Enquête nationale sur les voyages (ENV), qui recueillera de l’information relativement aux voyages effectués par les voyageurs canadiens. Cette nouvelle enquête remplacera l’actuelle Enquête sur les voyages des résidents du Canada, de même que la composante reliée aux voyages des résidents canadiens de l’Enquête sur les voyages internationaux. L’ENV tirera parti des bases de sondage communes de Statistique Canada et des outils de traitement communs, tout en maximisant l’utilisation des données administratives. Dans cette communication, on montrera comment les données administratives, comme celles provenant des fichiers de Passeport Canada, de l’Agence des services frontaliers du Canada et de l’Agence du revenu du Canada, pourraient servir à améliorer l’efficacité du plan de sondage de l’ENV.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014758
    Description :

    "Plusieurs secteurs de compétence au Canada, y compris l’Ontario, utilisent dans leurs modèles de financement des données sur les soins de santé axées sur les patients. Ces initiatives peuvent influencer la qualité de ces données, tant de façon positive que négative, les personnes ayant tendance à accorder davantage d’attention aux données et à leur qualité lorsqu’elles servent à prendre des décisions financières. La formule de financement de l’Ontario utilise des données de plusieurs bases de données nationales hébergées par l’Institut canadien d’information sur la santé (ICIS). Ces bases de données fournissent des renseignements sur les activités et le statut clinique des patients pour un continuum de soins. Comme les modèles de financement peuvent influencer le comportement du codage, l’ICIS collabore avec le Ministère ontarien de la santé et des soins de longue durée, afin d’évaluer et de contrôler la qualité de ces données. L’ICIS utilise un logiciel de forage des données et des techniques de modélisation (qui sont souvent associées aux « mégadonnées »), afin de déceler les anomalies dans les données pour plusieurs facteurs. Les modèles déterminent les tendances de codage clinique « typiques » pour des groupes clés de patients (p. ex. les patients vus dans des unités de soins spéciaux ou renvoyés chez eux pour des soins à domicile), afin que des valeurs aberrantes puissent être déterminées, lorsque les patients ne s’inscrivent pas dans la tendance attendue. Une composante clé de la modélisation est la segmentation des données selon les caractéristiques du patient, du fournisseur et de l’hôpital, afin de tenir compte des différences principales dans la prestation des soins de santé et les populations de patients dans la province. L’analyse de l’ICIS a permis d’identifier plusieurs hôpitaux dont les pratiques de codage semblent changer ou être significativement différentes par rapport à celles de leur groupe de pairs. Des examens plus poussés sont requis pour comprendre pourquoi ces différences existent et pour élaborer des stratégies appropriées pour atténuer les variations. "

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014741
    Description :

    Le mandat de Statistique Canada comprend la production de données statistiques en vue de faire la lumière sur les questions d’actualité touchant les entreprises. Le couplage des enregistrements de données d’entreprises est un aspect important de l’élaboration, de la production, de l’évaluation et de l’analyse de ces données statistiques. Comme le couplage d’enregistrements peut faire intrusion dans la vie privée, Statistique Canada n’y recourt que si l’intérêt public est manifeste et l’emporte sur les inconvénients de l’intrusion. Le couplage d’enregistrements connaît un renouveau déclenché par un usage plus important de données administratives par un grand nombre de programmes statistiques. Le couplage d’enregistrements de données d’entreprises pose de nombreux défis. Par exemple, plusieurs fichiers administratifs ne contiennent pas d’identificateurs communs, les données sont consignées dans des formats non normalisés, certaines données contiennent des erreurs typographiques, les fichiers de données administratives sont habituellement de grande taille, et enfin, l’évaluation de multiples paires d’enregistrements rend les comparaisons absolues difficiles, voire parfois impossibles. Étant donné l’importance et les défis du couplage d’enregistrements, Statistique Canada a élaboré une norme en vue d’aider les utilisateurs à optimiser leur processus de couplage d’enregistrements de données d’entreprises. Ainsi, ce processus comprend l’exploitation d’une stratégie de groupement des enregistrements qui réduit le nombre de paires d’enregistrements à comparer et à apparier, l’utilisation d’un logiciel interne de Statistique Canada pour procéder à des couplages déterministes et probabilistes, et la création de champs standardisés pour le nom et l’adresse des entreprises dans le Registre des entreprises de Statistique Canada. Le présent article donne un aperçu de la méthode de couplage d’enregistrements de données d’entreprises et examine divers projets économiques qui font appel au couplage d’enregistrements à Statistique Canada, notamment dans les domaines des Comptes nationaux, du commerce international, de l’agriculture et du Registre des entreprises.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014706
    Description :

    Au cours de la dernière décennie, la Division des prix à la production de Statistique Canada a élargi son programme d’Indices des prix à la production pour les services, tout en continuant d’améliorer son programme d’Indices des prix à la production de la construction et des biens. Même si la majorité des indices des prix sont fondés sur des méthodes d’enquêtes traditionnelles, des efforts ont été déployés pour utiliser davantage de données administratives et d’autres sources de données, afin de réduire le fardeau pour nos répondants. Ce manuscrit qui est axé principalement sur les programmes des prix à la production fournit également des renseignements sur l’importance grandissante des sources de données alternatives à Statistique Canada. Il présente aussi les défis opérationnels et les risques auxquels les bureaux statistiques pourraient faire face s’ils comptaient de plus en plus sur les produits de tiers. Finalement, il présente les outils en cours d’élaboration afin d’intégrer les données alternatives, tout en recueillant des métadonnées.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014738
    Description :

    Sous l’approche classique de traitement des observations manquantes fondée sur le plan de sondage, la construction de classes de pondération et le calage sont utilisés pour ajuster les poids de sondage pour les répondants présents dans l’échantillon. Ici, nous utilisons ces poids ajustés pour définir une loi de Dirichlet qui peut servir à faire des inférences au sujet de la population. Des exemples montrent que les procédures résultantes possèdent de meilleures propriétés de performance que les méthodes classiques quand la population est asymétrique.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014729
    Description :

    Les ensembles de données administratives servent de plus en plus couramment de sources de données en statistique officielle dans le cadre d’efforts visant à produire plus efficacement un plus grand nombre de produits. De nombreux produits résultent du couplage de deux ensembles de données ou plus, souvent réalisé en plusieurs phases en appliquant différentes méthodes et règles. Dans ces situations, nous aimerions pouvoir évaluer la qualité du couplage, ce qui comprend une certaine réévaluation des liens ainsi que des non-liens. Dans le présent article, nous discutons de méthodes d’échantillonnage en vue d’obtenir des estimations du nombre de faux négatifs et de faux positifs, en exerçant un contrôle raisonnable sur l’exactitude des estimations ainsi que sur les coûts. Des approches de stratification des liens (non-liens) pour l’échantillonnage sont évaluées en utilisant des données provenant du recensement de la population de l’Angleterre et du Pays de Galles de 2011.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014723
    Description :

    Le U.S. Census Bureau est à la recherche de façons d’utiliser les dossiers administratifs dans les opérations d’enquête et les opérations décennales afin de réduire les coûts et le fardeau des répondants, tout en préservant la qualité des données. Parmi les utilisations possibles des dossiers administratifs figure l’utilisation des données en l’absence de réponses sur la race et l’origine hispanique. Lorsque les dossiers administratifs fédéraux et de tiers sont compilés, les réponses concernant la race et l’origine hispanique ne sont pas toujours les mêmes pour la même personne dans les différentes sources de dossiers administratifs. Nous explorons différents ensembles de règles opérationnelles servant à attribuer une réponse pour la race et l’origine hispanique lorsque ces réponses diffèrent entre les sources. Nous décrivons aussi les caractéristiques des personnes dont les données sur la race et l’origine hispanique correspondent, ne correspondent pas et sont manquantes pour plusieurs variables démographiques, des ménages et contextuelles. Nous avons déterminé que les personnes appartenant à des minorités, et plus particulièrement les personnes d’origine hispanique, sont plus susceptibles d’avoir des réponses sur l’origine hispanique et la race qui ne correspondent pas dans les dossiers administratifs que dans le Recensement de 2010. Les Hispaniques sont moins susceptibles d’avoir des données manquantes sur l’origine hispanique, mais plus susceptibles d’avoir des données manquantes sur la race dans les dossiers administratifs. Les Asiatiques non hispaniques et les habitants des îles du Pacifique non hispaniques sont plus susceptibles d’avoir des données manquantes sur la race et l’origine hispanique dans les dossiers administratifs. Les personnes plus jeunes, les locataires, les personnes vivant dans des ménages de deux personnes ou plus, les personnes qui ont répondu au recensement dans le cadre de l’opération de suivi de la non-réponse ainsi que les personnes résidant dans des régions urbaines sont plus susceptibles d’avoir des réponses sur la race et l’origine ethnique qui ne correspondent pas.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014755
    Description :

    La National Children Study, dans sa phase pilote, est une étude de cohorte épidémiologique à grande échelle des enfants et de leurs parents. Des mesures ont été recueillies, de la période précédant la grossesse jusqu’à ce que l’enfant atteigne l’âge adulte. L’utilisation des données existantes visait à compléter la collecte directe de données auprès des répondants. Notre document énonce la stratégie pour le catalogage et l’évaluation des sources de données existantes, en vue de leur utilisation longitudinale à grande échelle. Dans le cadre de notre examen, nous avons sélectionné cinq facteurs d’évaluation pour guider les chercheurs à l’égard des sources de données disponibles : 1) pertinence, 2) actualité, 3) spatialité, 4) accessibilité et 5) exactitude.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014752
    Description :

    Le présent article décrit une nouvelle méthode de calcul des indices de prix pour le traitement des données issues de transactions électroniques (données de lecteurs optiques). Les indices de prix sont calculés sous forme du ratio d’un indice du chiffre d’affaires et d’un indice pondéré de quantité. Les pondérations de produits des quantités vendues sont calculées à partir des prix corrigés de l’inflation pour chaque mois de l’année de publication courante. Les nouveaux produits peuvent être incorporés en temps voulu, sans imputation de prix, de manière à ce que toutes les transactions puissent être traitées. Les pondérations des produits sont mises à jour mensuellement et sont utilisées afin de calculer les indices directs par rapport à un mois de base fixe. Les indices des prix construits de cette façon sont exempts du problème de « chain drift » (biais de chaînage). Les résultats sont robustes avec des écarts des choix méthodologiques. La méthode fait partie du programme de l’IPC des Pays-Bas depuis janvier 2016, quand elle a été appliquée pour la première fois aux téléphones mobiles.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014722
    Description :

    Le U.S. Census Bureau cherche des façons d’intégrer des données administratives dans les opérations des recensements décennaux et des enquêtes. Pour mener ces travaux, il est essentiel de comprendre la couverture de la population dans les dossiers administratifs. À partir de données administratives fédérales et de tiers couplées avec celles de l’American Community Survey (ACS), nous évaluons dans quelle mesure les dossiers administratifs fournissent des données sur les personnes nées à l’étranger dans l’ACS, et nous utilisons des techniques de régression logistique multinomiale pour évaluer les caractéristiques de celles qui figurent dans les dossiers administratifs par rapport à celles qui n’y figurent pas. Nous avons déterminé que, dans l’ensemble, les dossiers administratifs fournissent une bonne couverture des personnes nées à l’étranger dans notre échantillon pour lesquelles un appariement peut être déterminé. La probabilité de figurer dans les dossiers administratifs semble être liée aux processus d’assimilation des immigrants : la naturalisation, une meilleure connaissance de la langue anglaise, le niveau de scolarité, et un emploi à temps plein étant associés à une plus grande probabilité de figurer dans les dossiers administratifs. Ces résultats laissent supposer qu’au fur et à mesure que les immigrants s’adaptent à la société américaine et s’y intègrent, ils sont plus susceptibles de participer aux processus et aux programmes gouvernementaux et commerciaux pour lesquels nous incluons des données. Nous explorons ensuite la couverture des dossiers administratifs pour les deux groupes raciaux/ethniques les plus importants de notre échantillon, à savoir les personnes nées à l’étranger de race hispanique et de race asiatique unique non hispanique, en déterminant encore une fois que les caractéristiques liées à l’assimilation sont associées à une couverture des deux groupes dans les dossiers administratifs. Toutefois, nous observons que le contexte du quartier a des répercussions différentes sur les personnes d’origine hispanique et asiatique.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014728
    Description :

    "Le couplage d’enregistrements a pour objet de jumeler deux ou plusieurs sources de données. Le produit du couplage d’enregistrements est un fichier qui comprend un enregistrement par individu dans lequel est contenue toute l’information au sujet de cet individu provenant de plusieurs fichiers. Le problème de couplage est difficile lorsqu’on ne dispose pas d’une clé d’identification unique, qu’il existe des erreurs dans certaines variables, que certaines données manquent, et que les fichiers sont grands. Le couplage probabiliste d’enregistrements consiste à calculer une probabilité que les enregistrements provenant de fichiers différents appartiennent à un même individu. Il arrive que de faibles probabilités d’appariement soient attribuées à de vrais appariements et que des probabilités élevées soient attribuées à des non appariements. Les erreurs de désignation des appariements peuvent causer un biais dans les analyses portant sur la base de données composite. Les registres du cancer du programme SEER contiennent de l’information sur les cas de cancer du sein dans les régions qu’ils desservent. Un test fondé sur l’analyse de l’oncotype DX, effectuée par Genomic Health, Inc. (GHI), est souvent utilisé pour certains types de cancer du sein. Un couplage d’enregistrements en utilisant des renseignements personnels permettant l’identification a été effectué pour associer les résultats de l’analyse de l’oncotype DX aux données des registres du cancer du programme SEER. Le logiciel Link Plus a été utilisé pour générer une cote décrivant la similarité des enregistrements et repérer ainsi, pour les individus inscrits dans les registres du cancer du programme SEER, l’appariement paraissant le meilleur avec la base de données GHI. Un examen manuel a été effectué pour vérifier des échantillons d’appariements probables, d’appariements possibles et d’appariements improbables. Des modèles sont proposés pour modéliser conjointement le processus de couplage d’enregistrements et l’analyse statistique subséquente dans la présente application et dans d’autres. "

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014733
    Description :

    La valeur sociale des collectes de données est améliorée de façon marquée par la vaste diffusion des fichiers de recherche et l’augmentation en découlant de la productivité scientifique. À l’heure actuelle, la plupart des études sont conçues en vue de recueillir des données utiles et exactes au niveau analytique, en se préoccupant peu de la façon dont elles seront mises en commun. Tant les ouvrages publiés que la pratique reposent sur le principe que l’analyse de la divulgation aura lieu après la collecte. Toutefois, pour produire des données à grande diffusion comportant la plus grande utilité analytique possible pour le groupe d’utilisateurs le plus important, on doit tenir compte du risque de divulgation au début du processus de recherche. À partir de cadres théoriques de décisions économiques et statistiques et de recherches en méthodes d’enquête, cette communication vise à améliorer la productivité scientifique des données de recherche partagées en décrivant comment le risque de divulgation peut être résolu aux étapes les plus précoces de la recherche, grâce à la formulation de « plans sécuritaires » et de « simulations de divulgation », une approche statistique appliquée ayant été adoptée pour : 1) l’élaboration et la validation de modèles qui prédisent la composition des données d’enquête selon différents plans d’échantillonnage; 2) la sélection et/ou l’élaboration de mesures et de méthodes utilisées pour déterminer le risque de divulgation, l’utilité analytique et les coûts de la divulgation des données d’enquête qui conviennent le mieux pour l’évaluation des plans d’échantillonnage et de bases de données; et 3) la tenue de simulations pour recueillir des estimations du risque, de l’utilité et du coût des études comportant une vaste gamme de caractéristiques d’échantillonnage et de conception de bases de données.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014745
    Description :

    Au moment de la conception des enquêtes, un certain nombre de paramètres, comme la propension à la prise de contact, la propension à la participation et les coûts par unité d’échantillonnage, jouent un rôle décisif. Dans le cas des enquêtes permanentes, ces paramètres de conception d’enquête sont habituellement estimés à partir de l’expérience antérieure et mis à jour graduellement, au fur et à mesure des nouvelles expériences. Dans les nouvelles enquêtes, ces paramètres sont estimés à partir de l’opinion des experts et de l’expérience acquise dans des enquêtes similaires. Même si les instituts de sondage ont une expertise et une expérience relativement bonnes, l’énoncé, l’estimation et la mise à jour des paramètres de conception d’enquête se font rarement de façon systématique. Dans la présentation, nous proposons un cadre bayésien qui permet de prendre en compte et de mettre à jour les connaissances acquises et les opinions des experts concernant les paramètres. Ce cadre est établi dans le contexte de plans de collecte adaptatifs, dans lesquels les différentes unités de population peuvent être traitées différemment compte tenu des objectifs de qualité et de coût. Pour ce type d’enquête, l’exactitude des paramètres de conception devient encore plus cruciale pour prendre des décisions efficaces. Le cadre permet une analyse bayésienne du rendement d’une enquête pendant la collecte des données et entre les vagues. Nous démontrons l’analyse bayésienne au moyen d’une étude de simulation réaliste.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014751
    Description :

    Pratiquement tous les grands détaillants utilisent des lecteurs optiques pour enregistrer de l’information sur les transactions avec leurs clients (consommateurs). Ces données comprennent habituellement un code de produits, une brève description, un prix et une quantité vendue. Il s’agit d’une source hautement pertinente pour les programmes statistiques comme l’Indice des prix à la consommation (IPC) de Statistique Canada, l’un des plus importants indicateurs économiques au pays. L’utilisation des données de lecteurs optiques pourrait améliorer la qualité de l’IPC par, entre autres, l’augmentation du nombre de prix utilisés dans les calculs, une plus grande couverture géographique et l’utilisation des quantités vendues, tout en réduisant les coûts de collecte. Cependant, l’utilisation de ces données présente de nombreux défis. L’exploration de données de lecteurs optiques obtenues auprès d’un premier détaillant a démontré un taux de changement élevé au cours d’une année parmi les codes identifiant les produits. Les conséquences de ces changements posent des défis d’un point de vue de la classification des produits et de la qualité des estimations. Cet article se concentrera sur les enjeux reliés à l’acquisition, la classification et l’exploration de ces données afin d’évaluer la qualité pour leur utilisation dans l’IPC.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014713
    Description :

    Le terme mégadonnées peut signifier différentes choses pour différentes personnes. Pour certaines, il s’agit d’ensembles de données que nos systèmes classiques de traitement et d’analyse ne peuvent plus traiter. Pour d’autres, cela veut simplement dire tirer parti des ensembles de données existants de toutes tailles et trouver des façons de les fusionner, avec comme objectif de produire de nouveaux éléments de connaissance. La première perspective présente un certain nombre de défis importants pour les études traditionnelles de marché, recherches sur l’opinion et recherches sociales. Dans l’un ou l’autre cas, il existe des répercussions pour l’avenir des enquêtes, qu’on commence à peine à explorer.

    Date de diffusion : 2016-03-24

Date de modification :