Statistiques par sujet – Méthodes statistiques

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Enquête ou programme statistique

40 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Enquête ou programme statistique

40 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Enquête ou programme statistique

40 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Année de publication

43 facettes affichées. 0 facettes sélectionnées.

Enquête ou programme statistique

40 facettes affichées. 0 facettes sélectionnées.

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Autres ressources disponibles pour appuyer vos recherches.

Aide pour trier les résultats
Explorer notre base centrale des principaux concepts normalisés, définitions, sources de données et méthodes.
En cours de chargement
Chargement en cours, veuillez patienter...
Tout (1 610)

Tout (1 610) (25 of 1,610 results)

  • Articles et rapports : 13-604-M2018087
    Description :

    Statistique Canada publie régulièrement des indicateurs macroéconomiques sur les actifs, les passifs et la valeur nette des ménages dans le cadre des comptes du bilan national (CBN) trimestriels. Ces comptes correspondent aux plus récentes normes internationales et constituent la source des estimations du patrimoine national pour tous les secteurs de l’économie, y compris les ménages, les institutions sans but lucratif, les administrations publiques et les sociétés, de même que la position du Canada en matière de richesse par rapport au reste du monde. Bien que les CBN fournissent des renseignements de grande qualité sur la position globale des ménages relativement aux autres secteurs économiques, ils ne possèdent pas la granularité requise pour comprendre les vulnérabilités de certains groupes particuliers et les conséquences qui en résultent sur le plan du bien-être économique et de la stabilité financière.

    Date de diffusion : 2018-04-13

  • Produits techniques : 75F0002M
    Description :

    Cette série comprend de la documentation détaillée sur revenu, notamment les problèmes de conception, l'évaluation qualitative des données et les recherches préliminaires.

    Date de diffusion : 2018-04-05

  • Produits techniques : 75F0002M2018001
    Description :

    Cette étude passe en revue les changements apportés en 2018 à la méthodologie utilisée pour calculer la mesure de faible revenu de la famille de recensement, en faisant appel au Fichier des familles (FFT1; données des déclarants). Ces changements font en sorte que la méthodologie concorde mieux avec d’autres sources de données de Statistique Canada, comme le Recensement de la population et l’Enquête canadienne sur le revenu. Afin de tenir compte des changements apportés à la méthodologie, de nouveaux tableaux standard du FFT1 fournissant des données sur la mesure de faible revenu de la famille de recensement (revenu après impôt) à partir de 2004 ont été introduits.

    Date de diffusion : 2018-04-05

  • Produits techniques : 75F0002M2018002
    Description :

    Cette étude passe en revue les différences entre les statistiques de mesure de faible revenu (MFR) après impôt provenant de deux sources de données qui font appel à des données fiscales administratives comme intrants principaux : le Recensement de la population de 2016 et le Fichier des familles T1 (FFT1). Elle présente un résumé des deux sources de données et une comparaison des statistiques de MFR en mettant l’accent sur l’unité d’analyse, les seuils de MFR après impôt et le pourcentage de la population sous la MFR. L’étude examine en outre les facteurs que les utilisateurs pourraient prendre en considération au moment de choisir une source de données par rapport à une autre.

    Date de diffusion : 2018-04-05

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2018-04-03

  • Revues et périodiques : 11-633-X
    Description :

    Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.

    Date de diffusion : 2018-03-27

  • Articles et rapports : 11-633-X2018016
    Description :

    Le couplage d’enregistrements a été reconnu comme mécanisme possible pour inclure des renseignements sur les traitements dans le Registre canadien du cancer (RCC). Le Projet de couplage des données sur le traitement du cancer au Canada (PCDTCC) a pour objet d’ajouter des données sur les traitements chirurgicaux au RCC. La Base de données sur les congés des patients (BDCP) et le Système national d’information sur les soins ambulatoires (SNISA) ont été couplés au RCC, et les données sur les traitements chirurgicaux ont été extraites. Le projet a été financé dans le cadre de l’Initiative de développement concerté des données du Partenariat canadien contre le cancer.

    Le PCDTCC a été conçu comme une étude de faisabilité dans le cadre de laquelle les dossiers de patients contenus dans le RCC seraient couplés aux enregistrements sur les traitements chirurgicaux contenus dans la BDCP et le SNISA, tenus par l’Institut canadien d’information sur la santé. La cohorte cible pour le couplage des données sur les traitements chirurgicaux était les patients âgés de 19 ans ou plus inscrits au RCC (de 2010 à 2012). Le couplage a été fait dans l’Environnement de couplage de données sociales (ECDS) de Statistique Canada.

    Date de diffusion : 2018-03-27

  • Articles et rapports : 11-629-X2018002
    Description :

    Célébrez le centenaire de Statistique Canada en jetant un coup d’œil au chemin que nous avons parcouru avec le Canada.

    Date de diffusion : 2018-03-16

  • Produits techniques : 84-538-X
    Description :

    Ce document présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires et ce, à partir de la période de référence 1980-1982.

    Date de diffusion : 2018-02-23

  • Articles et rapports : 11-633-X2018015
    Description :

    Le présent document porte sur le processus d’estimation du volume de consommation de cannabis au Canada, selon le groupe d’âge, de 1960 à 2015. La consommation de cannabis est estimée au moyen d’un modèle qui comprend d’abord une estimation du nombre de consommateurs de cannabis chez les personnes âgées de 15 à 17 ans, de 18 à 24 ans, de 25 à 44 ans et de 45 à 64 ans. Pour ce faire, on estime la prévalence de la consommation de cannabis sur la base de plusieurs sources de données d’enquête. Les consommateurs de chaque groupe d’âge sont divisés en catégories, selon la fréquence annuelle de consommation : une fois au cours de la dernière année, moins d’une fois par mois, une à trois fois par mois, chaque semaine (mais pas chaque jour) et chaque jour. Chacune des catégories de fréquence de consommation est par la suite associée à une quantité de cannabis consommée.

    Date de diffusion : 2018-02-21

  • Articles et rapports : 82-003-X201800254908
    Description :

    Cette étude a examiné neuf enquêtes nationales menées auprès de la population à domicile dont les données sur la consommation de drogues ont été recueillies au cours de la période de 1985 à 2015. Ces enquêtes sont examinées aux fins de comparabilité, et leurs données sont utilisées pour estimer la consommation de cannabis (totale et selon le sexe et l'âge) au cours de l'année précédente, désignée comme la consommation courante. Au moyen des données qui se prêtent le mieux à la comparaison, les tendances en matière de consommation de 2004 à 2015 sont estimées.

    Date de diffusion : 2018-02-21

  • Articles et rapports : 11-633-X2018014
    Description :

    La Base canadienne de données sur la mortalité (BCDM) est une base de données administratives qui recueille des renseignements sur la cause de décès auprès de tous les registres provinciaux et territoriaux de la statistique de l’état civil au Canada. La Base canadienne de données sur la mortalité (BCDM) ne comporte pas d’identificateurs de la sous-population pour examiner les taux de mortalité et les disparités entre des groupes tels que les Premières Nations, les Métis, les Inuits et les groupes de minorités visibles. Le couplage des données de la BCDM à celles du Recensement de la population permet de contourner ce problème. Le présent rapport décrit un couplage de la BCDM (2006 à 2011) au Recensement de la population de 2006, qui a été réalisé au moyen d’un appariement exact déterministe hiérarchique, en mettant l’accent sur la méthodologie et la validation.

    Date de diffusion : 2018-02-14

  • Articles et rapports : 11-633-X2018013
    Description :

    Depuis 2008, plusieurs recensements de la population ont été couplés à des données administratives sur la santé et à des données financières. Ces ensembles de données couplés ont été déterminants pour examiner les inégalités en matière de santé et ont servi à la recherche sur la salubrité de l’environnement. Le présent article décrit la création de la Cohorte santé et environnement du recensement canadien (CSERCan) de 1996 : 3,57 millions de personnes qui ont répondu au questionnaire détaillé du recensement et qui ont rétrospectivement fait l’objet d’un suivi relatif à la mortalité et à la mobilité pendant 16,6 ans, de 1996 à 2012. La CSERCan de 1996 était limitée aux répondants au recensement qui étaient âgés de 19 ans ou plus le jour du recensement (le 14 mai 1996), qui étaient résidents du Canada, qui ne résidaient pas dans un établissement institutionnel et qui avaient déposé une déclaration de revenus. Ces répondants ont été couplés aux enregistrements de décès de la Base canadienne de données sur la mortalité ou au fichier maître des particuliers T1 et à un historique de codes postaux provenant de diverses sources. Il s’agit de la troisième CSERCan d’une série de cohortes qui, une fois combinées, permettent d’examiner les tendances en matière de mortalité et d’expositions environnementales par caractéristiques socioéconomiques pendant trois cycles de recensement et 21 ans de données de recensement, de données fiscales et de données sur la mortalité. Le présent rapport décrit les méthodologies de couplage, la validation et l’évaluation des biais, ainsi que les caractéristiques de la CSERCan de 1996. On y évalue également la mesure dans laquelle la CSERCan de 1996 représente la population adulte du Canada.

    Date de diffusion : 2018-01-22

  • Articles et rapports : 11-633-X2018012
    Description :

    La présente étude examine la mesure dans laquelle les redressements et les retards de production des déclarations de revenus influent sur la fiabilité des ensembles de données fiscales administratives canadiennes utilisées dans le cadre d’une analyse économique. L’étude est basée sur les dossiers fiscaux individuels provenant du fichier maître sur les particuliers T1 et du fichier maître sur les particuliers historique T1 pour certaines années pendant la période allant de 1990 à 2010. Ces ensembles de données contiennent des dossiers fiscaux pour environ 100 % des déclarants initiaux et pour tous les déclarants ayant soumis des déclarations de revenus à l’Agence du revenu du Canada (ARC) avant les dates limites de traitement.

    Date de diffusion : 2018-01-11

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2018-01-08

  • Articles et rapports : 11-633-X2018011
    Description :

    La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 30 ans. La BDIM combine des fichiers de données administratives sur les admissions d’immigrants et sur les permis de résidence non permanente provenant d’Immigration, Réfugiés et Citoyenneté Canada (IRCC) à des fichiers de données fiscales provenant de l’Agence du revenu du Canada (ARC). Ces données sont disponibles pour des immigrants déclarants admis à partir de 1980. Les dossiers de déclarants sont disponibles pour les immigrants déclarants depuis 1982.

    Ce rapport vise à discuter des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatifs à l’immigration ainsi que des analyses que permet la BDIM.

    Date de diffusion : 2018-01-08

  • Microdonnées à grande diffusion : 89F0002X
    Description :

    La BD/MSPS est un modèle de microsimulation statique qui sert à l'analyse des interactions financières entre les gouvernements et les particuliers au Canada. Elle permet de calculer les impôts payés aux gouvernements et les transferts monétaires reçus de ceux-ci. Elle est formée d'une base de données, d'une série d'algorithmes et de modèles relatifs aux impôts et aux transferts, d'un logiciel d'analyse et de la documentation de l'utilisateur.

    Date de diffusion : 2018-01-08

  • Articles et rapports : 18-001-X2017001
    Description :

    Ce document de travail donne un profil des entreprises canadiennes qui développement et produisent des bioproduits. Ce rapport fournit les données sur le nombre et les types d'entreprises bioproduits en 2015, incluant les recettes bioproduits, la recherche et le développement, utilisation de la biomasse, les brevets, les produits, les pratiques de l'entreprise et l'impact des réglementations gouvernementales sur ce secteur.

    Date de diffusion : 2017-12-22

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-12-21

  • Enquêtes et programmes statistiques — Documentation : 71-526-X
    Description :

    L'Enquête sur la population active du Canada (EPA) est la source officielle d'estimations mensuelles de l'emploi total et du chômage. Suite au recensement de 2011, l'EPA a connu un remaniement pour tenir compte de l’évolution des caractéristiques de la population et du marché du travail, pour s’adapter aux besoins actuels et prévus des utilisateurs de données et pour mettre à jour l’information géographique requise pour mener l’enquête. Le programme de remaniement qui a suivi le recensement de 2011 a mené à l'introduction d'un nouvel échantillon au début de l'année 2015. Cette publication est un ouvrage de référence sur les aspects méthodologiques de l'EPA, y compris la stratification, l'échantillonnage, la collecte, le traitement, la pondération, l'estimation, l'estimation de la variance et la qualité des données.

    Date de diffusion : 2017-12-21

  • Revues et périodiques : 12-001-X
    Description :

    La revue publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d'ordre pratique, l'utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l'évaluation des enquêtes, la recherche sur les méthodes d'enquêtes, l'analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l'intégration des données statistiques, les méthodes d'estimation et d'analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l'élaboration et à l'évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254896
    Description :

    Cette note de Sharon L. Lohr présente une discussion de l’article « Théorie et méthodologie des enquêtes par sondage : orientations passées, présentes et futures » où J.N.K. Rao et Wayne A. Fuller partagent leur vision quant à l’évolution de la théorie et de la méthodologie des enquêtes par sondage au cours des 100 dernières années.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254897
    Description :

    Cette note de Chris Skinner présente une discussion de l’article « Théorie et méthodologie des enquêtes par sondage : orientations passées, présentes et futures » où J.N.K. Rao et Wayne A. Fuller partagent leur vision quant à l’évolution de la théorie et de la méthodologie des enquêtes par sondage au cours des 100 dernières années.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254887
    Description :

    L’article propose une nouvelle approche de décomposition de l’écart salarial entre les hommes et les femmes fondée sur une procédure de calage. Cette approche généralise deux méthodes de décomposition courantes, qui sont réexprimées en se servant des poids de sondage. La première est la méthode de Blinder-Oaxaca et la seconde est une méthode de repondération proposée par DiNardo, Fortin et Lemieux. La nouvelle approche offre un système de pondération qui nous permet d’estimer des paramètres d’intérêt tels que les quantiles. Une application aux données de l’Enquête suisse sur la structure des salaires illustre l’intérêt de cette approche.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254872
    Description :

    La présente note expose les fondements théoriques de l’extension de l’intervalle de couverture bilatéral de Wilson à une proportion estimée à partir de données d’enquêtes complexes. Il est démontré que l’intervalle est asymptotiquement équivalent à un intervalle calculé en partant d’une transformation logistique. Une légèrement meilleure version est examinée, mais les utilisateurs pourraient préférer construire un intervalle unilatéral déjà décrit dans la littérature.

    Date de diffusion : 2017-12-21

Données (8)

Données (8) (8 of 8 results)

  • Microdonnées à grande diffusion : 89F0002X
    Description :

    La BD/MSPS est un modèle de microsimulation statique qui sert à l'analyse des interactions financières entre les gouvernements et les particuliers au Canada. Elle permet de calculer les impôts payés aux gouvernements et les transferts monétaires reçus de ceux-ci. Elle est formée d'une base de données, d'une série d'algorithmes et de modèles relatifs aux impôts et aux transferts, d'un logiciel d'analyse et de la documentation de l'utilisateur.

    Date de diffusion : 2018-01-08

  • Tableau : 53-500-X
    Description :

    Dans ce rapport, on présente les résultats d'une enquête pilote menée par Statistique Canada pour mesurer la consommation de carburant des véhicules sur route immatriculés au Canada. Cette étude a été réalisée au moyen de l'Enquête sur les véhicules au Canada (EVC), qui permet de recueillir des données sur les activités routières tels que les distances parcourues, le nombre de passagers et la raison de chaque déplacement.

    Date de diffusion : 2004-10-21

  • Tableau : 95F0495X2001012
    Description :

    Ce tableau renferme des données tirées du Recensement de 2001 pour la Classification des secteurs statistiques (CSS). Une CSS regroupe les subdivisions de recensement selon qu'elles font partie d'une région métropolitaine de recensement, d'une agglomération de recensement, d'une zone d'influence des régions métropolitaines de recensement et des agglomérations de recensement (ZIM forte, ZIM modérée, ZIM faible ou ZIM sans influence) ou des territoires (Territoires du Nord-Ouest, Territoire du Yukon et Nunavut). La CSS est utilisée aux fins de la diffusion des données.

    Les caractéristiques des données présentées pour la CSS comprennent l'âge, l'état matrimonial, les groupes de minorité visible, l'immigration, la langue maternelle, le niveai de scolarité, le revenu, l'emploi, les familles et les logements. Ces données sont présentées pour le Canada, les provinces et les territoires. Les caractéristiques des données présentées dans ce tableau peuvent être différentes de celles d'autres produits de la série « Profils ».

    Date de diffusion : 2004-02-27

  • Tableau : 53-222-X19980006587
    Description :

    Le but principal de cet article est de présenter la nouvelle série chronologique de données et d'en démontrer le potentiel analytique et non pas de fournir une analyse détaillée de ces données. L'analyse présentée à la section 5.2.4 portera principalement sur les tendances des variables importantes en rapport au trafic intérieur et transfrontalier.

    Date de diffusion : 2000-03-07

  • Tableau : 75M0007X
    Description :

    L'Enquête sur l'absence du travail fournit aux ministères des renseignements importants sur le temps perdu au travail par les Canadiens pour des raisons de santé. Ces renseignements contribuent également à l'élaboration de programmes d'aide à l'intention des employés qui s'absentent du travail. Par exemple, le régime restreint d'assurance-salaire tire des renseignements essentiels des données sur l'absence du travail. Ce régime s'adresse aux employeurs qui offrent à leurs salariés une assurance contre les pertes de salaire attribuable à la maladie, etc. Ces employeurs bénéficient d'une réduction des contributions qu'ils versent à la Commission d'assurance-emploi. Les réponses obtenues permettront également d'aider à déterminer les taux de réduction applicables à ces employeurs. Bien que l'enquête sur l'absence du travail recueille des renseignements sur les absences pour cause de maladie, d'accident ou de grossesse, elle ne constitue pas une représentation exhaustive des personnes qui ont été absentes du travail pour ces raisons, car les concepts et les définitions ont été élaborés spécialement pour répondre aux besoins du client. Aux fins de cette enquête, l'absence est, par définition, de deux semaines au moins, et on ne demande aux répondants que de citer les trois raisons de leur absence la plus récente et de celle qui l'a précédée.

    Date de diffusion : 1999-06-29

  • Tableau : 82-567-X
    Description :

    L'Enquête nationale sur la santé de la population a pout but d'améliorer la compréhension des différents processus affectant la santé. L'enquête collecte les données transversales ainsi que longitudinales. En 1994-1995, l'enquête portait sur un échantillon de 17 276 répondants qui ont été interviewés une deuxième fois en 1996-1997. Le taux de réponse fut de 96 % en 1996-1997. La collecte des données de cet échantillon se poursuivra durant une vingtaine d'années. Dans le but d'obtenir des données transversales, un total de 81 000 résidents de ménages ont été interviewés dans toutes les provinces (exepté les gens vivant dans les réserves Indiennes ou dans les Forces Armées Canadiennes) en 1996-1997.

    Voici quelques exemples de la variété d'informations disponibles que l'on peut obtenit grâce à l'enquête: perception de la santé, les conditions chroniques de santé, les blessures, les mouvements répétitifs, la dépression, le tabagisme, la consommation d'alcool, les activités physiques, la consommation de médicaments, l'utilisation des soins de santé et la médecine douce.

    Date de diffusion : 1998-07-29

  • Tableau : 62-010-X19970023422
    Description :

    La période de base officielle de l'indice des prix à la consommation (IPC) est actuellement 1986=100. Cette période de base a été utilisée pour la première fois au moment de la diffusion des données de l'IPC pour juin 1990. Statistique Canada s'apprête à convertir toutes les séries des indices de prix à la période de base 1992=100. Par conséquent, toutes les séries en dollars constants seront aussi converties en dollars de 1992. L'IPC adoptera la nouvelle période de base lorsque paraîtront les données de l'indice pour janvier 1998 dès le 27 février 1998.

    Date de diffusion : 1997-11-17

  • Microdonnées à grande diffusion : 89M0005X
    Description :

    Résumé à venir

    Date de diffusion : 1996-10-21

Analyses (902)

Analyses (902) (25 of 902 results)

  • Articles et rapports : 13-604-M2018087
    Description :

    Statistique Canada publie régulièrement des indicateurs macroéconomiques sur les actifs, les passifs et la valeur nette des ménages dans le cadre des comptes du bilan national (CBN) trimestriels. Ces comptes correspondent aux plus récentes normes internationales et constituent la source des estimations du patrimoine national pour tous les secteurs de l’économie, y compris les ménages, les institutions sans but lucratif, les administrations publiques et les sociétés, de même que la position du Canada en matière de richesse par rapport au reste du monde. Bien que les CBN fournissent des renseignements de grande qualité sur la position globale des ménages relativement aux autres secteurs économiques, ils ne possèdent pas la granularité requise pour comprendre les vulnérabilités de certains groupes particuliers et les conséquences qui en résultent sur le plan du bien-être économique et de la stabilité financière.

    Date de diffusion : 2018-04-13

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2018-04-03

  • Revues et périodiques : 11-633-X
    Description :

    Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.

    Date de diffusion : 2018-03-27

  • Articles et rapports : 11-633-X2018016
    Description :

    Le couplage d’enregistrements a été reconnu comme mécanisme possible pour inclure des renseignements sur les traitements dans le Registre canadien du cancer (RCC). Le Projet de couplage des données sur le traitement du cancer au Canada (PCDTCC) a pour objet d’ajouter des données sur les traitements chirurgicaux au RCC. La Base de données sur les congés des patients (BDCP) et le Système national d’information sur les soins ambulatoires (SNISA) ont été couplés au RCC, et les données sur les traitements chirurgicaux ont été extraites. Le projet a été financé dans le cadre de l’Initiative de développement concerté des données du Partenariat canadien contre le cancer.

    Le PCDTCC a été conçu comme une étude de faisabilité dans le cadre de laquelle les dossiers de patients contenus dans le RCC seraient couplés aux enregistrements sur les traitements chirurgicaux contenus dans la BDCP et le SNISA, tenus par l’Institut canadien d’information sur la santé. La cohorte cible pour le couplage des données sur les traitements chirurgicaux était les patients âgés de 19 ans ou plus inscrits au RCC (de 2010 à 2012). Le couplage a été fait dans l’Environnement de couplage de données sociales (ECDS) de Statistique Canada.

    Date de diffusion : 2018-03-27

  • Articles et rapports : 11-629-X2018002
    Description :

    Célébrez le centenaire de Statistique Canada en jetant un coup d’œil au chemin que nous avons parcouru avec le Canada.

    Date de diffusion : 2018-03-16

  • Articles et rapports : 11-633-X2018015
    Description :

    Le présent document porte sur le processus d’estimation du volume de consommation de cannabis au Canada, selon le groupe d’âge, de 1960 à 2015. La consommation de cannabis est estimée au moyen d’un modèle qui comprend d’abord une estimation du nombre de consommateurs de cannabis chez les personnes âgées de 15 à 17 ans, de 18 à 24 ans, de 25 à 44 ans et de 45 à 64 ans. Pour ce faire, on estime la prévalence de la consommation de cannabis sur la base de plusieurs sources de données d’enquête. Les consommateurs de chaque groupe d’âge sont divisés en catégories, selon la fréquence annuelle de consommation : une fois au cours de la dernière année, moins d’une fois par mois, une à trois fois par mois, chaque semaine (mais pas chaque jour) et chaque jour. Chacune des catégories de fréquence de consommation est par la suite associée à une quantité de cannabis consommée.

    Date de diffusion : 2018-02-21

  • Articles et rapports : 82-003-X201800254908
    Description :

    Cette étude a examiné neuf enquêtes nationales menées auprès de la population à domicile dont les données sur la consommation de drogues ont été recueillies au cours de la période de 1985 à 2015. Ces enquêtes sont examinées aux fins de comparabilité, et leurs données sont utilisées pour estimer la consommation de cannabis (totale et selon le sexe et l'âge) au cours de l'année précédente, désignée comme la consommation courante. Au moyen des données qui se prêtent le mieux à la comparaison, les tendances en matière de consommation de 2004 à 2015 sont estimées.

    Date de diffusion : 2018-02-21

  • Articles et rapports : 11-633-X2018014
    Description :

    La Base canadienne de données sur la mortalité (BCDM) est une base de données administratives qui recueille des renseignements sur la cause de décès auprès de tous les registres provinciaux et territoriaux de la statistique de l’état civil au Canada. La Base canadienne de données sur la mortalité (BCDM) ne comporte pas d’identificateurs de la sous-population pour examiner les taux de mortalité et les disparités entre des groupes tels que les Premières Nations, les Métis, les Inuits et les groupes de minorités visibles. Le couplage des données de la BCDM à celles du Recensement de la population permet de contourner ce problème. Le présent rapport décrit un couplage de la BCDM (2006 à 2011) au Recensement de la population de 2006, qui a été réalisé au moyen d’un appariement exact déterministe hiérarchique, en mettant l’accent sur la méthodologie et la validation.

    Date de diffusion : 2018-02-14

  • Articles et rapports : 11-633-X2018013
    Description :

    Depuis 2008, plusieurs recensements de la population ont été couplés à des données administratives sur la santé et à des données financières. Ces ensembles de données couplés ont été déterminants pour examiner les inégalités en matière de santé et ont servi à la recherche sur la salubrité de l’environnement. Le présent article décrit la création de la Cohorte santé et environnement du recensement canadien (CSERCan) de 1996 : 3,57 millions de personnes qui ont répondu au questionnaire détaillé du recensement et qui ont rétrospectivement fait l’objet d’un suivi relatif à la mortalité et à la mobilité pendant 16,6 ans, de 1996 à 2012. La CSERCan de 1996 était limitée aux répondants au recensement qui étaient âgés de 19 ans ou plus le jour du recensement (le 14 mai 1996), qui étaient résidents du Canada, qui ne résidaient pas dans un établissement institutionnel et qui avaient déposé une déclaration de revenus. Ces répondants ont été couplés aux enregistrements de décès de la Base canadienne de données sur la mortalité ou au fichier maître des particuliers T1 et à un historique de codes postaux provenant de diverses sources. Il s’agit de la troisième CSERCan d’une série de cohortes qui, une fois combinées, permettent d’examiner les tendances en matière de mortalité et d’expositions environnementales par caractéristiques socioéconomiques pendant trois cycles de recensement et 21 ans de données de recensement, de données fiscales et de données sur la mortalité. Le présent rapport décrit les méthodologies de couplage, la validation et l’évaluation des biais, ainsi que les caractéristiques de la CSERCan de 1996. On y évalue également la mesure dans laquelle la CSERCan de 1996 représente la population adulte du Canada.

    Date de diffusion : 2018-01-22

  • Articles et rapports : 11-633-X2018012
    Description :

    La présente étude examine la mesure dans laquelle les redressements et les retards de production des déclarations de revenus influent sur la fiabilité des ensembles de données fiscales administratives canadiennes utilisées dans le cadre d’une analyse économique. L’étude est basée sur les dossiers fiscaux individuels provenant du fichier maître sur les particuliers T1 et du fichier maître sur les particuliers historique T1 pour certaines années pendant la période allant de 1990 à 2010. Ces ensembles de données contiennent des dossiers fiscaux pour environ 100 % des déclarants initiaux et pour tous les déclarants ayant soumis des déclarations de revenus à l’Agence du revenu du Canada (ARC) avant les dates limites de traitement.

    Date de diffusion : 2018-01-11

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2018-01-08

  • Articles et rapports : 11-633-X2018011
    Description :

    La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 30 ans. La BDIM combine des fichiers de données administratives sur les admissions d’immigrants et sur les permis de résidence non permanente provenant d’Immigration, Réfugiés et Citoyenneté Canada (IRCC) à des fichiers de données fiscales provenant de l’Agence du revenu du Canada (ARC). Ces données sont disponibles pour des immigrants déclarants admis à partir de 1980. Les dossiers de déclarants sont disponibles pour les immigrants déclarants depuis 1982.

    Ce rapport vise à discuter des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatifs à l’immigration ainsi que des analyses que permet la BDIM.

    Date de diffusion : 2018-01-08

  • Articles et rapports : 18-001-X2017001
    Description :

    Ce document de travail donne un profil des entreprises canadiennes qui développement et produisent des bioproduits. Ce rapport fournit les données sur le nombre et les types d'entreprises bioproduits en 2015, incluant les recettes bioproduits, la recherche et le développement, utilisation de la biomasse, les brevets, les produits, les pratiques de l'entreprise et l'impact des réglementations gouvernementales sur ce secteur.

    Date de diffusion : 2017-12-22

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-12-21

  • Revues et périodiques : 12-001-X
    Description :

    La revue publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d'ordre pratique, l'utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l'évaluation des enquêtes, la recherche sur les méthodes d'enquêtes, l'analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l'intégration des données statistiques, les méthodes d'estimation et d'analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l'élaboration et à l'évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254896
    Description :

    Cette note de Sharon L. Lohr présente une discussion de l’article « Théorie et méthodologie des enquêtes par sondage : orientations passées, présentes et futures » où J.N.K. Rao et Wayne A. Fuller partagent leur vision quant à l’évolution de la théorie et de la méthodologie des enquêtes par sondage au cours des 100 dernières années.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254897
    Description :

    Cette note de Chris Skinner présente une discussion de l’article « Théorie et méthodologie des enquêtes par sondage : orientations passées, présentes et futures » où J.N.K. Rao et Wayne A. Fuller partagent leur vision quant à l’évolution de la théorie et de la méthodologie des enquêtes par sondage au cours des 100 dernières années.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254887
    Description :

    L’article propose une nouvelle approche de décomposition de l’écart salarial entre les hommes et les femmes fondée sur une procédure de calage. Cette approche généralise deux méthodes de décomposition courantes, qui sont réexprimées en se servant des poids de sondage. La première est la méthode de Blinder-Oaxaca et la seconde est une méthode de repondération proposée par DiNardo, Fortin et Lemieux. La nouvelle approche offre un système de pondération qui nous permet d’estimer des paramètres d’intérêt tels que les quantiles. Une application aux données de l’Enquête suisse sur la structure des salaires illustre l’intérêt de cette approche.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254872
    Description :

    La présente note expose les fondements théoriques de l’extension de l’intervalle de couverture bilatéral de Wilson à une proportion estimée à partir de données d’enquêtes complexes. Il est démontré que l’intervalle est asymptotiquement équivalent à un intervalle calculé en partant d’une transformation logistique. Une légèrement meilleure version est examinée, mais les utilisateurs pourraient préférer construire un intervalle unilatéral déjà décrit dans la littérature.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254888
    Description :

    L’exposé retrace l’évolution de la théorie et de la méthodologie des enquêtes par sondage au cours des 100 dernières années. Dans un article fondamental publié en 1934, Neyman jetait les bases théoriques de l’approche axée sur l’échantillonnage probabiliste pour l’inférence à partir d’échantillons d’enquête. Les traités d’échantillonnage classiques publiés par Cochran, Deming, Hansen, Hurwitz et Madow, Sukhatme, ainsi que Yates au début des années 1950 étendaient et étoffaient la théorie de l’échantillonnage probabiliste, en mettant l’accent sur l’absence de biais, les caractéristiques exemptes de modèle, ainsi que les plans de sondage qui minimisent la variance selon un coût fixe. De 1960 à 1970, l’attention s’est portée sur les fondements théoriques de l’inférence à partir de données d’enquêtes, contexte dans lequel l’approche dépendante d’un modèle a suscité d’importantes discussions. L’apparition de logiciels statistiques d’usage général a entraîné l’utilisation de ces derniers avec des données d’enquêtes, d’où la conception de méthodes spécialement applicables aux données d’enquêtes complexes. Parallèlement, des méthodes de pondération telles que l’estimation par la régression et le calage devenaient réalisables et la convergence par rapport au plan de sondage a remplacé la contrainte d’absence de biais comme critère pour les estimateurs classiques. Un peu plus tard, les méthodes de rééchantillonnage gourmandes en ressources informatiques sont également devenues applicables à des échantillons d’enquêtes à grande échelle. L’augmentation de la puissance informatique a permis des imputations plus avancées des données manquantes, l’utilisation d’une plus grande quantité de données auxiliaires, le traitement des erreurs de mesure dans l’estimation, et l’application de procédures d’estimation plus complexes. Une utilisation marquante de modèles a eu lieu dans le domaine en expansion de l’estimation sur petits domaines. Les orientations futures de la recherche et des méthodes seront influencées par les budgets, les taux de réponse, le degré d’actualité des données, les outils améliorés de collecte des données et l’existence de données auxiliaires, dont une partie proviendra des « mégadonnées ». L’évolution des comportements culturels et de l’environnement physico-technique aura une incidence sur la façon de réaliser les enquêtes.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254871
    Description :

    L’article aborde la question de savoir comment utiliser des sources de données de rechange, telles que les données administratives et les données des médias sociaux, pour produire les statistiques officielles. Puisque la plupart des enquêtes réalisées par les instituts nationaux de statistique sont répétées au cours du temps, nous proposons une approche de modélisation de séries chronologiques structurelle multivariée en vue de modéliser les séries observées au moyen d’une enquête répétée avec les séries correspondantes obtenues à partir de ces sources de données de rechange. En général, cette approche améliore la précision des estimations directes issues de l’enquête grâce à l’utilisation de données d’enquête observées aux périodes précédentes et de données provenant de séries auxiliaires connexes. Ce modèle permet aussi de profiter de la plus grande fréquence des données des médias sociaux pour produire des estimations plus précises en temps réel pour l’enquête par sondage, au moment où les statistiques pour les médias sociaux deviennent disponibles alors que les données d’enquête ne le sont pas encore. Le recours au concept de cointégration permet d’examiner dans quelle mesure la série de rechange représente les mêmes phénomènes que la série observée au moyen de l’enquête répétée. La méthodologie est appliquée à l’Enquête sur la confiance des consommateurs des Pays-Bas et à un indice de sentiments dérivé des médias sociaux.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254894
    Description :

    Cette note de Danny Pfeffermann présente une discussion de l’article « Théorie et méthodologie des enquêtes par sondage : orientations passées, présentes et futures » où J.N.K. Rao et Wayne A. Fuller partagent leur vision quant à l’évolution de la théorie et de la méthodologie des enquêtes par sondage au cours des 100 dernières années.

    Date de diffusion : 2017-12-21

  • Articles et rapports : 12-001-X201700254895
    Description :

    Cette note de Graham Kalton présente une discussion de l’article « Théorie et méthodologie des enquêtes par sondage : orientations passées, présentes et futures » où J.N.K. Rao et Wayne A. Fuller partagent leur vision quant à l’évolution de la théorie et de la méthodologie des enquêtes par sondage au cours des 100 dernières années.

    Date de diffusion : 2017-12-21

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2017-12-18

  • Articles et rapports : 11-626-X2017077
    Description :

    Le 13 avril 2017, le gouvernement du Canada a déposé le projet de loi de légalisation de la consommation récréative du cannabis pour les adultes. Cette décision aura une incidence directe sur le système statistique du Canada. Cet article d’Aperçus économiques vise à fournir des estimations expérimentales du volume de la consommation de cannabis, en se fondant sur des renseignements existants relatifs à la prévalence de la consommation de cannabis. Cet article présente les estimations expérimentales du nombre de tonnes de cannabis consommé par tranche d’âge au cours de la période allant de 1960 à 2015. Ces estimations expérimentales se fondent sur des données d’enquête de plusieurs sources, de techniques statistiques permettant de coupler les sources au cours du temps, et d’hypothèses relatives au comportement de consommation. Elles pourront faire l’objet de révisions à mesure que des sources de données améliorées ou supplémentaires deviennent disponibles.

    Date de diffusion : 2017-12-18

Références (700)

Références (700) (25 of 700 results)

  • Produits techniques : 75F0002M
    Description :

    Cette série comprend de la documentation détaillée sur revenu, notamment les problèmes de conception, l'évaluation qualitative des données et les recherches préliminaires.

    Date de diffusion : 2018-04-05

  • Produits techniques : 75F0002M2018001
    Description :

    Cette étude passe en revue les changements apportés en 2018 à la méthodologie utilisée pour calculer la mesure de faible revenu de la famille de recensement, en faisant appel au Fichier des familles (FFT1; données des déclarants). Ces changements font en sorte que la méthodologie concorde mieux avec d’autres sources de données de Statistique Canada, comme le Recensement de la population et l’Enquête canadienne sur le revenu. Afin de tenir compte des changements apportés à la méthodologie, de nouveaux tableaux standard du FFT1 fournissant des données sur la mesure de faible revenu de la famille de recensement (revenu après impôt) à partir de 2004 ont été introduits.

    Date de diffusion : 2018-04-05

  • Produits techniques : 75F0002M2018002
    Description :

    Cette étude passe en revue les différences entre les statistiques de mesure de faible revenu (MFR) après impôt provenant de deux sources de données qui font appel à des données fiscales administratives comme intrants principaux : le Recensement de la population de 2016 et le Fichier des familles T1 (FFT1). Elle présente un résumé des deux sources de données et une comparaison des statistiques de MFR en mettant l’accent sur l’unité d’analyse, les seuils de MFR après impôt et le pourcentage de la population sous la MFR. L’étude examine en outre les facteurs que les utilisateurs pourraient prendre en considération au moment de choisir une source de données par rapport à une autre.

    Date de diffusion : 2018-04-05

  • Produits techniques : 84-538-X
    Description :

    Ce document présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires et ce, à partir de la période de référence 1980-1982.

    Date de diffusion : 2018-02-23

  • Enquêtes et programmes statistiques — Documentation : 71-526-X
    Description :

    L'Enquête sur la population active du Canada (EPA) est la source officielle d'estimations mensuelles de l'emploi total et du chômage. Suite au recensement de 2011, l'EPA a connu un remaniement pour tenir compte de l’évolution des caractéristiques de la population et du marché du travail, pour s’adapter aux besoins actuels et prévus des utilisateurs de données et pour mettre à jour l’information géographique requise pour mener l’enquête. Le programme de remaniement qui a suivi le recensement de 2011 a mené à l'introduction d'un nouvel échantillon au début de l'année 2015. Cette publication est un ouvrage de référence sur les aspects méthodologiques de l'EPA, y compris la stratification, l'échantillonnage, la collecte, le traitement, la pondération, l'estimation, l'estimation de la variance et la qualité des données.

    Date de diffusion : 2017-12-21

  • Index et guides : 98-500-X
    Description :

    Fournit des renseignements qui permettent aux utilisateurs d’utiliser les données du Recensement de la population de manière efficace, de les mettre en application et de les interpréter. Chaque guide renferme des définitions et des explications sur les concepts du recensement ainsi qu’une rubrique sur la qualité des données et la comparabilité historique. Des renseignements supplémentaires seront inclus pour des variables spécifiques afin d'aider les utilisateurs à mieux comprendre les concepts et les questions utilisés dans le recensement.

    Date de diffusion : 2017-11-29

  • Produits techniques : 12-206-X
    Description :

    Ce rapport résume les travaux réalisés dans le cadre d'un programme parrainé par les trois divisions de la méthodologie de Statistique Canada. Ce programme couvre les activités de recherche et de développement liées aux méthodes statistiques pouvant être appliquées à grande échelle aux programmes d'enquêtes du Bureau qui, autrement, n'auraient pas été offertes parmi les services de méthodologie de ces programmes d'enquête. Elles comportent aussi des tâches de soutien à l'intention des clients concernant l'application d'exploitations antérieures fructueuses, qui visent à promouvoir l'utilisation des résultats de recherche et des travaux préparatoires.

    Date de diffusion : 2017-11-03

  • Index et guides : 12-606-X
    Description :

    Ceci est une trouse destiné à aider des producteurs et des utilisateurs de données à l'externe de Statistique Canada.

    Date de diffusion : 2017-09-27

  • Produits techniques : 12-586-X
    Description :

    Le Cadre d’assurance de la qualité (CAQ) est l’outil de gouvernance de niveau le plus élevé pour la gestion de la qualité à Statistique Canada. Il fournit un aperçu des stratégies de gestion de la qualité et d’atténuation des risques adoptées par les différents secteurs de programme de l’organisme. Le CAQ est utilisé conjointement avec les pratiques de gestion de Statistique Canada, comme celles décrites dans les Lignes directrices concernant la qualité.

    Date de diffusion : 2017-04-21

  • Produits techniques : 91-621-X2017001
    Date de diffusion : 2017-01-25

  • Produits techniques : 75F0002M2016003
    Description :

    Les statistiques sur le revenu sont périodiquement mises à jour pour rendre compte des plus récentes estimations de population fondées sur les données du recensement. Ainsi, avec la diffusion des données de 2014 de l’Enquête canadienne sur le revenu, Statistique Canada a révisé les estimations pour la période de 2006 à 2013 en s’appuyant sur les nouveaux chiffres de population du Recensement de 2011. Le présent document fournit des estimations non révisées ainsi que des estimations révisées pour des statistiques de revenus clés, ainsi qu’une description des changements les plus significatifs.

    Date de diffusion : 2016-07-08

  • Produits techniques : 11-522-X
    Description :

    Depuis 1984, un série de conférences annuelles a été parrainé par Statistique Canada. Le recueil de la conférence est disponible depuis 1987.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014714
    Description :

    Les Ententes sur le développement du marché du travail (EDMT) sont des ententes entre le Canada et les provinces et territoires visant à financer la formation et les services de soutien sur le marché du travail pour les prestataires d’assurance-emploi. L’objectif de cette communication est d’examiner les améliorations au fil des ans de la méthode d’évaluation des répercussions. Le présent document décrit les EDMT et les travaux d’élaboration passés et mentionne les raisons qui motivent une meilleure utilisation de fonds de données administratives importants. Suit une explication détaillée de la façon dont la nouvelle approche a fait en sorte que le processus d’évaluation nécessite moins de ressources, alors que les résultats s’appliquent mieux à l’élaboration de politiques. Le document fait aussi état des leçons apprises d’un point de vue méthodologique et fournit un aperçu des façons de rendre efficace ce type d’utilisation des données administratives, particulièrement dans le contexte des grands programmes.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014753
    Description :

    Le fait que le monde évolue constamment et que les nouvelles technologies sont de plus en plus accessibles crée de nouveaux débouchés et défis pour les instituts nationaux de statistiques (INS) dans le monde. Qu’arriverait-il si les INS pouvaient accéder à de grandes quantités de données complexes, gratuitement (ou à faible coût), auprès des entreprises? Cela pourrait-il augmenter la capacité des INS de diffuser des indicateurs plus précis pour les décideurs et les utilisateurs, réduire de façon significative le fardeau de réponse pour les entreprises, réduire les coûts pour les INS et, à long terme, améliorer le niveau de vie de la population d’un pays? Le temps est venu pour les INS de trouver la meilleure façon d’aligner les dispositions législatives, les règlements et les pratiques dans le domaine des données de lecteurs optiques et des mégadonnées. Sans un terrain d’entente, il est peu probable qu’on obtienne un consensus. Des discussions doivent être entreprises sur la façon de définir la qualité. Si les INS définissent et abordent la qualité différemment, cela entraînera une situation très peu souhaitable, les INS s’écartant de l’harmonisation. La Suède est l’un des principaux pays qui mettent ces questions à l’ordre du jour de la coopération en Europe. En 2012, la Suède a intégré des données de lecteurs optiques dans son Indice des prix à la consommation au niveau national, après qu’il eut été démontré, par suite d’études de recherche et d’analyses statistiques, que ces données étaient de loin supérieures aux données recueillies manuellement.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014716
    Description :

    Les données administratives, selon leur source et leur objectif original, peuvent être considérées comme plus fiables au chapitre de l’information que les données recueillies dans le cadre d’une enquête. Elles ne nécessitent pas qu’un répondant soit présent et comprenne le libellé des questions, et elles ne sont pas limitées par la capacité du répondant à se rappeler des événements rétrospectivement. La présente communication compare certaines données d’enquête, comme des variables démographiques, tirées de l’Étude longitudinale et internationale des adultes (ELIA), à diverses sources administratives pour lesquelles des ententes de couplage avec l’ELIA sont en place. La correspondance entre les sources de données, et certains des facteurs qui pourraient l’affecter, sont analysés pour divers aspects de l’enquête.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014728
    Description :

    "Le couplage d’enregistrements a pour objet de jumeler deux ou plusieurs sources de données. Le produit du couplage d’enregistrements est un fichier qui comprend un enregistrement par individu dans lequel est contenue toute l’information au sujet de cet individu provenant de plusieurs fichiers. Le problème de couplage est difficile lorsqu’on ne dispose pas d’une clé d’identification unique, qu’il existe des erreurs dans certaines variables, que certaines données manquent, et que les fichiers sont grands. Le couplage probabiliste d’enregistrements consiste à calculer une probabilité que les enregistrements provenant de fichiers différents appartiennent à un même individu. Il arrive que de faibles probabilités d’appariement soient attribuées à de vrais appariements et que des probabilités élevées soient attribuées à des non appariements. Les erreurs de désignation des appariements peuvent causer un biais dans les analyses portant sur la base de données composite. Les registres du cancer du programme SEER contiennent de l’information sur les cas de cancer du sein dans les régions qu’ils desservent. Un test fondé sur l’analyse de l’oncotype DX, effectuée par Genomic Health, Inc. (GHI), est souvent utilisé pour certains types de cancer du sein. Un couplage d’enregistrements en utilisant des renseignements personnels permettant l’identification a été effectué pour associer les résultats de l’analyse de l’oncotype DX aux données des registres du cancer du programme SEER. Le logiciel Link Plus a été utilisé pour générer une cote décrivant la similarité des enregistrements et repérer ainsi, pour les individus inscrits dans les registres du cancer du programme SEER, l’appariement paraissant le meilleur avec la base de données GHI. Un examen manuel a été effectué pour vérifier des échantillons d’appariements probables, d’appariements possibles et d’appariements improbables. Des modèles sont proposés pour modéliser conjointement le processus de couplage d’enregistrements et l’analyse statistique subséquente dans la présente application et dans d’autres. "

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014739
    Description :

    Les ensembles de données de la statistique de l’état civil, comme la Base canadienne de données sur la mortalité, n’ont pas d’identificateurs pour certaines populations d’intérêt, comme les Premières Nations, les Métis et les Inuits. Le couplage d’enregistrements entre les données de la statistique de l’état civil et les ensembles de données d’enquête ou autres ensembles de données administratives peuvent permettre de contourner cette limite. Le présent document décrit un couplage de la Base canadienne de données sur la mortalité et du Recensement de la population de 2006, ainsi que l’analyse prévue à partir des données couplées.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014751
    Description :

    Pratiquement tous les grands détaillants utilisent des lecteurs optiques pour enregistrer de l’information sur les transactions avec leurs clients (consommateurs). Ces données comprennent habituellement un code de produits, une brève description, un prix et une quantité vendue. Il s’agit d’une source hautement pertinente pour les programmes statistiques comme l’Indice des prix à la consommation (IPC) de Statistique Canada, l’un des plus importants indicateurs économiques au pays. L’utilisation des données de lecteurs optiques pourrait améliorer la qualité de l’IPC par, entre autres, l’augmentation du nombre de prix utilisés dans les calculs, une plus grande couverture géographique et l’utilisation des quantités vendues, tout en réduisant les coûts de collecte. Cependant, l’utilisation de ces données présente de nombreux défis. L’exploration de données de lecteurs optiques obtenues auprès d’un premier détaillant a démontré un taux de changement élevé au cours d’une année parmi les codes identifiant les produits. Les conséquences de ces changements posent des défis d’un point de vue de la classification des produits et de la qualité des estimations. Cet article se concentrera sur les enjeux reliés à l’acquisition, la classification et l’exploration de ces données afin d’évaluer la qualité pour leur utilisation dans l’IPC.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014750
    Description :

    Le Fichier maître de l’éducation (FME) est un système qui a été élaboré pour permettre l’analyse des programmes d’enseignement au Canada. Le noyau du système est constitué de fichiers administratifs comprenant toutes les inscriptions aux programmes postsecondaires et d’apprentissage au Canada. De nouveaux fichiers administratifs deviennent disponibles sur une base annuelle. Lorsqu’un nouveau fichier devient disponible, il est d’abord sujet à un traitement initial, qui comprend un couplage avec d’autres dossiers administratifs. Ce couplage produit de l’information qui peut améliorer la qualité du fichier; il permet d’autres couplages avec d’autres données décrivant le marché du travail, et il constitue la première étape pour ajouter le fichier au FME. Une fois qu’elle fait partie du FME, l’information du fichier peut être incluse dans des projets transversaux ou longitudinaux, afin d’étudier les cheminements scolaires et les résultats sur le marché du travail par suite de l’obtention du diplôme. À l’heure actuelle, le FME comprend des données de 2005 à 2013, mais il évolue à mesure que de nouvelles données deviennent disponibles. Le présent document donne un aperçu des mécanismes utilisés pour créer le FME, en mettant l’accent sur la structure du système final et une partie de son potentiel analytique.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014733
    Description :

    La valeur sociale des collectes de données est améliorée de façon marquée par la vaste diffusion des fichiers de recherche et l’augmentation en découlant de la productivité scientifique. À l’heure actuelle, la plupart des études sont conçues en vue de recueillir des données utiles et exactes au niveau analytique, en se préoccupant peu de la façon dont elles seront mises en commun. Tant les ouvrages publiés que la pratique reposent sur le principe que l’analyse de la divulgation aura lieu après la collecte. Toutefois, pour produire des données à grande diffusion comportant la plus grande utilité analytique possible pour le groupe d’utilisateurs le plus important, on doit tenir compte du risque de divulgation au début du processus de recherche. À partir de cadres théoriques de décisions économiques et statistiques et de recherches en méthodes d’enquête, cette communication vise à améliorer la productivité scientifique des données de recherche partagées en décrivant comment le risque de divulgation peut être résolu aux étapes les plus précoces de la recherche, grâce à la formulation de « plans sécuritaires » et de « simulations de divulgation », une approche statistique appliquée ayant été adoptée pour : 1) l’élaboration et la validation de modèles qui prédisent la composition des données d’enquête selon différents plans d’échantillonnage; 2) la sélection et/ou l’élaboration de mesures et de méthodes utilisées pour déterminer le risque de divulgation, l’utilité analytique et les coûts de la divulgation des données d’enquête qui conviennent le mieux pour l’évaluation des plans d’échantillonnage et de bases de données; et 3) la tenue de simulations pour recueillir des estimations du risque, de l’utilité et du coût des études comportant une vaste gamme de caractéristiques d’échantillonnage et de conception de bases de données.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014713
    Description :

    Le terme mégadonnées peut signifier différentes choses pour différentes personnes. Pour certaines, il s’agit d’ensembles de données que nos systèmes classiques de traitement et d’analyse ne peuvent plus traiter. Pour d’autres, cela veut simplement dire tirer parti des ensembles de données existants de toutes tailles et trouver des façons de les fusionner, avec comme objectif de produire de nouveaux éléments de connaissance. La première perspective présente un certain nombre de défis importants pour les études traditionnelles de marché, recherches sur l’opinion et recherches sociales. Dans l’un ou l’autre cas, il existe des répercussions pour l’avenir des enquêtes, qu’on commence à peine à explorer.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014707
    Description :

    L’Enquête sur la population active (EPA) est une enquête menée auprès d’environ 56 000 ménages, qui fournit des renseignements sur le marché du travail au Canada. La piste de vérification est une option de programmation Blaise pour les enquêtes comme l’EPA, avec interviews assistées par ordinateur (IAO), qui crée des fichiers comprenant chaque frappe au clavier, des résultats de vérification des données ainsi qu’une indication horaire de chaque tentative de collecte faite auprès de tous les ménages. La combinaison d’une enquête de grande taille et d’une source aussi complète de paradonnées ouvre la porte à une analyse approfondie de la qualité des données, mais entraîne aussi des défis au chapitre des mégadonnées. Comment peut-on extraire des renseignements utiles de ce grand ensemble de frappes au clavier et d’indications horaires? Comment cela peut-il contribuer à évaluer la qualité de la collecte des données de l’EPA? La présentation décrira certains des défis qui se sont posés et les solutions qui ont été utilisées pour les relever, ainsi que les résultats de l’analyse de la qualité des données.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014742
    Description :

    Cette communication décrit le Quick Match System (QMS), une application interne conçue pour apparier les enregistrements de microdonnées d’entreprises, et les méthodes utilisées pour coupler l’ensemble de données du United States Patent and Trademark Office (USPTO) et le Registre des entreprises (RE) de Statistique Canada pour la période de 2000 à 2011. La communication illustre le cadre de couplage des enregistrements et fait état des techniques utilisées pour préparer et classer chaque enregistrement, ainsi que pour évaluer les résultats de l’appariement. L’ensemble de données du USPTO comprenait 41 619 brevets américains accordés à 14 162 entités canadiennes distinctes. Le processus de couplage d’enregistrements a permis d’apparier les noms, la ville, la province et les codes postaux des cessionnaires de brevets de l’ensemble de données du USPTO avec ceux des entreprises des versions de janvier du Fichier générique de l’univers de l’enquête (FGUE) tiré du RE pour la même période de référence. Étant donné que la grande majorité des particuliers cessionnaires de brevets n’ont pas d’activité commerciale produisant des biens ou des services imposables, ils ont tendance à ne pas figurer dans le RE. Le taux d’appariement relativement faible de 24,5 % parmi les particuliers, comparativement à 84,7 % parmi les établissements, rend compte de cette tendance. Même si les 8 844 particuliers cessionnaires de brevets dépassaient en nombre les 5 318 établissements, ces derniers étaient à l’origine de 73,0 % des brevets, comparativement à 27,0 % pour les particuliers. Par conséquent, cette étude et ses conclusions sont axées principalement sur les cessionnaires de brevets institutionnels. Le couplage des établissements du USPTO et du RE est important parce qu’il donne accès à des microdonnées sur les caractéristiques des entreprises, l’emploi, le revenu, ainsi que l’actif et le passif. En outre, la récupération d’identificateurs administratifs robustes permet un couplage subséquent avec d’autres sources de données d’enquête et de données administratives. L’ensemble de données intégrées appuiera des études analytiques directes et comparatives du rendement des établissements canadiens qui ont obtenu des brevets aux États-Unis entre 2000 et 2011.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014715
    Description :

    En vue du Recensement de 2021 au Royaume-Uni, l'Office for National Statistics (ONS) s’est engagée à mener un programme de recherche exhaustif, afin d’explorer comment les données administratives couplées peuvent servir à appuyer les processus statistiques conventionnels. Le contrôle et l’imputation (C et I) au niveau de la question joueront un rôle important pour l’ajustement de la base de données du Recensement de 2021. Toutefois, l’incertitude associée à l’exactitude et à la qualité des données administratives disponibles jette des doutes sur l’efficacité d’une approche intégrée fondée sur des données du recensement et des données administratives en ce qui a trait au C et I. Les contraintes actuelles, qui dictent une approche anonymisée de la « clef » pour le couplage des enregistrements, afin d’assurer la confidentialité, accentuent cette incertitude. Nous fournissons les résultats préliminaires d’une étude de simulation comparant l’exactitude prédictive et l’exactitude de la distribution de la stratégie conventionnelle de C et I mise en œuvre au moyen du SCANCIR pour le Recensement de 2011 au Royaume-Uni, à celles d’une approche intégrée reposant sur des données administratives synthétiques, comme données auxiliaires, avec une erreur qui augmente de façon systématique. À cette étape initiale de la recherche, nous mettons l’accent sur l’imputation d’une année d’âge. L’objectif de l’étude est de déterminer si les données auxiliaires découlant des données administratives peuvent améliorer les estimations de l’imputation, et où se situent les différentes stratégies dans un continuum d’exactitude.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014724
    Description :

    À l’Institut national de santé publique du Québec, le Système intégré de surveillance des maladies chroniques du Québec (SISMACQ) est utilisé quotidiennement depuis environ quatre ans. Les bénéfices de ce système sont nombreux pour mesurer plus précisément l’ampleur des maladies, pour évaluer adéquatement l’utilisation des services de santé et pour identifier certains groupes à risque. Or, au fil des mois, divers problèmes sont apparus et ont nécessité une réflexion plus ou moins longue et élaborée. Des problèmes touchant différentes sphères d’activité, du jumelage à la qualité des données en passant par la coordination entre de multiples utilisateurs et le respect des obligations légales. Cette présentation a pour objet de décrire les principaux défis associés à l’utilisation des données du SISMACQ, ainsi que de présenter quelques pistes de solution. Sera notamment abordé le traitement de cinq sources de données qui proviennent non seulement de cinq sources différentes, mais dont l’utilité première n’est pas la surveillance des maladies chroniques. La qualité variable des données, autant entre fichiers qu’à l’intérieur d’un même fichier, sera aussi discutée. Certaines situations reliées à l’utilisation simultanée du système par plusieurs utilisateurs seront aussi exposées. Des exemples d’analyses sur de grands ensembles de données ayant causé des tracas seront donnés. Également, quelques défis entourant la divulgation et le respect des ententes légales seront brièvement évoqués.

    Date de diffusion : 2016-03-24

Date de modification :