Techniques statistiques

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

1 facets displayed. 0 facets selected.

Géographie

2 facets displayed. 0 facets selected.

Enquête ou programme statistique

2 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (9)

Tout (9) ((9 résultats))

  • Articles et rapports : 82-003-X201901200003
    Description :

    Cet article fournit une description des Cohortes santé et environnement du recensement canadien (CSERCan), qui sont des ensembles de données couplées, fondés sur la population à domicile au moment de la collecte du recensement. Les ensembles de données des CSERCan constituent des ressources nationales en matière de données qui sont abondantes et qui peuvent servir à mesurer et à examiner les inégalités en matière de santé selon les aspects socioéconomiques et ethnoculturels lors de différentes périodes et à divers endroits. Ils peuvent également servir à examiner les effets de l'exposition à des facteurs environnementaux sur la santé humaine.

    Date de diffusion : 2019-12-18

  • Articles et rapports : 11-633-X2018016
    Description :

    Le couplage d’enregistrements a été reconnu comme mécanisme possible pour inclure des renseignements sur les traitements dans le Registre canadien du cancer (RCC). Le Projet de couplage des données sur le traitement du cancer au Canada (PCDTCC) a pour objet d’ajouter des données sur les traitements chirurgicaux au RCC. La Base de données sur les congés des patients (BDCP) et le Système national d’information sur les soins ambulatoires (SNISA) ont été couplés au RCC, et les données sur les traitements chirurgicaux ont été extraites. Le projet a été financé dans le cadre de l’Initiative de développement concerté des données du Partenariat canadien contre le cancer.

    Le PCDTCC a été conçu comme une étude de faisabilité dans le cadre de laquelle les dossiers de patients contenus dans le RCC seraient couplés aux enregistrements sur les traitements chirurgicaux contenus dans la BDCP et le SNISA, tenus par l’Institut canadien d’information sur la santé. La cohorte cible pour le couplage des données sur les traitements chirurgicaux était les patients âgés de 19 ans ou plus inscrits au RCC (de 2010 à 2012). Le couplage a été fait dans l’Environnement de couplage de données sociales (ECDS) de Statistique Canada.

    Date de diffusion : 2018-03-27

  • Articles et rapports : 11-633-X2018013
    Description :

    Depuis 2008, plusieurs recensements de la population ont été couplés à des données administratives sur la santé et à des données financières. Ces ensembles de données couplés ont été déterminants pour examiner les inégalités en matière de santé et ont servi à la recherche sur la salubrité de l’environnement. Le présent article décrit la création de la Cohorte santé et environnement du recensement canadien (CSERCan) de 1996 : 3,57 millions de personnes qui ont répondu au questionnaire détaillé du recensement et qui ont rétrospectivement fait l’objet d’un suivi relatif à la mortalité et à la mobilité pendant 16,6 ans, de 1996 à 2012. La CSERCan de 1996 était limitée aux répondants au recensement qui étaient âgés de 19 ans ou plus le jour du recensement (le 14 mai 1996), qui étaient résidents du Canada, qui ne résidaient pas dans un établissement institutionnel et qui avaient déposé une déclaration de revenus. Ces répondants ont été couplés aux enregistrements de décès de la Base canadienne de données sur la mortalité ou au fichier maître des particuliers T1 et à un historique de codes postaux provenant de diverses sources. Il s’agit de la troisième CSERCan d’une série de cohortes qui, une fois combinées, permettent d’examiner les tendances en matière de mortalité et d’expositions environnementales par caractéristiques socioéconomiques pendant trois cycles de recensement et 21 ans de données de recensement, de données fiscales et de données sur la mortalité. Le présent rapport décrit les méthodologies de couplage, la validation et l’évaluation des biais, ainsi que les caractéristiques de la CSERCan de 1996. On y évalue également la mesure dans laquelle la CSERCan de 1996 représente la population adulte du Canada.

    Date de diffusion : 2018-01-22

  • Articles et rapports : 12-001-X201600214684
    Description :

    Cet article présente un plan d’échantillonnage en grappes adaptatif incomplet qui est facile à appliquer, permet de bien contrôler la taille de l’échantillon et n’oblige pas à suivre le voisinage. Dans un tel plan, on prélève un échantillon initial par un des plans classiques. Si une cellule répond à une condition préétablie, on procède à une sélection complète dans un rayon déterminé de cette cellule. On estime la moyenne de la population à l’aide de l’estimateur \pi. Si toutes les probabilités d’inclusion sont connues, on dispose d’un estimateur \pi sans biais, mais si selon le cas ces probabilités sont inconnues pour une partie des unités de l’échantillon final, elles feront l’objet d’une estimation. Pour estimer les probabilités d’inclusion, on construit un estimateur biaisé. Toutefois, les simulations démontrent que, si la taille d’échantillon est suffisante, l’erreur sera négligeable pour les probabilités d’inclusion et que l’estimateur \pi relatif sera presque exempt de biais. Ce plan rivalise avec l’échantillonnage en grappes adaptatif, parce qu’il permet de contrôler la taille de l’échantillon final et que sa gestion est facile. Il rivalise également avec l’échantillonnage séquentiel à deux degrés, parce qu’on tient compte de la forme en grappes de la population et qu’on diminue le coût de la couverture de toute l’aire d’échantillonnage. L’auteur se sert de données réelles d’une population d’oiseaux ainsi que de simulations pour comparer ce plan à un échantillonnage séquentiel adaptatif à deux degrés. Les simulations montrent que le plan est d’une grande efficacité en comparaison à son rival.

    Date de diffusion : 2016-12-20

  • Articles et rapports : 11-633-X2016003
    Description :

    De grandes cohortes de mortalité nationales sont utilisées pour estimer les taux de mortalité en fonction de différents groupes socioéconomiques et démographiques ainsi que pour effectuer des recherches dans le domaine de la santé environnementale. En 2008, Statistique Canada a créé une cohorte en couplant les données du Recensement de 1991 avec des données sur la mortalité. La présente étude décrit le couplage des données des répondants au questionnaire détaillé du Recensement de 2001 âgés de 19 ans et plus avec les données du Fichier maître des particuliers T1 et la Base de données combinées sur la mortalité. Ce couplage permet de faire le suivi de tous les décès survenus sur une période de 10,6 ans (soit pour le moment jusqu’à la fin de 2011).

    Date de diffusion : 2016-10-26

  • Articles et rapports : 12-001-X201600114539
    Description :

    L’appariement statistique est une technique permettant d’intégrer deux ou plusieurs ensembles de données lorsque les renseignements nécessaires pour apparier les enregistrements des participants individuels dans les ensembles de données sont incomplets. On peut considérer l’appariement statistique comme un problème de données manquantes en vertu duquel on souhaite effectuer une analyse conjointe de variables qui ne sont jamais observées ensemble. On utilise souvent une hypothèse d’indépendance conditionnelle pour créer des données imputées aux fins d’appariement statistique. Nous examinons une approche générale de l’appariement statistique faisant appel à l’imputation fractionnaire paramétrique de Kim (2011) pour créer des données imputées en vertu de l’hypothèse que le modèle spécifié est entièrement identifié. La méthode proposée ne produit pas une séquence EM convergente si le modèle n’est pas identifié. Nous présentons aussi des estimateurs de variance convenant à la procédure d’imputation. Nous expliquons comment la méthode s’applique directement à l’analyse des données obtenues à partir de plans de sondage à questionnaire scindé et aux modèles d’erreur de mesure.

    Date de diffusion : 2016-06-22

  • Articles et rapports : 82-003-X201300611796
    Géographie : Canada
    Description :

    La présente étude évalue la faisabilité d'utiliser des techniques de modélisation statistique pour combler les lacunes dans les données liées aux facteurs de risque, et plus particulièrement l'usage du tabac, dans les données de recensement couplées.

    Date de diffusion : 2013-06-19

  • Articles et rapports : 12-001-X200800210759
    Description :

    L'analyse des données recueillies auprès d'un échantillon stratifié à plusieurs degrés requiert de l'information sur le plan de sondage, telle que les identificateurs de strate et d'unité primaire d'échantillonnage (UPE), ou les poids de rééchantillonnage connexes, pour l'estimation de la variance. Dans certains fichiers de données à grande diffusion, l'information sur le plan de sondage est masquée en vue d'éviter le risque de divulgation, tout en permettant à l'utilisateur d'obtenir des estimations valides des variances. Par exemple, dans le cas des enquêtes aréolaires comptant un nombre limité d'UPE, les UPE originales sont divisées et (ou) recombinées pour construire des pseudo UPE dans lesquelles sont permutées les unités d'échantillonnage de deuxième degré et de degré subséquent. Cependant, ces méthodes de masquage des UPE faussent manifestement la structure de mise en grappes du plan d'échantillonnage, ce qui donne des estimations de variance biaisées pouvant présenter un rapport systématique entre les deux estimations de variance obtenues avec et sans masquage des identificateurs d'UPE. Certains travaux antérieurs ont révélé certaines tendances du ratio des estimations de la variance obtenues avec et sans masquage si on représente ce ratio graphiquement en fonction de l'effet de plan sans masquage. Le présent article traite de l'effet du masquage des UPE sur les estimations de la variance sous échantillonnage en grappes en fonction de divers aspects, dont la structure de mise en grappes et le degré de masquage. En outre, nous tâchons d'établir une stratégie de masquage des UPE par permutation des unités d'échantillonnage du degré subséquent qui réduit le biais résultant des estimations de la variance. En guise d'illustration, nous utilisons des données provenant de la National Health Interview Survey (NHIS) auxquelles nous avons apporté certaines modifications artificielles. La stratégie proposée permet de bien réduire le biais des estimations de la variance. Les résultats tant théoriques qu'empiriques indiquent que l'effet du masquage des UPE sur les estimations de la variance est modeste si la permutation des unités d'échantillonnage de degré subséquent est minimale. Nous avons appliqué la stratégie de masquage proposée aux données diffusées de la National Health and Nutrition Examination Survey (NHANES) de 2003 2004.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 11F0019M1996091
    Géographie : Province ou territoire
    Description :

    Introduction : Le contexte économique actuel oblige tous les partenaires des réseaux de soins de santé, qu'ils soient publics ou privés, à identifier les facteurs qui conditionnent l'utilisation des services de soins de santé. Pour améliorer notre compréhension des phénomènes qui sous-tendent ces relations, Statistique Canada et le Manitoba Centre for Health Policy and Evaluation viennent de mettre sur pied une nouvelle base de données. Pour un échantillon représentatif de la province du Manitoba, des microdonnées transversales portant sur le niveau de santé des individus, sur leurs caractéristiques socio-économiques et des données longitudinales détaillées portant sur l'utilisation des services de soins de santé ont été couplées.

    Données et méthodes : L'enquête sur la santé et les limitations d'activités de 1986-87, le recensement de 1986 et les dossiers de la Manitoba Health ont été couplés (sans utilisation de noms ou d'adresses) en utilisant le progiciel CANLINK. Dans le cadre du projet pilote 20 000 unités de base ont été sélectionnées selon des techniques d'échantillonnage modernes pour constituer la base de données. Préalablement à l'appariement des fichiers, des consultations ont été tenues afin d'établir un cadre visant à protéger la vie privée et à préserver la confidentialité des données.

    Résultat : Un taux de couplage de 74 % a été obtenu pour les ménages privés. Une évaluation de la qualité basée sur la comparaison de noms et d'adresses a permis d'établir que le taux global de concordance parmi les paires appariées est de 95,5 %. Le taux d'appariement de même que le taux de concordance varient selon l'âge et la composition du ménage. Les estimations produites à partir de l'échantillon reflètent bien le profil socio-démographique, la mortalité, l'hospitalisation, les coûts et la consommation de soins de santé des résidents du Manitoba.

    Discussion : Le taux de couplage de 74 % s'avère satisfaisant en comparaison du taux de réponses rapporté dans la plupart des enquêtes auprès de la population. En raison de l'excellence du taux de concordance et de la précision des estimations provenant de l'échantillon, cette base de données va permettre d'étudier adéquatement l'association entre les composantes socio-démographiques, la santé et l'utilisation des soins de santé pour la province de Manitoba.

    Date de diffusion : 1996-03-30
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (9)

Analyses (9) ((9 résultats))

  • Articles et rapports : 82-003-X201901200003
    Description :

    Cet article fournit une description des Cohortes santé et environnement du recensement canadien (CSERCan), qui sont des ensembles de données couplées, fondés sur la population à domicile au moment de la collecte du recensement. Les ensembles de données des CSERCan constituent des ressources nationales en matière de données qui sont abondantes et qui peuvent servir à mesurer et à examiner les inégalités en matière de santé selon les aspects socioéconomiques et ethnoculturels lors de différentes périodes et à divers endroits. Ils peuvent également servir à examiner les effets de l'exposition à des facteurs environnementaux sur la santé humaine.

    Date de diffusion : 2019-12-18

  • Articles et rapports : 11-633-X2018016
    Description :

    Le couplage d’enregistrements a été reconnu comme mécanisme possible pour inclure des renseignements sur les traitements dans le Registre canadien du cancer (RCC). Le Projet de couplage des données sur le traitement du cancer au Canada (PCDTCC) a pour objet d’ajouter des données sur les traitements chirurgicaux au RCC. La Base de données sur les congés des patients (BDCP) et le Système national d’information sur les soins ambulatoires (SNISA) ont été couplés au RCC, et les données sur les traitements chirurgicaux ont été extraites. Le projet a été financé dans le cadre de l’Initiative de développement concerté des données du Partenariat canadien contre le cancer.

    Le PCDTCC a été conçu comme une étude de faisabilité dans le cadre de laquelle les dossiers de patients contenus dans le RCC seraient couplés aux enregistrements sur les traitements chirurgicaux contenus dans la BDCP et le SNISA, tenus par l’Institut canadien d’information sur la santé. La cohorte cible pour le couplage des données sur les traitements chirurgicaux était les patients âgés de 19 ans ou plus inscrits au RCC (de 2010 à 2012). Le couplage a été fait dans l’Environnement de couplage de données sociales (ECDS) de Statistique Canada.

    Date de diffusion : 2018-03-27

  • Articles et rapports : 11-633-X2018013
    Description :

    Depuis 2008, plusieurs recensements de la population ont été couplés à des données administratives sur la santé et à des données financières. Ces ensembles de données couplés ont été déterminants pour examiner les inégalités en matière de santé et ont servi à la recherche sur la salubrité de l’environnement. Le présent article décrit la création de la Cohorte santé et environnement du recensement canadien (CSERCan) de 1996 : 3,57 millions de personnes qui ont répondu au questionnaire détaillé du recensement et qui ont rétrospectivement fait l’objet d’un suivi relatif à la mortalité et à la mobilité pendant 16,6 ans, de 1996 à 2012. La CSERCan de 1996 était limitée aux répondants au recensement qui étaient âgés de 19 ans ou plus le jour du recensement (le 14 mai 1996), qui étaient résidents du Canada, qui ne résidaient pas dans un établissement institutionnel et qui avaient déposé une déclaration de revenus. Ces répondants ont été couplés aux enregistrements de décès de la Base canadienne de données sur la mortalité ou au fichier maître des particuliers T1 et à un historique de codes postaux provenant de diverses sources. Il s’agit de la troisième CSERCan d’une série de cohortes qui, une fois combinées, permettent d’examiner les tendances en matière de mortalité et d’expositions environnementales par caractéristiques socioéconomiques pendant trois cycles de recensement et 21 ans de données de recensement, de données fiscales et de données sur la mortalité. Le présent rapport décrit les méthodologies de couplage, la validation et l’évaluation des biais, ainsi que les caractéristiques de la CSERCan de 1996. On y évalue également la mesure dans laquelle la CSERCan de 1996 représente la population adulte du Canada.

    Date de diffusion : 2018-01-22

  • Articles et rapports : 12-001-X201600214684
    Description :

    Cet article présente un plan d’échantillonnage en grappes adaptatif incomplet qui est facile à appliquer, permet de bien contrôler la taille de l’échantillon et n’oblige pas à suivre le voisinage. Dans un tel plan, on prélève un échantillon initial par un des plans classiques. Si une cellule répond à une condition préétablie, on procède à une sélection complète dans un rayon déterminé de cette cellule. On estime la moyenne de la population à l’aide de l’estimateur \pi. Si toutes les probabilités d’inclusion sont connues, on dispose d’un estimateur \pi sans biais, mais si selon le cas ces probabilités sont inconnues pour une partie des unités de l’échantillon final, elles feront l’objet d’une estimation. Pour estimer les probabilités d’inclusion, on construit un estimateur biaisé. Toutefois, les simulations démontrent que, si la taille d’échantillon est suffisante, l’erreur sera négligeable pour les probabilités d’inclusion et que l’estimateur \pi relatif sera presque exempt de biais. Ce plan rivalise avec l’échantillonnage en grappes adaptatif, parce qu’il permet de contrôler la taille de l’échantillon final et que sa gestion est facile. Il rivalise également avec l’échantillonnage séquentiel à deux degrés, parce qu’on tient compte de la forme en grappes de la population et qu’on diminue le coût de la couverture de toute l’aire d’échantillonnage. L’auteur se sert de données réelles d’une population d’oiseaux ainsi que de simulations pour comparer ce plan à un échantillonnage séquentiel adaptatif à deux degrés. Les simulations montrent que le plan est d’une grande efficacité en comparaison à son rival.

    Date de diffusion : 2016-12-20

  • Articles et rapports : 11-633-X2016003
    Description :

    De grandes cohortes de mortalité nationales sont utilisées pour estimer les taux de mortalité en fonction de différents groupes socioéconomiques et démographiques ainsi que pour effectuer des recherches dans le domaine de la santé environnementale. En 2008, Statistique Canada a créé une cohorte en couplant les données du Recensement de 1991 avec des données sur la mortalité. La présente étude décrit le couplage des données des répondants au questionnaire détaillé du Recensement de 2001 âgés de 19 ans et plus avec les données du Fichier maître des particuliers T1 et la Base de données combinées sur la mortalité. Ce couplage permet de faire le suivi de tous les décès survenus sur une période de 10,6 ans (soit pour le moment jusqu’à la fin de 2011).

    Date de diffusion : 2016-10-26

  • Articles et rapports : 12-001-X201600114539
    Description :

    L’appariement statistique est une technique permettant d’intégrer deux ou plusieurs ensembles de données lorsque les renseignements nécessaires pour apparier les enregistrements des participants individuels dans les ensembles de données sont incomplets. On peut considérer l’appariement statistique comme un problème de données manquantes en vertu duquel on souhaite effectuer une analyse conjointe de variables qui ne sont jamais observées ensemble. On utilise souvent une hypothèse d’indépendance conditionnelle pour créer des données imputées aux fins d’appariement statistique. Nous examinons une approche générale de l’appariement statistique faisant appel à l’imputation fractionnaire paramétrique de Kim (2011) pour créer des données imputées en vertu de l’hypothèse que le modèle spécifié est entièrement identifié. La méthode proposée ne produit pas une séquence EM convergente si le modèle n’est pas identifié. Nous présentons aussi des estimateurs de variance convenant à la procédure d’imputation. Nous expliquons comment la méthode s’applique directement à l’analyse des données obtenues à partir de plans de sondage à questionnaire scindé et aux modèles d’erreur de mesure.

    Date de diffusion : 2016-06-22

  • Articles et rapports : 82-003-X201300611796
    Géographie : Canada
    Description :

    La présente étude évalue la faisabilité d'utiliser des techniques de modélisation statistique pour combler les lacunes dans les données liées aux facteurs de risque, et plus particulièrement l'usage du tabac, dans les données de recensement couplées.

    Date de diffusion : 2013-06-19

  • Articles et rapports : 12-001-X200800210759
    Description :

    L'analyse des données recueillies auprès d'un échantillon stratifié à plusieurs degrés requiert de l'information sur le plan de sondage, telle que les identificateurs de strate et d'unité primaire d'échantillonnage (UPE), ou les poids de rééchantillonnage connexes, pour l'estimation de la variance. Dans certains fichiers de données à grande diffusion, l'information sur le plan de sondage est masquée en vue d'éviter le risque de divulgation, tout en permettant à l'utilisateur d'obtenir des estimations valides des variances. Par exemple, dans le cas des enquêtes aréolaires comptant un nombre limité d'UPE, les UPE originales sont divisées et (ou) recombinées pour construire des pseudo UPE dans lesquelles sont permutées les unités d'échantillonnage de deuxième degré et de degré subséquent. Cependant, ces méthodes de masquage des UPE faussent manifestement la structure de mise en grappes du plan d'échantillonnage, ce qui donne des estimations de variance biaisées pouvant présenter un rapport systématique entre les deux estimations de variance obtenues avec et sans masquage des identificateurs d'UPE. Certains travaux antérieurs ont révélé certaines tendances du ratio des estimations de la variance obtenues avec et sans masquage si on représente ce ratio graphiquement en fonction de l'effet de plan sans masquage. Le présent article traite de l'effet du masquage des UPE sur les estimations de la variance sous échantillonnage en grappes en fonction de divers aspects, dont la structure de mise en grappes et le degré de masquage. En outre, nous tâchons d'établir une stratégie de masquage des UPE par permutation des unités d'échantillonnage du degré subséquent qui réduit le biais résultant des estimations de la variance. En guise d'illustration, nous utilisons des données provenant de la National Health Interview Survey (NHIS) auxquelles nous avons apporté certaines modifications artificielles. La stratégie proposée permet de bien réduire le biais des estimations de la variance. Les résultats tant théoriques qu'empiriques indiquent que l'effet du masquage des UPE sur les estimations de la variance est modeste si la permutation des unités d'échantillonnage de degré subséquent est minimale. Nous avons appliqué la stratégie de masquage proposée aux données diffusées de la National Health and Nutrition Examination Survey (NHANES) de 2003 2004.

    Date de diffusion : 2008-12-23

  • Articles et rapports : 11F0019M1996091
    Géographie : Province ou territoire
    Description :

    Introduction : Le contexte économique actuel oblige tous les partenaires des réseaux de soins de santé, qu'ils soient publics ou privés, à identifier les facteurs qui conditionnent l'utilisation des services de soins de santé. Pour améliorer notre compréhension des phénomènes qui sous-tendent ces relations, Statistique Canada et le Manitoba Centre for Health Policy and Evaluation viennent de mettre sur pied une nouvelle base de données. Pour un échantillon représentatif de la province du Manitoba, des microdonnées transversales portant sur le niveau de santé des individus, sur leurs caractéristiques socio-économiques et des données longitudinales détaillées portant sur l'utilisation des services de soins de santé ont été couplées.

    Données et méthodes : L'enquête sur la santé et les limitations d'activités de 1986-87, le recensement de 1986 et les dossiers de la Manitoba Health ont été couplés (sans utilisation de noms ou d'adresses) en utilisant le progiciel CANLINK. Dans le cadre du projet pilote 20 000 unités de base ont été sélectionnées selon des techniques d'échantillonnage modernes pour constituer la base de données. Préalablement à l'appariement des fichiers, des consultations ont été tenues afin d'établir un cadre visant à protéger la vie privée et à préserver la confidentialité des données.

    Résultat : Un taux de couplage de 74 % a été obtenu pour les ménages privés. Une évaluation de la qualité basée sur la comparaison de noms et d'adresses a permis d'établir que le taux global de concordance parmi les paires appariées est de 95,5 %. Le taux d'appariement de même que le taux de concordance varient selon l'âge et la composition du ménage. Les estimations produites à partir de l'échantillon reflètent bien le profil socio-démographique, la mortalité, l'hospitalisation, les coûts et la consommation de soins de santé des résidents du Manitoba.

    Discussion : Le taux de couplage de 74 % s'avère satisfaisant en comparaison du taux de réponses rapporté dans la plupart des enquêtes auprès de la population. En raison de l'excellence du taux de concordance et de la précision des estimations provenant de l'échantillon, cette base de données va permettre d'étudier adéquatement l'association entre les composantes socio-démographiques, la santé et l'utilisation des soins de santé pour la province de Manitoba.

    Date de diffusion : 1996-03-30
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :