Résumé

Passer au texte

Contexte
Mots-clés
Résultats
Auteurs
Ce que l'on sait déjà sur le sujet
Ce qu'apporte l'étude

Début du texte

Contexte

Le couplage d’enregistrements est couramment utilisé par les chercheurs du domaine de la santé pour combler les lacunes statistiques. L’étude présente un résumé des résultats du couplage des données du Recensement de la population de 2006 (sauf le Québec) et des données hospitalières provenant de la Base de données sur les congés des patients (BDCP).

Données et méthodes

On a utilisé l’appariement exact déterministe hiérarchique pour coupler les données du Recensement de 2006 et de la BDCP (2006-2007, 2007-2008 et 2008-2009), en fonction des clés de couplage dérivées de trois variables présentes dans les deux fichiers, à savoir la date de naissance, le code postal et le sexe. On a utilisé le fichier de données intégrales du recensement (questionnaire abrégé; 23,4 millions d’enregistrements) pour le couplage d’enregistrements; le fichier de données-échantillon (20 %) (questionnaire détaillé; 4,65 millions d’enregistrements), représentant la cohorte étudiée, a été utilisé pour la validation. Les fichiers couplés ont été comparés pour des secteurs de compétence, des années et d’autres covariables sélectionnées, pour ce qui est de l’admissibilité au couplage, des clés couplées et des taux de couplage et de couverture.

Résultats

Dans l’ensemble, 80 % des clés de couplage relevées dans la BDCP ont été couplées aux données du Recensement de 2006. Le pourcentage des répondants au recensement ayant rempli le questionnaire détaillé qui ont été couplés à au moins un dossier d’hospitalisation variait de 5 % à 8 % dans les différents secteurs de compétence; les taux de couplage étaient les plus élevés chez les grands utilisateurs connus de services hospitaliers, c’est-à-dire les groupes d’âge le plus avancé, les personnes à faible revenu et les Autochtones. En général, le fichier des données couplées englobe la majorité des événements ayant trait aux hospitalisations survenues au cours de la période visée par l’étude. Les taux de couverture pondérés et non pondérés variaient selon la région géographique et le groupe d’âge, les territoires et certains des groupes d’âge les plus jeunes présentant les taux pondérés les plus faibles.

Interprétation

Grâce à la méthode d’appariement exact déterministe hiérarchique, il est possible de coupler les données du recensement aux données relatives à plusieurs années dans la BDCP. L’incorporation des codes postaux mis à jour à partir des dossiers fiscaux a permis de réduire l’érosion du couplage au fil du temps. Les faibles taux de couverture observés pour les territoires et les groupes d’âge jeune laissent supposer que ces populations pourraient être sous-représentées dans les fichiers couplés.

Mots-clés

Couverture, collecte de données, couplage de données, bases de données, dossiers médicaux, dossiers d’hôpital.

Résultats

Le couplage d’enregistrements, c’est-à-dire le processus d’appariement d’enregistrements entre différents ensembles de données ou à l’intérieur d’un seul ensemble, est couramment utilisé par les chercheurs dans le domaine de la santé pour combler les lacunes statistiques et créer des ensembles de données ayant des applications diversifiées. La majorité des couplages de données sur la santé au Canada se sont fondés sur les numéros d’assurance-maladie (NAM) extraits des registres provinciaux de l’assurance-maladie, qui sont uniques pour chaque personne. Cependant, les numéros d'assurance-maladie ne sont pas enregistrés dans la plupart des bases de données (p. ex., mortalité, recensement, impôt), et l’accès aux registres provinciaux est limité. [Texte intégral]

Auteurs

Michelle Rotermann (Michelle.Rotermann@statcan.gc.ca) et Claudia Sanmartin travaillent à la Division de l’analyse de la santé, Richard Trudeau (Richard.Trudeau@statcan.gc.ca), à la Division des enquêtes spéciales, et Hélène St-Jean, à la Division des méthodes d’enquêtes auprès des ménages de Statistique Canada, Ottawa (Ontario).

Ce que l'on sait déjà sur le sujet

  • Le couplage d’enregistrements est une façon efficace sur le plan des coûts d’ajouter de la valeur aux ensembles de données administratives et d’enquêtes.
  • La combinaison de sources de données complémentaires permet des analyses qui autrement ne seraient pas possibles.
  • Le recours aux registres provinciaux d’assurance-maladie aux fins de couplages d’enregistrements pour étudier la santé de la population est une méthode bien établie.
  • Les méthodes fondées et non fondées sur des registres pour le couplage des données administratives sur la santé et des données du Recensement de 2006 ont produit des données d’une qualité suffisante pour la recherche, en ce qui a trait aux provinces de l’Ontario et du Manitoba, à l’égard de l’exercice 2006-2007.

Ce qu'apporte l'étude

  • Cette étude présente les résultats d’un couplage par appariement exact déterministe hiérarchique de données du Recensement de 2006 et de données tirées d’enregistrements de la Base de données sur les congés des patients (BDCP), pour les exercices 2006-2007 à 2008-2009. Le couplage porte sur tous les secteurs de compétence du Canada (sauf le Québec) et se fonde sur la date de naissance, le code postal et le sexe.
  • Le recours aux données sur l’impôt permet d’avoir des codes postaux à jour pour les personnes dénombrées au recensement, ce qui a pour but de réduire au minimum le nombre de couplages qui pourraient être manqués.
  • La cohorte ayant résulté du couplage représente environ 80 % des hospitalisations survenues au cours de la période 2006-2007 à 2008-2009.
  • Le fichier issu du couplage recensement–BDCP, qui est représentatif de la population nationale, comble des lacunes statistiques et offre de nouvelles possibilités de recherche.
Date de modification :