Études analytiques : méthodes et références
Zeno : un outil pour le calcul des intervalles de confiance des taux en santé
Consulter la version la plus récente.
Information archivée dans le Web
L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.
par Philippe Finès et Gisèle Carriere
Division de l’analyse de la santé
Remerciements
Les auteurs remercient Claude Nadeau pour ses commentaires concernant une version préliminaire de cet article.
Résumé
Les taux d’hospitalisation font partie des statistiques couramment employées quand il est question de l’utilisation des services de soins de santé. La variété des méthodes de calcul des intervalles de confiance pour ces taux et d’autres taux liés à la santé porte à croire qu’il serait nécessaire de classifier, de comparer et d’évaluer ces méthodes. Zeno est un outil conçu pour calculer les intervalles de confiance des taux à partir de plusieurs formules disponibles dans la littérature. Le présent rapport présente le contenu de la page principale de l’outil Zeno et indique les formules à utiliser en fonction des hypothèses des utilisateurs et de la portée de l’analyse.
Mots-clés : Intervalles de confiance, santé, hospitalisation, taux
1. Introduction
Les taux d’hospitalisation font partie des statistiques couramment employées quand il est question de l’utilisation des services de soins de santé. Le choix d’une méthode de calcul des intervalles de confiance (IC) de ces taux constitue un problème récurrent auquel les analystes d’information sur la santé font face.
Quand des événements en milieu hospitalier sont indépendants les uns des autres (un seul événement par personne, comme un congé) et que le taux n’est ni très faible ni élevé, l’IC peut être calculé à l’aide d’une approximation fondée sur la distribution normale. Par contre, les situations présentent souvent des conditions différentes de celles-ci. Par exemple, contrairement aux statistiques de l’état civil comme les naissances ou les décès, des événements récurrents pourraient viser une personne donnée, malgré la faible probabilité de leur occurrence. Ces événements ne sont pas indépendants, et cette situation a des répercussions sur la validité du recours à des approximations fondées sur la distribution normale pour calculer les IC. Un examen des visites à l’hôpital d’une personne pourrait aussi tenir compte de toutes les visites ou seulement de la première visite pour une maladie particulière. Différentes hypothèses sont avancées, selon la portée de l’analyse; il faut, par conséquent, disposer de différentes méthodes pour calculer les IC.
Dans l’examen d’un seul événement par personne et d’une faible probabilité d’occurrence de cet événement, il est recommandé de recourir à des calculs exacts à partir de distributions données. Souvent, l’hypothèse repose sur une distribution binomiale ou de Poisson. D’autres techniques ont été proposées (Glynn et coll., 1993; Carriere et Roos, 1997; Fay et Feuer, 1997; Kegler, 2007), qui supposent des distributions particulières, de type gamma ou khi carré. Outre la rareté des événements, un deuxième problème se pose du fait que l’analyse d’événements récurrents (comme les hospitalisations), contrairement à des événements non récurrents (comme le décès), contrevient à l’hypothèse d’indépendance de Poisson (Carriere et Roos, 1997).
La littérature sur les IC calculés pour des taux qui évaluent ces différentes situations a rapidement pris de l’ampleur et se révèle parfois intimidante pour les chercheurs qui doivent décider de la formule à utiliser dans un contexte particulier. Peu d’études comparatives ont toutefois été réalisées sur ces méthodes de calcul des IC pour des taux. Habituellement, les auteurs font état de leurs travaux (avec leurs notations caractéristiques) et traitent peu de la compatibilité et de la comparabilité de leurs travaux avec ceux d’autres chercheurs.
La première version de cet article visait à cataloguer toutes les méthodes disponibles pour le calcul des IC de taux. Le rapprochement des notations des différents auteurs et l’obligation de s’assurer que toute la littérature pertinente était prise en compte faisaient partie des nombreuses difficultés de cette entreprise. La tâche est vite devenue trop complexe. Certains articles décrivaient des méthodes exactes, tandis que d’autres présentaient des approximations; des articles indiquaient comment comparer des taux (avec des différences ou des rapports de taux); certains se concentraient sur un événement par personne, tandis que d’autres permettaient les occurrences multiples; certains présentaient des formules pour les taux bruts, tandis que d’autres se limitaient à des taux normalisés, etc. Il fallait procéder à un examen systématique des formules publiées. Il est apparu clairement qu’il serait utile de regrouper une famille de formules liées au problème général du calcul des IC pour les taux à l’intérieur d’un seul outil.
Par conséquent, l’objectif initial est passé de la création d’un catalogue de formules à la mise au point d’un outil grâce auquel les chercheurs verraient les effets de l’application de l’une ou l’autre des différentes méthodes proposées. Il porte sur le calcul des IC pour les taux, mais omet les formules relatives à la validation d’hypothèses sur les taux (comme la comparaison entre différents groupes ou l’évaluation de la « surdispersion » ou des distributions gonflées à zéro [van den Broek, 1995]). Cet outil (classeur), Zeno, est maintenant disponible sur demande. Puisque les taux et le nombre d’événements sont liés, les IC des deux métriques sont disponibles. Même si les utilisateurs ont accès à plusieurs formules pour les IC, celle qui convient le mieux ne procurera pas nécessairement l’IC le plus court. Au contraire, la formule la plus appropriée sera celle qui satisfait aux conditions des hypothèses utilisées pour décrire la distribution de l’événement; les calculs reposent sur ces hypothèses.
Cet article vise à décrire l’outil Zeno. Les trois prochaines sections présentent les références relatives aux formules initiales (section 2); les notations utilisées dans l’outil et dans cet article (section 3); le contenu de la page principale de l’outil (section 4). La section Données et résultats (section 5) contient un tableau croisé dynamique extrait de l’outil. La Conclusion (section 6) résume la description et propose des améliorations possibles.
2. Revue de la littérature
Même sans examen systématique de tous les articles parus dans ce domaine, les références utilisées sont à jour et pertinentes pour les besoins de l’outil. Le corollaire est, comme il est mentionné plus haut, que la notation varie dans toutes les références. Pour bien cerner les subtilités d’une méthode donnée et la comparer à d’autres, les lecteurs doivent interpréter mentalement la notation utilisée par un auteur selon les termes utilisés par un autre. Par exemple, le concept de poids a étonnamment plus d’une définition. Les hypothèses relatives aux formules retenues dans l’outil sont présentées sous forme de liste dans le tableau 1. En présence d’une proportion relativement modeste des cas récurrents, toutes les mesures mentionnées dans « Un événement par personne » pourront servir aux analyses de « Tous les événements ».
Formule | Appropriée pour un événement par personne ou pour tous les événements? | D’abord conçu pour les taux ou pour le nombre d’événements? | Références (équations) |
---|---|---|---|
Fondée sur une distribution de Poisson | |||
Formule exacte | Un événement par personne | Nombre d'événements | (5) dans Fay et Feuer (1997)Tableau 1 Note 1 (aussi [14] [15], [20], [21] dans Daly [1992]Tableau 1 Note 2) |
Approximation normale | Un événement par personne | Nombre d'événements | (7) dans Daly (1992) |
Transformation log-normale | Un événement par personne | Taux | (1a) dans Kegler (2007)Tableau 1 Note 3 |
Fondée sur une distribution binomiale | |||
Formule exacte | Un événement par personne | Taux | (4) et (5) dans Daly (1992) |
Approximation normale | Un événement par personne | Taux | (3) dans Daly (1992) |
Approximation normale pour de petites proportions | Un événement par personne | Taux | (1.26) et (1.27) dans Fleiss (1981)Tableau 1 Note 4 |
Pour l’analyse de tous les événements | |||
Distribution de Poisson composée | Tous les événements | Taux | (1b) dans Kegler (2007) |
Hypothèse binomiale négative | Tous les événements | Taux | Glynn et coll. (1993, p. 780)Tableau 1 Note 5 |
|
3. Notations et formules
Le tableau 2 présente une liste des principaux concepts et de leurs symboles. Lorsque tous les événements sont pris en compte, les taux sont indiqués par le symbole et le nombre d’événements, par le symbole . Pour ce qui est des résultats normalisés selon l’âge, les symboles seront plutôt et . À l’intérieur d’une strate d’âge , le suffixe est annexé au symbole. Quand un seul événement par personne est pris en compte (le premier événement, par exemple), les mêmes notations sont entourées de crochets «[» et «]», de sorte que devient , devient , et ainsi de suite. D’autres symboles sont aussi nécessaires : correspond à la taille totale (propre à la strate) de la population à l’étude, alors que correspond à la taille totale (propre à la strate) de la population de référence à partir de laquelle les poids sont calculés.
Concept | Tailles et poids | Nombre d'événements | Taux |
---|---|---|---|
Taille de la population | |||
Par strate d'âge | #N_i | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer |
Total pour la strate d’âge | #N | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer |
Taille de la population de référence | |||
Par strate d’âge | #NR_i | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer |
Total pour la strate d’âge | #NR | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer |
Poids utilisés pour la normalisation selon l’âge | |||
Dans chaque strate | w_i = #NR_i /#NR | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer |
Portée des événements examinés — méthode | |||
Tous les événements | |||
Résultats bruts (par strate d’âge i) | Note ...: n'ayant pas lieu de figurer | #E_i | r_i |
Résultats bruts (pour toutes les strates d’âge combinées) | Note ...: n'ayant pas lieu de figurer | #E | r |
Résultats normalisés selon l’âge | Note ...: n'ayant pas lieu de figurer | AS#E | ASR |
Un événement par personne seulement | |||
Résultats bruts (par strate d’âge i) | Note ...: n'ayant pas lieu de figurer | [#E_i] | [r_i] |
Résultats bruts (par strates d’âge combinées) | Note ...: n'ayant pas lieu de figurer | [#E] | [r] |
Résultats normalisés selon l’âge | Note ...: n'ayant pas lieu de figurer | [AS#E] | [ASR] |
... n'ayant pas lieu de figurer |
Lorsque des nombres représentent deux événements uniques pour certaines personnes et des événements récurrents et non indépendants pour d’autres, une notation plus complexe s’impose. La notation doit permettre de décrire le contenu des cellules renfermant des valeurs qui encodent le nombre de personnes, ainsi que le nombre d’événements vécus par une personne donnée. Dans la notation de Kegler (2007), correspond au nombre de personnes pour lesquelles le nombre d’événements est égal à . Dans Kegler (2007), va de 1 à 2; dans l’outil présenté ici, va de 1 à 14. Par conséquent, correspond à la « taille de l’ensemble composé de toutes les personnes qui occupent la strate et pour lesquelles le nombre d’événements est égal à ». Autrement dit, la formule exprime le nombre de personnes de la strate qui ont connu événements. Par souci de cohérence avec d’autres notations du tableau 2, désigne ; par extension, désigne le nombre de personnes de la strate qui n’ont connu aucun événement, et , le nombre de personnes qui, dans l’ensemble, n’ont pas connu d’événement.
Les résultats seront définis en fonction des métriques choisies, à savoir les taux ou le nombre d’événements selon la population (strate d’âge particulière ou totaux) et la portée (tous les événements ou un seul événement par personne). Les taux et le nombre d’événements sont liés conformément à la formule générale suivante :
qui, à l’aide des notations du tableau 2, donnera, par exemple :
et
La taille de la population est partout considérée comme fixe, puisqu’il s’agit d’une norme pour plusieurs auteurs. Par conséquent, il est possible de calculer le taux ou le nombre d’événements lorsque l’autre métrique est connue. En fait, certaines formules intégrées à l’outil ont d’abord été présentées dans les articles de référence pour le calcul des IC des taux (ou du nombre d’événements). Les formules correspondant à l’autre métrique ont été élaborées par la suite.
Bien que plusieurs des formules citées en référence portent sur un calcul en particulier, il est possible d’étendre les formules pour les appliquer à d’autres cas. Dans les références qui présentent les formules pour de multiples visites, par exemple, une simplification à une seule visite par personne est une mesure simple; seules des modifications mineures doivent être apportées aux formules initiales.
De même, un taux normalisé selon l’âge est une somme pondérée des taux propres à la strate d’âge.
(où les poids sont égaux à ). Si, dans cette formule, on remplaçait les poids par des « pseudo-poids » (chacun étant égal à ), le résultat serait :
Cela montre qu’il est possible d’exprimer (taux brut) en tant que somme pondérée des taux propres aux strates; autrement dit, est le taux normalisé selon l’âge obtenu avec l’utilisation de « pseudo-poids ». Cette propriété a servi à convertir la formule pour l’IC de en une formule pour l’IC de lorsque les références ne font pas directement état de ce dernier.
En somme, l’outil renferme une série complète de formules pour les six métriques dans les deux dernières colonnes du tableau 2, selon l’application de différentes hypothèses du tableau 1.
4. Contenu de la page principale
L’outil Zeno est essentiellement une page (« page principale ») qui renferme les données et les résultats. En fait, il peut y avoir autant de « pages principales » que souhaité; l’étiquette de la page analysée doit être indiquée sur la page « Prep », ce qui reformate les résultats pour générer les plans et les tableaux croisés dynamiques qui conviennent.
Les cellules de la page principale sont désignées par une concaténation de colonne (lettre) et de rangée (chiffre). Le tableur Excel permet d’insérer 21 strates, pour lesquelles l’utilisateur inscrit des données dans les rangées =11 à 31.
Comme il est indiqué plus haut, des symboles propres à la strate sont désignés par une concaténation de symboles, « » et de rangées =1 à 21. Les rangées et les strates sont couplées par le rapport suivant : . Les tableaux 3-1 à 3-4 présentent les composants essentiels de la page principale, où l’identificateur de la cellule est décrit par ce qui suit le signe «=». Par exemple : la cellule D11 renferme le nombre d’événements pour la strate 1; correspond au taux de la strate 1. Les cellules suivantes sont les seules que les utilisateurs peuvent modifier :
- C1 et D1 à T1 (mot-clé et titre)
- C2 : unité de référence (dénominateur) des taux
- C3 : niveau alpha des IC (p. ex. 0,05)
- aire de D11 à T31 : respectivement, pour chaque strate d’âge = 1 à 21 : pour = 1 à 14 (parce que l’outil accepte jusqu’à 14 événements par personne).
Rangées | Colonnes A-C | Colonne D | Colonne E | Colonne F | Colonnes G-T | Colonne V | Colonnes W-Z | Colonnes AI-AL | Colonne AM | Colonne AW |
---|---|---|---|---|---|---|---|---|---|---|
1..10 | Étiquettes | Étiquettes | Étiquettes | Étiquettes | Étiquettes | Étiquettes | Étiquettes | Étiquettes | Étiquettes | Étiquettes |
i*=11..31 | Étiquettes | Di*= #E_iCette cellule contient des données. | Ei*= #N_iCette cellule contient des données. | Fi*= #NR_iCette cellule contient des données. | Gi*= #E_1_i, jusqu'à Ti*=#E_14_i (tiré de Kegler [2007])Cette cellule contient des données. | Vi*=r_iCette cellule contient des estimations et des résultats intermédiaires, par strate. | Wi*=w_iCette cellule contient des estimations et des résultats intermédiaires, par strate. | ALi*=Gi + 2*Hi + 3*Ii + ... + 14*Ti (tiré de Kegler [2007])Cette cellule contient des estimations et des résultats intermédiaires, par strate. | AMi*= Gi + 4*Hi + 9*Ii + ... + 196*Ti (tiré de Kegler [2007])Cette cellule contient des estimations et des résultats intermédiaires, par strate. | AWi*= ln(r_i)Cette cellule contient des intervalles de confiance pour les taux, par strate. |
33 | Étiquettes | D33=#E | E33=#N | F33=#NR | G33= sur i de #E_1_i jusqu'à T33= sur i de #E_14_i | Vide | W33= sur i de w_i =1, Y33=ASR | AI33=[#E], AK33=[ASR] | Vide | Vide |
44 | Étiquettes | Vide | Vide | Vide | G44=G33*1, jusqu'à T44=T33*14 | V44=r | Y44=AS#E | AJ44=[r], AK44=[AS#E] | Vide | AW44= ln(r) |
45 | Étiquettes | Vide | Vide | Vide | G45=G33*1^2, jusqu'à T45=G33*14^2 | Vide | Z45=s^2 (tiré de Glynn et coll. [1993]) | Vide | Vide | Vide |
47 | Étiquettes | Vide | Vide | Vide | Vide | Vide | Z47=k-hat (tiré de Glynn et coll. [1993]) | Vide | Vide | AW47= ln(ASR) |
50 | Étiquettes | Vide | Vide | Vide | Vide | Vide | Vide | Vide | Vide | AW50= ln([R]) |
53 | Étiquettes | Vide | Vide | Vide | Vide | Vide | Vide | Vide | Vide | AW53= ln([ASR]) |
Les notes sont présentées au bas du tableau 3-4. |
Rangées | Colonnes AX-BA | Colonnes BB-BE | Colonnes BF-BI | Colonnes BM-BP | Colonnes BQ-BT | Colonnes BU-BX |
---|---|---|---|---|---|---|
1..10 | Étiquettes | Étiquettes | Étiquettes | Étiquettes | Étiquettes | Étiquettes |
i* = 11..31 | AXi*-BAi*= limites de l’IC, largeur de l’IC, c.v. pour r_i à l’aide d’une distribution de Poisson, formule exacteCette cellule contient des intervalles de confiance pour les taux, par strate. | BBi*-BEi*= limites de l’IC, largeur de l’IC, c.v. pour r_i à l’aide d’une distribution de Poisson, approximation normaleCette cellule contient des intervalles de confiance pour les taux, par strate. | BFi*-BLi*= estimation de r_i, limites de l’IC de ln(r_i), limites de l’IC, largeur de l’IC, c.v. pour r_i à l’aide d’une distribution de Poisson, formule de transformation log-normaleCette cellule contient des intervalles de confiance pour les taux, par strate. | BMi*-BPi*= limites de l’IC, largeur de l’IC, c.v. pour r_i à l’aide d’une distribution binomialeCette cellule contient des intervalles de confiance pour les taux, par strate. | BQi*-BTi*= limites de l’IC, largeur de l’IC, c.v. pour r_i à l’aide d’une distribution binomiale, approximation normaleCette cellule contient des intervalles de confiance pour les taux, par strate. | BUi*-BXi*= limites de l’IC, largeur de l’IC, c.v. pour r_i à l’aide d’une distribution binomiale, approximation normaleCette cellule contient des intervalles de confiance pour les taux, par strate. |
33 | Vide | Vide | Vide | Vide | Vide | Vide |
44 | AX44-BA44= limites de l’IC, largeur de l’IC, c.v. pour r à l’aide d’une distribution de Poisson, formule exacte | BB44-BE44= limites de l’IC, largeur de l’IC, c.v. pour r à l’aide d’une distribution de Poisson, approximation normale | BF44-BL44= estimation de r, limites de l’IC de ln(r), limites de l’IC, largeur de l’IC, c.v. pour r à l’aide d’une distribution de Poisson, formule de transformation log-normale | BM44-BP44= limites de l’IC, largeur de l’IC, c.v. pour r à l’aide d’une distribution binomiale | BQ44-BT44= limites de l’IC, largeur de l’IC, c.v. pour r à l’aide d’une distribution binomiale, approximation normale | BU44-BX44= limites de l’IC, largeur de l’IC, c.v. pour r à l’aide d’une distribution binomiale, approximation normale |
45 | Vide | Vide | Vide | Vide | Vide | Vide |
47 | AX47-BA47= limites de l’IC, largeur de l’IC, c.v. pour ASR à l’aide d’une distribution de Poisson, formule exacte | BB47-BE47= limites de l’IC, largeur de l’IC, c.v. pour ASR à l’aide d’une distribution de Poisson, approximation normale | BF47-BL47= estimation de ASR, limites de l’IC de ln(ASR), limites de l’IC, largeur de l’IC, c.v. pour ASR à l’aide d’une distribution de Poisson, formule de transformation log-normale | BM47-BP47= limites de l’IC, largeur de l’IC, c.v. pour ASR à l’aide d’une distribution binomiale | BQ47-BT47= limites de l’IC, largeur de l’IC, c.v. pour ASR à l’aide d’une distribution binomiale, approximation normale | BU47-BX47= limites de l’IC, largeur de l’IC, c.v. pour ASR à l’aide d’une distribution binomiale, approximation normale |
50 | AX50-BA50= limites de l’IC, largeur de l’IC, c.v. pour [r] à l’aide d’une distribution de Poisson, formule exacte | BB50-BE50= limites de l’IC, largeur de l’IC, c.v. pour [r] à l’aide d’une distribution de Poisson, approximation normale | BF50-BL50= estimation de [r], limites de l’IC de ln([r]), limites de l’IC, largeur de l’IC, c.v. pour [r] à l’aide d’une distribution de Poisson, formule de transformation log-normale | BM50-BP50= limites de l’IC, largeur de l’IC, c.v. pour [r] à l’aide d’une distribution binomiale | BQ50-BT50= limites de l’IC, largeur de l’IC, c.v. pour [r] à l’aide d’une distribution binomiale, approximation normale | BU50-BX50= limites de l’IC, largeur de l’IC, c.v. pour [r] à l’aide d’une distribution binomiale, approximation normale |
53 | AX53-BA53= limites de l’IC, largeur de l’IC, c.v. pour [ASR] à l’aide d’une distribution de Poisson, formule exacte | BB53-BE53= limites de l’IC, largeur de l’IC, c.v. pour [ASR] à l’aide d’une distribution de Poisson, approximation normale | BF53-BL53= estimation de [ASR], limites de l’IC de ln([ASR]), limites de l’IC, largeur de l’IC, c.v. pour [ASR] à l’aide d’une distribution de Poisson, formule de transformation log-normale | BM53-BP53= limites de l’IC, largeur de l’IC, c.v. pour [ASR] à l’aide d’une distribution binomiale | BQ53-BT53= limites de l’IC, largeur de l’IC, c.v. pour [ASR] à l’aide d’une distribution binomiale, approximation normale | BU53-BX53= limites de l’IC, largeur de l’IC, c.v. pour [ASR] à l’aide d’une distribution binomiale, approximation normale |
Les notes sont présentées au bas du tableau 3-4. |
Rangées | Colonnes BY-CF | Colonnes CG-CJ | Colonnes CM-CO | Colonnes CP-CR | Colonnes CS-CU | Colonnes CV-CX |
---|---|---|---|---|---|---|
1..10 | Étiquettes | Étiquettes | Étiquettes | Étiquettes | Étiquettes | Étiquettes |
i* = 11..31 | BYi*-CFi*=Calculs relatifs à une distribution de Poisson composée, limites de l’IC, largeur de l’IC, c.v. pour r_i à l’aide d’une distribution de Poisson composéeCette cellule contient des intervalles de confiance pour les taux, par strate. | CGi*-CJi*= limites de l’IC, largeur de l’IC, c.v. pour r_i à l’aide d’une distribution binomiale négativeCette cellule contient des intervalles de confiance pour les taux, par strate. | CMi*-COi*= limites de l’IC, largeur de l’IC pour #E_i à l’aide d’une distribution de Poisson, formule exacteCette cellule contient des intervalles de confiance pour le nombre d'événements, par strate. | CPi*-CRi*= limites de l’IC, largeur de l’IC pour #E_i à l’aide d’une distribution de Poisson, approximation normaleCette cellule contient des intervalles de confiance pour le nombre d'événements, par strate. | CSi*-CUi*= limites de l’IC, largeur de l’IC pour #E_i à l’aide d’une distribution de Poisson, formule de transformation log-normaleCette cellule contient des intervalles de confiance pour le nombre d'événements, par strate. | CVi*-CXi*= limites de l’IC, largeur de l’IC pour #E_i à l’aide d’une distribution binomialeCette cellule contient des intervalles de confiance pour le nombre d'événements, par strate. |
33 | Vide | Vide | Vide | Vide | Vide | Vide |
44 | BY44-CF44= Calculs relatifs à une distribution de Poisson composée, limites de l’IC, largeur de l’IC, c.v. pour r à l’aide d’une distribution de Poisson composée | CG44-CJ44= limites de l’IC, largeur de l’IC, c.v. pour r à l’aide d’une distribution binomiale négative | CM44-CO44= limites de l’IC, largeur de l’IC pour #E à l’aide d’une distribution de Poisson, formule exacte | CP44-CR44= limites de l’IC, largeur de l’IC pour #E à l’aide d’une distribution de Poisson, approximation normale | CS44-CU44= limites de l’IC, largeur de l’IC pour #E à l’aide d’une distribution de Poisson, formule de transformation log-normale | CV44-CX44= limites de l’IC, largeur de l’IC pour #E à l’aide d’une distribution binomiale |
45 | Vide | Vide | Vide | Vide | Vide | Vide |
47 | BY47-CF47= Calculs relatifs à une distribution de Poisson composée, limites de l’IC, largeur de l’IC, c.v. pour ASR à l’aide d’une distribution de Poisson composée | CG47-CJ47= limites de l’IC, largeur de l’IC, c.v. pour ASR à l’aide d’une distribution binomiale négative | CM47-CO47= limites de l’IC, largeur de l’IC pour AS#E à l’aide d’une distribution de Poisson, formule exacte | CP47-CR47= limites de l’IC, largeur de l’IC pour AS#E à l’aide d’une distribution de Poisson, approximation normale | CS47-CU47= limites de l’IC, largeur de l’IC pour AS#E à l’aide d’une distribution de Poisson, formule de transformation log-normale | CV47-CX47= limites de l’IC, largeur de l’IC pour AS#E à l’aide d’une distribution binomiale |
50 | BY50-CF50= Calculs relatifs à une distribution de Poisson composée, limites de l’IC, largeur de l’IC, c.v. pour [r] à l’aide d’une distribution de Poisson composée | Vide | CM50-CO50= limites de l’IC, largeur de l’IC pour [#E] à l’aide d’une distribution de Poisson, formule exacte | CP50-CR50= limites de l’IC, largeur de l’IC pour [#E] à l’aide d’une distribution de Poisson, approximation normale | CS50-CU50= limites de l’IC, largeur de l’IC pour [#E] à l’aide d’une distribution de Poisson, formule de transformation log-normale | CV50-CX50= limites de l’IC, largeur de l’IC pour [#E] à l’aide d’une distribution binomiale |
53 | BY53-CF53= Calculs relatifs à une distribution de Poisson composée, limites de l’IC, largeur de l’IC, c.v. pour [ASR] à l’aide d’une distribution de Poisson composée | Vide | CM53-CO53= limites de l’IC, largeur de l’IC pour [AS#E] à l’aide d’une distribution de Poisson, formule exacte | CP53-CR53= limites de l’IC, largeur de l’IC pour [AS#E] à l’aide d’une distribution de Poisson, approximation normale | CS53-CU53= limites de l’IC, largeur de l’IC pour [AS#E] à l’aide d’une distribution de Poisson, formule de transformation log-normale | CV53-CX53= limites de l’IC, largeur de l’IC pour [AS#E] à l’aide d’une distribution binomiale |
Les notes sont présentées au bas du tableau 3-4. |
Rangées | Colonnes CY-DA | Colonnes DB-DD | Colonnes DE-DG | Colonnes DH-DJ | Colonne DK |
---|---|---|---|---|---|
1..10 | Étiquettes | Étiquettes | Étiquettes | Étiquettes | Étiquettes |
i* = 11..31 | CYi*-DAi*= limites de l’IC, largeur de l’IC pour #E_i à l’aide d’une distribution binomiale, approximation normaleCette cellule contient des intervalles de confiance pour le nombre d'événements, par strate. | DBi*-DDi*= limites de l’IC, largeur de l’IC pour #E_i à l’aide d’une distribution binomiale, approximation normaleCette cellule contient des intervalles de confiance pour le nombre d'événements, par strate. | DEi*-DGi*= limites de l’IC, largeur de l’IC pour #E_i à l’aide d’une distribution de Poisson composéeCette cellule contient des intervalles de confiance pour le nombre d'événements, par strate. | DHi*-DJi*= limites de l’IC, largeur de l’IC pour #E_i à l’aide d’une distribution binomiale négativeCette cellule contient des intervalles de confiance pour le nombre d'événements, par strate. | DKi*= min(n_i*p_i,n_i*(1-p_i)) : critère utilisé pour la validité du test fondé sur une distribution binomialeCette cellule est destinée à la vérification. |
33 | Vide | Vide | Vide | Vide | Vide |
44 | CY44-DA44= limites de l’IC, largeur de l’IC pour #E à l’aide d’une distribution binomiale, approximation normale | DB44-DD44= limites de l’IC, largeur de l’IC pour #E à l’aide d’une distribution binomiale, approximation normale | DE44-DG44= limites de l’IC, largeur de l’IC pour #E à l’aide d’une distribution de Poisson composée | DH44-DJ44= limites de l’IC, largeur de l’IC pour #E à l’aide d’une distribution binomiale négative | DK44= min(np,n(1-p)) : critère utilisé pour la validité du test fondé sur une distribution binomiale |
45 | Vide | Vide | Vide | Vide | Vide |
47 | CY47-DA47= limites de l’IC, largeur de l’IC pour AS#E à l’aide d’une distribution binomiale, approximation normale | DB47-DD47= limites de l’IC, largeur de l’IC pour AS#E à l’aide d’une distribution binomiale, approximation normale | DE47-DG47= limites de l’IC, largeur de l’IC pour AS#E à l’aide d’une distribution de Poisson composée | DH47-DJ47= limites de l’IC, largeur de l’IC pour AS#E à l’aide d’une distribution binomiale négative | DK47= critère utilisé pour la validation du test fondé sur une distribution binomiale |
50 | CY50-DA50= limites de l’IC, largeur de l’IC pour [#E] à l’aide d’une distribution binomiale, approximation normale | DB50-DD50= limites de l’IC, largeur de l’IC pour [#E] à l’aide d’une distribution binomiale, approximation normale | DE50-DG50= limites de l’IC, largeur de l’IC pour [#E] à l’aide d’une distribution de Poisson composée | Vide | DK50= critère utilisé pour la validité du test fondé sur une distribution binomiale |
53 | CY53-DA53= limites de l’IC, largeur de l’IC pour [AS#E] à l’aide d’une distribution binomiale, approximation normale | DB53-DD53= limites de l’IC, largeur de l’IC pour [AS#E] à l’aide d’une distribution binomiale, approximation normale | DE53-DG53= limites de l’IC, largeur de l’IC pour [AS#E] à l’aide d’une distribution de Poisson composée | Vide | DK53= critère utilisé pour la validité du test fondé sur une distribution binomiale |
Notes : La signification du code de couleurs utilisé dans le tableur Excel est la suivante : orange : étiquettes; mauve clair : données; vert pâle : estimations et résultats intermédiaires, par strate; vert foncé : intervalles de confiance (IC) pour les taux, par strate; rose : IC pour le nombre d’événements, par strate; mauve foncé : vérification. Les formules mentionnées dans ce tableau sont expliquées dans le tableau 1. Les références relatives aux citations indiquées dans ce tableau se trouvent dans le tableau 1. La signification des symboles est donnée au tableau 2. CV: coefficient de variation. |
5. Données et résultats
Les données utilisées pour mettre l’outil à l’essai avaient d’abord été tirées des bases des données administratives sur le cancer du Manitoba. Ces données ont été retenues pour illustrer la valeur de l’outil et pour présenter une situation dans laquelle l’intérêt pourrait porter sur tous les événements (taux total d’hospitalisations pour le cancer, y compris les récurrences) ou sur un seul événement par personne (taux de la première hospitalisation pour le cancer chez les résidents de la province).
Le tableau 4 présente un échantillon des résultats. Les utilisateurs peuvent choisir le seuil de signification (p. ex. 95 %, 90 %)Note 1 des IC et préciser les métriques (p. ex., , , , ), les statistiques (estimation, limites inférieure [I] et supérieure [S] des IC), les méthodes (formules du tableau 1), et déterminer si ceux-ci sont applicables à l’ensemble des strates ou à une strate particulière. Les utilisateurs doivent connaître la pertinence de la méthode d’après la portée, comme le montre le tableau 1.
Étiquettes de rangée | Estimation | IC exact (PoissonTableau 4 Note 1) | IC (Poisson, log-normaleTableau 4 Note 2) | IC (Poisson, composéeTableau 4 Note 3) |
---|---|---|---|---|
r | ||||
Estimation | 1860,2 | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer |
I | Note ...: n'ayant pas lieu de figurer | 1714,3 | 1851,9 | 1845,0 |
S | Note ...: n'ayant pas lieu de figurer | 2083,5 | 1868,5 | 1875,5 |
ASR | ||||
Estimation | 1885,5 | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer |
I | Note ...: n'ayant pas lieu de figurer | 1737,6 | 1877,1 | 1869,4 |
S | Note ...: n'ayant pas lieu de figurer | 2111,7 | 1893,8 | 1901,6 |
[r] | ||||
Estimation | 923,7 | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer |
I | Note ...: n'ayant pas lieu de figurer | 851,3 | 917,9 | 917,9 |
S | Note ...: n'ayant pas lieu de figurer | 1034,6 | 929,6 | 929,6 |
[ASR] | ||||
Estimation | 964,9 | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer | Note ...: n'ayant pas lieu de figurer |
I | Note ...: n'ayant pas lieu de figurer | 889,3 | 959,0 | 958,0 |
S | Note ...: n'ayant pas lieu de figurer | 1080,7 | 970,9 | 971,9 |
... n'ayant pas lieu de figurer
Source : Statistique Canada, calculs des auteurs. Données initialement tirées de base de données administratives sur le cancer du Manitoba, puis modifiées aux fins d'illustration. |
6. Conclusion
L’outil Zeno regroupe et complète des formules tirées de plusieurs sources publiées. Il présente, sur une seule page, les calculs proposés par différents auteurs et permet aux utilisateurs de comparer l’incidence de différentes méthodes sur les intervalles de confiance (IC) qui en découlent. L’outil développe également les formules décrites dans les références. Dans une référence, par exemple, l’IC est présent pour , mais pas l’IC pour ; dans une autre référence, l’IC est présent pour , mais pas celui pour ; ou des formules existent pour , mais pas pour . L’outil Zeno complète donc les ensembles de formules disponibles à utiliser dans une plus vaste gamme de situations susceptibles de se retrouver dans les données.
Il serait possible de développer l’outil pour y ajouter des fonctions comme les comparaisons entre groupes ou des tests de « surdispersion » ou de distributions gonflées à zéro. L’installation d’une fonction de modélisation des taux serait également à envisager. Il faut toutefois faire preuve de prudence avant d’introduire des fonctions additionnelles. Même si ces fonctions se révélaient utiles, elles compliqueraient l’utilisation de l’outil. Celui-ci pourrait devenir encombrant, parce que des analyses additionnelles, comme des tests d’hypothèses, nécessiteraient plus de colonnes ou de rangées qui ne servent pas dans toutes les situations. Tel qu’il est présenté, cet outil général s’applique à un large éventail de situations, tout en étant souple et adaptable afin de combler d’autres besoins particuliers.
Bibliographie
Carriere, K.C., et L.L. Roos. 1997. « A Method of Comparison for Standardized Rates of Low-Incidence Events », Medical Care 35 (1) : 57 à 69.
Daly, L. 1992. « Simple SAS macros for the calculation of exact binomial and Poisson confidence limits », Computers in Biology and Medicine 22 (5) : 351 à 361.
Fay, M.P., et E.J. Feuer. 1997. « Confidence intervals for directly standardized rates : A method based on the Gamma distribution », Statistics in Medicine 16 (7) : 791 à 801.
Fleiss, J.L. 1981. Statistical Methods for Rates and Proportions, 2nd Edition. New York, John Wiley and Sons Ltd.
Glynn, R.J., T.A. Stukel, S.M. Sharp, T.A. Bubolz, J.A. Freeman et E.S. Fisher. 1993. « Estimating the Variance of Standardized Rates of Recurrent Events, with Application to Hospitalizations Among the Elderly in New England ». American Journal of Epidemiology 137 (7) : 776 à 786.
Kegler, S.R. 2007. « Applying the compound Poisson process model to the reporting of injury-related mortality rates », Epidemiologic Perspectives & Innovations 4 (1). DOI : 10.1186/1742-5573-4-1.
van den Broek, J. 1995. « A score test for zero inflation in a Poisson distribution », Biometrics 51 (2) : 738 à 743.
Signaler un problème sur cette page
Quelque chose ne fonctionne pas? L'information n'est plus à jour? Vous ne trouvez pas ce que vous cherchez?
S'il vous plaît contactez-nous et nous informer comment nous pouvons vous aider.
- Date de modification :