Appendice I : Modéle logistique à plusieurs variables

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Dans le cas de la régression logistique binaire, la qualité de l'ajustement se mesure par une transformation de l'estimation du maximum de vraisemblance (EMV), comme suit : 

(A1) Qualité de l'ajustement = -2 log(L), où L (vraisemblance) = Π pi Π (1-pi).

La valeur -2log(L) est répartie approximativement sous forme de χ2 avec des degrés de liberté équivalents au nombre de variables. Étant donné que l'EMV est une probabilité et ne peut pas être supérieure à 1, son logarithme est négatif. À mesure que l'ajustement s'améliore, la probabilité du MV augmente pour s'approcher de 1. Le logarithme augmente également (tout en demeurant négatif) et la valeur -2log(L) diminue. Une autre variable améliore l'ajustement du modèle si elle réduit la probabilité de la valeur -2log (tableau I). Le modèle « témoin » initial comporte des caractéristiques sociodémographiques (x1, x2 et x4 à x6), comme l'âge, le revenu et le lieu, toutes importantes pour l'utilisation d'Internet. Le modèle complet comprend des comportements en ligne (intensité, portée et expérience –x3,x7 et x8– de même que les préoccupations au sujet de la protection des cartes de crédit, x9.). Le modèle final tient compte de l'expérience à titre de variable qualitative. Toutes les variables demeurent importantes et l'ajustement général du modèle s'améliore (tableau I).

La statistique de Nagelkerke est une pseudo-valeur R2 qui tente de fournir une analogie logistique à la valeur R2 dans la méthode des moindres carrés ordinaires. Bien que la statistique de Nagelkerke varie de 0 à 1, comme le fait la valeur R2 dans la méthode des moindres carrés ordinaires, elle n'indique pas la proportion de variance expliquée par les variables explicatives (UCLA, 2004). Elle indique plutôt la proportion de variance non imputée qui diminue à l'ajout de variables au modèle, comparativement au modèle nul (c.-à-d., la constante). La valeur de Nagelkerke augmente de 0,102 dans le modèle témoin à 0,300 dans le modèle final.

Dans le cas des variables continues, l'interprétation des coefficients de pente est similaire à celle de la régression de la méthode des moindres carrés ordinaires. Dans le cas des variables discrètes, le coefficient de régression (B) équivaut au rapport logarithmique de cotes de l'utilisation ou de la non-utilisation d'Internet par un particulier. Les cotes sont définies comme étant p/q ou p/(1 - p), où p = la probabilité de l'événement et q = (1 - p). Un rapport logarithmique de cotes se définit comme suit : 

(A2) ln[p1/(1 - p1)]/[p0/(1 - p0)].