Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Histogramme et polygone statistique

L'histogramme est un outil fréquemment utilisé, notamment pour résumer des données discrètes ou continues mesurées dans une échelle d'intervalle. Il est souvent employé pour montrer les caractéristiques principales de la distribution des données de façon pratique. Un histogramme sépare les valeurs possibles des données en classes ou groupes. Pour chaque groupe, un rectangle est construit dont la base correspond aux valeurs de ce groupe, et dont la taille du rectangle est proportionnelle au nombre d'observations dans le groupe. Cela signifie que les rectangles seront d'une hauteur différente. Un histogramme a une apparence semblable au diagramme à bandes verticales, mais lorsque les variables sont continues, il n'y a pas d'écart entre les barres. Lorsque les variables sont discrètes, des écarts devraient être laissés entre les barres. La figure 1 est un bon exemple d'histogramme.

Un histogramme qui montre la distribution des salaires de la société Acme

Un diagramme à bandes verticales diffère d'un histogramme de par les éléments suivants :

  • Dans un histogramme, la fréquence est mesurée par la surface de la colonne.
  • Dans un diagramme à bandes verticales, la fréquence est mesurée par la hauteur de la barre.

Caractéristiques de l'histogramme

En règle générale, l'histogramme possède des barres d'une largeur égale, même si ce n'est pas le cas lorsque les intervalles des classes sont de tailles différentes. Choisir la bonne largeur de barre pour l'histogramme est important. Comme vous pouvez le voir dans l'exemple ci-dessus, l'histogramme consiste simplement en un ensemble de barres verticales. Les valeurs de la variable étudiée sont mesurées selon l'échelle arithmétique de l'axe des x. Les barres sont de largeur égale et correspondent à des intervalles de classes égales, alors que la hauteur des barres correspond à la fréquence de la classe qu'elle représente.

L'histogramme est utilisé pour les variables dont les valeurs sont numériques et mesurées dans une échelle d'intervalle. Il est habituellement employé pour de grands ensembles données (plus de 100 observations). Un histogramme peut également faciliter la détection d'observations inhabituelles (valeurs aberrantes) ou tout manque dans les données.

Polygones statistiques

Un polygone statistique est un diagramme formé en reliant les points médians des colonnes d'un histogramme. Ces diagrammes sont utilisés seulement pour présenter des données concernant des variables continues d'un histogramme.

Le polygone statistique aplanit les changements abruptes pouvant être visibles dans un histogramme. Il est utile pour montrer la continuité de la variable à l'étude. Les figures 2 et 3 sont de bons exemples de polygones statistiques.

Un polygones statistiques qui montre la distribution des salaires de la société Acme

Un polygones statistiques qui montre la fréquence des résultats d'un test de mathématique de 10 questions

Contrairement à la figure 2, ce polygone statistique comprend des espaces entre les barres. En regardant la figure, le lecteur peut immédiatement dire que les espaces signifient que les variables sont discrètes. De cette façon, les polygones statistiques permettent au lecteur de déterminer plus facilement le type de variables utilisées.