4 Exploration des données
4.5 Mesures de la dispersion

Début du texte

Les mesures de tendance centrale visent à identifier la valeur la plus représentative d’un ensemble de données, c’est-à-dire le centre de la distribution. Pour obtenir une meilleure description d’un ensemble de données, il faut également une mesure de l’étalement des valeurs autour du centre. C’est ce qu’on appelle la dispersion. Les mesures de dispersion principales sont les suivantes :

  • L’étendue, qui est la différence entre la plus petite valeur et la plus grande;
  • L’écart interquartile, qui est l’étendue du 50% des données qui sont au centre de la distribution;
  • La variance, qui est l’écart élevé au carré moyen entre chaque donnée et le centre de la distribution ;
  • L’écart-type, la racine carrée de la variance.

Les sections qui suivent expliquent comment calculer ces mesures à l’aide d’exemples. Les mesures de dispersions s’appliquent uniquement aux variables numériques.


Date de modification :