4.4 Mesures de la tendance centrale
4.4.3 Calcul du mode

Début du texte

Lorsqu’il est unique, le mode est la valeur d’une variable la plus souvent observée dans un ensemble de données et il peut alors être considéré comme une mesure de tendance centrale, au même titre que la moyenne et la médiane. Il est toutefois possible qu’il n’y ait aucun mode ou qu’il y ait plusieurs modes.

Il n’y a aucun mode lorsque toutes les valeurs possibles apparaissent le même nombre de fois dans l’ensemble de données. Il y a plusieurs modes lorsque la fréquence la plus élevée a été observée pour plusieurs valeurs différentes. Dans les cas où il n’y a aucun mode ou plusieurs modes, le mode ne peut pas être utilisé pour situer le centre de la distribution.

Le mode peut être utilisé pour résumer des variables catégoriques, alors que la moyenne et la médiane ne peuvent être calculées que pour les variables numériques. C’est d’ailleurs le principal avantage de cette mesure. Il est aussi utile pour les variables discrètes et pour les variables continues lorsqu’elles sont présentées par intervalles.

Voici quelques exemples de calcul du mode pour une variable discrète.

Exemple 1 – Nombre de buts dans un tournoi de hockey

Lors d’un tournoi de hockey, Audrey a compté 7, 5, 0, 7, 8, 5, 5, 4, 1 et 5 buts en dix parties. Une fois les données résumées dans un tableau de fréquences, il est facile de voir que le mode du nombre de buts d’Audrey sur les 10 parties est de 5, puisque cette valeur apparaît le plus souvent (4 fois). Le mode peut être considéré comme une mesure de tendance centrale pour cet ensemble de données, car il est unique.


Tableau 4.4.3.1
Nombre de parties selon le nombre de buts comptés
Sommaire du tableau
Le tableau montre les résultats de Nombre de parties selon le nombre de buts comptés. Les données sont présentées selon Nombre de buts (titres de rangée) et Fréquence (nombre de parties)(figurant comme en-tête de colonne).
Nombre de buts Fréquence (nombre de parties)
0 1
1 1
4 1
5 4
7 2
8 1

Exemple 2 – Nombre de points en douze parties de basket-ball

En 12 parties de basket-ball, Gabriel a compté 14, 14, 15, 16, 14, 16, 16, 18, 14, 16, 16 et 14 points. Une fois les données résumées dans un tableau de fréquences, il est facile de voir que cet ensemble de données est bimodal, c’est-à-dire qu’il y a deux modes, 14 et 16, parce que ce sont les valeurs les plus souvent observées (elles apparaissent 5 fois chacune). Le mode ne peut pas être utilisé comme mesure de tendance centrale, car il y en a plus d’un. Il s’agit d’une distribution bimodale.


Tableau 4.4.3.2
Nombre de parties selon le nombre de points comptés
Sommaire du tableau
Le tableau montre les résultats de Nombre de parties selon le nombre de points comptés. Les données sont présentées selon Nombre de points (titres de rangée) et Fréquence (nombre de parties)(figurant comme en-tête de colonne).
Nombre de points Fréquence (nombre de parties)
14 5
15 1
16 5
18 1

Exemple 3 – Nombre de touchés au cours de la saison de football

L’ensemble de données qui suit représente le nombre de touchés que Jérôme a marqué au cours de la saison de football : 0, 0, 1, 0, 0, 2, 3, 1, 0, 1, 2, 3, 1, 0. Comparons la moyenne, la médiane et le mode.

La somme ces valeurs est de 14 et le nombre de valeurs est de 14. La moyenne est donc égale à 1. Étant donné que le nombre de données est pair, la médiane sera égale à la moyenne entre la 7e et la 8e valeur une fois les données ordonnées :


Tableau 4.4.3.3
Rang associé aux valeurs du nombre de touchés à chaque partie
Sommaire du tableau
Le tableau montre les résultats de Rang associé aux valeurs du nombre de touchés à chaque partie. Les données sont présentées selon Rang (titres de rangée) et Nombre de touchés(figurant comme en-tête de colonne).
Rang Nombre de touchés
1 0
2 0
3 0
4 0
5 0
6 0
7 1
8 1
9 1
10 1
11 2
12 2
13 3
14 3

Elle est donc égale à 1. Une fois les données résumées dans un tableau de fréquences, on peut voir que le mode est quant à lui égal à 0.


Tableau 4.4.3.4
Nombre de parties selon le nombre de touchés marqués
Sommaire du tableau
Le tableau montre les résultats de Nombre de parties selon le nombre de touchés marqués. Les données sont présentées selon Nombre de touchés (titres de rangée) et Fréquence (nombre de parties)(figurant comme en-tête de colonne).
Nombre de touchés Fréquence (nombre de parties)
0 6
1 4
2 2
3 2

En résumé, dans cet exemple, la moyenne est égale à 1, la médiane est égal à 1 et le mode est égal à 0.

Le mode est moins utilisé pour les variables continues, car il est probable qu’aucune valeur ne revienne plus d’une fois. Par exemple, si on demande à 20 personnes leur revenu exact au dollar près au cours de la dernière année, il se peut que certains aient des revenus très près les uns des autres, mais qu’ils ne soient jamais exactement le même. On peut alors utiliser des intervalles et déterminer la classe modale. L’histogramme permet de visualiser facilement la classe modale d’une variable continue.

Exemple 4 – Taille des personnes présentes à une partie de basketball

On s’intéresse à la taille des personnes présentes dans l’aréna lors d’une partie de basketball. Le tableau 4.4.3.5 présente le nombre de personnes pour chaque intervalle de 20 centimètres de la taille dans un jeu de données. La classe modale serait l’intervalle de 160 à 179 cm, car c’est celle avec la fréquence la plus élevée.


Tableau 4.4.3.5
Nombre de personnes par intervalle de taille
Sommaire du tableau
Le tableau montre les résultats de Nombre de personnes par intervalle de taille. Les données sont présentées selon Taille (en centimètre) (titres de rangée) et Fréquence (nombre de personnes)(figurant comme en-tête de colonne).
Taille (en centimètre) Fréquence (nombre de personnes)
20 to 39 42
40 to 59 105
60 to 79 176
80 to 99 230
100 to 119 214
120 to 139 168
140 to 159 363
160 to 179 480
180 to 200 170
200 to 219 11

Le graphique 4.4.3.1 présente ces données sous la forme d’un histogramme.

Graphique 4.4.3.1 Histogramme de la taille des personnes présentes à la partie de basketball

Tableau de données du graphique 4.4.3.1

Les données illustrées par ce graphique sont celles du tableau 4.4.3.5.

En observant l’histogramme, on peut clairement identifier la classe modale, 160 à 179, qui a une fréquence de 480. Cependant, on s’aperçoit que la fréquence diminue lorsque l’on passe à l’intervalle 140 à 159 (363) et diminue davantage à l’intervalle 120 à 139 (168), mais ensuite qu’elle remonte jusqu’à l’intervalle 80 à 99 (230).

Pour les variables catégoriques ou discrètes, les modes multiples correspondent à la même fréquence (la plus grande). Pour les variables continues, tous les sommets de la distribution peuvent être considérés comme des modes, même lorsqu’ils correspondent à des hauteurs différentes sur l’histogramme. La distribution de cet exemple serait donc bimodale, avec un mode majeur au niveau de la classe 160 à 179 et un mode mineur situé au niveau de la classe 80 à 99. La classe modale ne doit pas être utilisée comme mesure de tendance centrale, mais la découverte de deux modes nous donne une indication qu’il existe possiblement deux groupes distincts dans les données qui devraient être analysés séparément.


Date de modification :