Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Diagrammes à tiges et à feuilles

Contenu archivé

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Un diagramme à tiges et à feuilles est une technique utilisée pour classer des variables discrètes ou continues. Il sert à organiser des données au fur et à mesure de leur collecte.

Un diagramme à tiges et à feuilles ressemble un peu à un diagramme à bandes. Chaque nombre à l'intérieur des données est ventilé en une tige et une feuille, d'où le nom diagramme à tiges et à feuilles. La tige du nombre inclut tous les chiffres sauf le dernier. La feuille du nombre sera toujours un chiffre unique.

Éléments d'un bon diagramme à tiges et à feuilles

  • Un bon diagramme à tiges et à feuilles indique comme tige les premiers chiffres du nombre (des milliers, des centaines ou des dizaines) et comme feuille le dernier chiffre (unique).
  • Un diagramme à tiges et à feuilles indique habituellement des nombres entiers. Un nombre avec un point décimal sera arrondi au nombre entier le plus près. Par exemple, des résultats d'examens, des mesures de taille et de poids, des données de vitesse, etc.
  • Un bon diagramme à tiges et à feuilles ressemble à un diagramme à bandes quand on le tourne de côté.
  • Il indique comment les données sont dispersées, c'est-à-dire le nombre le plus élevé, le nombre le plus faible, le nombre le plus courant ou le plus fréquent et les valeurs aberrantes (un nombre qui se situe à l'extérieur du groupe principal de nombres).

Tuyaux sur la façon de dessiner un diagramme à tiges et à feuilles

Une fois que vous aurez décidé qu'un diagramme à tiges et à feuilles est le meilleur moyen d'illustrer vos données, dessinez-le comme suit :

  • Inscrivez les milliers, les centaines ou les dizaines (tous les chiffres, sauf le dernier) dans la partie gauche de la page. Ces chiffres constitueront les tiges.
  • Tracez une ligne à la droite des tiges.
  • De l'autre côté de la ligne, inscrivez les chiffres (le dernier chiffre d'un nombre) qui constitueront les feuilles.

Par exemple, si la valeur observée est 25, la tige sera alors 2 et la feuille, 5. Par ailleurs, si la valeur observée est 369, la tige sera 36 et la feuille, 9. Dans les cas où les observations comportent une décimale ou plus, telle que 23,7, la tige sera 23, alors que la feuille sera 7. Si la plage des valeurs est trop grande, il suffit d'arrondir le chiffre 23,7 à 24, de façon à limiter le nombre de tiges.

Les coches ne sont pas nécessaires lorsqu'on dessine un diagramme à tiges et à feuilles, puisqu'on utilise des données réelles.

Pas si simple à comprendre? Faites quelques exercices.

Exemple 1 – Création d'un diagramme à tiges et à feuilles

Chaque matin, une enseignante interrogeait dans le cadre d'un jeu-questionnaire les élèves de sa classe en leur posant 20 questions au sujet de la géographie. Les élèves consignaient les notes de la classe et leurs propres notes également. À mesure que l'année avançait, chaque élève essayait d'améliorer ses notes au jeu-questionnaire. Samuel enregistrait ses notes au jeu-questionnaire chaque matin sur un diagramme à tiges et à feuilles. Voici à quoi elles ressemblaient tracées sous forme de points :

Tableau 1. Notes obtenues par Samuel l'an dernier au jeu-questionnaire sur des faits bien connus
Tige Feuille
0 3 6 5
1 0 1 4 3 5 6 5 6 8 9 7 9
2 0 0 0 0

Analysez le diagramme à tiges et à feuilles de Samuel. Quelle a été sa note la plus courante au jeu-questionnaire portant sur la géographie? Quelle a été sa note la plus élevée? Sa note la plus faible? Tournez de côté le diagramme à tiges et à feuilles pour qu'il ressemble à un diagramme à bandes. Est-ce que la plupart des notes de Samuel se situent dans les 10, les 20 ou les moins que 10? Comme on ne connait pas l'ordre des notes dans le tracé, c'est difficile de déterminer si Samuel s'est amélioré ou non.

Essayez de créer votre propre diagramme à tiges et à feuilles. Utilisez toutes les notes d'examen que vous avez obtenues l'année dernière ou les points accumulés par votre équipe sportive au cours de la saison.

Le principal avantage d'un diagramme à tiges et à feuilles

Le principal avantage d'un diagramme à tiges et à feuilles, c'est que les données sont groupées et que toutes les données originales y sont indiquées également. Dans l'exemple 3 sur la durée de vie des piles de la section des Tableaux de distribution de fréquences, un tableau montre que deux observations font partie de l'intervalle variant de 360 à 369 minutes. Le tableau ne vous dit pas toutefois en quoi consistent réellement ces observations. Un diagramme à tiges et à feuilles permettrait d'illustrer cette information. Sans diagramme à tiges et à feuilles, on ne peut trouver les deux valeurs (363 et 369) qu'en parcourant toutes les données originales, une tâche fastidieuse lorsqu'on a beaucoup de données!

Quand on examine un ensemble de données, on peut considérer que chaque observation se compose de deux parties : une tige et une feuille. Pour créer un diagramme à tiges et à feuilles, il faut d'abord séparer chaque valeur observée en deux parties :

  • La tige est le premier chiffre ou la première série de chiffres;
  • La feuille est le dernier chiffre d'une valeur;
  • Chaque tige peut se composer d'un certain nombre de chiffres;
  • Chaque feuille ne peut comporter qu'un seul chiffre.

Exemple 2 – Création d'un diagramme à tiges et à feuilles

Un enseignant a demandé à 10 élèves d'indiquer combien de livres ils avaient lus au cours des 12 derniers mois. Voici leurs réponses :

12, 23, 19, 6, 10, 7, 15, 25, 21, 12

Tracez un diagramme à tiges et à feuilles pour ces données.

Tuyau : On peut écrire le chiffre 6 comme 06 pour désigner que la tige est 0 et la feuille, 6.

Voici ce à quoi le diagramme à tiges et à feuilles devrait ressembler :

Tableau 2. Livres lus en une année par 10 élèves
Tige Feuille
0 6 7
1 2 9 0 5 2
2 3 5 1

Dans le tableau 2 :

  • la tige 0 représente l'intervalle de classe 0 à 9;
  • la tige 1 représente l'intervalle de classe 10 à 19;
  • la tige 2 représente l'intervalle de classe 20 à 29.

Habituellement, un diagramme à tiges et à feuilles est ordonné, ce qui veut dire simplement que les feuilles sont disposées dans l'ordre ascendant de gauche à droite. De plus, les signes de ponctuation (les virgules ou les points) qui séparent les feuilles (chiffres) ne sont pas nécessaires, puisque chaque feuille est toujours un chiffre unique.

Nous avons créé, à l'aide des données tirées du tableau 2, le diagramme à tiges et à feuilles qui figure ci-dessous :

Tableau 3. Livres lus en une année par 10 élèves
Tige Feuille
0 6 7
1 0 2 2 5 9
2 1 3 5

Exemple 3 – Création d'un diagramme à tiges et à feuilles ordonné

On a demandé à 15 personnes d'indiquer combien de fois elles se sont rendues au travail au volant d'un véhicule au cours d'une période de 10 jours ouvrables.Voici le nombre de fois déclaré par chaque personne :

5, 7, 9, 9, 3, 5, 1, 0, 0, 4, 3, 7, 2, 9, 8

Créez un diagramme à tiges et à feuilles ordonné pour ce tableau.

On devrait dessiner ce tracé comme suit :

Tableau 4. Nombre de fois où chaque personne s'est rendue au travail au volant d'un véhicule pendant 10 jours
Tige Feuille
0 0 0 1 2 3 3 4 5 5 7 7 8 9 9 9

Division des tiges

L'organisation de ce diagramme à tiges et à feuilles ne fournit pas beaucoup d'information sur les données. Le fait de n'avoir qu'une seule tige crée une feuille surchargée. Si les feuilles sont trop chargées, il pourrait alors être utile de diviser chaque tige en deux composantes ou plus. Ainsi, on peut diviser un intervalle 0 à 9 en deux intervalles de 0 à 4 et de 5 à 9. De même, on pourrait diviser une tige 0 à 9 en cinq intervalles : 0-1, 2-3, 4-5, 6-7 et 8-9.

Voici ce à quoi le diagramme à tiges et à feuilles devrait alors ressembler :

Tableau 5. Nombre de fois où chaque personne s'est rendue au travail au volant d'un véhicule pendant 10 jours
Tige Feuille
0(0) 0 0 1 2 3 3 4
0(5) 5 5 7 7 8 9 9 9

Nota : La tige 0(0) signifie que toutes les données se situent à l'intérieur de l'intervalle 0 à 4. La tige 0(5) signifie que toutes les données se situent à l'intérieur de l'intervalle 5 à 9.

Exemple 4 – Division des tiges

Gabrielle est une nageuse qui s'entraîne pour une compétition. Voici le nombre de longueurs de 50 mètres qu'elle a parcourues à la nage quotidiennement pendant 30 jours :

22, 21, 24, 19, 27, 28, 24, 25, 29, 28, 26, 31, 28, 27, 22, 39, 20, 10, 26, 24, 27, 28, 26, 28, 18, 32, 29, 25, 31, 27

  1. Tracez un diagramme à tiges et à feuilles ordonné. Formulez un bref commentaire sur ce qu'il indique.
  2. Redessinez le diagramme à tiges et à feuilles en divisant les tiges en intervalles de cinq unités. Formulez un bref commentaire sur ce qu'indique le nouveau tracé.

Réponses

  1. La valeur des observations varie de 10 à 39; le diagramme à tiges et à feuilles devrait donc comporter des tiges de 1, 2 et 3. Le diagramme à tiges et à feuilles ordonné est illustré ci-dessous :
    Tableau 6. Longueurs que Gabrielle a parcourues à la nage en 30 jours
    Tige Feuille
    1 0 8 9
    2 0 1 2 2 4 4 4 5 5 6 6 6 7 7 7 7 8 8 8 8 8 9 9
    3 1 1 2 9
    Le diagramme à tiges et à feuilles montre que Gabrielle parcourt habituellement à la nage de 20 à 29 longueurs pendant sa séance quotidienne d'entraînement.
  2. La division des tiges en intervalles de cinq unités donne le diagramme à tiges et à feuilles suivant :
    Tableau 7. Longueurs que Gabrielle a parcourues à la nage en 30 jours
    Tige Feuille
    1(0) 0
    1(5) 8 9
    2(0) 0 1 2 2 4 4 4
    2(5) 5 5 6 6 6 7 7 7 7 8 8 8 8 8 9 9
    3(0) 1 1 2
    3(5) 9

    Nota : La tige 1(0) signifie que toutes les données se situent entre 10 et 14, alors que 1(5) signifie que toutes les données se situent entre 15 et 19, et ainsi de suite.

    Le diagramme à tiges et à feuilles révisé montre que Gabrielle parcourt habituellement de 25 à 29 longueurs durant sa séance quotidienne d'entraînement. Les valeurs 1(0) 0 = 10 et 3(5) 9 = 39 sont des valeurs aberrantes, un concept qui sera décrit dans la section suivante.

Exemple 5 – Division des tiges à l'aide de valeurs décimales

Voici les mesures de poids de 30 élèves (arrondis au dixième de kilogramme) qui ont été enregistrés :

59,2, 61,5, 62,3, 61,4, 60,9, 59,8, 60,5, 59,0, 61,1, 60,7, 61,6, 56,3, 61,9, 65,7, 60,4, 58,9, 59,0, 61,2, 62,1, 61,4, 58,4, 60,8, 60,2, 62,7, 60,0, 59,3, 61,9, 61,7, 58,4, 62,2

Tracez un diagramme à tiges et à feuilles ordonné pour les données. Formulez un bref commentaire sur ce qu'indique l'analyse.

Réponse

Dans ce cas, les tiges seront les valeurs exprimées en nombres entiers et les feuilles, les valeurs décimales. Les données varient de 56,3 à 65,7; les tiges devraient donc commencer à 56 et se terminer à 65.

Tableau 8. Poids de 30 élèves
Tige Feuille
56 3
57  
58 4 4 9
59 0 0 2 3 8
60 0 2 4 5 7 8 9
61 1 2 4 4 5 6 7 9 9
62 1 2 3 7
63  
64  
65 7

Dans cet exemple, il n'était pas nécessaire de diviser les tiges, parce que les feuilles ne sont pas entassées sur un trop petit nombre de tiges, ni d'arrondir les valeurs, puisque leur plage n'est pas trop étendue. Ce diagramme à tiges et à feuilles révèle que le groupe pour lequel on a enregistré le nombre le plus élevé d'observations est celui de 61,0 à 61,9.

Valeurs aberrantes

Une valeur aberrante est une valeur extrême des données. C'est une valeur d'observation énormément différente du reste de ces dernières. Il peut y avoir plus d'une valeur aberrante dans un ensemble de données.

Dans l'exemple précédent, 56,3 et 65,7 sont des valeurs aberrantes, puisque ces deux valeurs sont assez différentes des autres.

Si l'on ne tient pas compte de ces deux valeurs aberrantes, on pourrait redessiner le diagramme à tiges et à feuilles de l'exemple précédent comme suit :

Tableau 9. Poids de 30 élèves, à l'exception des valeurs aberrantes
Tige Feuille
58 4 4 9
59 0 0 2 3 8
60 0 2 4 5 7 8 9
61 1 2 4 4 5 6 7 9 9
62 1 2 3 7

Lorsqu'on utilise un diagramme à tiges et à feuilles, repérer une valeur aberrante est souvent une question de jugement, parce qu'il n'existe pas de règle stricte à respecter relativement à la distance devant séparer une valeur du reste d'un ensemble de données pour qu'elle remplisse les conditions nécessaires afin d'être considérée comme une valeur aberrante, sauf dans le cas où l'on emploierait des tracés en rectangle (tel qu'il est décrit dans la section sur les diagrammes de quartiles).

Caractéristiques des distributions

Lorsque vous évaluez le profil général d'une distribution (c'est-à-dire le profil établi à partir de toutes les valeurs d'une variable particulière), recherchez ces caractéristiques :

  • le nombre de pointes de la distribution;
  • sa forme générale (désaxée [asymétrique] ou symétrique);
  • son centre;
  • sa dispersion.

Nombre de pointes

Les diagrammes linéaires sont utiles parce qu'ils révèlent facilement et rapidement certaines caractéristiques des données.

La première caractéristique qu'on peut facilement et rapidement voir à partir d'un diagramme linéaire est le nombre de points élevés ou de pointes élevées que compte la distribution.

Même si la plupart des distributions de données statistiques ne comptent qu'une pointe principale (distributions unimodales), d'autres peuvent compter deux pointes (distributions bimodales) ou plus de deux pointes (distributions multimodales).

Voici des exemples de diagrammes linéaires unimodaux, bimodaux et multimodaux :

exemple de diagrammes linéaires unimodaux, bimodaux et multimodaux.

Forme générale

La deuxième caractéristique principale d'une distribution est son degré de symétrie.

Une courbe parfaitement symétrique est une courbe dont les deux côtés de la distribution se marieraient exactement l'un à l'autre si l'on pliait la figure en son point central. En voici un exemple :

exemple d'une courbe parfaitement symétrique

On appelle une distribution symétrique, unimodale, en (forme de) cloche, un cas relativement courant, une distribution normale.

Si la distribution est dissymétrique, on dit qu'elle est désaxée.

On dit qu'une distribution est désaxée vers la droite, ou positivement désaxée, lorsque la plupart des données sont concentrées à sa gauche. Les distributions positivement désaxées sont plus courantes que les distributions négativement désaxées.

Le revenu fournit un exemple d'une distribution positivement désaxée. La plupart des gens gagnent moins de 40 000 $ par année, mais certains gagnent un revenu nettement plus élevé et un plus petit nombre gagne plusieurs millions annuellement. La queue positive (droite) du diagramme linéaire pour le revenu s'étend donc assez loin, tandis que la queue de l'asymétrie négative (gauche) s'arrête à zéro. La queue droite s'étend manifestement plus loin à partir du centre de la distribution que la queue gauche, comme il est indiqué ci-dessous :

une distribution positive

On dit qu'une distribution est désaxée vers la gauche, ou négativement désaxée, si la plupart des données sont concentrées à sa droite. La queue gauche s'étend manifestement plus loin à partir du centre de la distribution que la queue droite, comme il est indiqué ci-dessous :

une distribution négative

Centre et dispersion

On peut situer le centre (la médiane) d'une distribution en comptant la moitié des observations à partir de la plus petite. Évidemment, cette méthode est impossible à utiliser pour de très grands ensembles de données. Un diagramme à tiges et à feuilles en facilite cependant l'utilisation, parce que les données sont disposées dans l'ordre ascendant. (Voir le chapitre sur les mesures de tendance centrale pour plus de détails.)

On peut rapidement repérer sur un diagramme l'ampleur de la dispersion d'une distribution et tous les écarts importants par rapport au profil général (les valeurs aberrantes).

Utilisation de diagrammes à tiges et à feuilles comme diagrammes

Un diagramme à tiges et à feuilles est un type simple de diagramme qui est dessiné à partir des nombres eux-mêmes. C'est un moyen de présenter les principales caractéristiques d'une distribution. Si on le tourne de côté, un diagramme à tiges et à feuilles ressemblera à un histogramme ou à un diagramme à bandes et fournira de l'information visuelle similaire.

Exemple 6 – Utilisation de diagrammes à tiges et à feuilles comme diagrammes

Voici les résultats enregistrés d'examens de mathématiques de 41 élèves (pour lesquels la meilleure note possible était de 70) :

31, 49, 19, 62, 50, 24, 45, 23, 51, 32, 48, 55, 60, 40, 35, 54, 26, 57, 37, 43, 65, 50, 55, 18, 53, 41, 50, 34, 67, 56, 44, 4, 54, 57, 39, 52, 45, 35, 51, 63, 42

  1. La variable est-elle discrète ou continue? Expliquez.
  2. Tracez un diagramme à tiges et à feuilles ordonné pour les données et décrivez brièvement ce qu'il indique.
  3. Y a-t-il des valeurs aberrantes? Si oui, quelles sont ces notes?
  4. Examinez de côté le diagramme à tiges et à feuilles. Décrivez les principales caractéristiques de la distribution comme :
    1. le nombre de pointes;
    2. la symétrie;
    3. la valeur au centre de la distribution.

Réponses

  1. Une note d'examen est une variable discrète. Il est impossible, par exemple, d'avoir une note d'examen de 35,74542341...
  2. La valeur la plus faible est 4 et la valeur la plus élevée, 67. Voici donc à quoi ressemble le diagramme à tiges et à feuilles qui englobe cette plage de valeurs.
    Tableau 10. Notes d'examens de mathématiques de 41 élèves
    Tige Feuille
    0 4
    1 8 9
    2 3 4 6
    3 1 2 4 5 5 7 9
    4 0 1 2 3 4 5 5 8 9
    5 0 0 0 1 1 2 3 4 4 5 5 6 7 7
    6 0 2 3 5 7

    Nota : La notation 2|4 représente la tige 2 et la feuille 4.

    Le diagramme à tiges et à feuilles révèle que la plupart des élèves ont obtenu des notes qui se situent à l'intérieur de l'intervalle de 50 à 59. Le grand nombre d'élèves qui ont obtenu des résultats élevés pourrait indiquer que l'examen était trop facile, que la plupart des élèves connaissaient bien la matière, ou une combinaison des deux.

  3. Le résultat de 4 pourrait être une valeur aberrante, puisqu'il y a un large écart entre ce résultat et le résultat suivant, 18.
  4. Si on le tourne de côté, le diagramme à tiges et à feuilles ressemblera à ce qui suit :

    un diagramme tourné de côté

    La distribution ne comporte qu'une seule pointe, qui se situe à l'intérieur de l'intervalle 50 à 59.

    Même s'il n'y a que 41 observations, la distribution montre que la plupart des données sont groupées à droite. La queue gauche s'étend plus loin du centre des données que la queue droite. La distribution est donc désaxée vers la gauche ou négativement désaxée.

    Puisqu'il y a 41 observations, le centre de la distribution se situera à la 21e observation. Si l'on compte 21 observations à partir de la plus petite, le centre est 48. (Notez que l'on aurait obtenu la même valeur si l'on avait compté 21 observations à partir de la plus élevée.)