L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.
Un diagramme à tiges et à feuilles est une technique utilisée pour classer des variables discrètes ou continues. Il sert à organiser des données au fur et à mesure de leur collecte.
Un diagramme à tiges et à feuilles ressemble un peu à un diagramme à bandes. Chaque nombre à l'intérieur des données est ventilé en une tige et une feuille, d'où le nom diagramme à tiges et à feuilles. La tige du nombre inclut tous les chiffres sauf le dernier. La feuille du nombre sera toujours un chiffre unique.
Une fois que vous aurez décidé qu'un diagramme à tiges et à feuilles est le meilleur moyen d'illustrer vos données, dessinez-le comme suit :
Par exemple, si la valeur observée est 25, la tige sera alors 2 et la feuille, 5. Par ailleurs, si la valeur observée est 369, la tige sera 36 et la feuille, 9. Dans les cas où les observations comportent une décimale ou plus, telle que 23,7, la tige sera 23, alors que la feuille sera 7. Si la plage des valeurs est trop grande, il suffit d'arrondir le chiffre 23,7 à 24, de façon à limiter le nombre de tiges.
Les coches ne sont pas nécessaires lorsqu'on dessine un diagramme à tiges et à feuilles, puisqu'on utilise des données réelles.
Pas si simple à comprendre? Faites quelques exercices.
Chaque matin, une enseignante interrogeait dans le cadre d'un jeu-questionnaire les élèves de sa classe en leur posant 20 questions au sujet de la géographie. Les élèves consignaient les notes de la classe et leurs propres notes également. À mesure que l'année avançait, chaque élève essayait d'améliorer ses notes au jeu-questionnaire. Samuel enregistrait ses notes au jeu-questionnaire chaque matin sur un diagramme à tiges et à feuilles. Voici à quoi elles ressemblaient tracées sous forme de points :
Tige | Feuille |
---|---|
0 | 3 6 5 |
1 | 0 1 4 3 5 6 5 6 8 9 7 9 |
2 | 0 0 0 0 |
Analysez le diagramme à tiges et à feuilles de Samuel. Quelle a été sa note la plus courante au jeu-questionnaire portant sur la géographie? Quelle a été sa note la plus élevée? Sa note la plus faible? Tournez de côté le diagramme à tiges et à feuilles pour qu'il ressemble à un diagramme à bandes. Est-ce que la plupart des notes de Samuel se situent dans les 10, les 20 ou les moins que 10? Comme on ne connait pas l'ordre des notes dans le tracé, c'est difficile de déterminer si Samuel s'est amélioré ou non.
Essayez de créer votre propre diagramme à tiges et à feuilles. Utilisez toutes les notes d'examen que vous avez obtenues l'année dernière ou les points accumulés par votre équipe sportive au cours de la saison.
Le principal avantage d'un diagramme à tiges et à feuilles, c'est que les données sont groupées et que toutes les données originales y sont indiquées également. Dans l'exemple 3 sur la durée de vie des piles de la section des Tableaux de distribution de fréquences, un tableau montre que deux observations font partie de l'intervalle variant de 360 à 369 minutes. Le tableau ne vous dit pas toutefois en quoi consistent réellement ces observations. Un diagramme à tiges et à feuilles permettrait d'illustrer cette information. Sans diagramme à tiges et à feuilles, on ne peut trouver les deux valeurs (363 et 369) qu'en parcourant toutes les données originales, une tâche fastidieuse lorsqu'on a beaucoup de données!
Quand on examine un ensemble de données, on peut considérer que chaque observation se compose de deux parties : une tige et une feuille. Pour créer un diagramme à tiges et à feuilles, il faut d'abord séparer chaque valeur observée en deux parties :
Un enseignant a demandé à 10 élèves d'indiquer combien de livres ils avaient lus au cours des 12 derniers mois. Voici leurs réponses :
12, 23, 19, 6, 10, 7, 15, 25, 21, 12
Tracez un diagramme à tiges et à feuilles pour ces données.
Tuyau : On peut écrire le chiffre 6 comme 06 pour désigner que la tige est 0 et la feuille, 6.
Voici ce à quoi le diagramme à tiges et à feuilles devrait ressembler :
Tige | Feuille |
---|---|
0 | 6 7 |
1 | 2 9 0 5 2 |
2 | 3 5 1 |
Dans le tableau 2 :
Habituellement, un diagramme à tiges et à feuilles est ordonné, ce qui veut dire simplement que les feuilles sont disposées dans l'ordre ascendant de gauche à droite. De plus, les signes de ponctuation (les virgules ou les points) qui séparent les feuilles (chiffres) ne sont pas nécessaires, puisque chaque feuille est toujours un chiffre unique.
Nous avons créé, à l'aide des données tirées du tableau 2, le diagramme à tiges et à feuilles qui figure ci-dessous :
Tige | Feuille |
---|---|
0 | 6 7 |
1 | 0 2 2 5 9 |
2 | 1 3 5 |
On a demandé à 15 personnes d'indiquer combien de fois elles se sont rendues au travail au volant d'un véhicule au cours d'une période de 10 jours ouvrables.Voici le nombre de fois déclaré par chaque personne :
5, 7, 9, 9, 3, 5, 1, 0, 0, 4, 3, 7, 2, 9, 8
Créez un diagramme à tiges et à feuilles ordonné pour ce tableau.
On devrait dessiner ce tracé comme suit :
Tige | Feuille |
---|---|
0 | 0 0 1 2 3 3 4 5 5 7 7 8 9 9 9 |
L'organisation de ce diagramme à tiges et à feuilles ne fournit pas beaucoup d'information sur les données. Le fait de n'avoir qu'une seule tige crée une feuille surchargée. Si les feuilles sont trop chargées, il pourrait alors être utile de diviser chaque tige en deux composantes ou plus. Ainsi, on peut diviser un intervalle 0 à 9 en deux intervalles de 0 à 4 et de 5 à 9. De même, on pourrait diviser une tige 0 à 9 en cinq intervalles : 0-1, 2-3, 4-5, 6-7 et 8-9.
Voici ce à quoi le diagramme à tiges et à feuilles devrait alors ressembler :
Tige | Feuille |
---|---|
0(0) | 0 0 1 2 3 3 4 |
0(5) | 5 5 7 7 8 9 9 9 |
Nota : La tige 0(0) signifie que toutes les données se situent à l'intérieur de l'intervalle 0 à 4. La tige 0(5) signifie que toutes les données se situent à l'intérieur de l'intervalle 5 à 9.
Gabrielle est une nageuse qui s'entraîne pour une compétition. Voici le nombre de longueurs de 50 mètres qu'elle a parcourues à la nage quotidiennement pendant 30 jours :
22, 21, 24, 19, 27, 28, 24, 25, 29, 28, 26, 31, 28, 27, 22, 39, 20, 10, 26, 24, 27, 28, 26, 28, 18, 32, 29, 25, 31, 27
Tige | Feuille |
---|---|
1 | 0 8 9 |
2 | 0 1 2 2 4 4 4 5 5 6 6 6 7 7 7 7 8 8 8 8 8 9 9 |
3 | 1 1 2 9 |
Tige | Feuille |
---|---|
1(0) | 0 |
1(5) | 8 9 |
2(0) | 0 1 2 2 4 4 4 |
2(5) | 5 5 6 6 6 7 7 7 7 8 8 8 8 8 9 9 |
3(0) | 1 1 2 |
3(5) | 9 |
Nota : La tige 1(0) signifie que toutes les données se situent entre 10 et 14, alors que 1(5) signifie que toutes les données se situent entre 15 et 19, et ainsi de suite.
Le diagramme à tiges et à feuilles révisé montre que Gabrielle parcourt habituellement de 25 à 29 longueurs durant sa séance quotidienne d'entraînement. Les valeurs 1(0) 0 = 10 et 3(5) 9 = 39 sont des valeurs aberrantes, un concept qui sera décrit dans la section suivante.
Voici les mesures de poids de 30 élèves (arrondis au dixième de kilogramme) qui ont été enregistrés :
59,2, 61,5, 62,3, 61,4, 60,9, 59,8, 60,5, 59,0, 61,1, 60,7, 61,6, 56,3, 61,9, 65,7, 60,4, 58,9, 59,0, 61,2, 62,1, 61,4, 58,4, 60,8, 60,2, 62,7, 60,0, 59,3, 61,9, 61,7, 58,4, 62,2
Tracez un diagramme à tiges et à feuilles ordonné pour les données. Formulez un bref commentaire sur ce qu'indique l'analyse.
Dans ce cas, les tiges seront les valeurs exprimées en nombres entiers et les feuilles, les valeurs décimales. Les données varient de 56,3 à 65,7; les tiges devraient donc commencer à 56 et se terminer à 65.
Tige | Feuille |
---|---|
56 | 3 |
57 | |
58 | 4 4 9 |
59 | 0 0 2 3 8 |
60 | 0 2 4 5 7 8 9 |
61 | 1 2 4 4 5 6 7 9 9 |
62 | 1 2 3 7 |
63 | |
64 | |
65 | 7 |
Dans cet exemple, il n'était pas nécessaire de diviser les tiges, parce que les feuilles ne sont pas entassées sur un trop petit nombre de tiges, ni d'arrondir les valeurs, puisque leur plage n'est pas trop étendue. Ce diagramme à tiges et à feuilles révèle que le groupe pour lequel on a enregistré le nombre le plus élevé d'observations est celui de 61,0 à 61,9.
Une valeur aberrante est une valeur extrême des données. C'est une valeur d'observation énormément différente du reste de ces dernières. Il peut y avoir plus d'une valeur aberrante dans un ensemble de données.
Dans l'exemple précédent, 56,3 et 65,7 sont des valeurs aberrantes, puisque ces deux valeurs sont assez différentes des autres.
Si l'on ne tient pas compte de ces deux valeurs aberrantes, on pourrait redessiner le diagramme à tiges et à feuilles de l'exemple précédent comme suit :
Tige | Feuille |
---|---|
58 | 4 4 9 |
59 | 0 0 2 3 8 |
60 | 0 2 4 5 7 8 9 |
61 | 1 2 4 4 5 6 7 9 9 |
62 | 1 2 3 7 |
Lorsqu'on utilise un diagramme à tiges et à feuilles, repérer une valeur aberrante est souvent une question de jugement, parce qu'il n'existe pas de règle stricte à respecter relativement à la distance devant séparer une valeur du reste d'un ensemble de données pour qu'elle remplisse les conditions nécessaires afin d'être considérée comme une valeur aberrante, sauf dans le cas où l'on emploierait des tracés en rectangle (tel qu'il est décrit dans la section sur les diagrammes de quartiles).
Lorsque vous évaluez le profil général d'une distribution (c'est-à-dire le profil établi à partir de toutes les valeurs d'une variable particulière), recherchez ces caractéristiques :
Les diagrammes linéaires sont utiles parce qu'ils révèlent facilement et rapidement certaines caractéristiques des données.
La première caractéristique qu'on peut facilement et rapidement voir à partir d'un diagramme linéaire est le nombre de points élevés ou de pointes élevées que compte la distribution.
Même si la plupart des distributions de données statistiques ne comptent qu'une pointe principale (distributions unimodales), d'autres peuvent compter deux pointes (distributions bimodales) ou plus de deux pointes (distributions multimodales).
Voici des exemples de diagrammes linéaires unimodaux, bimodaux et multimodaux :
La deuxième caractéristique principale d'une distribution est son degré de symétrie.
Une courbe parfaitement symétrique est une courbe dont les deux côtés de la distribution se marieraient exactement l'un à l'autre si l'on pliait la figure en son point central. En voici un exemple :
On appelle une distribution symétrique, unimodale, en (forme de) cloche, un cas relativement courant, une distribution normale.
Si la distribution est dissymétrique, on dit qu'elle est désaxée.
On dit qu'une distribution est désaxée vers la droite, ou positivement désaxée, lorsque la plupart des données sont concentrées à sa gauche. Les distributions positivement désaxées sont plus courantes que les distributions négativement désaxées.
Le revenu fournit un exemple d'une distribution positivement désaxée. La plupart des gens gagnent moins de 40 000 $ par année, mais certains gagnent un revenu nettement plus élevé et un plus petit nombre gagne plusieurs millions annuellement. La queue positive (droite) du diagramme linéaire pour le revenu s'étend donc assez loin, tandis que la queue de l'asymétrie négative (gauche) s'arrête à zéro. La queue droite s'étend manifestement plus loin à partir du centre de la distribution que la queue gauche, comme il est indiqué ci-dessous :
On dit qu'une distribution est désaxée vers la gauche, ou négativement désaxée, si la plupart des données sont concentrées à sa droite. La queue gauche s'étend manifestement plus loin à partir du centre de la distribution que la queue droite, comme il est indiqué ci-dessous :
On peut situer le centre (la médiane) d'une distribution en comptant la moitié des observations à partir de la plus petite. Évidemment, cette méthode est impossible à utiliser pour de très grands ensembles de données. Un diagramme à tiges et à feuilles en facilite cependant l'utilisation, parce que les données sont disposées dans l'ordre ascendant. (Voir le chapitre sur les mesures de tendance centrale pour plus de détails.)
On peut rapidement repérer sur un diagramme l'ampleur de la dispersion d'une distribution et tous les écarts importants par rapport au profil général (les valeurs aberrantes).
Un diagramme à tiges et à feuilles est un type simple de diagramme qui est dessiné à partir des nombres eux-mêmes. C'est un moyen de présenter les principales caractéristiques d'une distribution. Si on le tourne de côté, un diagramme à tiges et à feuilles ressemblera à un histogramme ou à un diagramme à bandes et fournira de l'information visuelle similaire.
Voici les résultats enregistrés d'examens de mathématiques de 41 élèves (pour lesquels la meilleure note possible était de 70) :
31, 49, 19, 62, 50, 24, 45, 23, 51, 32, 48, 55, 60, 40, 35, 54, 26, 57, 37, 43, 65, 50, 55, 18, 53, 41, 50, 34, 67, 56, 44, 4, 54, 57, 39, 52, 45, 35, 51, 63, 42
Tige | Feuille |
---|---|
0 | 4 |
1 | 8 9 |
2 | 3 4 6 |
3 | 1 2 4 5 5 7 9 |
4 | 0 1 2 3 4 5 5 8 9 |
5 | 0 0 0 1 1 2 3 4 4 5 5 6 7 7 |
6 | 0 2 3 5 7 |
Nota : La notation 2|4 représente la tige 2 et la feuille 4.
Le diagramme à tiges et à feuilles révèle que la plupart des élèves ont obtenu des notes qui se situent à l'intérieur de l'intervalle de 50 à 59. Le grand nombre d'élèves qui ont obtenu des résultats élevés pourrait indiquer que l'examen était trop facile, que la plupart des élèves connaissaient bien la matière, ou une combinaison des deux.
La distribution ne comporte qu'une seule pointe, qui se situe à l'intérieur de l'intervalle 50 à 59.
Même s'il n'y a que 41 observations, la distribution montre que la plupart des données sont groupées à droite. La queue gauche s'étend plus loin du centre des données que la queue droite. La distribution est donc désaxée vers la gauche ou négativement désaxée.
Puisqu'il y a 41 observations, le centre de la distribution se situera à la 21e observation. Si l'on compte 21 observations à partir de la plus petite, le centre est 48. (Notez que l'on aurait obtenu la même valeur si l'on avait compté 21 observations à partir de la plus élevée.)