Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Liens institutionnels

Les statistiques : le pouvoir des données!
Glossaire

Contenu archivé

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Les définitions qui suivent visent à renseigner ceux qui ont des questions concernant les statistiques, mais qui n'ont pas besoin d'une définition hautement technique.

Nos définitions représentent parfois une grande simplification de notions très complexes. Pour obtenir une définition plus technique d'un terme, vous n'avez qu'à cliquer sur la liste de dictionnaires et définitions de Statistique Canada.

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

A

Accessibilité

L'accessibilité reflète la disponibilité de l'information détenue par l'organisme. Elle tient compte de la pertinence du format dans lequel est offerte l'information, du support de diffusion, de la disponibilité des métadonnées (texte descriptif) et du fait que l'utilisateur doit savoir que cette information existe et connaître la façon de l'obtenir. Pour les utilisateurs, le coût d'achat de cette information par rapport à la valeur qu'ils y accordent constitue aussi un aspect de cette caractéristique.

Actualité

L'actualité de l'information reflète l'intervalle entre la disponibilité de l'information et l'événement ou le phénomène décrit. Nous devons la considérer dans le contexte d'une période de temps qui confère toute sa valeur à l'information et qui permet d'y intervenir. En général, l'actualité peut influer sur la fiabilité de l'information.

Analyse fonctionnelle

Activité consistant à décomposer un problème de traitement de données en éléments fonctionnels afin de juger de la meilleure méthode de solution. Il s'agit d'un diagramme destiné à représenter la structure par âge d'une population.

Arrondissement aléatoire

Méthode par laquelle tous les chiffres d'un tableau, y compris les totaux, sont arrondis de façon aléatoire (vers le haut ou vers le bas) à un multiple de 5 ou parfois à un multiple de 10. Cette technique protège contre la divulgation directe, résiduelle ou négative des données réelles, tout en préservant au maximum l'utilité des données.

Asymétrique

Distribution asymétrique des valeurs des données. Les valeurs situées d'un côté de la courbe de distribution ont tendance à s'éloigner davantage du « milieu » que les valeurs situées de l'autre côté.

Axe des X

Ligne numérique horizontale dans le plan à coordonnées cartésiennes.

Axe des Y

Ligne numérique verticale dans le plan à coordonnées cartésiennes.

B

Baby-boomer

De façon générale, il s'agit d'une personne née après la Deuxième Guerre mondiale, entre les années 1946 et 1966.

Balance des paiements

La balance des paiements retrace l'ensemble des transactions économiques entre les résidents du Canada et les non-résidents. Elle comprend le compte courant et le compte capital et financier. Source : ARCHIVÉ - Le Quotidien-Le vendredi 28 mai 2004

Base de sondage

Liste, carte ou caractérisation théorique des unités de la population visée par une enquête; c'est le moyen par lequel on sélectionnera les répondants. Il peut s'agir par exemple d'un annuaire téléphonique ou d'un répertoire de la ville, de la liste des membres d'une association ou d'un groupement en particulier.

Base de données

Liste structurée et ordonnée de fait ou de renseignements qui est habituellement produite par ordinateur.

Biais

Dans l'estimation de la valeur d'un paramètre d'une répartition de probabilités, c'est la différence entre la valeur prévue et la valeur réelle du paramètre.

C

Caractéristique

Propriété servant à différencier les individus d'une population donnée. La différenciation entre individus peut être soit qualitative, soit quantitative.

Centiles

Valeurs qui divisent un ensemble d'observations en 100 parties égales.

Classification

Représentation d'une population donnée organisée en catégories homogènes.

Codage

Procédé servant à convertir en nombres ou en symboles l'information incluse dans un questionnaire afin de faciliter les opérations subséquentes de traitement des données. Cela demande parfois d'interpréter des réponses et de les classer dans des résultats prédéterminés.

Codage de données

Il peut arriver que des données brutes enregistrées dans un ordinateur doivent être codées. À cette fin, on étiquette chacun des éléments de données à l'aide d'un code abrégé (habituellement numérique) afin de faciliter la manipulation des données.

Coefficient de corrélation

Indice montrant dans quelle mesure deux variables fluctuent de façon interdépendante.

Coefficient de détermination

Permet de déterminer dans quelle mesure la variabilité d'une variable donnée dépend de sa relation avec une autre variable donnée. Pour calculer le coefficient, on élève au carré la valeur de la corrélation linéaire, r. Dans un modèle linéaire par exemple, une corrélation de 0,80 (r = 0,80) signifierait que r², le coefficient de détermination, équivaudrait à 0,64. En conséquence, il serait possible de prédire 64 % de la variabilité des valeurs Y en se fondant sur la relation avec les valeurs X.

Coefficient de variation

Mesure de la dispersion calculée en divisant l'écart-type d'une distribution par sa moyenne. Erreur-type d'une estimation, exprimée sous forme de ratio ou de pourcentage de l'estimation.

Cohérence

Degré selon lequel les données et l'information d'un seul programme statistique sont regroupées avec d'autres données pour former un ensemble logique et complet. Des données entièrement cohérentes présentent une uniformité logique — à l'interne, au fil du temps et d'un produit ou d'un programme à l'autre. Le cas échéant, les concepts et les populations cibles utilisés ou présentés font l'objet d'une distinction logique par rapport aux concepts et aux populations cibles semblables ou aux notions et à la terminologie courantes.

Cold deck

Méthode qui repose sur un jeu fixe de valeurs, qui couvre tous les éléments de données. Ces valeurs peuvent découler de données historiques, de l'expertise de la spécialité, etc. Un questionnaire « parfait » est créé pour répondre aux besoins complets ou partiels de l'imputation.

Compte capital et financier

Le compte capital et financier porte principalement sur les transactions reliées à des instruments financiers. L'actif et le passif financiers découlant des transactions avec les non-résidents sont présentés selon trois catégories fonctionnelles : les investissements directs, les investissements de portefeuille et tous les autres types d'investissement. Ces investissements appartiennent soit à des résidents canadiens (actif du Canada), soit à des étrangers (passif du Canada). Les transactions sont dites positives si elles représentent une entrée de capital et négatives si elles représentent une sortie de capital du Canada.
Source : ARCHIVÉ - Le Quotidien-Le vendredi 28 mai 2004

Compte courant

Le compte courant couvre les transactions sur les biens, les services, les revenus découlant de placements, et les transferts courants. Les transactions tels les exportations et les revenus d'intérêt correspondent à des recettes alors que les importations et les versements d'intérêt correspondent à des paiements. Le solde de ces transactions détermine si le Canada enregistre un surplus ou un déficit au compte courant.
Source : ARCHIVÉ - Le Quotidien-Le vendredi 28 mai 2004

Confidentialité

Dans une enquête confidentielle, le caractère privé des renseignements fournis par les différents répondants est protégé, de sorte qu'il est impossible de déduire ces renseignements personnels des résultats publiés.

Conjoints de fait

Deux personnes de sexe opposé ou de même sexe qui vivent ensemble en tant que couple, sans être légalement mariées l'une à l'autre.

Connaissance des langues officielles

Capacité de converser en français ou en anglais seulement, à la fois en français et en anglais ou dans une langue autre que les langues officielles du Canada.

Contrôle de la qualité

Ensemble des opérations visant à garantir que les erreurs introduites au cours de l'enquête n'excéderont pas les niveaux déterminés.

Corrélation directe

Dans une corrélation directe, les deux variables ont tendance à suivre la même direction. Quand l'une des variables augmente, l'autre augmente aussi.

Corrélation linéaire

Détermine dans quelle mesure des points de données correspondent à une ligne droite. Quand tous les points se trouvent sur la ligne, on parle de corrélation parfaite. Quand les points sont dispersés dans tout le diagramme, il n'y pas de corrélation.

Corrélation négative

Dans une corrélation négative, les deux variables tendent à aller dans des directions opposées. À mesure qu'une variable augmente, l'autre diminue. On peut donc aussi parler de relation inverse.

Corrélation positive

Dans une corrélation positive, les deux variables tendent à aller dans la même direction. Lorsqu'une variable augmente, l'autre aussi augmente.

D

Décennal

Qui a lieu tous les 10 ans.

Désaisonnalisation

Technique statistique utilisée pour retirer des données l'effet des fluctuations saisonnières normales, afin de mieux faire ressortir les tendances sous-jacentes. Les statistiques économiques soumises à une influence saisonnière sont parfois présentées sans tenir compte de cette influence. L'effet calculé des saisons est éliminé de ces données.

Diagramme

Représentation graphique de données (p.ex. diagramme à bandes, diagramme linéaire, diagramme circulaire, histogramme, pictogramme).

Diagramme à bandes

Diagramme qui compare des barres de même largeur, mais de hauteur différente, conformément aux statistiques ou aux données qu'elles représentent. Les grahiques à barres sont horizontales. Un diagramme à bandes présenté de façon verticale s'appelle « diagramme à colonnes ». Exemple d'un diagramme à bandes

Diagramme à colonnes

Diagramme à bandes vertical. Voir diagramme à bandes. Exemple d'un diagramme à colonnes

Diagramme à tiges et à feuilles

Diagramme à ramifications montrant toutes les combinaisons ou tous les résultats possibles.

Diagramme circulaire

Diagramme circulaire permettant d'élaborer un concept visuel d'un ensemble donné (100 % = 360 degrés). Le diagramme est divisé en secteurs, chacun correspondant à une catégorie de la variable présentée (p.ex., chaque groupe d'âge). Chaque secteur est proportionnel au pourcentage de la catégorie correspondante. Exemple d'un diagramme circulaire

Voir diagramme circulaire.

Diagramme linéaire

Diagramme où les points successifs représentant les valeurs d'une variable pour certaines valeurs de la variable dépendante sont reliés par des lignes droites (p.ex., le taux de chômage chez les jeunes au cours des 10 dernières années). Exemple d'un diagramme linéaire

Diagramme par points

Diagramme à deux dimensions représentant deux variables sous la forme d'une série de points. Principalement utilisé pour montrer la corrélation entre les deux variables. Exemple d'un diagramme de points

Dispersion

Décrit dans quelle mesure les observations divergent autour de la tendance centrale.

Distribution de fréquences

diagramme ou tableau montrant avec quelle fréquence chaque valeur ou chaque série de valeurs d'une variable apparaît dans un ensemble de données.

Distribution de fréquences groupées

Relation entre les valeurs d'une caractéristique et leurs fréquences, lorsque ces valeurs sont groupées en intervalles de classe.

Distribution de fréquences non groupées

Distribution de fréquences de données numériques où les données brutes ne sont pas groupées.

Distribution normale

Souvent appelée simplement « courbe en cloche » ou « courbe en forme de cloche ». La plupart des résultats de ce diagramme sont groupés au centre. La moyenne, la médiane et le mode sont égaux et les résultats situés à chaque extrémité de la distribution sont moins fréquents. Par exemple, dans une courbe représentant les résultats d'un test d'intelligence, la plupart des personnes se trouvent au centre ou autour de l'intervalle d'intelligence « moyen », tandis que le nombre de personnes diminue des deux côtés à mesure que les résultats s'éloignent de la moyenne, d'où la forme et le nom de la courbe.

Dollars constants

Dollars d'une année de référence précise, indexés en fonction de l'inflation ou de la déflation, de façon à montrer les changements du pouvoir d'achat du dollar (voir aussi « Dollars courants »). L'année de référence doit toujours être indiquée.

Dollars courants

Dollars qui expriment le coût d'articles en fonction de l'année où ceux-ci sont achetés. Il est à noter que les « dollars courants » sont aussi nommés « dollars de l'année budgétaire », par opposition aux « dollars constants ».

Données

Faits ou chiffres à partir desquelles on tire des conclusions.

Données brutes

Information qui n'a pas encore été organisée, mise en forme ou analysée.

Données catégoriques

Données qui peuvent être groupées en catégories spécifiques (aussi nommées « variables qualitatives »). Les variables catégoriques peuvent être associées à des catégories qui suivent un ordre naturel (variables ordinales) ou qui ne suivent pas d'ordre naturel (variables nominales). Par exemple, la variable « hauteur » est ordinale parce qu'elle contient les catégories « petit », « moyen » et « grand » qui suivent naturellement un ordre ascendant. Au contraire, des variables comme « sexe » et « couleur des cheveux », qui ne contiennent pas de catégories naturellement ordonnées, sont des exemples de variables nominales.

Données élémentaires (éléments d'information)

Le plus petit élément d'information qu'on puisse obtenir par une enquête ou un recensement.

E

Écart interquartile

Voir Intervalle interquartile.

Écart semi-interquartile

Voir Intervalle semi-interquartile.

Écart-type

Racine carrée de la variance, l'écart-type mesure l'étalement ou la dispersion par rapport à la moyenne d'un ensemble de données. C'est la mesure de l'étalement la plus utilisée.

Échantillon non aléatoire

Voir Échantillonnage non probabiliste.

Échantillonnage à participation volontaire

Échantillons formés de personnes qui ont offert bénévolement leurs services en sachant que le processus serait long ou exigeant, et parfois même désagréable. On a souvent constaté que ces bénévoles ont une attitude favorable ou tout au moins neutre, alors que la population en général a tendance à manifester des attitudes plus diverses au sujet des questions concernées.

Échantillonnage à plusieurs degrés

Activité par laquelle on prélève un échantillon en deux ou trois étapes. Il y a dans ce cas une hiérarchie de types d'unités où chaque unité de premier degré pourrait se décomposer en unités de deuxième degré, et ainsi de suite.

Échantillonnage aléatoire

Voir Échantillonnage probabiliste.

Échantillonnage aléatoire simple

Échantillonnage probabiliste de base où chaque échantillon a des probabilités égales d'être tirée.

Échantillonnage à l'aveuglette

On procède à un tel échantillonnage au hasard par commodité ou disponibilité.

Échantillonnage au jugé (par choix raisonné)

Activité d'échantillonnage reposant sur l'hypothèse selon laquelle la compétence et le jugement personnels peuvent permettre une sélection d'unités typiques ou représentatives de la population cible.

Échantillonnage non probabiliste

Échantillon sélectionné par une méthode non probabiliste. Par exemple, un schéma dans lequel les unités sont choisies dans un but précis, donnerait un échantillon non aléatoire.

Échantillonnage par participation volontaire

On forme des échantillons avec des gens qui ont offert leurs services en sachant que l'exercice serait long ou exigeant et deviendrait peut-être même désagréable. On a souvent constaté que ces bénévoles avaient des attitudes sinon favorables, du moins neutres, alors que la population en général avait tendance à varier plus largement dans ses attitudes à l'égard des sujets d'intérêt.

Échantillonnage par quotas

Activité où le nombre de répondants appartenant à une catégorie (parmi plusieurs) est établi d'avance et où la sélection finale des répondants est confiée à l'intervieweur qui échantillonne jusqu'à ce que toutes les unités de chaque catégorie soient réunies.

Échantillonnage probabiliste

Méthode d'échantillonnage où chaque membre de la population a une chance d'être sélectionné. On le nomme aussi « échantillonnage aléatoire » en raison de la manière aléatoire dont les personnes sont choisies afin de garantir une représentation sans biais de l'ensemble de la population.

Échantillonnage stratifié

Procédé d'échantillonnage où la population se répartit en sous-groupes homogènes ou en strates et où le tirage d'échantillons est indépendant dans chaque strate.

Échantillonnage systématique

Sélection d'unités dans une liste à l'aide d'un intervalle de sélection (k), de façon à ce que chaque élément de la liste touché par l'intervalle k soit inclus dans l'échantillon, l'origine ayant été choisie au hasard entre 1 et k. Si par exemple k était égal à 6 et si l'origine choisie au hasard était 2, l'échantillon serait 2, 8, 14, 20, etc.

Échelle

Ligne graduée divisée en valeurs successives, pouvant être diagramme, descriptive ou numérique, utilisée pour rendre compte d'évaluations. Dans les diagrammes, l'échelle est la subdivision de chaque axe. L'échelle peut être numérique ou catégorique. (Voir aussi : Les parties d'un diagramme.)

Effectif

Voir fréquence.

Enquête

Collecte de données sur des caractéristiques d'intérêt d'une partie ou de la totalité des unités d'une population à l'aide de concepts, de méthodes et de procédures bien définis. Elle est suivie d'un exercice de rassemblement permettant de présenter les données recueillies sous une forme récapitulative utile.

Enquête-échantillon (ou enquête par sondage)

Collecte d'information auprès d'une partie seulement de la population.

Enquêtes polyvalentes

Enquêtes dont les objectifs prévoient une mesure d'un grand nombre de caractéristiques. Par exemple, une enquête sur les dépenses agricoles pourrait viser à établir plus que les frais totaux d'exploitation agricole et vouloir en particulier découvrir ce qu'il en coûte au total pour les instruments aratoires, les salaires, les emprunts, les semences, l'alimentation des animaux, etc.

Enregistrement magnétique

Enregistrement qui permet la lecture et l'écriture. Cette méthode est utilisée lorsqu'il importe de garantir la sécurité des données. L'application la plus répandue de ce type de saisie est la lecture du NIP des cartes bancaires.

Ensemble de données

Tout groupe de données ayant un thème commun ou des caractéristiques semblables.

Entrée de données

Procédé (numérisation, inscription sur papier, bandes magnétiques, fiches, etc.) utilisé pour relever la saisie des données.

Équation de régression

Équation qui permet de prévoir une variable inconnue en utilisant la valeur donnée d'une ou de plusieurs autres variables. Par exemple, l'équation Y = a + b X donne la valeur estimative de Y, si la valeur de X est connue. (Voir aussi Régression et Modèle de régression).

Erreur aléatoire

Erreurs imprévisibles dans une estimation. Ces erreurs ont tendance à s'annuler dans un grand échantillon, contrairement aux erreurs systématiques qui vont toutes dans la même direction.

Erreur d'échantillonnage

Erreur qui se produit lorsque les données sont recueillies auprès d'une partie seulement de la population. Elle est habituellement mesurable par les données de l'échantillon en cas d'échantillonnage probabiliste.

Erreur de non-réponse

Erreur causée par l'absence d'interview ou de non-réponse à une question d'un questionnaire.

Erreur non due à l'échantillonnage

Erreur causée par des facteurs autres que l'échantillonnage (des erreurs de couverture, des erreurs de réponse, des erreurs de non-réponse, des questionnaires erronés, ainsi que des erreurs de consignation par les intervieweurs, de traitement, etc.).

Erreur de réponse

Différence entre la vraie réponse à une question et la réponse donnée par le répondant; elle peut être imputable au répondant, à l'intervieweur, au questionnaire, au procédé d'enquête ou à l'interaction entre le répondant et l'intervieweur.

Erreur de traitement

Erreur qui se glisse dans un exercice de transformation des données de questionnaires, de listes de contrôle, etc. en des ensembles de totalisations et d'estimations.

Estimation

Fait de tirer des conclusions plus vastes d'un échantillon afin de prédire certaines caractéristiques ou tendances de l'ensemble de la population.

État matrimonial

Représente l'état de personnes mariées devant la loi (et non séparées), de personnes en union libre, de personnes séparées (mais toujours mariées devant la loi), de personnes divorcées, de veufs ou de veuves et de célibataires (personnes jamais mariées).

Étendue

Voir Fourchette.

Exactitude

Mesure dans laquelle les résultats d'un calcul ou de la lecture d'un instrument traduisent les quantités réelles qui font l'objet de ce calcul ou de cette lecture et sont exempts d'erreurs. (Voir aussi Précision)

Exclusif

Lorsqu'un événement exclut automatiquement la possibilité qu'un second événement se produise au même moment, les résultats sont exclusifs. Par exemple, rond et carré sont des termes exclusifs, puisqu'un objet ne peut pas avoir ces deux formes au même moment.

Exhaustif

Quand un ensemble d'événements inclut toutes les occurrences possibles d'un ensemble de références, les résultats sont exhaustifs. Par exemple, la liste de groupes d'âge 0-19, 20-34, 35-59 et 60 ans et plus est exhaustive, parce qu'elle couvre l'éventail des âges que peuvent avoir les membres de la population.

F

Fluctuation d'échantillonnage

Fait qu'une statistique prend des valeurs différentes pour des échantillons différents. Elle indique donc dans quelle mesure la valeur de la statistique fluctue d'un échantillon à l'autre.

Formule

Équation ou règle mathématique.

Fourchette

Tout l'intervalle de variation numérique des résultats. La fourchette exclusive est la différence entre la valeur la plus élevée et la valeur la moins élevée d'un ensemble de données, et la fourchette inclusive, la différence entre la limite supérieure réelle de l'intervalle le plus long et la limite inférieure réelle de l'intervalle le plus court.

Fréquence

Nombre de fois qu'un événement se produit ou qu'un élément se présente dans un ensemble de données.

Fréquence cumulée

Détermine le nombre d'observations sous-jacent à une valeur particulière. On la calcule en ajoutant chaque fréquence à la somme de ses prédécesseurs dans un diagramme arborescent et un tableau de distribution de fréquences.

Fréquence en pourcentage

Fréquence de chaque valeur ou de chaque intervalle de classe, exprimée sous forme de pourcentage du nombre total d'observations. Obtenue en multipliant chacune des valeurs de la fréquence relative par 100.

Fréquence relative

Fréquence d'une valeur ou d'un intervalle de classe, exprimée en tant que proportion d'un tout et observée dans un ensemble de données pour une variable particulière. On la calcule en divisant la fréquence par le nombre d'observations.

Fréquentation scolaire

Fréquentation à temps plein ou à temps partiel (de jour ou de soir) d'une école, d'un collège ou d'une université pendant les huit mois compris entre les mois de septembre et de mai (jour du recensement). Cette fréquentation se mesure uniquement par rapport aux études menant à un certificat, à un diplôme ou à un grade.

G

Graphique (diagramme) arborescent

Voir diagrammes à tiges et à feuilles.

Grappe

Ensemble d'unités d'une population qu'on constitue à l'aide de critères bien définis. Il peut s'agir d'un groupe qui existe dans la population (îlot urbain, hôpital, etc.) ou d'un groupe théorique (aires d'un quadrillage de carte, etc.).

Groupe de discussion

Technique d'interview où l'on interroge les répondants en groupe. Cette technique permet de les amener à parler librement, à exposer leurs idées et à faire spontanément part de leurs attitudes et de leurs sentiments sur une question. On s'en sert souvent pour explorer un éventail de questions avec les réactions des répondants en vue de bien orienter la conception d'un questionnaire.

H

Histogramme

Diagramme formé d'une suite de colonnes avec un intervalle de classe en abscisse et une courbe de fréquences en ordonnée. Exemple

Hot deck

La méthode du hot deck recourt à d'autres enregistrements (donneurs) pour répondre à la question (ou à l'ensemble de questions) qui doit faire l'objet d'une imputation. Le donneur peut être choisi au hasard parmi un groupe de donneurs affichant le même jeu de caractéristiques prédéterminées. Par exemple, dans le cas où un questionnaire serait retourné parce qu'il manquait le revenu dans un enregistrement, nous pourrions regrouper toutes les unités déclarantes de la même province, de la même profession et du même nombre d'années d'expérience. On pourrait ensuite dresser une liste des donneurs qui répondent à ces critères, puis en choisir un au hasard. Le revenu déclaré par cette personne tiendrait lieu de revenu pour la réponse manquante ou invalide.

I

Imputation

Remplacement de données manquantes ou non valides par des données acceptées. Normalement effectuée conformément à des règles de décision préétablies. Elle est souvent combinée à la vérification des données.

Indice

Désignation mathématique ou nombre servant à exprimer le niveau de prix, le volume du commerce, le montant relatif, etc. d'une période donnée, comparativement à celui d'une période de base, par exemple, l'indice des prix à la consommation.

Industrie

Groupe de fabricants ou de fournisseurs de services qui ont été rassemblés en fonction de l'homogénéité de leurs produits ou services.

Information

Données qui ont été enregistrées, classées, organisées, raccordées ou interprétées dans un cadre quelconque pour que la signification s'en dégage.

Internet

Réseau informatique mondial reliant des ordinateurs par satellite et par téléphone qui permet aux utilisateurs de se connecter à des réseaux comme le courriel et le W3 (World Wide Web).

Intervalle

Ensemble de chiffres se situant entre deux chiffres limites et pouvant comprendre l'un ou l'autre de ces chiffres; ainsi, l'intervalle [1,5;3] comprend tous les chiffres supérieurs ou égaux à 1,5 et inférieurs à 3. Il convient de noter que le chiffre 3 se trouve exclu de cet intervalle.

Intervalle de confiance

Estimation utilisant une série de valeurs (un intervalle) pour prédire la valeur probable d'un paramètre inconnu, accompagnée d'un niveau de confiance spécifique, ou probabilité que l'estimation sera exacte (c.-à-d. que l'intervalle contiendra effectivement la valeur vraie du paramètre).

Intervalles de classe

Si une variable comporte un grand nombre de valeurs, il est plus facile, pour présenter les données, en groupant les valeurs en intervalles de classe (par exemple, groupes d'âge tels que 0-4, 5-9, 10-14, 15-19, etc. pour rendre compte de l'âge de la population), que de présenter toutes les valeurs séparément. Cela permet de distinguer plus facilement les tendances des données.

Intervalle interquartile

Différence entre les quartiles supérieur et inférieur (Q3-Q1) d'un ensemble de données. Cet intervalle sert à mesurer l'étalement des données : il s'étend sur 50 % d'un ensemble de données et élimine l'influence des valeurs aberrantes (suppression des quarts supérieur et inférieur d'un ensemble de données).

Intervalle semi-interquartile

Estimé à la moitié de la différence entre le 75e (Q3) et le 25e centile (Q1). La formule est : (Q3-Q1)÷2. Comme la moitié des valeurs se situent entre Q3 et Q1, l'intervalle semi-interquartile équivaut à la moitié de la distance nécessaire pour couvrir la moitié des valeurs.

Intranet

Réseau informatique interne privé, l'intranet allie la commodité d'Internet au rendement et à la sécurité d'un système maison. Un intranet peut être relié à Internet au moyen d'une passerelle protégée, munie de pare-feux pour empêcher tout accès extérieur non autorisé aux systèmes internes.

L

Langue maternelle

Première langue apprise à la maison durant l'enfance et encore comprise par la personne au moment du recensement.

Langue parlée à la maison

Langue parlée le plus souvent à la maison par le répondant au moment du recensement.

Lecteur de reconnaissance

Connu aussi sous le nom « lecteur de code à barres », cet appareil peut reconnaître des lettres et des chiffres. Ces lecteurs balaient chaque ligne et les convertissent dans le programme.

Logiciel

Il y a deux catégories de logiciels : les logiciels de base (qui contrôlent le fonctionnement d'un ordinateur en Windows, DOS, etc.) et les logiciels d'application (Word, EXCEL, MS ACCESS).

M

Manipulation des données

Activité par laquelle on met les données en forme définitive (diagramme, moyennes arithmétiques, données agrégées, etc.).

Marge d'erreur

Nombre relatif qui peut être exprimé sous forme de pourcentage et qui est calculé à l'aide de l'erreur d'échantillonnage d'une estimation. On l'utilise pour établir l'intervalle de confiance de cette estimation.

Médiane

Valeur de l'élément central lorsque les données sont ordonnées de la plus basse à la plus haute; mesure de la tendance centrale. Si le nombre d'observations est pair, la médiane est la moyenne des deux observations centrales. Dans le cas des données brutes, la médiane correspond au point par rapport auquel la moitié exacte des données lui est supérieure et l'autre, inférieure.

Méthode de l'estimateur

Méthode qui recourt à une information tirée d'une autre question ou d'une autre réponse d'un enregistrement qui fera l'objet d'une imputation (du cycle actuel ou d'un cycle antérieur) et, au moyen d'opérations mathématiques, produit une valeur plausible destinée au champ vierge ou erroné.

Méthode de la substitution

Méthode qui repose sur la disponibilité de données comparables. Les données imputées peuvent être extraites de l'enregistrement du répondant obtenu lors d'un cycle antérieur de l'enquête ou d'un autre fichier source (p.ex., fichiers administratifs ou autres fichiers d'enquête du même répondant). Cette méthode est souvent difficile à réaliser parce que, dans de nombreux cas, il n'existe aucune autre information au sujet de ce répondant, à part l'information de l'enquête en cours.

Méthodologie

Ensemble de méthodes et de techniques de recherche appliquées à un domaine d'études particulier. À Statistique Canada, le terme « méthodologie » signifie « techniques d'enquête ».

Mode

Observation la plus fréquente dans un ensemble de données; il s'agit d'une mesure de la tendance centrale.

Modèle de régression

Modèle statistique utilisé pour décrire la relation entre une variable dépendante et une ou plusieurs variables indépendantes. Ces modèles présentent des formes et des degrés de complexité très divers. (Voir aussi Régression et Équation de régression).

Moyenne

Mesure la plus courante de la tendance centrale, la moyenne est la moyenne arithmétique d'un ensemble de nombres.

Municipalité dissoute

Il est possible que les limites et les noms des subdivisions de recensement fassent l'objet de modifications d'un recensement à l'autre par suite d'annexions, de dissolutions et d'incorporations. Ces changements peuvent résulter en la « dissolution » de différentes subdivisions de recensement. Une subdivision de recensement dissoute est une communauté qui existait le 1er janvier 1996, mais qui n'existait plus le 1er janvier 2001, soit la date de référence géographique du recensement de 2001. Le concept de « Subdivision de recensement - Recensement précédent » a été créé pour permettre la totalisation des données du recensement actuel selon les subdivisions de recensement du recensement précédent (1996). On procède au couplage des îlots du recensement de 2001 avec les subdivisions de recensement du recensement de 1996 selon un « ajustement optimal », afin d'être en mesure de totaliser les données du recensement actuel selon les communautés du recensement précédent.

N

Non-réponse

Situation dans laquelle on ne dispose pas de données sur certaines unités de l'échantillon pour une raison quelconque. Il se peut, par exemple, que le répondant ne soit pas disponible ou qu'il refuse de répondre ou de prendre part à l'interview.

O

Observations

Données recueillies pour une variable quelconque.

Ogive

Courbe d'un diagramme de distribution de fréquences. Il est à noter que les courbes de distribution n'ont pas toutes la forme d'une ogive. Il est donc préférable de limiter ce terme à la distribution normale ou quasi normale.

Ordinateur central

Ordinateur offrant des possibilités et des ressources étendues et auquel d'autres ordinateurs peuvent être connectés de manière à partager les ressources.

Ordinateur de milieu de gamme

Éventail très vaste d'ordinateurs allant des ordinateurs personnels haut de gamme aux ordinateurs centraux. Antérieurement appelés « mini-ordinateurs » et pourvus de terminaux non intelligents connectés à des systèmes centralisés, la plupart des ordinateurs de milieu de gamme sont utilisés aujourd'hui comme serveurs dans un environnement client-serveur.

Ordinateur personnel

Micro-ordinateur monoposte à usages multiples, conçu pour être utilisé par une seule personne à la fois.

Origine ethnique

Groupes ethniques ou culturels auxquels appartient l'ascendance d'un répondant; par origine ethnique ou culturelle, on entend les « racines » ethniques ou l'ascendance d'une population, terme à ne pas confondre avec les termes citoyenneté et nationalité.

P

Paramètre

Il s'agit de valeurs inconnues quantitatives (p.ex., recettes totales, recettes moyennes, rendement total, nombre de chômeurs) qui concernent toute la population ou certains domaines d'intérêt pour le chercheur.

Pertinence

La pertinence des données ou de l'information statistique constitue une évaluation quantitative de leur valeur inhérente. Cette valeur dépend du degré selon lequel les données et l'information conviennent aux buts de leur production et à l'intérêt qu'y portent les utilisateurs. La valeur dépend aussi du mandat de l'organisme, des exigences imposées par la loi et du coût de substitution de la production de ces données ou de cette information.

Peuples autoch-tones

Indiens, Métis ou Inuit (Esquimaux) d'Amérique du Nord.

Pictogramme

Diagramme de représentation imagée de statistiques (on peut utiliser, par exemple, un billet de 1 dollar en grandeur croissante pour représenter l'augmentation du pouvoir d'achat dans le temps). Exemple

Plan d'échantillonnage

Ensemble de spécifications qui détaillent la population, la base de sondage, les unités d'enquête, la taille de l'échantillon et les méthodes d'échantillonnage et d'estimation.

Polygone de fréquences

Diagramme que l'on forme en joignant en leurs points milieux les courbes en colonnes d'un histogramme (Voir aussi Histogramme)

Population

Ensemble des unités visées par les résultats de l'enquête (les unités en question sont des personnes, des animaux, des objets, des entreprises, des voyages, etc...)

Population active

Population de 15 ans et plus — à l'exception des pensionnaires d'établissement — qui est présente sur le marché du travail la semaine où tombe le 15e du mois précédant le jour du recensement. On classe les répondants en tant que personnes occupées (ayant un emploi) ou chômeurs. Le reste de la population en âge de travailler est alors considéré comme inactif.

Possibilité d'interprétation

La possibilité d'interprétation reflète la facilité avec laquelle l'utilisateur peut comprendre, utiliser et analyser les données ou l'information. La justesse des définitions des concepts, des populations cibles, des variables et de la terminologie sous-jacente aux données, ainsi que l'information sur toute limitation des données, détermine en grande partie la possibilité d'interprétation.

Pourcentage cumulé

Permet de calculer la fréquence cumulée en divisant ce pourcentage par le nombre d'observations et en le multipliant par 100. La dernière valeur est toujours égale à 100 %. Cela facilite la comparaison des données.

Précision

La précision est une mesure de la similarité. Le même sondage exécuté plus d'une fois devrait donner les mêmes résultats ou des résultats similaires. Plus les résultats de chaque répétition du sondage se ressemblent, plus ils sont précis.

Programmation

Production d'un jeu d'instructions pour qu'un ordinateur exécute une tâche en particulier.

Pyramide des âges

Diagramme qui vise à représenter la structure par selon l'âge et le sexe d'une population. Il est formé de deux histogrammes horizontaux qui sont joints. Exemple d'un pyramide des âges

Q

Qualité des données

Niveau ou degré de confiance que les données et l'information statistique sont « prêtes à l'emploi ». Les aspects auxquels Statistique Canada doit prêter attention sur le plan de la qualité ou de la capacité d'utilisation sont la pertinence, l'exactitude, l'actualité, l'accessibilité, la possibilité d'interprétation et la cohérence.

Quartiles

Pour déterminer l'intervalle interquartile, on divise l'ensemble de données en quatre parties égales. Chaque valeur marquant un palier est appelée quartile (premier, deuxième, etc.). Le deuxième quartile est aussi appelé la médiane.

Questionnaire

Série de questions conçues pour l'obtention de renseignements sur un ou plusieurs sujets auprès d'un répondant.

R

Rang-centile

Dans une distribution, proportion de valeurs à laquelle une valeur spécifique est supérieure ou égale. Par exemple, si une personne obtient une note de 95 % à un test de mathématiques et que cette note est supérieure ou égale aux notes obtenues par 88 % des élèves, la personne se trouve dans le 88e centile.

Ratio

Rapport proportionnel entre deux quantités ou deux nombres différents ou, en mathématique, quotient de deux nombres ou de deux expressions obtenu en divisant l'un des éléments par l'autre.

Recensement

Collecte de données sur toutes les unités d'une population, ce que l'on appelle parfois « enquête sur échantillon ». (Le terme « Recensement » [avec la majuscule initiale] désigne habituellement le Recensement de la population [à l'échelle nationale].)

Recensement décennal (Canada)

Les recensements ont lieu au début de chaque décennie, lors les années se terminant par le chiffre 1. Statistique Canada, par exemple, a effectué des recensements à tous les dix ans, de 1871 à 2001. (Voir aussi Recensement quinquennal)

Recensement quinquennal (Canada)

Recensement qui se tient à la mi-décennie dans les années se terminant par le chiffre 6. Par exemple, Statistique Canada a tenu des recensements quinquennaux en 1976, 1986 et 1996. (Voir aussi Recensement décennal)

Région métropolitaine

Statistique Canada a créé des groupements de municipalités, ou subdivisions de recensement, qui englobent le secteur placé sous l'influence d'un grand centre urbain. Le regroupement de ces municipalités étroitement interreliées parce que les habitants travaillent dans une municipalité et résident dans une autre, est régi par des lignes directrices précises. Les unités géographiques qui en résultent sont appelées « régions métropolitaines de recensement ».

Régression

Méthode statistique par laquelle on essaie de prévoir la valeur d'une caractéristique en étudiant sa relation avec une ou plusieurs autres caractéristiques. Cette relation s'exprime au moyen d'une équation de régression. (Voir aussi Modèle de régression)

Réseau étendu (RE)

Réseau de communication couvrant un vaste secteur géographique tel qu'une province ou un pays. Il diffère du réseau local (RL) qui se limite à un bâtiment ou à un ensemble de bâtiments, ainsi que du réseau de la région métropolitaine, qui couvre généralement une ville ou une banlieue.

Réseau local (RL)

Réseau de communication desservant les utilisateurs d'un secteur géographique limité. Il se compose de serveurs, de postes de travail, d'un système d'exploitation de réseau et d'un lien de télécommunication.

Révision

Voir révision de données. (Voir aussi imputation)

Révision de données

Procédé destiné à garantir que les données d'enquête sont exactes, complètes et uniformes.

S

S

Symbole mathématique de l'écart-type.

Symbole mathématique de la variance.

Saisie des données

Procédé consistant à enregistrer des réponses sur un support lisible par machine.

Saisie interactive

Procédé souvent désignée saisie intelligente. En général, les données saisies font l'objet d'une vérification avant leur imputation. Toutefois, cette méthode combine la saisie et la vérification en une seule fonction. Bien que la saisie interactive soit plus lente, elle est très efficace lorsqu'il y a une étroite interdépendance entre les questions. Ce processus nécessite une connaissance des procédures de vérification, car il importe de corriger les erreurs sur le champ. La saisie interactive réduit aussi le nombre de documents traités, car les vérifications sont faites directement par ordinateur.

Saisie par lots

Procédé qui constitue l'une des plus anciennes méthodes de saisie. Elle recourt à un clavier pour entrer les données. Ce processus convient parfaitement à l'entrée d'une grande quantité de données lorsque la rapidité est une nécessité. Aucune procédure de vérification n'a lieu, mais nous devons placer une bonne part de la confiance dans le programme de vérification. En outre, nous devons mettre en oeuvre des vérifications de la validité et des étendues pour veiller à la qualité de la saisie. Cela ne signifie pas que nous modifions les données, mais si un champ numérique contient plutôt des lettres, l'erreur sera détectée. Cette approche peut être avantageuse dans le cadre de grandes enquêtes comportant de nombreuses questions et vérifications.

Secteur de dénombrement (SD)

Région parcourue par un intervieweur dans le cadre du Recensement de la population du Canada. Les SD sont des unités bien définies et facilement reconnaissables sur les cartes et sur le terrain, mais qui sont propres à un recensement.

Lettre sigma du l'alphabétique grec
(sigma)

Symbole mathématique de sommation de valeurs.

Sous-produit administratif

Données disponibles à partir de l'information enregistrée dans les dossiers administratifs, les demandes, les rapports, etc.

Statistique

Fonction produisant un résultat numérique dont la valeur peut varier selon les résultats d'une expérience (p.ex., avec des échantillons différents). Exemple : la moyenne ou la médiane d'un échantillon, etc.

Statistiques

Type d'information obtenue en soumettant les valeurs numériques à des opérations mathématiques.

Statistiques, études des

Domaine d'investigation ayant pour objet la collecte et l'agencement de données, de faits ou de valeurs numériques se rapportant aux affaires humaines ou aux phénomènes naturels.

Statistiques de l'état civil

Statistiques sur les naissances, les décès, les mariages, la santé et la maladie.

Statistique inférentielle

Méthodes statistiques utilisées pour inférer les valeurs d'une population à partir des valeurs obtenues pour l'échantillon.

Les statistiques : le pouvoir des données!

Une ressource de Statistique Canada qui a été élaborée de façon à pouvoir tirer pleinement parti des statistiques.

Stockage de données

1) Capacité d'un ordinateur à emmagasiner de l'information.
2) Il s'agit également d'une fonction informatique de mise en mémoire de l'information sur un support (p.ex., bande magnétique, disquette, CD-ROM, etc.).

T

Tableau de pointage

Sert à enregistrer les données d'une expérience, à compter les occurrences d'un événement et à élaborer les tableaux de distribution de fréquences.

Tableau statistique

Présentation de données statistiques regroupant les valeurs d'une caractéristique ainsi que le nombre de fois que chaque valeur apparaît dans l'ensemble de données.

Taux d'activité

Pourcentage de la population âgée de 15 ans et plus.qui fait partie de la population active. Le taux d'activité d'un groupe en particulier (p.ex., celui des femmes de 25 ans et plus) s'exprime en pourcentage de la population totale du groupe en question.

Tendance centrale

Mesure de l'emplacement où se trouve le milieu ou le centre d'une distribution. La tendance centrale peut se rapporter à des mesures très diverses comme la moyenne, la médiane et le mode. La moyenne est la mesure de la tendance centrale la plus fréquemment utilisée.

(Diagrammes à) tiges et à feuilles

Méthode semi-graphique utilisée pour représenter des données numériques, où le premier chiffre (le plus à gauche) de chaque valeur correspond à la tige, tandis que le reste des chiffres qui composent le nombre sont les feuilles. Un diagramme arborescent montre toutes les valeurs des données d'un ensemble-échantillon.

Traitement des données

Procédé consistant à convertir des données brutes sous une forme lisible par machine, puis à les trier, à les vérifier, à les manipuler et à les présenter de manière à créer de l'information.

U

Unité centrale de traitement

L'unité centrale de traitement (UCT) est le cœur d'un système informatique. Elle est assez petite pour tenir dans une main, mais peut contenir des millions de circuits logiques.

Unité d'entrée

Organe ou dispositif (bande, carte, clavier, disquette, CD-ROM, photostyle, lecteur optique, caméra numérique, etc.) à partir duquel des données peuvent être introduites dans un ordinateur.

Unités d'enquête

Aux fins du tirage d'un échantillon, la population devrait être divisible sans recoupement en un nombre fini d'unités distinctes et identifiables de sorte que chaque membre de la population ne corresponde qu'à une unité d'échantillonnage.

V

Valeurs aberrantes

Dans un ensemble de données, ce sont les valeurs si éloignées des autres valeurs d'une distribution que leur présence ne saurait être attribuée aux seules probabilités.

Variable

Caractéristique susceptible de prendre plusieurs des valeurs d'un ensemble auquel une mesure numérique peut être appliquée (p.ex., revenu, âge, poids).

Variable continue

Variable numérique qui peut prendre un nombre infini de valeurs réelles. L'âge, la distance et la température par exemple sont considérés comme des variables continues, parce qu'une personne peut parcourir 3 642 531 km à pied.

Variable discrète

Variable numérique qui prend uniquement un nombre limité de valeurs réelles (par ex., X peut seulement être égal à 1, 3, 5 et 1000).

Variable groupée

Ensemble de données qui a été groupé ou classé en fonction de caractéristiques qualitatives ou quantitatives communes. Exemple d'une variable groupée

Variable nominale

Type de variable catégorique qui décrit un nom, une étiquette ou une catégorie sans ordre naturel. Par exemple, la liste des différents types de matières scolaires ne présente pas d'ordre naturel : l' « histoire » ne suit pas nécessairement la « biologie ». Ces matières peuvent être placées dans n'importe quel ordre.

Variable non groupée

Ensemble de données qui n'ont pas été groupées, ni classées; il s'agit plutôt d'une liste de valeurs individuelles observées (p.ex., années d'âge).

Variable numérique

Variable quantitative qui décrit une valeur mesurée de façon numérique (par ex., âge ou nombre de personnes dans un ménage). Ces variables peuvent être continues ou discrètes.

Variable ordinale

Type de variable catégorique : une variable ordinale présente un ordre naturel de ses valeurs possibles, mais les distances entre les valeurs ne sont pas définies. Habituellement, les variables ordinales ont des échelles catégoriques. Par exemple, lorsqu'on demande à des personnes de choisir entre « excellent », « bon », « moyen » et « médiocre » pour évaluer quelque chose, la réponse indique seulement une catégorie, mais il existe un ordre naturel de ces catégories.

Variance

Mesure de l'étalement équivalant au carré moyen de l'écart de chaque nombre par rapport à la moyenne d'un ensemble de données. Le terme variance est aussi lié à la variation d'échantillonnage.

Variation d'échantillonnage

Variation qu'accusent des échantillons d'une même population qui sont différents, mais d'une même taille.

Vérification

Activité par laquelle on vérifie les valeurs d'une variable dans tous les enregistrements ou des combinaisons préétablies de zones de tous les enregistrements pour ainsi s'assurer que les valeurs indiquées sont valables (Voir aussi Imputation)

Vérification de la cohérence

Activité par laquelle on compare les diverses réponses d'un enregistrement pour en assurer la cohérence l'une par rapport à l'autre. Par exemple, si une personne déclare faire partie du groupe d'âge de 0 à 14 ans et est à la retraite, il existe alors un problème de cohérence entre les deux réponses. La vérification inter-champ constitue une autre forme de vérification de la cohérence. Elle vise à vérifier que, si un chiffre est déclaré dans une section, un chiffre équivalent sera déclaré dans une autre section.

Vérification de la validité

Vérification qui porte sur un champ ou une cellule à la fois. Elle fait en sorte que nous tenions compte des descripteurs d'enregistrement, des caractères et des valeurs invalides; que les champs obligatoires aient été remplis (p.ex., aucun champ de quantité ne demeure vierge si un nombre est requis); que nous ayons bien utilisé les unités de mesure précisées et que le temps de déclaration respecte les limites précisées.

Vérification de l'étendue

Activité qui ressemble à la vérification de la validité, car elle porte aussi sur un champ à la fois. Ce type de vérification a pour but d'assurer que les valeurs, les rapports et les calculs respectent les limites prédéterminées.

Vérification des dédoublements

Activité par laquelle on examine un enregistrement complet à la fois. Elle recherche les dédoublements (c.-à-d. veille à ce que l'enregistrement d'une personne ou d'une chose apparaît une seule fois). Cette vérification recherche aussi si le répondant apparaît plus d'une fois dans l'univers de l'enquête, surtout après la modification du nom. Enfin, elle vérifie aussi si les données ont été entrées une seule fois dans le système.

Vérification des données

Activité par laquelle on s'assure que les données d'enquête sont exactes, exhaustives et cohérentes. (Voir aussi Imputation)

Vérifications diverses

Par vérifications diverses, on entend les dispositions spéciales de déclaration, les vérifications dynamiques propres à l'enquête, les vérifications de la classification appropriée, les modifications apportées aux adresses physiques, aux lieux et aux contacts ainsi que la vérification de la lisibilité, qui permet de s'assurer que les chiffres et les symboles sont reconnaissables.

Vérification historique

Activité par laquelle on compare les réponses des enquêtes régulières à celles des enquêtes précédentes. Par exemple, toute modification importante par rapport à la dernière enquête sera signalée. On compare aussi les rapports et les calculs. Ainsi, tout écart qui ne respecte pas les limites établies est noté et fait l'objet d'une analyse.

Vérification statistique

Vérification qui permet de comparer un ensemble complet de données. Ce type de vérification a lieu seulement après l'exécution de toutes les autres vérifications et la correction subséquente des données. Les données sont compilées et toute valeur extrême, toute donnée suspecte et toute valeur aberrante est rejetée.

X

x avec une barre au-dessous

Symbole mathématique de la Moyenne.