Renseignements additionnels sur les variables : comment les interpréter

« Une variable est une caractéristique d'une unité statistique que l'on observe et pour laquelle une valeur numérique ou une catégorie d'une classification peut être attribuée. »

Dans la définition qui précède, les composantes clés sont :

  • l'unité statistique observée,
  • la caractéristique,
  • la mesure numérique, et
  • la catégorie d'une classification.

Ces composantes sont les composantes standard utilisées dans la présente trousse d'information pour désigner et structurer les variables. Un organisme statistique qui publie des données doit adopter une façon uniforme pour désigner et structurer les variables auxquelles les données se rapportent. Pour ce qui est des utilisateurs, ils doivent être capables de reconnaître la même structure qui sous-tend le nom des variables, quelle que soit la subdivision de l'organisation qui produit les données et le sujet étudié. En ce qui a trait à la gestion des renseignements sur les données (appelés métadonnées) publiées par l'organisation, il faut adopter une convention et une structure de désignation uniformes pour les variables, afin de pouvoir conserver efficacement les métadonnées dans une base de données centrale, ainsi que de permettre une extraction efficace et une recherche utile par les utilisateurs.

La convention et la structure de désignation dont il est question précédemment sont adaptées de la norme de l'Organisation internationale de normalisation (ISO), Technologies de l'information - Registres de métadonnées, ou ISO 11179. Cette norme est adoptée par un nombre croissant d'organismes statistiques nationaux.

Façon dont la structure est appliquée

Lorsqu'il est décidé de produire des données dans le cadre d'un programme statistique, afin d'éclairer un certain domaine, les analystes responsables doivent déterminer :

  • la ou les unités statistiques qui seront observées, par exemple des personnes ou des ménages dans le cas d'un programme de statistiques sociales, ou des établissements commerciaux ou des entreprises dans le cas d'un programme de statistiques sur les entreprises;
  • les caractéristiques de ces unités statistiques qui seront mesurées, par exemple les revenus ou les dépenses et parfois l'occurrence proprement dite de l'unité statistique (par exemple le nombre de personnes, auquel cas la caractéristique mesurée de l'unité statistique est son existence même).
  • Le plus souvent, le programme statistique produira des données pour plus d'éléments que simplement la globalité des unités observées et pour plus d'éléments que simplement la caractéristique globale mesurée; le programme produira probablement des données pour dessous-catégories de l'unité statistique et pour des sous-catégories de la caractéristique générale. Par exemple, dans le cas des revenus des ménages, les données sont produites pour différentes catégories de revenus, par exemple, la rémunération, les pensions, etc.; de même, les données sont produites pour différentes catégories de ménages, par exemple les ménages comptant un soutien, les ménages comptantdeux soutiens, etc.. Ces catégories sont ce que les organismes statistiques appellent des « classes à l'intérieur de classifications ». Pourplus de cohérence entre les données publiées par les diverses subdivisions d'un organisme statistique, et même par différents organismesstatistiques, on crée des classifications types. Celles-ci comprennent généralement les catégories de caractéristiques et d'unités d'observations les plus fréquemment utilisées. Ainsi, les trois pays de l'Amérique du Nord ont développé le Système de classification des industries del'Amérique du Nord (SCIAN), en vue de publier des données pour les mêmes sous-catégories d'industries.
  • Enfin, les analystes doivent décider de l'unité de mesure qui sera utilisée pour exprimer les valeurs numériques; ainsi, dans le cas des revenus, il peut s'agir de dollars canadiens courants ou de dollars constants de 1997, etc..

Façon de consulter les tableaux statistiques des séries chronologiques à partir des composantes ISO

Prenons un tableau de série chronologique s'appliquant au Canada, dans lequel les en-têtes des colonnes correspondent aux périodesde référence, et les titres des lignes, aux noms de la caractéristique générale mesurée pour l'unité statistique observée, par exemple, « Revenus totaux de tous les ménages ». La documentation des variables que vous consultez en ce moment définit la caractéristique mesurée et l'unité statistique observée. Les cellules comprises dans les lignes contiennent les valeurs numériques, selon l'unité de mesureindiquée dans la documentation des variables.

Dans la plupart des cas, les données du tableau seront ventilées selon la région géographique à l'intérieur du Canada, par exemple,provinces et territoires, ou régions métropolitaines, etc. La documentation des variables informe les utilisateurs de cette ventilationgéographique. Dans la plupart des cas, la valeur de la caractéristique générale mesurée sera ventilée en sous-catégories de caractéristiques et/ou d'unités statistiques, i.e., en d'autres mots, ventilées en classes à l'intérieur de classifications; par exemple, les classes de sources de revenus ou les classes d'industries. La documentation des variables informe toujours les utilisateurs des différentes classes de la ou des classifications particulières utilisées pour présenter les données du tableau. Les noms de ces classes et groupes de classes apparaissent dans les titres des lignes du tableau.

Date de modification :