Supplément à l'Évaluation générique des facteurs relatifs à la vie privée de Statistique Canada liée à l'Enquête sur la sécurité individuelle au sein de la population étudiante postsecondaire

Date : Janvier 2019

Gestionnaires de programme :

  • Larry MacNaab, directeur, Division des enquêtes spéciales
  • Lynn Barr-Telford, directrice générale, Direction de la santé, de la justice et des enquêtes spéciales

Mention du fichier de renseignements personnels (FRP)

Les renseignements personnels recueillis au moyen de l'Enquête sur la sécurité individuelle au sein de la population étudiante postsecondaire sont décrits dans le FRP « Enquêtes spéciales » de Statistique Canada. Ce FRP renvoie aux renseignements recueillis par l'intermédiaire d'enquêtes ponctuelles de Statistique Canada, qui sont menées pour le compte d'autres ministères, conformément à la Loi sur la statistique. Les enquêtes spéciales portent sur une variété de thèmes socioéconomiques, dont la santé, le logement, la population active, l'éducation et la littératie ainsi que les données démographiques.

Le FRP « Enquêtes spéciales » (numéro de fichier : StatCan PPU 016) est publié dans le site Web de Statistique Canada, dans le plus récent chapitre de Renseignements sur les programmes et les fonds de renseignements.

Description de l'activité statistique

Statistique Canada mènera une enquête à participation volontaire intitulée Enquête sur la sécurité individuelle au sein de la population étudiante postsecondaire pour le compte du ministère fédéral des Femmes et de l'Égalité des genres en réponse à la Stratégie du Canada pour prévenir et contrer la violence fondée sur le sexe. L'enquête donnera un aperçu de la prévalence et de la nature de la victimisation sexuelle chez les étudiants postsecondaires, y compris le fait d'être témoin et de faire l'objet de comportements sexuels inappropriés, de harcèlement fondé sur le sexe, l'orientation sexuelle ou l'identité de genre, et d'agression sexuelle. Le contenu de l'enquête comprend également des questions portant sur les caractéristiques, les conséquences et la déclaration de ces expériences, ainsi que sur les connaissances et la perception des étudiants quant à l'efficacité des procédures et des services de soutien à leur établissement postsecondaire. Ces renseignements seront recueillis auprès d'adultes âgés de 18 à 24 ans (de 17 à 24 ans dans la province de Québec) qui fréquentent actuellement ou qui ont fréquenté des établissements postsecondaires au cours de leur vie.

Raison du supplément

Bien que l'Évaluation générique des facteurs relatifs à la vie privée aborde la plupart des risques en matière de vie privée et de sécurité liés à cette activité statistique, ce supplément décrit les mesures supplémentaires (voir la rubrique Facteurs d'atténuation) mises en œuvre pour la collecte des renseignements et l'accès à ceux-ci compte tenu du caractère délicat des questions posées. Ce supplément démontre également la nécessité d'obtenir ces renseignements personnels.

Nécessité et proportionnalité

La collecte et l'utilisation de renseignements personnels pour l'Enquête sur la sécurité individuelle au sein de la population étudiante postsecondaire peuvent être justifiées par rapport au critère en quatre parties proposé par le Commissariat à la protection de la vie privée du Canada :

  1. La nécessité : L'enquête comblera une lacune dans la qualité des estimations nationales et régionales concernant le harcèlement sexuel, la victimisation et le harcèlement fondés sur le sexe et la sexualité au sein de la population étudiante postsecondaire, un groupe précédemment identifié comme étant à risque de victimisation. Le contenu de l'enquête et les critères d'inclusion dans l'Étude sont le résultat de séances de mobilisation virtuelles et en personne ayant pour objectif de cerner les besoins en information d'une vaste gamme d'intervenants et d'experts en la matière, y compris des universitaires, des chercheurs, des fournisseurs de service, les gouvernements provinciaux et territoriaux, ainsi que le ministère des Femmes et de l'Égalité des genres.
  2. L'efficacité : La grande qualité, l'actualité et la pertinence des données produites à partir de l'enquête appuieront l'élaboration de politiques fondées sur des données probantes pour appuyer la Stratégie du gouvernement du Canada pour prévenir et contrer la violence fondée sur le sexe.
  3. La proportionnalité : Il a été évalué qu'un échantillon d'une taille de 54 000 répondants était optimal sur le plan méthodologique afin de produire des statistiques de qualité qui sont représentatives d'événements d'une prévalence possiblement faible (c.-à-d. agressions sexuelles) à l'échelle régionale au sein de la population étudiante postsecondaire. On estime que les avantages publics des résultats de l'enquête, qui devraient éclairer les politiques, les lois, les programmes et les services de soutien visant à améliorer le mieux‑être et la sécurité des étudiants, l'emportent sur l'intrusion éventuelle dans la vie privée des participants à cette enquête volontaire.
  4. Les autres solutions possibles : À l'heure actuelle, aucune autre source de données de qualité sur la victimisation sexuelle autodéclarée n'est disponible. Les données actuelles sur les crimes, accessibles auprès de sources de données administratives, se limitent souvent à des événements déclarés officiellement qui entourent le seuil de la criminalité et qui, croit-on, sous‑représentent considérablement les taux réels de victimisation sexuelle dans la population.

Facteurs d'atténuation

Consentement

On informera les participants que leur participation est volontaire avant de leur poser des questions. Aux fins de l'Enquête sur la sécurité individuelle au sein de la population étudiante postsecondaire, le consentement parental des mineurs ne sera pas demandé. Pour toute collecte auprès des mineurs, la décision de Statistique Canada de demander le consentement du parent ou du tuteur légal d'un mineur est fondée sur ce que l'on peut raisonnablement s'attendre à ce que le mineur comprenne. Statistique Canada a pris en considération des facteurs comme la capacité de comprendre les questions de l'enquête et de prendre une décision éclairée quant à leur participation, leurs réponses et l'utilisation de leurs renseignements personnels. Par conséquent, la ligne directrice pour la majorité des enquêtes de Statistique Canada consiste à demander le consentement parental pour les répondants âgés de moins de 15 ans. Cela ne s'applique pas à la présente enquête.

Le caractère délicat des questions

Les questions de l'enquête portent sur la sécurité individuelle, y compris le fait d'être témoin et de faire l'objet de comportements sexuels inappropriés, de harcèlement fondé sur le sexe, l'orientation sexuelle ou l'identité de genre, et d'agression sexuelle.

Le contenu de l'enquête est passé à travers deux rondes d'essais en personne, y compris une ronde volontaire d'essais du caractère délicat afin de cerner et de traiter les sources éventuelles de préjudice pour les futurs répondants. Comme prévu, les répondants aux essais ont confirmé que certaines questions étaient délicates, mais on a estimé que le risque de préjudice général pour les participants à l'enquête était gérable au moyen des mesures d'atténuation décrites ci-dessous.

Tous les répondants seront informés du caractère délicat du contenu de l'enquête avant d'y participer au moyen d'une lettre et d'une brochure sur l'enquête pour en expliquer l'objet.

Compte tenu du fait que les questions de l'enquête pourraient susciter des réactions émotionnelles de la part des répondants, des renseignements pour joindre des services de soutien et des ressources pour les victimes de violence sexuelle seront rendus accessibles aux répondants dans différents formats, dont la brochure envoyée par la poste aux répondants, dans le questionnaire de l'enquête ainsi que sur le site Web de Statistique Canada. Les intervieweurs et les membres du personnel du bureau d'aide pourront également fournir ces renseignements aux répondants, le cas échéant. Les intervieweurs de l'enquête recevront une formation d'un psychologue clinicien sur la façon de gérer les interviews difficiles et les répondants perturbés par le contenu de l'enquête. En outre, les intervieweurs recevront une formation et des ressources sur les stratégies pour prendre soin de soi pendant la période de collecte.

Accès aux renseignements personnels

Statistique Canada a établi que les réponses aux questions délicates recueillies auprès de mineurs ne seront pas divulguées aux parents ou aux tuteurs qui demandent l'accès aux renseignements personnels de leur enfant étant donné que la divulgation de ces renseignements pourrait éventuellement causer un préjudice à l'enfant.

Conclusion

Cette évaluation conclut que, grâce aux mesures de protection existantes de Statistique Canada, les risques résiduels sont suffisamment faibles pour que Statistique Canada accepte de gérer le risque.

Supplément à l'Évaluation générique des facteurs relatifs à la vie privée de Statistique Canada relative au Test du recensement de 2019

Date : Avril 2019

Gestionnaire de programme : Marc Hamel, directeur général, Programme du recensement

Mention du fichier de renseignements personnels (FRP)

Les renseignements personnels recueillis dans le cadre du test du recensement sont décrits dans le FRP « Recensement de la population — Test du contenu du Programme du recensement » de Statistique Canada.

Le FRP « Recensement de la population – Test du contenu du Programme du recensement » (numéro de fichier : StatCan PPU 007) est publié dans le site Web de Statistique Canada, dans le plus récent chapitre de Renseignements sur les programmes et les fonds de renseignements.

Description de l'activité statistique

Le test du recensement vise à déterminer s'il est possible de facilement comprendre les questions à l'étude pour le Recensement de la population de 2021, nouvelles ou révisées, et d'y répondre correctement, à évaluer la réaction du public à ces questions en les testant auprès d'un petit échantillon et à évaluer le comportement du personnel lorsqu'il utilise de nouveaux systèmes et de nouvelles procédures. Ce test quantitatif, obligatoire aux termes de la Loi sur la statistique et comportant un échantillon de logements à travers tout le pays, sera réalisé de mai à juillet 2019.

L'objectif du Recensement de la population consiste à fournir des données, des analyses et des services statistiques, en vue de mesurer les changements qui touchent la population du Canada et ses caractéristiques démographiques. Il pose les fondements de la prise de décisions dans les secteurs public et privé, ainsi que de la recherche et de l'analyse dans les domaines qui préoccupent la population du Canada.

Le Recensement de la population est un moyen fiable d'estimer la population des provinces, des territoires et des municipalités. Les données recueillies sont liées à des mesures législatives fédérales et provinciales et servent à la répartition des paiements de transfert fédéraux. Le recensement fournit également des données sur les caractéristiques de la population et des logements au sein de petites régions géographiques ainsi que pour de petits groupes de population afin de soutenir les activités d'évaluation et d'élaboration des politiques, de planification et d'administration de tous les ordres de gouvernement, de même que les activités des utilisateurs de données du secteur privé.

Pour assurer la pertinence continue du recensement pour les Canadiens, Statistique Canada procède à une consultation officielle au début de chaque cycle de recensement. Durant cette période, Statistique Canada invite les utilisateurs de données, les intervenants et le grand public à lui faire part des données qu'ils utilisent, des fins auxquelles elles sont utilisées, ainsi que des éventuelles lacunes qu'elles comportent et que Statistique Canada devrait songer à combler lors du prochain cycle du recensement. Le rapport Résultats de la consultation du Recensement de la population de 2021 : Ce que nous ont dit les Canadiens a été publié sur le site Web de Statistique Canada le 8 avril 2019.

Comme dans les recensements antérieurs, les Canadiens ont pu participer à de vastes consultations sur les questions à inclure dans le Recensement de la population de 2021. Statistique Canada a effectué en 2018 des tests qualitatifs sur les nouvelles questions et les questions révisées élaborées pour tenir compte des nouveaux besoins mentionnés dans les consultations, en ayant recours à des méthodes comme les interviews individuelles et les groupes de discussion.

Raison du supplément

Alors que l'Évaluation générique des facteurs relatifs à la vie privée (EFVP) porte sur la protection de la vie privée et les risques pour la sécurité liés aux activités statistiques de Statistique Canada, ce supplément décrit les nouveaux risques potentiels associés à la collecte, au traitement et à l'utilisation de données concernant le nouveau contenu du recensement à l'étude, et aux possibles préoccupations des Canadiens quant au degré d'intrusion de la collecte. Voici les principaux ajouts au contenu soumis aux tests :

  • une nouvelle question sur le sexe qui permet aux répondants de déclarer un sexe non binaire qui satisfait aux nouvelles normes de Statistique Canada relatives au sexe et au projet de loi C-16 (Loi canadienne sur les droits de la personne);
  • de nouvelles questions sur la langue des ayants droit afin de déterminer le droit des enfants à s'inscrire dans des écoles francophones à l'extérieur du Québec et dans des écoles anglophones à l'intérieur du Québec, dans l'application de l'article 23 de la Charte canadienne des droits et libertés;
  • une nouvelle question d'identification des anciens combattants, afin de faciliter l'exécution du mandat d'Anciens Combattants Canada (données probantes pour la prestation de services, l'élaboration de politiques, l'évaluation de prog
  • une nouvelle question sur la santé autodéclarée pour fournir un prédicateur fiable des besoins en matière de services de santé, notamment l'état de santé des populations vulnérables et pour de petits domaines;
  • une liste modifiée d'exemples d'appartenance ancestrale et de religion; questions modifiées sur l'immigration et le lieu de naissance (la liste d'exemples a d'importantes répercussions sur les structures de réponse);
  • deux questions modifiées sur l'identité autochtone; de nouvelles questions sur les Métis et les Inuits afin de mettre à jour la terminologie et de combler les besoins de renseignements plus précis sur les Métis et les Inuits et de régler les problèmes des données de recensement mis en évidence dans les ententes sur les revendications territoriales;
  • de nouvelles questions sur les titres scolaires les plus récents, le domaine/lieu des études et l'année d'achèvement; les compétences numériques des nouveaux diplômés; des questions modifiées (c.-à-d. titres et fréquentation scolaire) — afin de rehausser la pertinence en tenant compte des modifications apportées dans la prestation de l'enseignement collégial au Canada; d'accroître la qualité; de savoir si les nouveaux diplômés possèdent les compétences numériques qui leur seront nécessaires dans l'économie numérique;
  • de nouvelles questions sur les expériences acquises sur le marché de l'emploi; des questions modifiées sur le déplacement domicile-travail afin d'accroître la pertinence de mieux saisir les expériences acquises sur le marché de l'emploi, comme le sous-emploi et le travail involontairement à temps partiel; une meilleure saisie du navettage afin de mieux combler les besoins des utilisateurs de données.

Ce supplément décrit en outre les procédures en place pour le traitement des empreintes digitales. Conformément à la Politique du gouvernement sur la sécurité, tout le personnel recruté pour le Recensement doit avoir obtenu une cote de fiabilité, qui nécessite la vérification nominale du casier judiciaire (VNCJ) à partir des empreintes digitales, dans le respect de la Norme sur le filtrage de sécurité du Conseil du Trésor. L'organisme travaille avec un tiers fournisseur pour tester l'exécution des tâches automatisées relatives à la vérification des empreintes digitales et de la solvabilité dans le cadre du Test du recensement de 2019.

Nécessité et proportionnalité


La collecte et l'utilisation de renseignements personnels dans le cadre du Test du Recensement de la population de 2019 peuvent se justifier selon la vérification en quatre parties du Commissariat à la protection de la vie privée du Canada :

  • Nécessité : le mandat de Statistique Canada consiste à s'assurer que les Canadiens ont accès à une source fiable de statistiques officielles sur le Canada pour répondre à leurs besoins d'information les plus prioritaires. La production efficace de statistiques pertinentes, accessibles et de grande qualité favorise le fonctionnement efficient de l'économie canadienne et la gouvernance efficace de notre société. Dans l'exécution de ce mandat, Statistique Canada est tenu de réaliser un recensement de la population tous les cinq ans, conformément à la Loi sur la statistique (L.R.C., 1985, a. S-19). Selon la loi, le gouvernement (par l'entremise d'un décret) prescrit les questions à poser dans le recensement. La même loi oblige chaque personne à fournir les renseignements demandés dans le cadre du recensement, et engage Statistique Canada à protéger la confidentialité des renseignements personnels fournis par les répondants. Le prochain recensement aura lieu en mai 2021. Puisqu'il s'agit d'une opération statistique majeure, le recensement constitue un formidable défi pour Statistique Canada et nécessite une planification minutieuse afin d'assurer son achèvement réussi. La réalisation d'un test du recensement, un élément essentiel à sa réussite, est habituellement prévue deux ans avant le recensement. Le contenu proposé pour le recensement découle d'un cadre de détermination du contenu du recensement qui commence par la consultation d'intervenants externes à propos de leurs utilisations des données et de leurs besoins connexes en information, y compris les exigences en matière de pertinence et de qualité, suivie d'une évaluation du contenu canadien qui englobe le fardeau du répondant et les préoccupations sociétales en matière de protection de la vie privée, ainsi que d'une évaluation des facteurs de détermination par Statistique Canada, notamment les coûts, les facteurs opérationnels, la qualité des données et les mesures de protection contre une perte d'efficience ou de qualité dans d'autres programmes de Statistique Canada.

    Le contenu particulier à l'étude répond à des exigences en matière dedonnées hautement prioritaires mentionnées dans les consultations, par exemple :
    • une nouvelle question sur le sexe et des questions modifiées sur le sexe et le lien avec la Personne 1, permettant aux répondants du recensement de déclarer un sexe non binaire, à l'appui des nouvelles normes de Statistique Canada relatives au sexe et au projet de loi C-16 (Loi canadienne sur les droits de la personne);
    • de nouvelles questions sur la langue des ayants droit afin de déterminer le droit des enfants à s'inscrire dans des écoles francophones à l'extérieur du Québec et dans des écoles anglophones à l'intérieur du Québec, dans l'application de l'article 23 de la Charte canadienne des droits et libertés;
    • une nouvelle question d'identification des anciens combattants, qui facilite l'exécution du mandat d'Anciens Combattants Canada, avec des données probantes pour la prestation de services, l'élaboration de politiques, l'évaluation de programme;
    • une nouvelle question sur la santé autodéclarée fournit des données fortement corrélées avec la santé réelle de la personne, un prédicateur fiable des besoins en matière de services de santé, et indiquerait l'état de santé des populations vulnérables et pour de petits domaines;
    • une question modifiée sur l'identité autochtone et une nouvelle question sur les Métis et les Inuits, une mise à jour de la terminologie et la réponse à un besoin de renseignements plus précis sur les Métis; à un besoin de renseignements plus précis sur les Inuits; la résolution de problèmes concernant les données de recensement mis en évidence dans les ententes sur les revendications territoriales;
    • de nouvelles questions sur les titres scolaires les plus récents, le domaine/lieu des études et l'année d'achèvement; les compétences numériques des nouveaux diplômés, titres et fréquentation scolaire, rehaussent la pertinence en tenant compte des modifications apportées dans la prestation de l'enseignement collégial au Canada, accroissent la qualité et déterminent si les nouveaux diplômés possèdent les compétences numériques qui leur seront nécessaires dans l'économie numérique;
    • de nouvelles questions sur les expériences acquises sur le marché de l'emploi et des questions modifiées sur le déplacement domicile-travail, pour une pertinence accrue d'une meilleure capture des expériences acquises sur le marché de l'emploi, comme le sous-emploi et le travail involontairement à temps partiel, de même qu'une meilleure saisie des renseignements sur le navettage afin de mieux combler les besoins des utilisateurs de données.
  • Efficacité : la collecte et l'utilisation de ces données pendant le Test du recensement de 2019 se révéleront efficaces pour l'atteinte des objectifs de Statistique Canada, parce qu'elles servent à garantir que le Recensement de la population de 2021 générera des renseignements pertinents, hautement prioritaires et significatifs sur le plan statistique.

    Un nombre considérable de modifications du contenu sont testées en 2019. Certaines touchent des concepts de base, comme le sexe et qui devrait faire partie du dénombrement d'un ménage (couverture). De nombreuses modifications proposées du contenu de 2021 touchent de plus petits groupes de population (transgenres, non binaires, couples du même sexe; groupes ethniques; résidents ayant des visas de travail ou d'étudiant; populations autochtones; etc.). Pour être efficace, le test du contenu doit discerner avec précision les différences statistiques entre le contenu de 2016 (repère) et les différentes versions du contenu modifié afin que le contenu proposé puisse générer des renseignements pertinents et significatifs sur le plan statistique.
  • Proportionnalité : les données du programme de Recensement de la population brossent un portrait socioéconomique complet de la population canadienne au fil du temps, ce qui respecte les exigences clés des secteurs de politiques, notamment les conditions du marché du travail, l'immigration, les peuples autochtones, la scolarité, la mobilité, le développement des compétences, les langues officielles, le logement et le revenu. Tous les ordres de gouvernement, le secteur privé, les universités et les organismes sans but lucratif ont un besoin vital de ces renseignements pour leur prise de décisions et pour élaborer et surveiller les programmes et les politiques. Pour une réalisation efficiente et réussie du Recensement de la population du recensement de 2019, Statistique Canada procède au Test du recensement de 2019 auprès d'un échantillon de 258 000 ménages de tout le Canada. Le test sert de multiples fins, de la mise à l'essai de questions améliorées ou nouvelles à celle des améliorations apportées aux outils et aux procédures de collecte. La détermination de la taille de l'échantillon et du plan complexe du test fait en sorte que tous les objectifs du test sont atteints, tout en réduisant autant que possible le fardeau du répondant et le coût. Des tests quantitatifs plus modestes ont déjà été réalisés pour faciliter la réduction de la taille de l'échantillon du Test du recensement de 2019. Sans ce test du contenu, un risque significatif menacerait la réussite du Recensement de la population de 2021.
  • Solutions de rechange : Le Programme du recensement est l'une des seules sources d'information pour les petites régions géographiques fondées sur les mêmes concepts statistiques pour l'ensemble du pays, et la seule source d'information pour de nombreuses caractéristiques socioéconomiques.

    La réalisation de tests exhaustifs précédera le Recensement de 2021 afin d'évaluer les modifications apportées au contenu, les documents de communication, les procédures sur le terrain et les méthodes de collecte. Le Test de 2019 vise à mesurer avec précision les comportements des répondants face aux modifications apportées au contenu et aux procédures sur le terrain et aux méthodes de collecte. Des tests volontaires, en 2019, procureraient des résultats imprécis ou non concluants pour un grand nombre de modifications proposées au contenu du questionnaire. La documentation portant sur la collecte des données d'enquête montre que les tests de recensement obligatoires fournissent les mesures les plus précises sur les incidences dans le cadre d'études sur de petits sous-groupes de la population.

    Des réponses volontaires au test pourraient générer un biais de non-réponses, surtout pour les groupes de population plus petits. Des préoccupations du même ordre ont été soulevées dans le contexte de l'Enquête nationale auprès des ménages (ENM) de 2011. L'ENM de 2011 a montré que dans un contexte volontaire, certains répondants ont tendance à omettre des questions ou à abandonner plus souvent, ce qui amplifie la non-réponse à certaines questions, surtout celles situées près de la fin du questionnaire. Ces questions pourraient subir une plus forte incidence et mener à des conclusions erronées, ce qui entraînerait la formulation de recommandations sur le contenu nouveau ou modifié du Recensement de 2021 fondée sur des résultats de test incomplets. De plus, sans réduction du risque de biais de non-réponses, un test volontaire nécessiterait un échantillon de plus grande taille afin de tenir compte du total de non-réponses. Selon un plan provisoire, au moins 60 000 logements additionnels devraient faire partie du test, et compte tenu de la proportion plus élevée de non-réponses prévues, le nombre de rappels et de tentatives de contact avec les ménages sélectionnés serait plus élevé.

    Par ailleurs, bien Statistique Canada continue d'étudier la possibilité d'utiliser de nouvelles sources administratives pour remplacer la collecte des données auprès des répondants, les recherches ne sont pas encore assez avancées pour envisager l'utilisation de données administratives pour remplacer le nouveau contenu à l'étude pour le Recensement de la population de 2021.

Facteurs d'atténuation

Le Test du recensement de 2019 respectera les politiques de Statistique Canada en matière de collecte, de traitement et de diffusion de l'information.

Cette section définit les mesures de protection mises en place pour atténuer les risques pour la protection de la vie privée qui sont mentionnés dans l'EFVP générique, puisqu'ils sont liés à cette activité en particulier.

Entreposage

Les renseignements personnels des répondants parviennent directement à Statistique Canada par l'entremise de questionnaires électroniques sécurisés exploitables sur le Web ou, dans le cas des formats de questionnaire papier, par la poste, directement à un centre de dépouillement sécurisé de Statistique Canada, où les renseignements sont saisis et un document électronique, créé.

Les enregistrements sont conservés dans une base de données des réponses qui renferme les réponses des ménages, dont des renseignements personnels, afin de procéder à des couplages d'enregistrements avec les fichiers de réponses du Recensement de la population de 2016 et les fichiers de données fiscales.

Tous les enregistrements électroniques sont conservés dans l'environnement sécurisé de technologie de l'information de Statistique Canada. Les questionnaires papier sont conservés en toute sécurité dans l'environnement de traitement à accès contrôlé de Statistique Canada.

Les enregistrements sont conservés pour une période de 5 ans après la fin du test du recensement, puis ils sont détruits.

Traitement et analyse

La longue expérience de l'organisme en matière de couplage a montré qu'il est possible d'utiliser des associations particulières d'éléments des renseignements personnels pour identifier des personnes dans différentes sources des données avec un niveau très élevé de confiance, puis de relier les personnes entre divers fichiers.

Les renseignements personnels suivants seront recueillis et utilisés pour effectuer des couplages d'enregistrements :

  • prénom et nom de famille (recueillis);
  • date de naissance (recueillie);
  • sexe (recueilli);
  • adresse réelle complète (puisée dans la base de sondage et recueillie);
  • numéro de téléphone (puisé dans la base de sondage et recueilli);
  • mobilité en un an et en cinq ans (recueillie);
  • pays de citoyenneté (recueilli);
  • lieu de naissance (recueilli);
  • statut d'immigrant (recueilli auprès des répondants ayant reçu un questionnaire témoin ou la version 2 du questionnaire test; ajouté à partir de couplages pour les répondants ayant reçu la version 1 du questionnaire test);
  • année d'immigration (recueillie auprès des répondants ayant reçu un questionnaire témoin ou la version 2 du questionnaire test; ajoutée à partir de couplages pour les répondants ayant reçu la version 1 du questionnaire test);
  • identificateur de la base (puisé dans la base de sondage).

Le couplage des données du Programme du Recensement de la population et des données du Test du recensement de 2019 servira à des analyses statistiques visant à évaluer l'incidence des nouvelles questions ou des questions modifiées du questionnaire en comparant le Test du recensement de 2019 à d'autres sources existantes ou à des données recueillies dans le Recensement de 2016. Le fichier de couplage servira seulement à Statistique Canada, à des fins de recherche, de développement et de traitement méthodologiques. Les données couplées ne donneront lieu à aucune publication d'estimations statistiques.

Les identificateurs personnels, comme le nom, le numéro de téléphone et l'adresse (exception faite du code postal), seront coupés des fichiers couplés et remplacés par un identificateur statistique anonymisé.

Accès

L'accès à toute donnée confidentielle détenue par Statistique Canada fait l'objet d'une étroite surveillance et se limite aux employés désignés, conformément aux exigences opérationnelles du programme. Les employés doivent présenter les justificatifs de l'accès et obtenir l'approbation nécessaire. De plus, toutes les autorisations d'accès s'appliquent uniquement à une durée déterminée et doivent être régulièrement renouvelées, y compris les justificatifs relatifs au renouvellement de l'autorisation.

La base de données des réponses du Test de 2019 n'a pas encore été créée. Le nombre d'employés ayant accès à la base de données des réponses du Test du recensement de 2019 variera en fonction du calendrier des activités de préparation du Recensement de 2021 et de la nécessité, pour le personnel, d'y avoir accès dans le cadre de leur travail. L'accès aux renseignements identificatoires (noms, adresses et numéros de téléphone) que renferme cette base de données sera contrôlé et limité à un petit groupe d'employés ayant besoin de cet accès. La plupart des employés qui analyseront les données n'auront pas accès aux renseignements identificatoires contenus dans la base de données.

Diffusion

Statistique Canada se servira des données recueillies durant le Test du recensement de 2019 seulement à des fins analytiques, sans les rendre publiques. Statistique Canada ne divulguera aucun renseignement personnel provenant du Test du recensement de 2019 sans le consentement du répondant.

Transparence

La politique de Statistique Canada est de fournir à tous les répondants les renseignements sur le but d'une enquête (y compris l'utilisation prévue des statistiques qui seront produites à partir de l'enquête ainsi que les utilisateurs de ces statistiques), l'autorité en vertu de laquelle l'enquête est menée, le caractère obligatoire ou volontaire de la participation à l'enquête, la protection de la confidentialité, les couplages d'enregistrements envisagés et l'identité des parties cosignataires à tout accord de partage des données, s'il y a lieu.

Pour le Test du recensement de 2019, ces renseignements sont fournis dans la lettre d'invitation à remplir le questionnaire du test du recensement, dans le questionnaire électronique lui-même et dans la foire aux questions accessible sur le site Web du Recensement.

Ce supplément à l'EFVP sera mis à la disposition du public sur le site Web de Statistique Canada à titre d'addenda à l'EFVP générique. Statistique Canada a en outre préparé une liste de questions et réponses et de points de discussion pour aider le personnel interne à répondre aux questions du public ayant trait au Test.

Autres facteurs

Cette section présente d'autres considérations relatives à la confidentialité qui sont liées au Test du recensement de 2019.

Utilisation de données administratives pour les logements collectifs

Statistique Canada tente de recueillir auprès des résidents de logements collectifs les mêmes renseignements que ceux recueillis auprès d'autres Canadiens, et a eu recours à diverses méthodes de collecte, dans le passé. Le Test du recensement de 2019 reprendra la méthode utilisée pour le Recensement de 2016, où les dossiers administratifs d'établissements institutionnels ont servi d'instruments de collecte, le cas échéant, pour remplacer les dénombrements directs de résidents.

Messages texte de rappel sur le téléphone cellulaire

En 2016, le Recensement de la population a eu recours à la diffusion de messages vocaux en tant que dernier rappel envoyé aux Canadiens pour qu'ils remplissent leur questionnaire de recensement avant le début des activités de suivi sur le terrain auprès des non-répondants. Ces rappels ont entraîné un nombre accru de réponses. Puisque de plus en plus de Canadiens utilisent des téléphones cellulaires, Statistique Canada envisage la possibilité de recourir à une nouvelle méthode en utilisant des messages texte de rappel dans le Test du recensement de 2019 et de savoir ainsi si cette méthode s'avérerait efficace en tant que complément aux messages vocaux, en 2021.

Le 3 juin 2019, tous les logements non répondants pourvus de numéros de téléphone cellulaire dans le champ de la portion du contenu du test de 2019 (environ 27 000 logements) recevront l'un des trois traitements : un tiers recevra un message vocal de rappel, un tiers recevra un seul rappel textuel et le dernier tiers ne recevra aucun rappel. Il est à noter que lorsque les répondants dans le champ d'enquête reçoivent un troisième rappel par la poste pour remplir leur questionnaire de recensement, ils sont avisés que Statistique Canada pourrait communiquer ensuite avec eux par téléphone ou en personne. Les logements non répondants sans numéro de téléphone cellulaire recevront un message vocal de rappel.

Recrutement d'employés en vertu de la Loi sur la statistique

Les candidats éventuels pour les opérations sur le terrain dans le cadre du Recensement doivent remplir une demande d'emploi par l'entremise de l'Application de recrutement en ligne sécurisée sur le Web. Les renseignements personnels associés à la demande d'emploi sont conservés dans le Portail de gestion de la collecte (outil interne sécurisé de Statistique Canada pour le personnel sur le terrain), qui est dédié à l'EFVP générique de Statistique Canada. Ils comprennent le nom, l'adresse, les coordonnées, le statut de citoyen, l'expérience, les capacités et les références. Les recruteurs se servent de ces renseignements pour sélectionner, tester et interviewer les candidats, ainsi que pour lancer le processus de cote de sécurité.

Conformément à la Politique du gouvernement sur la sécurité, toute personne embauchée pour le Recensement doit obtenir une cote de fiabilité. Le processus d'obtention comprend une vérification nominale du casier judiciaire (VNCJ) à partir des empreintes digitales et une enquête de solvabilité, conformément à la Norme sur le filtrage de sécurité du Conseil du Trésor. Statistique Canada compte effectuer environ 80 000 évaluations de la sécurité pour la cote de fiabilité dans le cadre du processus de dotation pour le Recensement de la population de 2021.

L'organisme travaille avec un tiers fournisseur (en tant que personne réputée être employée) pour tester l'exécution des tâches automatisées relatives à la vérification des empreintes digitales et de la solvabilité dans le cadre du Test du recensement de 2019. Le tiers fournisseur n'aura pas accès aux renseignements des candidats, sauf s'il doit avoir accès au système pour régler des problèmes critiques, auquel cas il devra obtenir l'approbation de sa demande par le Bureau de la sécurité ministérielle après consultation auprès du Programme du recensement. L'accès sera supervisé et soumis à des contrôles d'accès. Deux agents ministériels de la sécurité seront autorisés à accéder aux résultats du filtrage de sécurité durant les périodes de production et de rétention.

L'exécution des tâches liées au filtrage de sécurité commence avec le consentement écrit des candidats à la vérification nominale du casier judiciaire à partir des empreintes digitales et une enquête de solvabilité. Par la suite, leurs empreintes digitales sont prises à l'aide d'appareils de dactyloscopie mobiles et accrédités au cours des séances d'examens de recrutement administrées par le personnel de Statistique Canada. La solution de filtrage de sécurité utilisée pour le test est accréditée par la Gendarmerie royale du Canada (GRC). Cela comprend des lecteurs d'empreintes digitales et une application Web servant à capturer les empreintes digitales des candidats accompagnées de leurs nom, adresse et date de naissance. La solution s'interface en toute sécurité avec les deux systèmes informatiques de la GRC pour effectuer une vérification nominale du casier judiciaire, et avec un service d'établissement de cote de crédit, pour effectuer une enquête de solvabilité. Les résultats sont ensuite envoyés directement au Bureau de la sécurité ministérielle (BSM) de Statistique Canada, par transmission électronique sécurisée faisant partie d'un flux de travail automatisé. Les agents du BSM procèdent à une évaluation plus poussée de tous les candidats n'ayant pas la citoyenneté canadienne, ayant déclaré avoir un casier judiciaire ou avoir séjourné à l'étranger plus de 6 mois au cours des 5 années précédentes. Le personnel de Statistique Canada effectue concurremment des vérifications des références. Les candidats qui passent la sélection par évaluation de la sécurité (vérifications du casier judiciaire et de la solvabilité) et la vérification des références reçoivent une cote de fiabilité et sont jugés admissibles à l'obtenti

Un examen des procédures proposées est réalisé afin d'assurer leur conformité avec l'autorisation pluriinstitutionnelle de disposer de documents portant sur la fonction « administration générale » (98/001) de Bibliothèque et Archives Canada. Comme pour les opérations courantes de Statistique Canada et en vertu de la disposition, les fiches de résultats sur le casier judiciaire et les résultats de l'enquête de solvabilité sont stockés sur un lecteur réseau sécurisé, dans le dossier électronique personnel du candidat, pendant les périodes de conservation exigées :

  • les fiches de résultats sur le casier judiciaire (qui contient les empreintes digitales) et les résultats de l'enquête de solvabilité des candidats qui ont les qualifications requises pour un poste et font partie d'un bassin de candidats (non embauchés) sont conservés pour la durée du bassin, puis détruits de façon sécuritaire;
  • les fiches de résultats sur le casier judiciaire (qui contient les empreintes digitales) et les résultats de l'enquête de solvabilité des candidats embauchés sont conservés pendant deux ans après la fin de l'emploi;
  • les empreintes digitales des candidats ayant échoué au test et n'ayant pas été embauchés n'ont aucune valeur opérationnelle et sont considérées de nature transitoire. Ils sont supprimés de façon sécuritaire dès que la confirmation du fait qu'ils ne sont plus nécessaires.

Conclusion

Cette évaluation conclut que, grâce aux mesures de protection existantes de Statistique Canada, les risques résiduels sont suffisamment faibles pour que Statistique Canada accepte de gérer le risque.

Supplément à l'Évaluation générique des facteurs relatifs à la vie privée de Statistique Canada liée à l'Enquête sur la sécurité individuelle au sein de la population étudiante postsecondaire

Date : Mars 2019

Gestionnaire de programme : Directeur, Division du tourisme et du Centre de la statistique de l'éducation

Introduction

La Plateforme longitudinale entre l'éducation et le marché du travail (PLEMT) st un environnement qui permet l'intégration de variables provenant de sources administratives de base sur l'éducation à celles d'autres ensembles de données sélectionnés. Le PLEMT ne contient aucun identificateur personnel. Des clés de couplage anonymes sont créées à l'aide de l'Environnement de couplage de données sociales (ECDS) à partir duquel a été réalisée une évaluation séparée des facteurs relatifs à la vie privée (Environnement de couplage de données sociales).

Référence au Fichier de renseignements personnels

Conformément à la Loi sur la protection des renseignements personnels, Statistique Canada a enregistré des fichiers de renseignements personnels (FRP) pour ses fonds de renseignements personnels, notamment les ensembles de données de base qui seront couplés par l'intermédiaire de la PLEMT : le Système d'information sur les étudiants postsecondaires (SIEP) (PPU 090), le Système d'information sur les apprentis inscrits (SIAI) (PPU 083) et le fichier sur la famille T1 (FFT1) (PPU 111). L'utilisation aux fins de couplage des renseignements personnels provenant de ces programmes est décrite dans ces FRP en tant qu'usages compatibles.
En cas d'intégration de sources de données supplémentaires à la PLEMT, les FRP pertinents sont ajoutés ou mis à jour, selon les besoins.

Veuillez consulter la page « Renseignements sur les programmes et les fonds de renseignements » pour voir les descriptions de ces fichiers de renseignements personnels.

Raison du supplément

L'évaluation générique des facteurs relatifs à la vie privée (EFVP) de Statistique Canada présente et analyse les principes de protection de la vie privée et les niveaux de risques potentiels à la sécurité ayant trait à ses activités statistiques. Les mesures de protection déjà en place ont été jugées suffisantes pour atténuer les risques potentiels relatifs à la protection de la vie privée associés à la PLEMT.

Ce supplément à l'EFVP vise par conséquent à décrire ce nouvel environnement de données et à illustrer clairement la nécessité d'obtenir ces renseignements personnels afin d'atténuer toute inquiétude que pourraient avoir les Canadiens à propos de cette activité statistique.

Description de l'activité statistique

La Plateforme longitudinale entre l'éducation et le marché du travail (PLEMT) est une plateforme d'ensembles de données intégrés en toute sécurité, qui donne accès, à l'aide de clés d'appariement, à des variables analytiques utilisées en recherche. La PLEMT donne accès à des renseignements longitudinaux anonymisés à propos de cohortes d'étudiants de collèges et d'universités et d'apprentis inscrits, afin de mieux comprendre leur cheminement dans le réseau d'enseignement postsecondaire et l'incidence de leurs études et de leur formation sur leurs perspectives de carrière en termes de gains.

Les recherches faisant appel aux données de la PLEMT porteront sur une grande variété de questions stratégiques relatives à la persévérance des étudiants et des apprentis, à leur achèvement, à leur mobilité et à leurs parcours. Ces données permettront aux décideurs politiques de comprendre les différents parcours que les étudiants peuvent suivre tout au long de leurs études postsecondaires ou de leur formation d'apprenti, de même que les caractéristiques des étudiants qui peuvent être liées à ces parcours. Ces données peuvent aussi servir à éclairer des questions stratégiques liées aux résultats sur le marché du travail : p. ex. quels résultats et expériences postsecondaires sont liés à de meilleurs résultats sur le marché du travail, et comment les caractéristiques (personnelles ou familiales) des étudiants peuvent être liées à leurs résultats sur le marché du travail. Les résultats obtenus à partir de la PLEMT seront aussi utiles aux jeunes Canadiens et à leurs familles lorsqu'ils auront à prendre des décisions concernant leurs études à venir.

Les ensembles de données de base de la PLEMT sont : le Système d'information sur les étudiants postsecondaires (SIEP), le Système d'information sur les apprentis inscrits (SIAI) et le fichier sur la famille T1 (FFT1) (tiré des données de la déclaration de revenus, pour tous les enregistrements couplés à ceux du SIEP et du SIAI). Le SIEP est un fonds de données renfermant toutes les inscriptions et tous les grades décernés par les collèges et universités publics du Canada selon le type de programme/diplôme d'études et le domaine d'études pour chaque année scolaire. Le SIAI est un ensemble de données administratives annuelles pancanadiennes (provinciales et territoriales) sur les apprentis inscrits et les travailleurs qualifiés. Le PLEMT de base comprend les données du SIEP à partir de 2009, les données du SIAI à partir de 2008, et les données du FFT1 à partir de 1992 pour toutes les provinces et tous les territoires.

L'intégration d'autres ensembles de données à la PLEMT à l'aide de l'ECDS décrite en détail ci-dessous sera nécessaire pour traiter des questions de recherche additionnelles connexes. Dans ces nouveaux ensembles de données, les fichiers de renseignements personnels seront ajoutés ou mis à jour, selon les besoins.

Les identificateurs personnels obtenus sur les étudiants postsecondaires et les apprentis sont utilisés dans l'ECDS pour attribuer des identificateurs statistiques anonymes qui permettent à Statistique Canada de les relier à d'autres sources d'information en sa possession aux fins d'analyse statistique et de recherche, une fois qu'il en aura obtenu l'approbation, conformément à la Directive sur le couplage de microdonnées. Les identificateurs personnels obtenus sont retirés du reste des renseignements et conservés de façon sécuritaire, leur accès étant restreint à tout au plus 25 employés de Statistique Canada ayant une exigence opérationnelle de les consulter, accès qui leur est retiré dès qu'il n'est plus nécessaire. La Directive sur la gestion des fichiers de microdonnées statistiques de Statistique Canada prescrit la durée de leur conservation avant leur élimination. En aucun cas les renseignements personnels sur les étudiants obtenus d'établissements d'enseignement postsecondaire et de formation d'apprentis serviront à des fins administratives ou analytiques.

Les ensembles de données intégrés dans la PLEMT sont assujettis aux exigences de confidentialité de la Loi sur la statistique. Comme pour toutes les données recueillies en vertu de la Loi sur la statistique, les ensembles de données analytiques intégrés qui sont accessibles à des fins de recherche ne renferment aucun identificateur personnel. Un accès est accordé aux chercheurs qui sont considérés comme des employés de Statistique Canada une fois qu'ils ont obtenu leur cote de sécurité et porté un serment de discrétion conformément à la Loi sur la statistique. L'accès aux données est approuvé en cas de besoins particuliers, pour un laps de temps donné, et doit avoir lieu dans des conditions sécurisées comme les bureaux de Statistique Canada ou les centres de données de recherche. Statistique Canada examine minutieusement tous les extrants pour en assurer la confidentialité avant les retirer du milieu sécurisé ou de les divulguer au public.

Seuls des renseignements statistiques agrégés et non confidentiels sur les étudiants et les apprentis canadiens seront rendus publics et, par conséquent, aucune personne ne sera identifiable dans les produits divulgués au public. Jamais un renseignement personnel ne sera divulgué sans le consentement de celui qui a recueilli les données à l'origine et l'autorisation du statisticien en chef, selon ce qu'exige la Loi sur la statistique.

Les Canadiens auront accès aux résultats obtenus à partir de la PLEMT dans une foule de produits, notamment des tableaux de données et des rapports d'analyse, publiés par Statistique Canada. Voici quelques exemples des avantages que les résultats procurent aux Canadiens : l'obtention des renseignements aux futurs étudiants et apprentis inscrits sur les gains par domaine d'études et métier; des perspectives sur les parcours d'études que les décideurs politiques pourraient utiliser pour mettre sur pied des programmes qui répondent mieux aux besoins des étudiants durant leurs études; des aperçus des caractéristiques familiales et générales des étudiants qui influent sur leur participation aux études postsecondaires et leur achèvement de celles-ci, dont peuvent se servir les décideurs politiques pour éclairer leurs décisions visant à optimiser la participation aux études postsecondaires et le taux de réussite.

Nécessité et proportionnalité

L'utilisation de renseignements personnels pour la PLEMT peut se justifier selon la vérification en quatre parties du Commissariat à la protection de la vie privée du Canada :

  1. Nécessité : La Plateforme longitudinale entre l'éducation et le marché du travail est une initiative conjointe de Statistique Canada, d'Emploi et Développement social Canada et des ministères provinciaux et territoriaux responsables des études postsecondaires qui vise à étendre les possibilités des ensembles de données administratives existants. La PLEMT permet l'intégration de différents ensembles de données, tant longitudinales que transversales, afin de faciliter le traitement d'un vaste éventail de questions prioritaires ayant trait à la persévérance des étudiants et des apprentis, de l'achèvement, de la mobilité, du parcours pédagogique et des résultats sur le marché du travail en fonction du temps, qu'il serait impossible de traiter à partir des seuls ensembles de données annuelles sous-jacents. La PLEMT facilite la production et la publication d'analyses, d'indicateurs et de tableaux de données portant sur ces sujets. Elle est essentielle à l'analyse longitudinale des données du SIEP et du SIAI, et à l'analyse entre établissements institutionnels et provinces/territoires.

  2. Efficacité : La PLEMT fait nettement augmenter les possibilités analytiques en rendant le SIEP et le SIAI longitudinaux. De plus, leur intégration à d'autres sources de données qui renferment des renseignements contextuels et sur les résultats des étudiants postsecondaires et les apprentis comblera les lacunes de données observées, ce que seuls des enregistrements administratifs peuvent faire. Il est par exemple possible de comparer les gains après l'achèvement de divers types de programmes d'enseignement ou de formation, pour différents types d'étudiants, à l'aide de données administratives au lieu de données d'enquête, ce qui réduit considérablement le fardeau imposé aux Canadiens. Il est possible d'examiner les parcours relatifs aux études postsecondaires au fil du temps et entre les établissements institutionnels et les provinces/territoires. Plusieurs années de données administratives existantes permettront d'établir les taux d'achèvement de programme au lieu de devoir attendre la fin d'un ou de plusieurs cycles d'une nouvelle enquête.

    Les ensembles de données analytiques comportant des clés d'appariement anonymes dont les chercheurs approuvés (de « personnes réputées être employées ») disposent par l'intermédiaire des centres de données statistiques de Statistique Canada élargissent les possibilités d'accès et de recherche chez les intervenants et autres pour l'utilisation de ces renseignements étoffés et l'habilitation de nouveaux projets.

  3. Proportionnalité : Toute utilisation de renseignements personnels suppose un certain degré d'intrusion perçue et oblige à gérer minutieusement la situation. La conception des méthodes et pratiques applicables à la PLEMT (et à l'ECDS) vise la protection de la vie privée et des renseignements personnels, tout en conservant la capacité d'intégrer des variables analytiques issues de différentes sources existantes pour combler les lacunes de données.

    En plus de combler les lacunes de données, la mise au point de la PLEMT offre des possibilités de recherche additionnelles sur les ensembles de données de base pour éclairer les politiques et les pratiques. Intégrer les ensembles de données administratives actuelles de Statistique Canada permet d'entreprendre de nouvelles analyses statistiques étendues. Cela permet également de prochains travaux de couplage avec d'autres bases de données administratives et axées sur les enquêtes de Statistique Canada — là encore en enrichissant et en élargissant les possibilités analytiques pour mieux éclairer les politiques publiques et la recherche.

  4. Autres données : La PLEMT fournit des clés pour apparier les enregistrements annuels d'étudiants et d'apprentis en fonction du temps. Sans cette option de données longitudinales, il est impossible d'analyser les parcours des étudiants dans les programmes d'études postsecondaires et de formation d'apprentis. Impossible aussi d'en tirer des indicateurs de rendement longitudinaux, comme les taux d'achèvement. L'appariement d'un recensement de données administratives sur les étudiants postsecondaires et les apprentis inscrits à des renseignements fiscaux sur les gains permet d'analyser à un niveau plus poussé les diplômes d'études et les types de programmes, de même que les résultats après les études. Dans un environnement sécurisé approuvé, les employés et les personnes réputées être employées peuvent analyser les liens entre les parcours d'étudiants et leurs résultats sur le marché du travail, sur une base annuelle. Aucune autre source ne permet une analyse aussi détaillée. Les sources d'enquête sont limitées par la taille de l'échantillon, les taux de réponse et une collecte moins fréquente, en plus du manque de détail des données. Une nouvelle enquête est dispendieuse et porteuse d'un fardeau de réponse. Statistique Canada a des preuves depuis longtemps de l'importante diminution des taux de réponse aux enquêtes longitudinales au fil du temps, ce qui entraîne un biais et réduit nettement la qualité et l'exactitude. C'est la raison pour laquelle la majorité des enquêtes longitudinales ont été abandonnées.

Transparence

Un résumé de ce supplément à l'EFVP sera mis à la disposition du public sur le site Web de Statistique Canada à titre d'addendum à l'EFVP générique. Vous trouverez une série de guides de référence décrivant la PLEMT sur le site Web de Statistique Canada (« Guides de référence technique de la Plateforme longitudinale entre l'éducation et le marché du travail (PLEMT) » (numéro 37200001 au catalogue). Le site Web de Statistique Canada présente également des renseignements sur les ensembles de données accessibles sur la PLEMT par l'intermédiaire de ses centres de données de recherche et sur les projets de recherche basés sur la PLEMT (Liste de tous les projets des CDR réalisés au cours des 12 derniers mois).

Statistique Canada a collaboré avec le Conseil des ministres de l'Éducation (Canada) (CMEC) et le Conseil canadien des directeurs de l'apprentissage (CCDA), et EDSC, afin d'obtenir les priorités relatives aux questions de recherche à orientation prédéterminée. Ces communications serviront à guider le développement de la PLEMT et à établir l'ordre de priorité des ensembles de données à ajouter. Statistique Canada travaille à un plan visant à accroître la transparence relative à l'utilisation de données administratives pour le développement de la PLEMT et poursuit ses travaux concertés avec le CMEC et le CCDA pour assurer l'efficacité des documents de communication qui en découleront.

Fichiers analytiques de données longitudinales sur les employés et les entreprises

Aperçu

Aperçu des fichiers analytiques de données longitudinales sur les employés et les entreprises

Programmes et applications

Liste des fichiers analytiques et exemples d'applications utilisant les fichiers analytiques de données longitudinales sur les employés et les entreprises

Pour commencer

Différentes façons d'accéder à nos données et de les utiliser pour votre propre projet de recherche


Statistique Canada a utilisé les données administratives sur les entreprises et les employés pour créer plusieurs fichiers de données longitudinales et couplables permettant d'effectuer des analyses longitudinales exhaustives. En plus d'intégrer de l'information provenant de diverses sources de données, ces fichiers comprennent également une gamme de variables analytiques tirées des études de Statistique Canada qui se sont avérées appropriées à des fins de recherche.

Grâce aux couplages avec ces fichiers analytiques, on obtient une perspective reposant sur diverses sources concernant la dynamique des employés et des entreprises. On peut ainsi procéder à une analyse détaillée des tendances relatives au marché du travail, du comportement des entreprises, de l'innovation et de la productivité pour appuyer la recherche politique et économique fondée sur des données probantes. Le couplage novateur s'appuyant sur diverses sources élargit le potentiel que recèlent les données existantes pour répondre aux besoins analytiques en matière d'information longitudinale et permet aux chercheurs d'étudier des questions de recherche complexes.

Aperçu

Au cours des dernières décennies, Statistique Canada a utilisé les données administratives sur les entreprises et les employés pour créer plusieurs fichiers de données longitudinales et couplables permettant d'effectuer des analyses longitudinales exhaustives. Les principales initiatives comprennent le couplage des données sur les personnes et sur les entreprises au moyen de la Base de données canadienne sur la dynamique employeurs-employés, du Fichier de données longitudinales sur la main-d'œuvre, de la Base de données sur la mobilité intergénérationnelle du revenu et des Microdonnées de recherche sur les entreprises.

Liste des fichiers analytiques

Avantages des fichiers analytiques de données longitudinales sur les employés et les entreprises

En plus d'intégrer de l'information provenant de diverses sources de données, ces fichiers comprennent également des variables analytiques dérivées qui sont fondées sur les études de Statistique Canada. Par exemple, les indicateurs de cessation d'emploi temporaire et permanente, les mesures de la valeur ajoutée et de la productivité du travail au niveau de l'entreprise, les activités d'innovation et de brevetage, les activités d'importation et d'exportation, ainsi que les mesures relatives à la propriété d'entreprise et à la diversité de la main-d'œuvre.

Grâce aux couplages avec ces fichiers analytiques, on obtient une perspective reposant sur diverses sources concernant la dynamique des employés et des entreprises. On peut ainsi procéder à une analyse détaillée des tendances du marché du travail, du comportement des entreprises, de l'innovation et de la productivité pour appuyer la recherche politique et économique fondée sur des données probantes. Parmi les autres avantages, mentionnons les suivants :

Pour en savoir plus sur le fonctionnement du couplage de microdonnées, veuillez consulter la page Couplage de microdonnées.

Confidentialité et protection des renseignements personnels

Statistique Canada ne divulgue aucun renseignement permettant d’identifier un particulier, un ménage, une entreprise ou une exploitation agricole sans son consentement ou sans que la Loi sur la statistique l’y autorise (Confidentialité et protection des renseignements personnels). Avant leur diffusion, les résultats finaux des enquêtes sont passés au peigne fin pour qu’on ne puisse déduire aucune information des statistiques publiées.

Pour obtenir de plus amples renseignements, veuillez consulter la page du Centre de confiance de Statistique Canada.

Produits et applications

Avec l'intégration et le développement de fichiers analytiques provenant de différentes sources et de différents domaines, le traitement annuel a servi à mettre au point différents fichiers analytiques couplables pour les employés et les entreprises aux fins des plateformes analytiques suivantes.

Liste des plateformes analytiques

Application des fichiers analytiques couplés dans les études

Ces fichiers de données ont été largement utilisés pour répondre à un éventail de questions de recherche importantes, contribuant ainsi à améliorer la compréhension de l'économie et de la société canadiennes.

Tableaux de données de l'Entrepôt commun de données de sortie de Statistique Canada qui utilisent des renseignements extraits des fichiers analytiques de données longitudinales sur les employés et les entreprises

Pour commencer

Statistique Canada reconnaît que les utilisateurs de données ont besoin d’accéder à des microdonnées à l’échelle de l’entreprise, du ménage ou de la personne à des fins de recherche. Afin d’encourager l’utilisation des microdonnées, Statistique Canada offre un large éventail de solutions d’accès au moyen d’une série de canaux en ligne, d’installations et de programmes pour les utilisateurs de données, tout en assurant la protection des renseignements personnels et la confidentialité des répondants. Plusieurs façons permettent aux utilisateurs d’accéder aux fichiers analytiques de données longitudinales sur les employés et les entreprises. Les utilisateurs peuvent notamment consulter les tableaux de données actuels (voir la liste dans la section sur les produits et applications), accéder à des microdonnées confidentielles ou demander des produits personnalisés.

Accès à des microdonnées confidentielles

En raison de la complexité des données couplées et de la nécessité de respecter les exigences en matière de confidentialité, les fichiers de données longitudinales sur les employés et les entreprises ne sont pas disponibles en tant que fichiers de microdonnées à grande diffusion ou par l'entremise du système d'accès à distance en temps réel. Les chercheurs externes qui se consacrent aux politiques et les chercheurs universitaires peuvent accéder aux fichiers analytiques de données longitudinales sur les employés et les entreprises (liste des fichiers analytiques) en tant que personnes réputées être employées ayant des projets de recherche approuvés grâce à diverses solutions sécurisées, dont les centres de données de recherche (CDR). Des renseignements détaillés concernant la demande d'accès aux données se trouvent sur la page Processus de demande et lignes directrices du CDR. L'accès des personnes réputées être employées est assujetti aux exigences juridiques et politiques de Statistique Canada, en particulier la Directive sur l'utilisation de personnes réputées être employées.

Accès aux données pour les utilisateurs de données universitaires

Des CDR sont situés sur les campus universitaires partout au Canada et leur personnel est composé d'employés de Statistique Canada. Ces centres sont accessibles aux utilisateurs de données accrédités affiliés à l'organisme d'accueil.

Le CDR virtuel, qui sera lancé en 2025, fournira une infrastructure virtuelle moderne qui offrira aux chercheurs universitaires un accès sécurisé aux microdonnées de Statistique Canada grâce à un partenariat avec le Réseau canadien des centres de données de recherche. Les utilisateurs de données admissibles auront accès aux données dans les installations sécurisées des CDR, ainsi qu'à partir d'autres « lieux de travail autorisés » (p. ex. à la maison ou au bureau).

La confidentialité de toutes les données produites est vérifiée par des employés de Statistique Canada avant d'être communiquée aux utilisateurs de données.

Accès aux données pour les utilisateurs de données de gouvernement

Le Centre fédéral de données de recherche (CFDR) offre aux employés des gouvernements fédéral, provinciaux et municipaux et aux utilisateurs de données d'organisations non gouvernementales et du secteur privé un environnement sécurisé pour accéder à des microdonnées confidentielles. Les installations physiques du CFDR sont situées dans la région de la capitale nationale.

Les utilisateurs accrédités du CFDR, dont les projets de recherche sur les microdonnées admissibles ont été approuvés, peuvent accéder aux microdonnées confidentielles à distance, dans des lieux de travail autorisés, par l'entremise du Laboratoire virtuel de données. Les frais exigés pour l'accès varient en fonction du projet.

La confidentialité de toutes les données produites est vérifiée par des employés de Statistique Canada avant d'être communiquée aux utilisateurs de données.

Demande de produits personnalisés

Statistique Canada offre également divers produits et services personnalisés pour répondre aux besoins en information, notamment des données, des totalisations et des analyses sur mesure (certains ne peuvent être produits que dans le cadre de projets fondés sur un recouvrement des coûts).

Pour obtenir de plus amples renseignements, veuillez envoyer un message à l'adresse analyticalstudies-etudesanalytiques@statcan.gc.ca.

Environnement de fichiers couplables – Entreprises

Survol

Survol de l'Environnement de fichiers couplables – Entreprises

Programmes et applications

Exemples de programmes et d'applications utilisant l'Environnement de fichiers couplables – Entreprises

Pour commencer

Ce qu'il faut considérer avant d’entamer un projet de couplage d’enregistrements à l’aide de l’Environnement de fichiers couplables – Entreprises


L'Environnement de fichiers couplables – Entreprises * (EFC-E) est l'espace virtuel dans lequel les microdonnées sur les entreprises tirées de sources administratives et d'enquêtes de Statistique Canada sont couplées aux fins d'analyse et de recherche afin de produire des renseignements précieux sur l’économie canadienne.

Le couplage de microdonnées est une méthode statistique dont l'objectif est de maximiser l'utilisation des renseignements existants en couplant différents fichiers et différentes variables pour créer de nouveaux renseignements qui servent l’intérêt des Canadiens. En appliquant cette méthode aux données sur les entreprises, l’EFC-E crée de nouveaux renseignements sans imposer de fardeau de réponse additionnel aux entreprises ni engendrer de coûts de collecte additionnels pour les intervenants.

En plus des données sur les entreprises, l'EFC-E comprend désormais des couplages avec les bases de données sociales, comme le Recensement de la population et la Base de données longitudinales sur l'immigration. Ces couplages enrichissent l'EFC-E en intégrant certains renseignements, comme le genre, l'âge, le groupe racisé, le niveau de scolarité et la langue des propriétaires d'entreprises et des employés.

Les bases de données découlant de ces couplages permettent de combler les lacunes en matière de données et d'appuyer la recherche et les politiques des ministères fédéraux, des administrations publiques provinciales et des chercheurs universitaires. Pour obtenir une description mise à jour de l'EFC-E ainsi qu'une liste de ses sources de données, consultez la page de la Base de métadonnées intégrée de Statistique Canada.

Principaux thèmes couverts par les sources de données de l'Environnement de fichiers couplables – Entreprises

Principaux thèmes couverts par les sources de données de l'Environnement de fichiers couplables – Entreprises
Description - Principaux thèmes couverts par les sources de données de l'Environnement de fichiers couplables – Entreprises

Cette image représente un diagramme circulaire montrant les principaux thèmes couverts par les sources de données de l’Environnement de fichiers couplables - Entreprises. Le côté gauche du cercle représente les thèmes couverts par les sources de données d'enquête et le côté droit, ceux couverts par les sources de données administratives. Au centre du diagramme circulaire se trouve un autre cercle, plus petit, dans lequel on peut voir, à gauche, le Registre des entreprises entouré par le mot « Entreprises ». Du côté droit de ce cercle de plus petite taille, on peut voir le recensement et la Base de données longitudinales sur l'immigration, avec les mots « Propriétaires et employés » autour. Au centre de ce cercle plus petit, on trouve l'image d'un édifice du côté gauche, et l'image d'une personne du côté droit.

Parmi les exemples de thèmes figurant du côté gauche du diagramme circulaire réservé aux données d'enquête, il y a l'innovation, la recherche et développement, les petites et moyennes entreprises, la propriété intellectuelle et l'investissement et le commerce.

Parmi les exemples de thèmes figurant du côté droit du diagramme circulaire réservé aux données administratives, il y a les données fiscales, l'emploi, le soutien à la croissance et à l'innovation en entreprise, le crédit d'impôt pour la recherche et développement, et les importateurs et les exportateurs.

Foire aux questions

  • Quels sont les avantages de l'utilisation de l'Environnement de fichiers couplables – Entreprises?

    I have logged onto my Electronic File Transfer account, where is the dataset?

    L'EFC-E permet aux utilisateurs de produire de nouveaux renseignements sur les entreprises grâce au couplage de microdonnées de sources de données existantes. Il favorise ainsi l'utilisation efficace des fonds de données existants, en plus de réduire le fardeau de réponse des entreprises canadiennes. Par ailleurs, il permet de combler les lacunes existantes en matière de données, d'englober l'ensemble des entreprises canadiennes et de produire de longues séries de données, ce qui facilite les comparaisons harmonieuses.

  • Quels types de couplages peut-on effectuer dans l’Environnement de fichiers couplables – Entreprises? 

    What output will I receive?

    Les couplages sont effectués pour les entreprises, au niveau de l’entreprise en tant qu’unité statistique.

  • Quels autres types de couplage peut-on effectuer à Statistique Canada?

    Why is my output file name different than my submitted file name?

    En ce qui concerne les couplages effectués au niveau de la personne, consultez la page Web de l'Environnement de couplage de données sociales.
    Les bases de données ouvertes constituent la composante centrale de l'Environnement de couplage de données ouvertes.

  • Comment puis-je en savoir plus sur l'Environnement de fichiers couplables – Entreprises?

    How are the data rounded?

    Si vous avez des questions à propos de l'EFC-E ou d'un projet potentiel pour celui-ci, écrivez-nous à statcan.elfe-eefc.statcan@statcan.gc.ca.

L'importance des données désagrégées : introduction (partie 2)

Numéro de catalogue : 892000062024002

Date de diffusion : le 16 juillet 2024 Mise à jour : le 9 juillet 2025

Cette courte vidéo explique comment l'utilisation de données désagrégées peut aider les décideurs à élaborer des politiques plus précises et plus efficaces, puisqu'ils seront en mesure de cerner les besoins et les défis uniques des différents groupes démographiques.

Étape du parcours des données
Fondation
Compétence des données
  • Création et utilisation de métadonnées
Audience
Essentiel
Conditions préalables suggérées
L'importance des données désagrégées : introduction (partie 1)
Durée
09:42
Coût
Gratuit

Voir la vidéo

L'importance des données désagrégées : Introduction (partie 2) - Transcription

(Le symbole de Statistique Canada et le mot-symbole du Canada est présent avec le titre suivant : « L'importance des données désagrégées : Introduction (partie 2) ».)

Qu'est-ce que les données désagrégées?

Dans un pays comme le Canada, on peut s'attendre à voir des portraits diversifiés de communautés, de groupes ethnoculturels, de stade de la vie, de genre et de professions. Ces groupes de personnes, petits ou grands, peuvent être confrontés à différents défis socio-économiques ou obtenir divers résultats tout au long de la vie, notamment en ce qui concerne la réussite scolaire ou les trajectoires sur le marché du travail. Certains groupes peuvent même être plus vulnérables et avoir des problèmes de santé mentale au cours de leur vie, ou même se retrouver sans abris. Pour mieux comprendre les données, nous les désagrégeons. Cela signifie que les données soigneusement recueillies et agrégées, soit l'étape essentielle pour veiller à ce que les données demeurent confidentielles, sont par la suite ventilées en catégorie plus fine pour diverses populations, régions ou toute autre combinaison de caractéristiques.

Où pouvez-vous trouver des données désagrégées?

Compte tenu de l'utilité potentielle des données désagrégées, vous pourriez aussi vous poser la question suivante, où puis-je trouver les données dont j'ai besoin? En réalité, vous devriez peut-être consulter plusieurs sources pour obtenir toutes les réponses à vos questions. Pour brosser un portrait complet, vous devrez peut-être combiner des données provenant de diverses sources. Les nombreux produits et services de Statistiques Canada peuvent être très utiles. Notre site web donne accès à un large éventail de rapports de recherche et de données désagrégées. Provenant d'une collection croissante d'enquêtes et de sources de données administratives, ces données peuvent également être complétées par de précieux renseignements qualitatifs provenant de personnes ayant une expérience vécue, d'activités de mobilisation et de consultation ou toute autre sources de renseignement qualitatif.

Chaque initiative nécessitera l'analyse de différents groupes de données désagrégées

(Catégories à l'écran révélé un à la suite de l'autre : « Genre et/ou sexe », « Âge », « Diversité ethnoculturelle », « Identité autochtone », « Géographie », « Niveau de scolarité », « Profession », « Revenu », « Orientation sexuelle », « Invalidité », « Langue », « Statut d'immigration », « Emploi », « Situation familiale », « Et bien d'autres... ».)

Voici quelques exemples de groupes de données désagrégées qu'il est important de prendre en considération aujourd'hui. Chaque jour, nous évoluons en tant que personne et nous devons relever des défis précis liés à l'étape où nous en sommes dans la vie. Certains d'entre nous s'occupent de jeunes enfants ou de personnes âgées. D'autres pourraient entamer des études universitaires ou chercher à perfectionner leurs compétences après avoir perdu un emploi. En 2022, le Canada a accueilli plus d'un million d'immigrants. Beaucoup sont donc nouveaux dans le pays. Les données désagrégées reflètent qui nous sommes et aident à déterminer les défis auxquels nous sommes confrontés à un moment donné. Chaque politique ou initiative devra déterminer les groupes de personnes sur lesquelles mettre l'accent. Ces groupes évolueront au fil du temps, au fur et à mesure que nos collectivités changent. Prenons l'exemple de Samir. Il s'est penché sur la géographie, l'âge et l'incapacité pour améliorer la prestation des services de transport public à Greendale. Une autre initiative devra prendre en compte des groupes différents. Essentiellement, les données désagrégées signifient que vous pouvez adapter l'analyse à vos besoins.

Il en est de même pour les initiatives orientées vers les entreprises

(Catégories à l'écran révélé un à la suite de l'autre : « Géographie », « Secteur », « Taille de l'entreprise », « Sous contrôle étranger ou national », « Exportateur/importateur », « Propriété majoritaire des groupes (p. ex. les femmes, les Autochtones, les personnes racisées) », « Constitué en société », « Âge de l'entreprise », « Et bien d'autres... ».)

Tout comme les personnes, les entreprises ne sont pas toutes identiques. Il est également important pour les politiques ou les programmes qui ciblent les entreprises de prendre en compte les groupes de données désagrégées. Chacune de ces caractéristiques peut avoir une influence sur les résultats et les défis des entreprises. Prenons par exemple une petite entreprise de restauration exploitée par un nouvel immigrant. Cette petite entreprise devra relever des défis différents de ceux d'une usine alimentaire appartenant à une entreprise multinationale.

Désagrégeons les données selon le sexe

Voici un exemple de données désagrégées. Imaginons que vous avez comme tâche de créer une initiative stratégique pour aider les gens à se trouver un emploi. Imaginons d'abord le taux de chômage pour l'ensemble du Canada afin de déterminer s'il y a des écarts considérables entre les hommes et les femmes. Le taux de chômage reflète principalement les personnes à la recherche d'un emploi. Ce taux est exprimé en pourcentage de l'ensemble de la population active, c'est-à-dire les personnes qui ont un emploi ou cherchent du travail. Pour 2023, les résultats sont relativement comparables entre les genres, le taux de chômage atteignant 5, 4 % pour les femmes et 5, 6 % pour les hommes. Ces tendances reflètent les performances de l'économie et du marché du travail cette année-là. La ventilation des données en fonction du genre ne semble pas suffire pour cerner les écarts notables. Voilà pourquoi nous devons analyser les données plus profondément et ajouter d'autres dimensions de désagrégation pertinentes afin de comprendre la situation de chômage.

Désagrégeons les données selon le sexe et l'âge

Désagrégeons maintenant les données selon le genre et l'âge. En consultant le graphique, nous pouvons constater que les jeunes âgés de 15 à 24 ans affichent des taux de chômage plus élevés que les personnes faisant partie du principal groupe d'âge actif et les personnes plus âgées. De plus, le taux de chômage chez les jeunes hommes est légèrement supérieur à celui des jeunes femmes. Environ un jeune homme sur neuf faisant partie de la population active n'occupe pas d'emplois. Le taux de chômage de ce groupe était de 11,6 % en 2023. À titre de comparaison, le taux de chômage chez les jeunes femmes était de 10,1 %. Quels seraient les autres facteurs d'identité qui pourraient être pris en compte dans cette analyse? Comme nous savons déjà que le Canada compte une population de jeunes très diversifiées, il pourrait être intéressant de désagréger les données en fonction de l'appartenance à un groupe racialisé, en plus du genre et de l'âge.

Désagrégeons les données selon le sexe, l'âge et l'appartenance à un groupe racisé

Dans les données dont nous disposons, nous constatons que l'appartenance à un groupe racialisé est mesurée au moyen de la variable "minorité visible". Si nous ciblons les jeunes âgés de 15 à 24 ans et que nous désagrégeons davantage les données selon le genre et selon l'appartenance à un groupe de minorité visible, nous observons de nouveaux écarts: chez les jeunes, les hommes appartenant à un groupe de minorité visible affichaient le plus haut taux de chômage établi à 13,2 %, suivi de près par les jeunes femmes appartenant à un groupe de minorités visibles établis à 12,8 %. En revanche, les jeunes femmes qui n'appartiennent pas à un groupe de minorités visibles affichent le taux le plus bas, c'est-à-dire un peu moins de 9 %. À ce stade, vous commencez peut-être à penser à comment aider les jeunes de groupes précisés à se trouver un emploi. Par contre, il s'agit encore d'un vaste groupe ayant des variations notables en matière de caractéristiques du marché du travail. Procédons donc à une désagrégation plus approfondie.

Désagrégeons les données selon le sexe, l'âge et l'appartenance à un groupe racisé précis

Examinons les résultats des cinq plus grands groupes de minorités visibles du Canada. Encore une fois, d'importants écarts sont observés lorsqu'on ajoute un autre niveau de désagrégation. Parmi les jeunes hommes. Les jeunes noirs et les jeunes arabes semblent être confrontés à des taux de chômage plus élevés comparativement à la moyenne globale représentée par la barre bleue. Quant aux jeunes femmes, le taux de chômage est légèrement supérieur à la moyenne globale dans la plupart des groupes racialisés, bien qu'il soit inférieur chez les jeunes femmes Philippines. Selon ces données désagrégées, vous pourriez réfléchir à la manière de vous assurer que votre initiative stratégique vise certains groupes plus susceptibles d'avoir besoin d'aide pour trouver un emploi, comme les jeunes de groupes racialisés en général et les jeunes hommes noirs et arabes en particulier.

(Texte à l'écran superposé sur une forme d'entonnoir : « Genre », « Âge (jeunes) », « Appartenance à un groupe racisé » et « Sud-asiatique, Chinois, Noir, Philippin, Arabe ».)

Comme nous l'avons vu dans cet exemple, l'utilisation de données désagrégées peut aider les décideurs à élaborer des politiques plus ciblées et plus efficaces, puisqu'ils seront en mesure de cerner les besoins et les défis uniques des différents groupes démographiques. Dans cet exemple, si nous avions fondé notre analyse seulement sur le taux de chômage au niveau national ou sur les femmes et les hommes, cela n'aurait pas suffi pour veiller à ce que notre intervention stratégique vise les personnes les plus à risque. Ceci n'est qu'un exemple. Selon votre organisation ou vos besoins analytiques, vous pouvez désagréger les données de différentes manières. Dans votre situation, la géographie ou une autre caractéristique pourrait être un facteur pertinent. Ce qui importe de souligner, c'est qu'il faut souvent appliquer diverses couches ou divers niveaux de désagrégation pour obtenir tous les faits.

(Le mot-symbole « Canada » s'affiche.)

L'importance des données désagrégées : introduction (partie 1)

Numéro de catalogue : 892000062024001

Date de diffusion : le 16 juillet 2024

Cette courte vidéo explique comment il est efficace d'utiliser des données désagrégées pour tous les ordres de gouvernement et toutes les organisations au service des collectivités pour prendre des décisions de politique publique fondées sur les données probantes. En utilisant des données désagrégées, les décideurs sont en mesure de concevoir des politiques plus appropriées et plus efficaces qui répondent aux besoins de chaque Canadien diversifié et unique.

Étape du parcours des données
Fondation
Compétence des données
  • Création et utilisation de métadonnées
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
03:38
Coût
Gratuit

Voir la vidéo

L'importance des données désagrégées : Introduction (partie 1) - Transcription

(Le symbole de Statistique Canada et le mot-symbole du Canada est présent avec le titre suivant : « L'importance des données désagrégées : Introduction (partie 1) ».)

(Texte à l'écran : Voici Samir.)

Samir est urbaniste. Il contribue à améliorer les transports publics dans la municipalité en pleine croissance de Greendale. Un jour, il reçoit un rapport sur son bureau : « 80 % des habitants de la ville sont satisfaits du système de transport public actuel. » C'est formidable, n'est-ce pas?

(Texte à l'écran : Carte de Greendale. La carte est divisée en trois catégories : Nord, Centre et Sud. Une quatrième catégorie intitulé « personnes âgées » est dispersée sur l'ensemble de la carte.)

Qu'adviendrait-il si Samir était en mesure d'exploiter des ressources qui lui permettraient d'analyser le rapport plus en profondeur? Puisque Samir possède des connaissances et qu'il sait comment accéder aux données utilisées pour rédiger le rapport, il est en mesure de décomposer (ou de désagréger) les données d'une manière plus approfondie. Il découvre ce qui suit :

  • Seulement 60 % des résidents du secteur du nord de la ville sont satisfaits et se plaignent souvent de l'irrégularité des services d'autobus.
  • Dans le secteur du centre, où habitent de nombreux employés de bureau, on observe une sursaturation d'autobus pendant les heures creuses, mais une pénurie d'autobus pendant les heures de pointe.
  • Le secteur du sud, plus récent et doté d'infrastructures récentes, bénéficie d'un taux de satisfaction de 95 %.
  • Les personnes âgées, qui représentent un pourcentage non négligeable de la population de la ville, affichent un taux de satisfaction de 50 % seulement. Elles signalent le manque d'options accessibles pour les personnes ayant des problèmes de mobilité.

(Un graphique à barres titré comme suit : « Satisfaction de la population de Greendale à l'égard du système de transport public actuel ». L'axe vertical représente le pourcentage de satisfaction et l'axe horizontal a quatre catégories intitulées : « Population du secteur du nord » à 60 % de satisfaction, « Population du secteur du centre » à 70 % de satisfaction, « Population du secteur du sud » à 95 % de satisfaction et « personnes âgées » à 50 % de satisfaction.)

Si Samir s'appuie uniquement sur les données initiales de satisfaction (soit de 80 %), il pourrait conclure que le système de transport public ne nécessite que des modifications mineures. Cela signifie qu'il contribuerait à l'insatisfaction d'une population mal desservie, sans parler du gaspillage des ressources, par exemple avoir trop d'autobus pendant les heures creuses.

Par contre, en ventilant (ou en désagrégeant) les données de satisfaction par zone géographique et par groupe d'âge, il est en mesure de faire ce qui suit :

  • Réévaluer et augmenter la fréquence des trajets d'autobus dans le secteur nord.
  • Modifier les horaires d'autobus dans le secteur central pour qu'ils cadrent mieux avec les heures de pointe des bureaux.
  • Créer un nouveau programme visant à améliorer l'accessibilité pour les personnes âgées.

Il est important que Samir sache où et comment accéder à des données désagrégées pour comprendre les divers besoins des différentes collectivités et régions. Cela lui permet de prendre des décisions qui veillent à ce que chaque résident reçoive la qualité de service qu'il mérite.

(Texte à l'écran apparait un après l'autre : « Genre », « Âge », « Identité ethnoculturelle », « Identité autochtone », « Géographie », « Et bien d'autres... ».)

De même, il peut être très efficace pour tous les ordres de gouvernement et toutes les organisations au service des collectivités d'utiliser des données désagrégées pour prendre des décisions de politique publique fondées sur les données probantes. En utilisant des données désagrégées, les décideurs sont en mesure de concevoir des politiques plus appropriées et plus efficaces qui répondent aux besoins de chaque Canadien différent et unique. Dans la mesure du possible, les données doivent être ventilées en fonction du sexe, de l'âge, de l'identité ethnoculturelle, de l'identité autochtone, des différentes zones géographiques Et de tout autre facteur d'identité pertinent pour la collectivité. Puis elles sont présentées de manière distincte pour chaque sous-groupe précis.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Statistique 101 : explorer les mesures de la tendance centrale

Numéro de catalogue : 892000062020002

Date de diffusion : le 3 mai 2021 Mise à jour : le 25 november 2021

Cette vidéo s'adresse aux apprenants qui veulent acquérir une connaissance de base du concept de tendance centrale et de ce qu'il signifie, ainsi que de certaines méthodes clés qui s'y rapportent et qui sont utilisées pour explorer les données. À la fin de cette vidéo, vous comprendrez les différences entre trois concepts statistiques fondamentaux: d'abord, la moyenne, puis la médiane et enfin, le mode.

Étape du parcours des données
Explorer, nettoyer, décrire
Compétence des données
  • Exploration des données
  • Interprétation des données
  • Raconter une histoire
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
11:34
Coût
Gratuit

Voir la vidéo

Statistique 101 : explorer les mesures de la tendance centrale - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran: "Statistique 101 : explorer les mesures de la tendance centrale")

Statistique 101: Explorer les mesures de la tendance centrale

Comment décrire les données en quelques termes simples? L'emplacement du centre, ou du point d'équilibre, et l'étalement des données constituent deux caractéristiques très importantes d'un ensemble de données. Essayez de concevoir la chose de la manière suivante: si vous tenez les données entre vos mains, seraient-elles fortement concentrées dans un même endroit, comme une balle de golf, ou plutôt dispersées comme de la barbe à papa? Ce que l'on appelle la dispersion correspond à la taille de la région couverte par les données ou, si vous préférez, la variabilité ou l'étalement des données. La tendance centrale se situe là où se trouve le centre des données. Dans cette vidéo, nous allons explorer le concept de tendance centrale. Pour en savoir plus sur la dispersion, regardez la vidéo intitulée "Explorez les mesures de la dispersion".

Objectifs d'apprentissage

À la fin de cette vidéo, vous comprendrez les différences entre trois concepts statistiques fondamentaux: d'abord, la moyenne, puis la médiane et enfin, le mode. Cette vidéo s'adresse aux apprenants qui veulent acquérir une connaissance de base du concept de tendance centrale et de ce qu'il signifie, ainsi que de certaines méthodes clés qui s'y rapportent et qui sont utilisées pour explorer les données. Aucune connaissance préalable n'est requise.

Étapes du cheminement des données

(Texte à l'écran: Étapes du cheminement des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité.)

(Diagramme du Cheminement des données: Étape 1 - définir, trouver, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et qualité.)

Ce diagramme est une représentation visuelle du cheminement des données, soit d'abord la collecte, l'exploration, l'épuration, la description et la compréhension des données, puis leur analyse, afin de pouvoir ultimement communiquer aux autres ce que révèlent ces données.

Étape 2: Explorer, nettoyer et décrire

(Diagramme du Cheminement des données avec une attention sur l'Étape 2 - Explorer, nettoyer et décrire.)

L'examen des mesures de la tendance centrale correspond à l'étape d'exploration, d'épuration et de description des données.

Mesures de la tendance centrale

(Graphique démontrant une distribution biaisée à droite où le mode est situé au sommet. À gauche du sommet se trouve la médiane et la moyenne, respectivement.)

La première chose à faire est de se demander ce que signifie exactement l'expression "tendance centrale". Les mesures de la tendance centrale décrivent la valeur la plus représentative des données sous la forme d'un seul nombre. C'est ce qu'on appelle aussi le point d'équilibre d'un ensemble de données qu'on représente habituellement comme étant la moyenne, la médiane ou le mode. Voyons un peu comment, ces trois mesures sont calculées.

La moyenne

La moyenne correspond à la moyenne arithmétique de toutes les valeurs d'une variable qui sont présents dans un ensemble de données. On la calcule en faisant la somme de toutes les valeurs, puis en divisant cette somme par le nombre de valeurs.

Calcul de la moyenne

(Série de nombres qui composeront l'ensemble de données pour lequel les nombres sont 3, 4, 8, 5, 7, 3.)

Utilisons à titre d'exemple cet ensemble de données. Pour calculer la moyenne, nous faisons d'abord la somme de toutes les valeurs. Nous divisons ensuite cette somme par le nombre de valeurs de l'ensemble. Dans cet exemple, l'ensemble de données contient 6 valeurs. La somme de ces 6 valeurs est égale à 30. Pour calculer la moyenne, nous divisons cette somme par le nombre de valeurs dans l'ensemble de données, soit 30 divisé par 6. La moyenne est donc égale à 5.

Il faut souligner que la présence de valeur aberrantes, c'est à dire des valeurs extrêmement élevées ou extrêmement faibles comparativement aux autres valeurs, peut influer sur la moyenne. En effet, une valeur extrêmement élevée, si elle est présentée dans les données, peut faire augmenter la moyenne au point où celle-ci n'est plus représentative des données prises dans l'ensemble. Vous pouvez voir que la dernière valeur sous cette diapositive est 33, comparativement à 3 à la diapositive précédente. Cette valeur différente peut être exacte, mais elle peut aussi être erronée. Nous ne pouvons pas le savoir. Quoi qu'il en soit, il convient de noter l'effet de cette valeur aberrante sur la moyenne: la somme des 6 valeurs est maintenant égale à 60, et la valeur correspondant à la moyenne double, passant de 5 à 10. Il est donc important de vérifier s'il y a des valeurs aberrantes avant de décider d'utiliser la moyenne pour mesurer la tendance centrale.

La médiane

La médiane est une autre mesure de la tendance centrale. Il s'agit de la valeur centrale lorsque toutes les valeurs sont ordonnées de la plus basse à la plus haute.

Calcul de la médiane: pour un nombre impair de valeurs

(Série de nombres qui composeront l'ensemble de données pour lequel les nombres sont 5, 6, 7, 8, 8, 9, 9, 9, 12, 15, 21, 28, 33.)

Il est très simple de calculer la médiane lorsque l'ensemble de données contient un nombre impair de valeurs. Nous ordonnons d'abord les valeurs de la plus basse à la plus élevée. Nous comptons ensuite les valeurs, et nous trouvons celles qui se situent au milieu, de sorte que la moitié des valeurs sont plus élevées et l'autre moitié, moins élevées. Cette valeur se situant au milieu est la médiane. Dans cet exemple, la médiane est 9.

Calcul de la médiane: pour un nombre pair de valeurs

(Série de nombres qui composeront l'ensemble de données pour lequel les nombres sont 5, 6, 7, 8, 8, 9, 9, 9, 12, 15, 21, 28, 33, 35.)

Examinons maintenant un ensemble de données qui contient un nombre pair de valeurs. Nous plaçons les valeurs en ordre ascendant, nous comptons le nombre de valeurs et repérons les deux valeurs qui se situent au milieu, de sorte qu'il y ait un nombre égal de valeurs plus élevées et de valeurs plus basses. Nous additionnons ensuite ces deux valeurs, puis nous les divisons par deux. Dans cet exemple, la médiane est encore une fois 9.

Valeurs extrêmes et médiane

(Deux séries de nombres qui composeront l'ensemble de données pour lequel les nombres pour l'ensemble de données a sont 5, 6, 6, 7, 8, 9, 9, 12, 15, 21, 28, 33 et les nombres pour l'ensemble de données b sont 5, 6, 6, 7, 8, 9, 9, 9, 12, 15, 21, 21, 28, 28, 333.)

Outre les méthodes servant à les calculer et à les établir, l'une des principales différences entre la moyenne et la médiane tient à l'effet des valeurs extrêmes. Contrairement à ce qui est le cas pour la moyenne, les valeurs extrêmes n'ont pas la même incidence sur la médiane. Prenons l'ensemble de données A et B, qui sont identiques à l'exception de la valeur la plus élevée, qui passe de 33 dans le premier ensemble de données à 333 dans le second. On constate que, même si seul l'ensemble de données B contient une valeur aberrante, la médiane demeure égale à 9 dans les deux ensembles de données. Même si l'ensemble des données B contenait une ou deux variables aberrantes supplémentaires, la médiane demeurerait 9, parce qu'il s'agit de la valeur milieu dans l'ensemble de données.

Le mode

La troisième mesure de la tendance centrale dont nous allons parler aujourd'hui est le mode. Le mode est la valeur observée le plus souvent dans un ensemble de données. Autrement dit, il s'agit du point des données le plus fréquent dans un ensemble de données. Le mode est la mesure la plus simple à déterminer. La présence de valeurs extrêmes n'a aucune incidence sur lui, car elle ne modifie pas la ou les valeurs les plus fréquemment observées.

Calcul du mode

(Série de nombres qui composeront l'ensemble de données pour lequel les nombres sont 6, 3, 9, 6, 6, 5, 9, 3.)

Pour trouver le mode, comptez le nombre de fois où chaque valeur apparaît. La valeur observée le plus souvent est le mode. Il convient de noter deux choses intéressantes au sujet de cette mesure de la tendance centrale: A) étant donné que le mode correspond à la valeur observée le plus souvent dans un ensemble de données, si toutes les valeurs ont le même nombre d'occurrences, il n'y a pas de mode. B) Si le plus grand nombre d'occurrences est le même pour plus d'une valeur, il y a plus d'un mode. Dans un tel cas, le mode ne sera peut-être pas une mesure appropriée de la tendance centrale.

Question

C'est maintenant à vous de jouer. Examinez les chiffres suivants: 1, 1, 1, 1, 1, 4, 5. Prenez quelques instants pour déterminer la moyenne, la médiane et le mode pour cet ensemble de chiffres. Les réponses apparaîtront sur la diapositive suivante.

Réponse

Pour calculer la moyenne, nous additionnons d'abord les chiffres 1+1+1+1+1+4+5=14. Il y a 7 chiffres, donc la moyenne est égale à 14 divisé par 7, ce qui donne 2. La médiane est la valeur se situant au milieu de l'ensemble de données. Par chance, les chiffres sont déjà en ordre ascendant. Il y a un 1 au milieu avec trois 1 à gauche, et les chiffres 1, 4 et 5 à droite. La médiane est donc 1. Il y en a cinq 1 et seulement un 4 et un 5. Par conséquent, le mode est aussi 1. Un certain nombre de progiciels, dont Excel, ont des fonctions intégrées pour calculer la moyenne, la médiane et le mode. La médiane se situe souvent entre la moyenne et le mode, mais ce n'est pas toujours le cas, comme le montre cet exemple.

Conseils à retenir - Moyenne, médiane et mode

(Une note figurant au bas de la diapositive indique qu'il peut être utile d'examiner plus d'une mesure de tendance centrale.)

Ces conseils ont pour but de vous aider à déterminer quelle mesure de la tendance centrale utiliser dans différentes situations. D'abord, il faut savoir que lorsque les données ne sont pas numériques, par exemple, s'il s'agit de noms de villes, il n'est pas possible de calculer une moyenne ou une médiane, de sorte que le mode devient une mesure à envisager. Ensuite, si les données contiennent des valeurs extrêmes, la médiane sera plus représentative que la moyenne. Enfin, lorsqu'il y a plus d'un mode dans un ensemble de données, cela peut signifier que le mode n'est pas la meilleure mesure de la tendance centrale dans les circonstances.

Question

(Diagramme montrant une distribution asymétrique à droite avec une ligne verticale étiquetée x au sommet. On retrouve à la droite du sommet une ligne étiquetée y et à la droite du y, une troisième ligne étiquetée z.)

Dans cet exercice de vérification de connaissances, nous allons mettre en application ce que nous avons appris jusqu'ici à propos des mesures de la tendance centrale. Dans le graphique de droite, les salaires des joueurs de hockey sont affichés sur l'axe horizontal et le nombre de joueurs, sur l'axe vertical. Dans cette distribution, à quelle mesure de la tendance centrale correspondent les lignes X, Y et Z?

Réponse

Avez-vous pu trouver la mesure correspondant à chaque ligne? X est le salaire gagné par le plus grand nombre de joueurs. Par conséquent, dans cette distribution, X est le mode. La courbe n'est pas symétrique. Elle présente ce qu'on appelle une distribution oblique à droite, ce qui veut dire qu'il y a un petit nombre de joueurs de hockey qui gagnent un salaire très élevé. Ces valeurs ont comme effet de hausser la moyenne, ce qui signifie que Z est la moyenne. Y correspond à peu près à une valeur centrale, la moitié des joueurs se situant au-dessus et l'autre moitié, en dessous. Y est donc la médiane.

Questions

(Le même diagramme est utilisé de nouveau. Il montre une distribution asymétrique à droite avec une ligne verticale étiquetée x au sommet. On retrouve à la droite du sommet une ligne étiquetée y et à la droite du y, une troisième ligne étiquetée z.)

Nous allons maintenant prendre un exemple concret pour illustrer des circonstances où une personne pourrait décider d'utiliser une mesure de la tendance centrale particulière plutôt qu'une autre. Supposons que vous êtes le représentant des propriétaires de la Ligue nationale de hockey. Quelle mesure de la tendance centrale vous aiderait à faire valoir que les salaires des joueurs sont trop élevés? Si vous êtes plutôt le représentant du syndicat des joueurs, quelle mesure de la tendance centrale vous aiderait à démontrer que les salaires des joueurs ne sont pas trop élevés? Enfin, quelle mesure de la tendance centrale est susceptible de représenter le mieux les salaires des joueurs?

Réponses

Si vous êtes le représentant des propriétaires et que vous estimez que les salaires des joueurs sont trop élevés, vous utiliserez la moyenne, car c'est la valeur la plus élevée des trois, et vous espérez que personne ne soulignera le fait que la présence de valeurs extrêmes peut avoir une incidence sur la moyenne. Si vous représentez le syndicat des joueurs, vous opterez le mode qui est la valeur la plus faible. Vous pourriez soutenir que, de tous les salaires, c'est celui-là qui est gagné par le plus de joueurs. Cela dit, il serait faux de prétendre que cette valeur est représentative de l'ensemble des salaires des joueurs, parce que le mode n'est que la valeur la plus fréquente, alors que, au niveau de l'ensemble, de nombreux joueurs gagnent beaucoup plus que ce salaire. La médiane est la valeur qui représente le mieux les salaires des joueurs, parce que la moitié d'entre eux gagnent davantage, tandis que l'autre moitié d'entre eux gagnent moins.

Résumé des principaux points

En résumé, nous avons appris aujourd'hui que la tendance centrale est l'expression que nous utilisons lorsque nous faisons référence à une méthode donnée pour déterminer le centre, ou le point d'équilibre, d'un ensemble de données. Nous avons examiné trois façons différentes de calculer la tendance centrale. La moyenne est sans doute la plus connue. Nous avons toutefois appris que les valeurs extrêmes peuvent influer sur la moyenne. Nous avons également traité de la médiane, ou le point milieu, ce qui signifie que la moitié des valeurs se trouvent au-dessous de ce point milieu et l'autre moitié, au-dessus. Les valeurs extrêmes sont moins susceptibles d'avoir une incidence sur la médiane. La troisième mesure de la tendance centrale que nous avons abordé est le mode qui correspond à la valeur la plus fréquemment observée. Il est important de se rappeler qu'un ensemble de données peut n'avoir aucun mode, et qu'il peut aussi en avoir plus d'un.

Formation complémentaire

Pour en savoir plus sur l'étalement ou la dispersion des données, regardez la vidéo intitulée "Explorez les mesures de la dispersion".

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Statistique 101 : Explorer les mesures de la dispersion

Numéro de catalogue : 892000062020003

Date de diffusion : le 3 mai 2021 Mise à jour : le 7 février 2023

Comment décrire les données en quelques termes simples? Deux caractéristiques très importantes d'un ensemble de données sont l'emplacement du centre, ou du point d'équilibre, et la taille de l'étendue.

Bref, si nous tenions les données entre nos mains, seraient-elles concentrées en un seul endroit, comme une balle de golf, ou dispersées un peu partout, comme de la barbe à papa? On appelle le point d'équilibre des données la « tendance centrale ». Mais la taille de la région couverte par les données et son étendue s'appellent la « dispersion ». Dans cette vidéo, nous découvrirons le concept de dispersion. Toutefois, comme condition préalable à cette vidéo, nous vous recommandons fortement de regarder d'abord notre vidéo intitulée « Explorer les mesures de la tendance centrale », car certains des concepts qui y sont présentés, dont la moyenne, seront abordés aujourd'hui.

Étape du parcours des données
Explorer, nettoyer, décrire
Compétence des données
  • Exploration des données
  • Interprétation des données
Audience
Essentiel
Conditions préalables suggérées
Statistique 101 : explorer les mesures de la tendance centrale
Durée
16:06
Coût
Gratuit

Voir la vidéo

Statistique 101 : Explorer les mesures de la dispersion - Transcription

(Le symbole et le mot-symbole de Statistique Canada apparaissent sur l'écran : « Statistique 101 : Exploration des mesures de dispersion ».)

Statistique 101 : Exploration des mesures de dispersion

Comment décrire les données en quelques termes simples? Deux caractéristiques très importantes d’un ensemble de données sont l’emplacement du centre, ou du point d’équilibre, et la taille de l’étendue.

Bref, si nous tenions les données entre nos mains, seraient-elles concentrées en un seul endroit, comme une balle de golf, ou dispersées un peu partout, comme de la barbe à papa? On appelle le point d’équilibre des données la « tendance centrale ». Mais la taille de la région couverte par les données et son étendue s’appellent la « dispersion ». Dans cette vidéo, nous découvrirons le concept de dispersion. Toutefois, comme condition préalable à cette vidéo, nous vous recommandons fortement de regarder d’abord notre vidéo intitulée « Explorer les mesures de la tendance centrale », car certains des concepts qui y sont présentés, dont la moyenne, seront abordés aujourd’hui.

Objectifs d'apprentissage

À la fin de cette vidéo, vous devriez avoir une compréhension de base des mesures de dispersion comme l’étendue, l’intervalle interquartile et l’écart-type.

Elle s’adresse à ceux et celles qui cherchent à acquérir une compréhension de base du concept de la dispersion, aussi appelé variabilité, de sa signification et de certains concepts connexes utilisés pour l’analyse des données. 

Mesures de dispersion

En statistique, la dispersion décrit l’étalement des valeurs d’une distribution. En d’autres mots, à quel point sont-elles étalées ou comprimées.

Imaginez que vous attendez un colis par la poste. Habituellement, le courrier arrive à n’importe quel moment entre 8 h et 16 h, ce qui signifie que si vous voulez être là quand il arrive, vous pouvez passer toute la journée à attendre à la maison. Toutefois, si vous savez que le courrier arrive habituellement entre 8 h et 10 h, vous avez une meilleure idée du moment de la livraison. Les mesures de dispersion donnent également une indication de la précision avec laquelle les mesures de la tendance centrale, comme la moyenne, décrivent l’étalement des valeurs dans l’ensemble de données. C’est utile lorsqu’on utilise des données-échantillons pour tirer des conclusions sur les comportements ou les caractéristiques de l’ensemble de la population.

Les mesures de dispersion sont également importantes, car elles nous aident à prendre des décisions éclairées sur la façon d’analyser les données et indiquent leur degré d’incertitude.

Étapes du cheminement des données

(Texte à l’écran : Étapes du cheminement des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité.)

(Diagramme du Cheminement des données : Étape 1 - définir, trouver et recueillir ; Étape 2 - explorer, nettoyer et décrire ; Étape 3 – analyser et modéliser ; Étape 4 - raconter l'histoire. Le cheminement des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité.)

Ce diagramme est une représentation visuelle du cheminement des données, de la collecte des données à la communication aux autres de l’histoire qu’elles racontent, en passant par le nettoyage, l’exploration, la description, la compréhension et l’analyse des données.

Étape 2 : Explorer, nettoyer et décrire

(Diagramme du Cheminement des données avec l'Étape 2 - Explorer, nettoyer et décrire, mise en évidence.)

L’exploration des mesures de dispersion fait partie de l’étape d’explorer, nettoyer et décrire le cheminement des données.

De quoi à l'air l'étalement des données?

(Graphique représentant le nombre de livraisons de pizza en fonction des délais de livraison sous une forme de cloche nommée « une distribution normale ».)

Avant de commencer, jetons un coup d’œil à certaines façons courantes dont les données sont étalées ou regroupées. La distribution des données est souvent représentée à l’aide de diagrammes de dispersion ou d’histogrammes. Leur forme montre l’étalement des valeurs de l’ensemble de données. Les données peuvent être représentées graphiquement en forme de cloche symétrique, comme on peut le voir ici dans le diagramme de temps de livraisons de pizza, où la plupart des valeurs sont regroupées au milieu, entre 20 et 40 minutes, tandis que certaines livraisons prennent moins de temps (p. ex. 15 minutes) et d’autres en prennent plus (p. ex. 40 minutes). C’est ce qu’on appelle une distribution normale, et on en parlera davantage plus tard.

(2 graphiques distincts à gauche et à droite représentant une distribution normale qui est biaisée positivement et négativement, respectivement.)

Si l’ensemble de données n’est pas symétrique, mais comporte plutôt plus de valeurs situées à gauche ou à droite du diagramme, la forme de la cloche devient asymétrique, créant une queue plus longue d’un côté ou de l’autre.  Un ensemble de données est considéré comme asymétrique dans la direction de la queue la plus longue. Lorsque les données sont positivement asymétriques, il y a beaucoup de valeurs situées du côté gauche ou « inférieur » du diagramme, créant une queue qui s’étire vers la droite. Lorsque les données sont négativement asymétriques, nous voyons un plus grand nombre de valeurs situées à l’extrémité supérieure du diagramme, et la queue s’étire vers la gauche ou la partie inférieure du diagramme.

Mesures de dispersion

(Organigramme présentant les trois mesures communes de dispersion : Étendue, Intervalle interquartile et écart-type.)

Revenons maintenant à nos mesures de dispersion… Pour déterminer la dispersion, trois mesures couramment utilisées sont l’étendue, l’intervalle interquartile et l’écart-type. Les diapositives suivantes examinent chacune d’elles individuellement.

Étendue

L’étendue, c’est la différence entre la plus grande valeur et la plus petite valeur dans un ensemble de données. Elle fournit une mesure rapide et simple de l’étalement de ces valeurs. Il est préférable de l’utiliser avec des données qui n’ont pas de valeurs extrêmes. Comme notre livraison de colis. Si nous savons que le colis sera livré entre 10 h et midi, nous pouvons en toute confiance planifier d’autres activités pour la journée. Ce genre d’information est très utile. Cependant, si on nous dit que le colis arrivera entre 8 h et 20 h, eh bien, cette information est-elle réellement utile? Seriez-vous sûr de pouvoir faire une course rapide durant la journée sans manquer votre livraison? Probablement pas.

Sachant que l'étendue est la différence entre la valeur la plus grande et la plus petite, nous allons l'exprimer sous forme d'équations. L'étendue est simplement la plus grande valeur moins la plus petite. Dans cet exemple, la plus petite valeur est 1 et la plus grande est 7 ainsi l'étendue est 7 moins 1, c'est-à-dire 6. Ici, l'étendue est une mesure appropriée, car les points de données sont rapprochés les uns des autres.

Exemple

(Tableau présentant les notes d'examen des étudiants. Les colonnes, de gauche à droite, sont intitulées : # | Étudiants | Score d'examen. La première ligne à la dernière ligne contient ce qui suit : 1 | Jean | 80 % ; 2 | Audrey | 85 % ; 3 | Thomas | 85 % ; 4 | Mathieu | 86 % ; 5 | Ali | 87 % ; 6 | Sofia | 88 % ; 7 | Josée | 90 % ; 8 | Maria | 90 % ; 9 | Hugo | 92 % ; 10 | Louise | 94 % ; 11 | Sylvain | 95 % ; 12 | Jade | 95 %.)

Prenons un exemple. Ici, nous avons les notes d’examen d’un groupe de 12 étudiants. La note la plus élevée est de 95 %. Pour déterminer l’étendue, nous y soustrayons la note d’examen la plus faible, qui est de 80 %. L’étendue est donc de 15 %, ce qui est assez petit. L’un des avantages d’utiliser l’étendue comme mesure de la dispersion, c’est qu’elle est facile à calculer.

Exemple (suite)

(Tableau présentant les notes d'examen des étudiants. Les colonnes, de gauche à droite, sont intitulées : # | Étudiant | Score d'examen. La première ligne à la dernière ligne contient ce qui suit : 1 | Jean | 10 % ; 2 | Audrey | 85 % ; 3 | Thomas | 85 % ; 4 | Mathieu | 86 % ; 5 | Ali | 87 % ; 6 | Sofia | 88 % ; 7 | Josée | 90 % ; 8 | Maria | 90 % ; 9 | Hugo | 92 % ; 10 | Louise | 94 % ; 11 | Sylvain | 95 % ; 12 | Jade | 95 %.)

Maintenant, prenons un exemple semblable, mais avec une grande différence. Ici, nous avons des notes d’examen du même groupe de 12 étudiants. La note la plus élevée est encore une fois de 95 %. Pour déterminer l’étendue, nous y soustrayons la note d’examen la moins élevée, qui est de 10 %. On obtient ainsi une étendue de 85 %. Il s’agit d’un étalement très vaste. Après un examen plus poussé, on constate qu’un étudiant, Jean, a obtenu un piètre résultat à l’examen, alors que tous les autres ont très bien réussi. Cela fait de la note de Jean une valeur aberrante, car 11 élèves sur 12 ont obtenu une note entre 85 % et 95 %. Sa note à elle seule est la cause principale de ce grand étalement. Et comme l’étendue est une comparaison de la valeur la plus faible par rapport à la valeur la plus élevée, on voit ici comment il peut être une mesure trompeuse de la dispersion lorsque les données comportent des valeurs aberrantes.

Intervalle interquartile

L’intervalle interquartile est semblable à l’étendue. Il s’agit également de la distance entre la valeur la plus élevée et la valeur la plus faible, mais seulement sur le 50 % central de la distribution globale. Il est donc un peu plus stable que l’étendue, car il ne tient pas compte des quartiles inférieur et supérieur des données, ce qui atténue l’incidence des valeurs aberrantes.

Bien que l’intervalle interquartile soit légèrement plus stable que l’étendue, il est important de savoir que lorsqu’on l’utilise comme mesure de la dispersion, on perd des détails sur ce qui se passe aux extrémités de la distribution.

Comment déterminer l'intervalle interquartile?

(Texte à l’écran : Ensemble de données = 3, 1, 8, 5, 3, 6, 4, 8, 6, 7)

Pour déterminer l’intervalle interquartile, il faut d’abord ordonner les données, de la valeur la plus faible à la valeur la plus grande. Après avoir dressé une liste en ordre croissant des dix chiffres qui composent l’ensemble de données sur cette diapositive, et en utilisant les connaissances que vous avez acquises dans la vidéo sur les mesures de la tendance centrale, vous trouveriez la médiane de l’ensemble de données complet, soit la valeur de l’élément central quand les données sont ordonnées de la plus basse à la plus haute. Dans ce cas-ci, comme il y a un nombre pair d’observations, on additionne les deux chiffres centraux et on les divise par deux, ce qui donne 5,5. En calculant la médiane, on peut diviser les données en deux moitiés, ce qui nous permet de passer à l’étape suivante…

Ensuite, on calcule de nouveau la médiane, mais cette fois-ci pour les moitiés supérieure et inférieure des données, ce qui donnerait trois pour la moitié inférieure et sept pour la moitié supérieure. Ensuite, on soustrait la médiane inférieure de la médiane supérieure. L’intervalle interquartile, c’est la différence entre ces deux chiffres, qui dans ce cas équivaut à quatre. Il est important de noter que cette méthode fonctionne bien pour des listes de valeurs simples et courtes. Mais pour les ensembles de données complexes, on peut facilement obtenir les Q1 et Q3 à l’aide de logiciels comme Excel.

Vérification des connaissances

(Tableau présentant le temps qu'il faut pour livrer la pizza pour chaque ménage. Les colonnes, de gauche à droite, s'intitulent : Ménage | Temps de livraison de la pizza en minutes. La première ligne à la dernière ligne contient ce qui suit : 1 | 15 ; 2 | 20 ; 3 | 25 ; 4 | 30 ; 5 | 30 ; 6 | 35 ; 7 | 35 ; 8 | 40 ; 9 | 45 ; 10 | 50.)

À vous maintenant. Disons que vous avez commandé une pizza et qu’on vous dit qu’il faudra environ 30 minutes pour la livraison. Disons maintenant que neuf autres ménages ont fait de même. Dans ce cas-ci, qu’entend-on par « environ 30 minutes »? Nous avons ici un tableau qui montre exactement combien de temps chacun des dix ménages a dû attendre pour recevoir sa pizza. Pour mettre vos connaissances à l’épreuve jusqu’à maintenant, mettez la vidéo sur pause et essayez de calculer l’étendue de temps de livraison, en minutes, à laquelle chaque ménage devrait s’attendre. Calculez ensuite l’intervalle interquartile. Mettez la vidéo en pause maintenant et relancez-la une fois que vous êtes prêt à vérifier vos réponses. Avez-vous obtenu 35 pour l’étendue et 15 pour l’intervalle interquartile? Si oui, bravo! Nous pouvons maintenant passer à notre prochaine mesure de la dispersion : l’écart-type.

Écart-type

(Tableau présentant les notes d'examen des étudiants. Les colonnes, de gauche à droite, sont intitulées : # | Étudiants | Score d'examen. La première ligne à la dernière contient ce qui suit : 1 | Jean | 10 % ; 2 | Audrey | 25 % ; 3 | Thomas | 55 % ; 4 | Mathieu | 86 % ; 5 | Ali | 87 % ; 6 | Sofia | 88 % ; 7 | Josée | 90 % ; 8 | Maria | 90 % ; 9 | Hugo | 92 % ; 10 | Louise | 94 % ; 11 | Sylvain | 95 % ; 12 | Jade | 95 %.)

Jusqu’à présent, cette vidéo a expliqué comment l’étendue et l’intervalle interquartile peuvent nous donner une bonne idée de la valeur médiane ou moyenne d’un ensemble de données. Mais ils ne nous disent pas à quel point le reste des valeurs de l’ensemble de données sont proches de cette médiane. Or, il peut s’agir d’information très importante. Par exemple, revenons à notre classe d’étudiants. Lorsque l’enseignante additionne la note de tout le monde, elle obtient un total de 907. Et lorsqu’elle divise ce nombre par le nombre de notes, soit 12, elle obtient une note moyenne de 76 %. 76 % pourrait être une bonne note, mais est-ce que tout le monde performe à ce niveau? Dans une classe de 12, il n’est pas difficile de constater que certains éprouvent des difficultés. Mais qu’en est-il d’une classe de 200?

(2 graphiques distincts à gauche et à droite représentant une distribution normale en forme de cloche avec un écart-type faible et élevé, respectivement.)

L’écart-type nous indique la dispersion d’un groupe de valeurs par rapport à la moyenne. Il peut être calculé rapidement et facilement à l’aide de logiciels comme Microsoft Excel, et il est considéré comme la plus solide des trois mesures de dispersion. C’est donc la mesure la plus souvent utilisée dans les analyses statistiques. Un petit écart-type signifie que la plupart des nombres sont proches de la moyenne. Ainsi, lorsqu’une enseignante doit déterminer le rendement de chacun de ses étudiants, un petit écart-type lui indiquerait que la majorité affiche un rendement semblable. Un grand écart-type lui dirait que tout le monde n’a pas le même rendement. Ainsi, si la moyenne de la classe était élevée, un écart-type élevé signifierait que certains étudiants éprouvent encore des difficultés.

(2 graphiques distincts à gauche et à droite représentant une distribution normale en forme de cloche avec un écart-type faible et élevé avec leurs moyens restant au centre de la distribution, respectivement.)

Mais dans les situations où l’on se contente d’observer et d’enregistrer des données, un écart-type élevé n’est pas nécessairement une mauvaise chose ; il reflète simplement une grande variabilité dans le groupe à l’étude. Par exemple, si on examine tous les salaires au sein d’une grande entreprise, des stagiaires au chef de la direction, l’écart-type peut être très élevé. Par contre, si on réduit le groupe en se concentrant uniquement sur les stagiaires, l’écart-type est plus petit, car les personnes de ce groupe ont des salaires semblables. Le deuxième ensemble de données n’est pas meilleur, il a tout simplement moins de variabilité.

Écart-type et distribution normale

La distribution normale est un exemple de distribution qui pourrait vous aider à mieux comprendre le concept d’écart-type. Dans le contexte des données, une distribution est un modèle mathématique qui reproduit la façon dont les points de données sont distribués ou dispersés. On visualise souvent la distribution normale comme une courbe en forme de sommet ou de cloche. Elle représente la présence de quelques points de données petits et volumineux respectivement sur les côtés gauche et droit de la courbe, alors que la plupart des points de données se trouvent quelque part au centre, où se trouve le sommet. Dans la distribution normale, les points de données dessinent une forme symétrique qui ressemble à la courbe qu’on voit sur cette diapositive, que l’on appelle une courbe en cloche.

Distribution normale

La distribution normale est symétrique, ce qui fait que la moyenne, la médiane et le mode sont les mêmes. Ceux-ci sont représentés par la ligne le long du centre de la courbe en cloche.

(Graphique représentant une distribution normale avec la moyenne, la médiane et le mode au sommet de la distribution.)

Pour la distribution normale standard, la méthode de mesure de la dispersion que nous appelons l’écart-type, ou « ET » sur cette diapositive, a des propriétés très intéressantes. Elle nous indique où nous pouvons nous attendre à trouver les points de données dans la distribution. La théorie de l’échantillonnage et la distribution normale nous indiquent qu’environ 68 % des valeurs de données dans l’ensemble de la population se situeront entre la moyenne plus ou moins 1 fois l’écart-type. De même, environ 95 % des valeurs de données correspondront à la moyenne plus ou moins 2 fois l’écart-type, et environ 99,7 % des valeurs de données correspondront à la moyenne plus ou moins 3 fois l’écart-type.

Résumé des principaux points

Les mesures de dispersion fournissent une indication quantitative de la mesure dans laquelle les valeurs de données sont dispersées ou regroupées.

Dans cette vidéo, nous avons examiné trois mesures courantes de la dispersion : l’étendue, l’intervalle interquartile et l’écart-type. Et nous avons appris que parfois, les données peuvent être dispersées en forme de cloche, la plupart des valeurs étant regroupées au milieu. C’est ce qu’on appelle souvent la distribution normale.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Statistique 101 : proportions, ratios et taux

Numéro de catalogue : 892000062021003

Date de diffusion : le 3 mai 2021 Mise à jour : le 1re décembre 2021

Cette vidéo s'adresse aux personnes qui souhaitent acquérir une connaissance de base de trois types de mesures, soit les proportions, les ratios et les taux. Aucune connaissance préalable n'est requise. Bien que les proportions, les ratios et les taux soient semblables, ils ont chacun des propriétés différentes.

Dans cette vidéo, vous apprendrez les différences entre ces trois mesures. De plus, quand vous aurez terminé, vous serez en mesure de répondre aux questions suivantes : Comment chaque type de mesure est-elle calculée et quand est-il préférable d'en utiliser une plutôt que l'autre?

Étape du parcours des données
Explorer, nettoyer, décrire
Compétence des données
  • Exploration des données
  • Interprétation des données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
13:21
Coût
Gratuit

Voir la vidéo

Statistique 101 : proportions, ratios et taux - Transcription

Statistique 101 : proportions, ratios et taux - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran: "Statistique 101 Proportions, ratios et taux")

Statistique 101: Proportions, ratios et taux

Souvent, la façon la plus facile d'exprimer ce que nous disent les données est simplement de comparer un chiffre avec un autre. Lorsqu'on nous dit "75% des personnes pensent ceci" ou "deux tiers des entreprises font cela", ce qu'on nous présente, ce sont les résultats de l'analyse d'un ensemble particulier de données, et trois mesures utiles pour effectuer les analyses sont les proportions, les ratios et les taux. Toutes ces mesures sont faciles à calculer, à utiliser et à comprendre. Dans cette vidéo, nous expliquons les concepts des proportions, des ratios et des taux, ainsi que leurs différences.

Objectifs d'apprentissage

Cette vidéo s'adresse aux personnes qui souhaitent acquérir une connaissance de base de trois types de mesures, soit les proportions, les ratios et les taux. Aucune connaissance préalable n'est requise. Bien que les proportions, les ratios et les taux soient semblables, ils ont chacun des propriétés différentes. Dans cette vidéo, vous apprendrez les différences entre ces trois mesures. De plus, quand vous aurez terminé, vous serez en mesure de répondre aux questions suivantes: comment chaque type de mesure est-elle calculé et et quand est-il préférable d'en utiliser une plutôt que l'autre?

Étapes du cheminement des données

(Texte à l'écran: Étapes du cheminement des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité.)

(Diagramme du Cheminement des données: Étape 1 - définir, trouver, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et qualité.)

Ce diagramme est une représentation visuelle du cheminement des données, de la collecte à la diffusion, en passant par le nettoyage, l'exploration et l'analyse.

Étape 2: Explorer, nettoyer et décrire

(Diagramme du Cheminement des données avec une attention sur l'Étape 2 - Explorer, nettoyer et décrire.)

Dans le cheminement des données, les proportions, les ratios et les taux font partie de l'étape de l'exploration, du nettoyage et de la description. Ils sont aussi utilisés pour l'analyse et la modélisation.

Qu'est-ce qu'une proportion?

Commençons par les proportions. Une proportion est une partie, une part ou un nombre qui est envisagé par rapport à tout. La plus petite valeur d'une proportion est 0, tandis que la plus grande valeur possible est 1. Une proportion peut être exprimée en pourcentage en multipliant sa valeur par 100. Les proportions sont utiles pour comparer un nombre avec un total. Par exemple, dans un auditoire de 50 personnes, 5 sont gauchères. Cela peut être exprimé en proportion en divisant 5 par 50 pour un résultat de 0,1 ou 10%, en multipliant 0,1 par 100.

Les proportions: un exemple

Imaginez que vous avez un jeu standard de 52 cartes à jouer. Le jeu contient 13 cartes de chaque couleur: carreaux, cœurs, trèfles et piques. Aux fins de cet exemple, nous supposerons qu'il n'y a pas de joker ou de cartes supplémentaire. Quelle est la proportion de carreaux dans un jeu? Pour calculer cette proportion, il faut d'abord compter le nombre de cartes de carreaux. Il y en a 13. Ensuite, nous divisons ce nombre par le nombre total de cartes dans le jeu, soit 52. Cela nous donne une proportion de 0,25. En pourcentage, cela donne 25%.

Qu'est-ce qu'un ratio?

Passons maintenant aux ratios. Un ratio, aussi appelé rapport, exprime les tailles relatives de deux valeurs. La différence entre une proportion et un ratio, c'est qu'avec les ratios, vous avez plus de liberté de comparaison. La notation est également différente. Bien que les ratios puissent être exprimés sous forme de nombres ou de pourcentages, ils sont le plus souvent exprimés avec deux-points. Le deux-points entre les chiffres 2 et 1, par exemple, devrait être interprété comme "un rapport de deux pour un". Cela signifie que la première valeur est deux fois plus grande que la seconde. En même temps, un ratio de 3 pour 2 signifie que pour 3 unités du premier élément, il y a deux unités du deuxième. Un bon exemple nous est donné lorsque nous faisons cuire du riz. Selon le type de riz, les instructions pourraient être "deux parties d'eau pour une partie de riz", ce qui signifie que peu importe si vous cuisinez du riz pour 2, 20 personnes ou le volume de riz dont vous disposez, le simple fait de connaître la ratio d'eau par rapport au riz, 2:1, vous permet de savoir qu'il faut deux fois plus d'eau pour la cuisson.

Une autre différence entre la proportion et le ratio, c'est qu'avec un ratio, vous pouvez choisir la quantité à utiliser comme référence. Au lieu de compter deux parties d'eau pour chaque partie de riz, vous pourriez décider d'exprimer ce ratio comme une partie de riz pour deux parties d'eau. Il est souvent plus facile d'exprimer la quantité la plus élevée par rapport à la plus petite, mais dans certains contextes, l'inverse peut être préférable. Enfin, le ratio est souvent exprimé de façon réduite. Un ratio de 4:2 est mieux compris s'il est exprimé sous la forme de 2:1.

Les ratios: un exemple

Revenons à notre exemple de cartes à jouer. Quel est le ratio entre les carreaux et les cœurs? Pour calculer ce ratio, nous devons d'abord compter le nombre de carreaux. D'après notre question précédente, nous savons qu'il y en a 13. Ensuite, comptons la deuxième partie de notre ratio, qui est le nombre de cœurs. Le nombre de cœurs est aussi de 13. Exprimé en ratio, nous avons 13 pour 13. Toutefois, ce ratio peut être réduit en divisant les deux côtés par le même nombre. Ici, les deux côtés peuvent être divisés par 13, ce qui nous donne un ratio de 1 pour 1. Cela veut dire que pour chaque carte de carreaux dans le jeu, il y a une carte de cœurs.

Vérification des connaissances

Voyons si vous savez calculer les proportions et les ratios. Premièrement, quelle proportion d'un jeu de cartes est composée de dames? Mettez la vidéo en pause ici et redémarrez-la lorsque vous pensez avoir la réponse.

4 cartes sur 52 sont des dames. La proportion des reines dans un jeu est d'environ 0,08 ou 8%.

Vérification des connaissances

Maintenant, quel est le ratio entre les figures et les cartes chiffrées dans un jeu? Mettez la vidéo en pause pour effectuer le calcul et redémarrez-la une fois que vous êtes prêt à avoir la réponse complète.

Il y a quatre couleurs (carreaux, piques, trèfles et cœurs). Dans chaque couleur, il y a trois différentes figures (valet, reine et roi) et dix cartes chiffrées. 4 fois 3 font 12, il y a donc 12 figures dans un jeu. 4 fois10 font 40, il y a donc 40 cartes chiffrées dans un jeu. Autrement dit, le ratio entre les figures et les cartes chiffrées est de 12:40, ou plus simplement, pour 3 figures, il y a 10 cartes chiffrées.

Qu'est-ce qu'un taux?

Passons maintenant aux taux. La façon la plus simple de définir un taux est de dire qu'il s'agit d'une quantité divisée par une autre quantité. Avec cette définition, les proportions et les ratios pourraient être considérés comme des taux. Quelle est donc la différence entre les taux et les deux autres mesures? Les proportions et les ratios sont le plus souvent utilisés pour comparer des quantités ayant la même unité de mesure. Dans l'exemple du jeu de cartes, les deux quantités qui sont comparées sont des chiffres représentant le nombre de cartes. Dans un taux, les deux quantités comparées ont souvent des unités de mesure différentes. Par exemple, la vitesse est un taux, c'est la distance parcourue en kilomètres divisée par le temps qu'il a fallu pour parcourir cette distance en heures. L'unité de mesure du taux est ici le kilomètre par heure (km/h).

Calcul des taux: taux de croissance

(Histogramme démontrant le montant du compte d'épargne ($) au 1er janvier 2018, 2019 et 2020. Respectivement, les montants sont de 800 $; 1 200 $ et 900 $)

Un type de taux particulièrement utile est le taux de croissance. Le taux de croissance compare la variation d'une mesure sur une période avec la valeur de la mesure au début de la période. Il est très utile d'évaluer les variations au fil du temps. Ce graphique représente le montant d'argent disponible dans un compte d'épargne au début des années 2018, 2019 et 2020. Supposons que vous vouliez évaluer la variation de votre compte d'épargne au cours de l'année 2018. Comment procéderiez-vous?

Pour calculer le taux de croissance du solde votre compte d'épargne, vous devez d'abord calculer la variation qui s'est produite au cours de l'année. Pour ce faire, vous prenez le montant économisé au début de 2019, qui était de 1200 $, et vous lui soustrayez le montant qui était dans le compte au début de 2018, soit 800 $. La différence est de 400 $. Ensuite, vous divisez cette différence par le montant du compte au début de 2018. Dans ce cas, cela signifie que vous divisez 400 par 800. Le résultat est 0,5. Ce taux de croissance peut alors être multiplié par 100 si vous voulez l'exprimer en pourcentage. Cela vous donne 50%. Cela signifie qu'en 2018, le montant de votre compte d'épargne a augmenté de moitié par rapport à ce qu'il était au début de l'année.

Vérification des connaissances

(Histogramme démontrant le montant du compte d'épargne ($) au 1er janvier 2018, 2019 et 2020. Respectivement, les montants sont de 800 $; 1 200 $ et 900 $)

À votre tour maintenant. Quel a été le taux de croissance du solde de votre compte d'épargne au cours de l'année 2019, c'est-à-dire du 1er janvier 2019 au 1er janvier 2020? Mettez la vidéo en pause et redémarrez-la une fois que vous êtes prêt à voir la réponse complète.

La réponse est -0,25 ou -25%, et voici pourquoi. Premièrement, nous avons pris le montant dans le compte au début de 2020, soit 900$, et nous avons soustrait le montant du début de 2019, soit 1200$. Cela nous a donné une valeur négative de -300$. Nous avons ensuite divisé cette différence par le montant au début de 2019, soit 1200$. Ce qui s'est traduit par un taux de croissance de -0,25 au -25%. Le taux de croissance négatif signifie que le montant dans le compte d'épargne a diminué en 2019. Un quart, ou 25%, de la valeur initiale a été perdu au cours de l'année.

Comparaison des proportions, ratios et taux

(Tableau contenant les définitions de chacune des 3 mesures. Les colonnes, de gauche à droite, sont intitulées comme suit : Mesure | Description | Conditions | Notations | Exemples dans les statistiques officielles. De la première à la dernière ligne : Proportion | Partie, part ou nombre pris en compte par rapport à toute une | 0, 1, ou n'importe quelle valeur entre 0 et 1 | Nombre ou pourcentage | Proportion de la population canadienne vivant en Colombie-Britannique; Ratio | La taille relative de deux valeurs | Nombres positifs (n'importe quelle valeur) | A:B (un rapport de A à B) ou un certain nombre | Ratio salarial entre les sexes; Taux | Une quantité divisée par une autre | Aucune (valeurs négatives sont autorisées) | Nombre ou pourcentage | Taux annuel de croissance démographique)

Examinons les trois mesures que nous avons vues. Une proportion est une partie, une part ou un nombre envisagé par rapport à un ensemble. Elle peut être égale à 0, à 1 ou à n'importe quelle valeur comprise entre les deux. On peut l'exprimer en nombre ou en pourcentage. Un exemple tiré des statistiques officielles serait la proportion de la population canadienne qui vit dans une province donnée. Un ratio représente la taille relative de deux valeurs. Il peut être utilisé pour comparer deux parties l'une par rapport à l'autre. Les rapports peuvent être constitués de n'importe quelle valeur positive et sont généralement exprimés sous forme de deux chiffres séparés par un deux-points ou par un seul chiffre. Un exemple tiré des statistiques officielles est le ratio des salaires entre les sexes, qui compare les gains selon le sexe. Enfin, un taux est une mesure plus générale dans laquelle une quantité divisée par une autre quantité, et où les deux quantités n'ont pas nécessairement besoin d'avoir les mêmes unités de mesure. Un taux peut prendre n'importe quelle valeur, y compris une valeur négative. Comme les proportions, il peut être exprimé sous forme de nombre ou de pourcentage. Un exemple bien connu est le taux annuel de croissance de la population.

Vérification des connaissances

(Tableau contenant les estimations de la population, le 1er juillet, des femmes et des hommes de la population canadienne entre 2018 et 2020 en des millions de personnes. Femmes : 18,7 (2018); 18.9 (2019); 19.1 (2020). Hommes : 18,4 (2018); 18.7 (2019); 18.9 (2020). Total : 37,1 (2018); 37.6 (2019); 38.0 (2020))

Dans les diapositives suivantes, nous verrons quelques exemples de proportions, de ratios et de taux provenant de données réelles. Le tableau 1 présente les estimations démographiques au milieu de l'année selon le sexe entre 2018 et 2020. Quelle proportion de la population canadienne était de sexe masculin en 2019? Pour trouver la réponse, vous devez diviser le nombre d'hommes 18,7 millions par la population totale 37,6 millions. Cela nous fournit notre réponse: la proportion d'hommes dans la population canadienne au milieu de 2019 était de 0,497. En multipliant par 100, on obtient la réponse en pourcentage: 49,7%.

Maintenant, essayez de calculer le ratio hommes-femmes dans la population canadienne en 2019. Mettez la vidéo en pause et essayez de calculer ce ratio. Si on regarde ce tableau, on peut dire que le ratio est de 18,7 millions d'hommes pour 18,9 millions de femmes. Cependant, cela semble confus. Il doit y avoir une meilleure façon de présenter ce renseignement! Essayons plutôt d'exprimer le ratio en nombres décimaux en divisant le nombre d'hommes par le nombre de femmes. Cela nous donne 0,99. Autrement dit, en juillet 2019, il y avait 0,99 homme pour chaque femme dans la population canadienne. Cela permet à votre auditoire de comprendre qu'il y a moins d'hommes que de femmes dans la population canadienne. De plus, étant donné que ce ratio est proche de 1, nous pouvons conclure que l'écart entre le nombre d'hommes et de femmes est faible.

Enfin, revenons au même tableau pour calculer le taux de croissance de la population canadienne entre 2018 et 2019. Premièrement, on calcule la différence de la population entre les deux années, puis on divise cette différence par la taille de la population de l'année précédente qui, dans ce cas, est 2018. On multiplie ensuite le résultat par 100 afin d'exprimer ce taux en pourcentage. Ici, le taux de croissance est de 1,3%. Comme le taux de croissance est positif, nous pouvons conclure que la population canadienne a augmenté de 2018 à 2019.

Le saviez-vous? Les taux peuvent être utilisés pour effectuer des prévisions!

Saviez-vous que les taux peuvent aussi servir à effectuer des prévisions? Dans le tableau 1 nous pouvons voir que la population canadienne était de 38 millions d'habitants en 2020. Mais si les données n'avaient pas encore été disponibles, comment aurions-nous pu prévoir ce chiffre à partir des estimations de la population de 2018 et de 2019? Une façon rapide et simple de le faire est de supposer que le taux de croissance entre 2019 et 2020 a été le même qu'entre 2018 et 2019. Ensuite, nous appliquons ce taux à la population de 2019 pour calculer la croissance et nous ajoutons la croissance à la population de 2019. Comme nous l'avons vu plus tôt, le taux de croissance entre 2018 et 2019 était de 1,3%. En multipliant ce taux par la population de 2019, soit 37,6 millions, nous obtenons 0,5 million. Cela représente la croissance prévue d'ici au milieu de 2020. Ensuite, en ajoutant ce chiffre à la population de 2019, soit 37,6 millions, nous obtenons 38,1 millions. Comment nous nous en sommes tirés? Le résultat, 38,1 millions, est légèrement supérieur à l'estimation réelle de 38 millions. Cela signifie que le taux de croissance réel entre 2019 et 2020 a finalement été inférieur à celui de l'année précédente. Mais notre prévision était très proche.

Principaux points à retenir

Récapitulons les principaux points que nous avons abordés dans cette vidéo. Les proportions, les ratios et les taux sont utiles pour comparer les chiffres et se ressemblent parfois beaucoup. Cependant, une porportion est une partie, une part ou un nombre considéré par rapport à tout, tandis qu'un ratio correspond à la taille relative de deux valeurs. Un taux est une quantité divisée par une autre quantité et les trois mesures ont des propriétés différentes. Il est également intéressant de noter que les taux comme les taux de croissance peuvent être utiles pour effectuer des prévisions.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.