Évaluation des Services d’analyse des données

Rapport d'évaluation

Mai 2025

Structure du rapport

Le rapport en bref

Dans le cadre du budget de 2018, un financement a été annoncé pour appuyer le programme de modernisation de Statistique Canada (StatCan) et améliorer son infrastructure statistique technologique grâce au développement des Services d’analyse des données (SAD). En raison de la croissance exponentielle du volume de données et de leur utilisation, en plus des demandes correspondantes pour le stockage et le traitement, des approches nouvelles et novatrices de la fourniture d’infrastructures étaient nécessaires. Les SAD sont une plateforme infonuagique conçue et développée à l’interne qui fournit aux utilisateurs un accès aux données, aux outils d’analyse et aux logiciels de Statistique Canada ainsi que la puissance de calcul nécessaire pour effectuer diverses analyses. Cette plateforme s’adresse à un large éventail d’utilisateurs externes, comme les chercheurs, les analystes de données, les scientifiques des données et les professionnels des secteurs public et privé.

Dans l’ensemble, la plateforme des SAD offre plusieurs fonctionnalités :

  • des espaces de travail personnels ou collaboratifs sécurisés pour le calcul à grande capacité;
  • des données de StatCan de grande qualité, actuelles et fiables téléversées directement dans les espaces de travail des utilisateurs;
  • des métadonnées riches et une infrastructure de recherche pour veiller à ce que les données soient faciles à trouver, accessibles, interopérables et réutilisables;
  • des outils de pointe : cela va des logiciels statistiques aux fins de familiarité et de commodité à des logiciels en source libre pour une plus grande agilité et une plus grande souplesse;
  • des capacités avancées comme l’intelligence artificielle, des techniques d’apprentissage automatique et le traitement de données à haute performance.

Le Laboratoire virtuel de données (LVD) est un exemple de projet qui utilise les SAD. Il a une vaste base d’utilisateurs et fournit des services semblables à ceux d’autres environnements des SAD. Toutefois, l’architecture n’est pas aussi avancée sur le plan technologique et repose sur une infrastructure non infonuagique; des efforts de modernisation sont donc nécessaires.

La gouvernance des SAD est répartie entre le Secteur des solutions numériques (secteur 9) et le Secteur de la gestion stratégique des données, des méthodes et de l’analyse (secteur 6). En 2023, sous la direction du dirigeant principal des données (statisticien en chef adjoint [SCA] du secteur 6), le secteur 6 a repris la responsabilité opérationnelle des SAD et est responsable de la surveillance de tous les processus de SAD et chargé de la gestion des programmes. Le secteur 9 demeure le détenteur du budget exécutif et demeure responsable de l’expertise technologique. Il y a également le Conseil consultatif sur les SAD, coprésidé par les directeurs généraux des deux secteurs, qui examine les escalades des problèmes, la portée, le budget et l’harmonisation stratégique des activités.

L’objectif de l’évaluation est de fournir des renseignements crédibles et neutres sur la pertinence et le rendement des SAD. La portée de la présente évaluation était axée sur la pertinence des SAD et l’atteinte des résultats prévus, ainsi que sur des considérations relatives à l’amélioration continue et à la durabilité de la plateforme. L’optimisation des ressources a également été évaluée de façon générale.

Principales constatations et recommandations

Il y a un besoin permanent en ce qui concerne les SAD. Ils sont importants pour la modernisation des données fédérales et la collaboration sécurisée dans un environnement de type Protégé B axé sur l’infrastructure infonuagique, ainsi que l’accès en temps réel, afin de répondre aux besoins uniques des chercheurs, des scientifiques des données et des décideurs. Les SAD ne sont pas considérés comme des services faisant double emploi avec d’autres services et pourraient, grâce à des améliorations en matière de fonctionnalité et de convivialité, continuer de répondre aux besoins changeants des utilisateurs.

Toutefois, les SAD ont connu un succès mitigé dans l’atteinte des résultats prévus. Bien que certains objectifs aient été atteints, comme permettre l’accès aux données et soutenir la collaboration, des défis comme les longs délais d’intégration, les retards d’accès et les enjeux d’harmonisation avec le mandat de Statistique Canada ont nui à son plein potentiel. Les utilisateurs internes indiquent une plus grande satisfaction que les utilisateurs externes, qui ont connu des pertes d’efficacité ayant une incidence sur le lancement de projets et l’expérience utilisateur globale. Bien que les SAD aient appuyé divers projets visant à sécuriser le partage des données et le soutien stratégique, de nombreux projets sont toujours en cours ou ont été abandonnés, ce qui limite l’évaluation de leurs répercussions complètes au moment de l’évaluation.

De plus, les SAD font face à d’importants défis en matière de durabilité en raison de déficits de financement, des limites de capacité en matière de technologie de l’information (TI) et de la baisse de satisfaction des utilisateurs. Bien que les améliorations récentes soient prometteuses, leur incidence n’est pas encore mesurable, et des préoccupations continues pourraient entraîner une sous-utilisation et des coûts d’exploitation élevés. Plus de temps et de surveillance sont nécessaires pour déterminer la viabilité à long terme des SAD.

À la lumière de ces constatations, les recommandations suivantes sont proposées.

Recommandation 1

Le SCA du Secteur de la gestion stratégique des données, des méthodes et de l’analyse (secteur 6), en collaboration avec le SCA du Secteur des solutions numériques (secteur 9), devrait veiller à ce que les efforts de modernisation déployés pour les SAD et le LVD soient harmonisés et non redondants. Cela permettra de s’aligner sur la vision à long terme des SAD tout en utilisant efficacement les ressources limitées de TI de StatCan.

Recommandation 2

Le SCA du secteur 6, en collaboration avec le SCA du secteur 9, devrait chercher des façons d’améliorer l’expérience des utilisateurs externes pour soutenir l’adoption des SAD et promouvoir des coûts durables. Selon les résultats de l’évaluation, les domaines d’amélioration devraient comprendre, sans s’y limiter, l’intégration, le catalogage des services, les modèles de calcul des coûts et l’accès rapide aux données.

Recommandation 3

Le SCA du secteur 6, en collaboration avec le SCA du secteur 9, devrait veiller à ce que le programme fasse l’objet d’une surveillance efficace et, plus précisément, à ce que :

  1. des processus soient en place pour suivre et surveiller les clients directs et indirects des SAD, afin de mieux comprendre la base de clients des SAD et leur adoption au fil du temps;
  2. que des indicateurs de rendement pour les SAD, comme l’utilisation et la satisfaction des clients, soient établis et surveillés régulièrement;
  3. des évaluations continues des coûts globaux du programme, de l’efficience et du dédoublement des services (c.-à-d. LVD, Espace de travail d’analyse avancée, Environnement d’analyse collaborative) et de l’incidence sur les utilisateurs soient effectuées.

Recommandation 4

Le SCA du secteur 6, en collaboration avec le SCA du secteur 9, devrait explorer les possibilités de rendre la fonctionnalité et la technologie de la plateforme des SAD plus accessibles à un public plus vaste d’utilisateurs.

Recommandation 5

Les SCA des secteurs 6 et 9 devraient examiner la structure budgétaire actuelle pour s’assurer qu’elle est efficiente et efficace, et qu’elle est harmonisée avec les politiques et les pratiques organisationnelles.

Sigles et termes utilisés

API
Interface de programmation d’applications
CDR
Centre de données de recherche
CFDR
Centre fédéral de données de recherche
EAC
Environnement d’analyse collaborative
EAG
Environnement d’analyse géospatiale
EPI
Équipement de protection individuelle
ETAA
Espace de travail d’analyse avancée
FAIR
Facile à trouver, accessible, interopérable, réutilisable
IA
Intelligence artificielle
LVD
Laboratoire virtuel de données
PFDS
Plateforme fédérale de données scientifiques
RO des SAD
Responsable opérationnel des Services d’analyse des données
SAD
Services d’analyse des données
SCA
Statisticien en chef adjoint
SDMX
Initiative d’échange de données et de métadonnées statistiques
SPC
Services partagés Canada
StatCan
Statistique Canada
TI
Technologie de l’information
UTG
Unité de traitement graphique

Contenu

1. Contexte

Dans le cadre du budget de 2018, un financement a été annoncé pour appuyer le programme de modernisation de Statistique Canada (StatCan) et améliorer son infrastructure statistique technologique grâce au développement des Services d’analyse des données (SAD). En raison de la croissance exponentielle du volume de données et de leur utilisation, en plus des demandes correspondantes pour le stockage et le traitement, des approches nouvelles et novatrices de la fourniture d’infrastructures étaient nécessaires. Les SAD sont une plateforme infonuagique conçue et développée à l’interne qui fournit aux utilisateurs un accès aux données, aux outils d’analyse et aux logiciels de StatCan ainsi que la puissance de calcul nécessaire pour effectuer diverses analyses. Cette plateforme s’adresse à un large éventail d’utilisateurs, comme les chercheurs, les analystes de données, les scientifiques des données et les professionnels des secteurs public et privé.

Les SAD permettent aux utilisateurs de combiner les données de StatCan à des ensembles de données externes (c.-à-d. données appartenant aux clients ou accessibles au public) afin de créer des ensembles de données plus détaillés, tout en maintenant des protocoles de sélection et de sécurité stricts. Ces ensembles de données peuvent être stockés en toute sécurité dans le nuage afin que les utilisateurs puissent y accéder à distance et effectuer diverses analyses en collaboration pour générer des extrants comme des tableaux, des graphiques et des visualisations de données. L’objectif global des SAD est de favoriser la collaboration dans le cadre de projets axés sur les données, d’améliorer l’expérience utilisateur lors de l’accès aux données de StatCan et d’accroître la pertinence de StatCan pour les utilisateurs clés.

La plateforme est en partie financée par un modèle de recouvrement des coûtsNote de bas de page 1 selon lequel les frais sont fondés sur la portée, la complexité et la taille d’un projet donné. Ces frais couvrent des coûts comme les salaires, les licences et les services infonuagiques. Les coûts de l’infonuagique sont payés à Microsoft Azure et ils varient selon le niveau d’utilisation de la plateforme par un client.

La plateforme des SAD offre quatre environnements distincts aux utilisateurs, selon leurs besoins et leur expertise (figure 1). Les utilisateurs peuvent également combiner des fonctionnalités dans les différents environnements des SAD.

Figure 1. Environnements des Services d’analyse des données disponibles
Figure 1. Environnements des Services d’analyse des données disponibles
Description - Figure 1. Environnements des Services d’analyse des données disponibles

La figure 1 présente un aperçu de quatre environnements distincts conçus pour soutenir divers niveaux d'analyse de données et de gestion des données statistiques. Chaque environnement est adapté aux besoins de différents groupes d'utilisateurs, allant des débutants aux utilisateurs avancés.

  1. Environnement d'analyse collaborative (CAE) :
    • Offre une expérience de glisser-déposer qui permet aux utilisateurs de tous les niveaux de compétence d’acquérir rapidement des connaissances
    • Offre la suite connue de produits d’analyse de Microsoft (p. ex. Microsoft Power BI, Databricks, service d’apprentissage automatique d’Azure, Synapse et Azure DevOps)
  2. Espace de travail d'analyse avancée (AAW) :
    • Augmente la puissance et la flexibilité de traitement, d’analyse et de visualisation des données pour des utilisateurs plus avancés
    • Offre une suite de produits d’analyse libres et ouverts de premier plan, comme JupyterLab, R, Python, R Shiny, Kibana et Kubeflow
  3. Environnement d'analyse géospatiale (EAG) :
    • Permet aux utilisateurs d’intégrer des composantes géospatiales dans leur analyse et leur visualisation
    • Offre des produits d’analyse géospatiale exclusifs, libres et ouverts de premier plan, comme Esri, ArcGIS et Notebooks
  4. Échange de données et de métadonnées statistiques (.Stat SDMX) :
    • Fournit une plateforme en source ouverte pour la production et la diffusion efficaces de données statistiques de grande qualité

Dans l’ensemble, la plateforme des SAD offre plusieurs fonctionnalités :

  • des espaces de travail personnels ou collaboratifs sécurisés pour le calcul à grande capacité;
  • des données de StatCan de grande qualité, actuelles et fiables téléversées directement dans les espaces de travail des utilisateurs;
  • des métadonnées riches et une infrastructure de recherche pour veiller à ce que les données respectent les principes FAIR, c.-à-d. soient faciles à trouver, accessibles, interopérables et réutilisablesNote de bas de page 2;
  • des outils de pointe; cela va des logiciels statistiques aux fins de familiarité et de commodité à des logiciels en source libre pour une plus grande agilité et une plus grande souplesse;
  • des capacités avancées comme l’intelligence artificielle (IA), des techniques d’apprentissage automatique et le traitement de données à haute performance.

Les SAD fournissent également divers services de soutien, comme les opérations et la surveillance, l’ingestion de données, l’accès aux données de StatCan (p. ex. microdonnées, données protégées), l’ingénierie de solutions, l’accompagnement à l’intégration et les services de bac à sable, pour aider les utilisateurs à accéder aux SAD et à les utiliser. Pour obtenir de plus amples renseignements sur les SAD, veuillez consulter l’annexe A, où figurent ses divers environnements, intrants, services et extrants.

Divers projets ont tiré avantage des environnements des SAD pour atteindre différents objectifs, comme une collaboration accrue et un meilleur accès aux données. L’annexe B présente une liste d’exemples de projets variés. Il convient de noter qu’un projet qui utilise des SAD est le Laboratoire virtuel de données (LVD), qui est une première ancienne version de l’Environnement d’analyse collaborative (EAC) lancé en 2021. Il fournit aux utilisateurs l’infrastructure et les outils dont ils ont besoin pour tirer parti à distance et en toute sécurité des microdonnées confidentielles de StatCan, une solution de rechange aux centres de données de recherche (CDR) ou au Centre fédéral de données de recherche (CFDR). Il compte une vaste base d’utilisateurs composée de 38 organismes de parrainage et de 375 utilisateurs, et offre une intégration et un accès efficaces en raison de ses processus de gouvernance plus stricts et de ses offres de services et cas d’utilisation plus simples. Bien que le LVD offre un environnement verrouillé et une sécurité de pointe, l’architecture n’est pas aussi avancée sur le plan technologique que les autres environnements des SAD et repose sur une infrastructure non infonuagique.

Le processus d’intégration

Les clients commencent le processus d’intégration en communiquant avec l’équipe des SAD pour fournir une description de leurs besoins. Une solution, des coûts et des échéanciers sont convenus, puis le projet est lancé sur la plateforme. Bien que l’échéancier d’intégration diffère selon la complexité du projet, la figure 2 donne un aperçu du parcours habituel d’un utilisateur des SAD, du lancement du projet à la mise hors service. Divers changements ont été apportés au parcours d’intégration depuis le lancement des SAD; la figure 2 présente son état actuel.

Figure 2. Processus d’intégration des Services d’analyse des données
Figure 2. Processus d’intégration des Services d’analyse des données
Description - Figure 2. Processus d’intégration des Services d’analyse des données

La figure 2 illustre les quatre étapes du processus d'intégration des SAD, détaillant les étapes et les interactions impliquées depuis le lancement jusqu'à la mise hors service.

  • Lancement : À l'étape du lancement, les clients accèdent au portail des Services d’analyse des données pour soumettre une demande. L’équipe d’intégration communique avec les clients, trie les demandes et recueille les exigences.
  • Administration et gouvernance : Pendant l'étape d'administration et de gouvernance, les clients reçoivent une solution proposée, ainsi qu’une estimation de coût et un échéancier. Le projet fait l’objet d’un examen complet de la gouvernance des données, de la protection de la vie privée et de l’éthique en collaboration avec le Bureau de gestion de la protection de la vie privée et de coordination de l’information et le Secrétariat de l’éthique des données.
  • Soutien à l'intégration : Lorsqu’une entente de service est signée, la solution est élaborée et livrée. Une formation et une intégration, ainsi qu’un soutien et une tenue à jour continus des technologies de l’information, sont fournis aux clients. Des spécialistes de Statistique Canada fournissent également un soutien méthodologique aux clients.
  • Mise hors service : À l'étape de la mise hors service, après la fin du projet, les données et les environnements sont supprimés, les comptes sont révoqués et une enquête sur la satisfaction des clients est envoyée.

Gouvernance

La gouvernance des SAD est répartie entre le Secteur des solutions numériques (secteur 9) et le Secteur de la gestion stratégique des données, des méthodes et de l’analyse (secteur 6). En 2023, sous la direction du dirigeant principal des données (statisticien en chef adjoint du secteur 6), le secteur 6 a repris la responsabilité opérationnelle des SAD, qui relèvent maintenant du Centre des normes en matière de statistiques et de données. Le secteur 6 est responsable de la surveillance de tous les processus de SAD et chargé de la gestion des programmes sous la direction de l’équipe de responsabilité opérationnelle des Services d’analyse des données (RO des SAD). Le secteur 9 demeure le détenteur du budget exécutif et demeure responsable de l’expertise technologique.

Il y a également le Conseil consultatif sur les SAD, coprésidé par les directeurs généraux des deux secteurs. Ses membres sont divers directeurs du secteur 6 (y compris du Bureau de gestion de la protection de la vie privée et de coordination de l’information et de la Division de l’accès aux données), du secteur 9, des divisions spécialisées, du Service de renseignements statistiques et de l’équipe de RO des SAD. Le Conseil examine les escalades des problèmes, la portée, le budget et l’harmonisation stratégique des activités.

Évolution des Services d’analyse des données

Depuis leur lancement en 2018, les SAD ont subi plusieurs changements importants. Vous trouverez ci-dessous un aperçu de leur évolution qui met l’accent sur les principaux développements pertinents pour l’évaluation.

  • 2018 : lancement des SAD
    Les SAD ont été lancés en 2018, d’abord pour répondre aux besoins en matière d’analyse de données de la communauté de la science des données de StatCan et, plus tard, pour établir un partenariat dans le cadre de projets pilotes avec d’autres ministères fédéraux. Le secteur 9 était à la fois le responsable opérationnel et le détenteur du budget exécutif responsable de l’élaboration de la plateforme.
  • 2020 : répercussions de la COVID-19
    La pandémie a eu une incidence importante sur les SAD, accélérant l’utilisation de l’espace de travail d’analyse avancée (ETAA) et de l’EAC. Par exemple, dans le cadre d’un projet, une analyse collaborative a été menée pour éclairer les décisions sur la disponibilité de l’équipement de protection individuelle (EPI).
  • 2023 : clôture du projet et transfert de la responsabilité opérationnelle
    À la fin du projet de SAD, une lacune importante a été relevée : l’absence d’un plan stratégique pour gérer les SAD en tant que programme pour aller de l’avant. En mai 2023, le statisticien en chef a nommé le secteur 6 comme nouveau responsable opérationnel des SAD. Le secteur 9 est demeuré le détenteur du budget exécutif et responsable de l’expertise technologique.
  • 2024 : planification stratégique et amélioration des SAD
    Après le transfert de la responsabilité opérationnelle, plusieurs changements clés ont été apportés pour améliorer l’efficacité, l’efficience et la durabilité des SAD :
    • On a prévu de faire la transition des utilisateurs de StatCan vers des plateformes internes plus efficaces (c.-à-d. La Zone et la solution de rechange aux SAD), en mettant l’accent sur les utilisateurs externes (p. ex. autres ministères fédéraux, administrations provinciales, territoriales et municipales, et secteur privé).
    • Les offres de services ont été simplifiées en réduisant la personnalisation pour les utilisateurs et en allégeant les pressions sur les spécialistes de la technologie de l’information (TI) de StatCan.
    • Les utilisateurs dont les besoins ne correspondaient pas au mandat de StatCan ont été exclus de la plateforme des SAD.Note de bas de page 3
    • Une nouvelle lettre d’entente a été créée entre le secteur 6 et le secteur 9 et décrit les rôles et les responsabilités des deux secteurs, y compris les affectations budgétaires.

L’évaluation tient compte de la nature évolutive des SAD et des récents changements pris en considération pour les thèmes de recommandation.

2. À propos de l’évaluation

Autorité

L’évaluation a été menée conformément à la Politique sur les résultats du Conseil du Trésor et au Plan d’audit et d’évaluation fondé sur les risques de StatCan (2024-2025 à 2028-2029).

Objectif et portée

L’objectif de l’évaluation est de fournir des renseignements crédibles et neutres sur la pertinence et le rendement des SAD.

La portée de la présente évaluation, déterminée en collaboration avec diverses parties prenantes clés (c.-à-d. le secteur 6, le secteur 9 et la haute direction), était axée sur la pertinence des SAD et l’atteinte des résultats prévus, ainsi que sur des considérations relatives à l’amélioration continue et à la durabilité de la plateforme. L’optimisation des ressources a également été évaluée de façon générale en examinant la mesure dans laquelle le programme de SAD est pertinent et affiche un bon rendement, et par les perceptions des utilisateurs quant au coût du service et de la plateforme.

Le travail d’évaluation a été effectué de septembre 2024 à janvier 2025.

Approche et méthodologie

Les trois questions d’évaluation suivantes ont été relevées :

  1. Dans quelle mesure les SAD sont-ils toujours nécessaires?
  2. Dans quelle mesure les SAD ont-ils atteint les résultats prévus?
  3. Dans quelle mesure les SAD sont-ils durables dans leur état actuel?

De plus amples renseignements sur les questions d’évaluation et les indicateurs connexes figurent à l’annexe C.

Les méthodes de collecte de données décrites à la figure 3 ont été utilisées. Les constatations présentées dans le présent rapport sont fondées sur la triangulation de ces méthodes de collecte de données.

Figure 3. Méthodes de collecte des données
Figure 3. Méthodes de collecte des données
Description - Figure 3. Méthodes de collecte des données

La figure 3 décrit les méthodes utilisées par l'évaluation pour la collecte des données.

  • Entrevues auprès des utilisateurs des SAD : Des entrevues semi-structurées ont été menées avec 15 utilisateurs externes des SAD, y compris des individus d'autres ministères fédéraux, des chercheurs et des analystes de politiques. De plus, 14 utilisateurs internes des SAD, qui sont des employés de Statistique Canada, ont été consultés.
  • Entrevues auprès des représentants de programme : Des entrevues semi-structurées ont également été menées avec 15 représentants de programme et partenaires au sein de Statistique Canada.
  • Examen des documents : Un examen des documents de Statistique Canada a été effectué, y compris les données sommaires d'enquête fournies par le programme.

Quatre principales limites ont été relevées et des stratégies d’atténuation ont été employées (tableau 1).

Tableau 1. Limites et stratégies d’atténuation
Limites Stratégies d’atténuation
Un biais d’autodéclaration peut se produire lors des entrevues; les personnes déclarant leurs propres activités pouvant les présenter sous un jour plus positif. Dans la mesure du possible, des commentaires et des réflexions sur les activités ont été demandés selon divers points de vue. Un examen des documents relatifs au programme est également venu appuyer une perspective équilibrée.
Étant donné que le moment de cette évaluation coïncidait avec une planification et une restructuration de programme importantes, il a été difficile d’évaluer ces efforts parce que trop peu de temps s’était écoulé. Un examen des réussites et des défis actuels, ainsi que des efforts déployés dans le cadre du programme pour en tirer parti et les relever, a été effectué. Les recommandations portent sur les efforts en suspens ou supplémentaires nécessaires pour combler les lacunes et les limites actuelles.
Il a été difficile de déterminer les utilisateurs externes. Au moment de leur identification, la plupart des personnes consultées n’avaient pas eu recours aux Services d’analyse des données (SAD) ou avaient refusé de participer à une entrevue. Cela a rendu difficile l’évaluation complète des répercussions sur les utilisateurs. Des responsables spécialisés internes de plusieurs projets externes ont pu être consultés. L’accès, la satisfaction des utilisateurs internes et externes et les répercussions sur ces utilisateurs ont été examinés dans la mesure du possible. Toutefois, des mesures et des évaluations continues du rendement seront nécessaires pour évaluer la réussite et les répercussions sur les utilisateurs externes à l’avenir.
Les SAD comportaient des aspects financiers très techniques et complexes. Outre d’autres incertitudes, celles-ci étaient difficiles à contextualiser et nécessitaient des éclaircissements. Plusieurs réunions non officielles ont eu lieu avec les secteurs 6 et 9 et d’autres parties prenantes de Statistique Canada tout au long de l’évaluation, afin de clarifier diverses composantes techniques, financières et liées à la gestion des SAD et de fournir un contexte important pour les constatations.

Leçons tirées

1. Pertinence : besoin continu

Dans quelle mesure les SAD sont-ils toujours nécessaires?

Les SAD sont toujours nécessaires. Ils sont importants pour la modernisation des données fédérales et la collaboration sécurisée dans un environnement de type Protégé B axé sur l’infrastructure infonuagique, ainsi que l’accès en temps réel, afin de répondre aux besoins uniques des chercheurs, des scientifiques des données et des décideurs. Les SAD ne sont pas considérés comme des services faisant double emploi avec d’autres services et pourraient, grâce à des améliorations en matière de fonctionnalité et de convivialité, continuer de répondre aux besoins changeants des utilisateurs.

Les SAD respectent les priorités à l’échelle fédérale et de l’organisme en ce qui concerne la modernisation, l’accessibilité et la collaboration en matière de données. Afin de mieux tenir compte des priorités de l’organisme, l’admissibilité des utilisateurs a récemment été mise à jour pour exclure les utilisateurs externes dont les projets ne correspondent pas au mandat de Statistique Canada.

À l’échelle fédérale, les SAD s’harmonisent avec les principales priorités établies dans la Stratégie de données pour la fonction publique fédérale, y compris la création d’initiatives pangouvernementales en matière de données, la facilitation du partage sécurisé des données et le soutien à la transformation numérique et à l’infonuagique.

À l’échelle de l’organisme, les SAD s’harmonisent avec la Stratégie de données de StatCan et le programme de modernisation, particulièrement en ce qui concerne ce qui suit :

  • la transformation numérique et la modernisation de la TI (p. ex. l’habilitation infonuagique, exploitation de l’IA et de l’apprentissage automatique, milieux de travail numériques, outils de pointe pour l’acquisition, le traitement, l’intégration et l’analyse de données);
  • la gestion collaborative des données et les partenariats avec diverses parties prenantes internes et externes, comme les ministères fédéraux, les administrations provinciales et territoriales, le milieu universitaire, les organisations autochtones et d’autres (p. ex. partage de données, renforcement des systèmes statistiques nationaux, élaboration d’approches intégrées pour la collecte et l’analyse de données, élimination des cloisonnements);
  • l’accès général aux données (p. ex. accès aux données de type Protégé B et aux microdonnées anonymisées) tout en maintenant un processus rigoureux et transparent qui respecte les exigences en matière de protection de la vie privée, d’éthique et de législation (p. ex. Conseil consultatif sur les SAD et surveillance de l’acquisition et de la gestion des données);
  • l’approche axée sur les données administratives et l’exploitation des écosystèmes de données (p. ex. données ouvertes).

Toutefois, des enjeux d’harmonisation avec le mandat de StatCan ont été cernés, ce qui a changé la façon dont les SAD pouvaient être utilisés. Selon l’interprétation par les personnes consultées de la Loi sur la statistique, qui établit le mandat de StatCan, les SAD ne doivent pas être utilisés uniquement comme infrastructure de TI ou comme serveur de données pour les utilisateurs externes. Ils devraient plutôt servir à permettre une collaboration externe pour enrichir ou ajouter de la valeur aux extrants statistiques collectifs, appuyer la production de statistiques et d’extrants officiels, et appuyer le rôle de StatCan dans la coordination nationale des données. Les utilisateurs externes dont les besoins ne correspondaient pas à cette interprétation du mandat de StatCan ont récemment été exclus de la plateforme des SAD. Par exemple, les utilisateurs externes qui n’avaient pas besoin d’exploiter les données de StatCan n’étaient plus en mesure d’utiliser la plateforme des SAD pour leurs besoins en matière d’analyse.

Certaines personnes consultées sur le programme ont fait remarquer que Services partagés Canada (SPC) pourrait être mieux en mesure d’héberger une infrastructure de TI ou un serveur de données plus vaste pour les utilisateurs externes, parce que cela cadre avec son mandat d’offrir des programmes et des services numériques à l’échelle de l’entreprise. Cela permettrait aux projets exclus de tirer avantage de la technologie développée et d’éviter le dédoublement des efforts.

Il y a une demande croissante d’environnements collaboratifs sécurisés pour l’analyse de données, avec un accent particulier mis sur l’infrastructure infonuagique, l’accès en temps réel et la gouvernance des données. Bien que les SAD aient visé à répondre à ces besoins, de nombreux utilisateurs ont fait face à des défis importants qui ont entraîné des retards ou la recherche de solutions de rechange. Malgré le potentiel futur perçu des SAD, les préoccupations quant à sa fonctionnalité et à sa convivialité persistaient chez les utilisateurs.

Selon un examen des stratégies fédérales et de l’organisme, ainsi que des entrevues, il y a une demande parmi les chercheurs, les scientifiques des données et les décideurs en matière d’environnements sécurisés, collaboratifs et efficaces pour le traitement des données, avec un accent particulier sur l’infrastructure infonuagique, l’accès en temps réel et la gouvernance et la sécurité des données. Cela est particulièrement pertinent compte tenu de l’augmentation rapide du nombre de plateformes d’informatique en nuage et d’analyse infonuagique à l’échelle mondiale. En général, les SAD sont considérés comme un outil puissant et novateur pouvant répondre à ces besoins en raison de l’habilitation infonuagique, des espaces de travail collaboratifs, de l’accès aux données et à l’expertise de StatCan ainsi que de protocoles stricts en matière de sécurité, de protection de la vie privée et d’accès.

Toutefois, les documents de programme et les entrevues ont montré que les utilisateurs faisaient face à des obstacles techniques et liés à la gouvernance (p. ex. longue période d’intégration, enjeux de calcul des coûts, instabilité de la plateforme, manque de conseils pour les débutants), ce qui a entraîné des retards dans les projets ou une recherche de solutions de rechange (ces défis sont décrits plus en détail dans le paragraphe sur le rendement). Dans l’ensemble, bien que les aspects théoriques de la plateforme aient été considérés comme solides par la plupart des personnes consultées, la question de la fonctionnalité et de la convivialité n’était toujours pas réglée pour la plupart d’entre elles. Cela était particulièrement vrai pour les personnes consultées qui étaient des utilisateurs externes et pour les projets à petit budget ou ceux ne nécessitant pas de capacités complexes (p. ex. production de statistiques descriptives de base).

Bien que plusieurs autres services offrent des capacités d’analyse semblables aux utilisateurs, les caractéristiques uniques des SAD démontrent que ces services ne font pas double emploi. Les SAD offrent une valeur ajoutée pour des cas d’utilisation particuliers, comme soutenir les employés fédéraux qui ont besoin de collaboration externe dans un environnement de type Protégé B ou de l’aide d’experts de StatCan, ainsi que les employés non fédéraux qui ont besoin d’un accès aux données, d’un soutien et d’une collaboration.

Plusieurs autres services similaires à ceux des SAD ont été relevés au cours des entrevues, notamment :

  • La plateforme fédérale de données scientifiques (PFDS) de SPC : Cette plateforme infonuagique collaborative pour les scientifiques fédéraux comprend une infrastructure de données et des solutions analytiques reposant sur un modèle libre-service. La plupart des personnes consultées qui sont des utilisateurs fédéraux ont indiqué que la PFDS était une plateforme de rechange qu’ils envisageaient.
  • La Zone et la solution de rechange aux SAD de StatCan : Cette plateforme infonuagique pour les employés internes de StatCan offre des services semblables aux plateformes ETAA et CAE de SAD, avec certaines améliorations. Par conséquent, les employés internes de StatCan n’utiliseront plus les SAD pour des fonctions génériques ou de routine. Les personnes consultées sur le programme ont indiqué que ces plateformes avaient été modélisées sur les SAD, notant que leur élaboration et leur mise en œuvre étaient par conséquent plus efficaces.
  • Les entreprises privées : Solutions d’infrastructures de données et solutions analytiques infonuagiques par l’entremise de Microsoft, Amazon, Google, etc.

Toutefois, en comparant ces options avec les SAD, il a été déterminé que ces services ne faisaient pas double emploi en raison de plusieurs caractéristiques uniques à valeur ajoutée, comme illustrée à la figure 4.

Figure 4. Valeur ajoutée des Services d’analyse des données
Figure 4. Valeur ajoutée des Services d’analyse des données
Description - Figure 4. Valeur ajoutée des Services d’analyse des données

La figure 4 compare la valeur ajoutée des SAD avec d'autres plateformes, y compris la Plateforme fédérale des données scientifiques de Services partagés Canada (SPC), La Zone et solution de rechange aux SAD de StatCan, ainsi que des entreprises privées, selon quatre critères : collaboration externe, environnement Protégé B, accès aux données de StatCan et soutien de StatCan.

  • Collaboration externe
    • Plateforme fédérale des données scientifiques de SPC : Non
    • La Zone et solution de rechange aux SAD de StatCan : Non
    • Entreprises privées : Oui
    • SAD : Oui
  • Protégé B (Protégé B est un niveau de sécurité pour les renseignements et les biens de nature délicate au Canada. Il s’agit de renseignements qui, s’ils étaient compromis, pourraient causer un préjudice grave à une personne, à un organisme ou à un gouvernement)
    • Plateforme fédérale des données scientifiques de SPC : Non
    • La Zone et solution de rechange aux SAD de StatCan : À venir prochainement
    • Entreprises privées : Oui
    • SAD : Oui
  • Accès aux données de StatCan
    • Plateforme fédérale des données scientifiques de SPC : Non
    • La Zone et solution de rechange aux SAD de StatCan : Non
    • Entreprises privées : Non
    • SAD : Oui
  • Soutien de StatCan
    • Plateforme fédérale des données scientifiques de SPC : Non
    • La Zone et solution de rechange aux SAD de StatCan : Non
    • Entreprises privées : Non
    • SAD : Oui

Plus précisément, les SAD offrent la valeur ajoutée suivante :

  • Collaboration externe : Les SAD sont accessibles aux chercheurs, aux scientifiques des données et aux décideurs à l’extérieur du gouvernement fédéral. Aucun autre service fédéral ne permet l’accès à ces types d’utilisateurs externes et la collaboration avec eux.
  • Environnement Protégé BNote de bas de page 4 : La plateforme des SAD est un environnement de type Protégé B qui permet d’accéder à un volume et à un type accrus de données protégées aux fins de collaboration externe. Aucune entreprise privée ne peut offrir ce type d’environnement à des utilisateurs externes.
  • Accès aux données de StatCan : Les SAD fournissent aux utilisateurs un accès à distance aux microdonnées confidentielles de StatCan et, dans certains cas, un accès aux données de StatCan avant la diffusion. Cela donne accès à un plus grand volume de données et à plus de types de données. Aucun autre service fédéral ou aucune autre entreprise privée ne peut offrir aux utilisateurs ces types de données de StatCan.
  • Soutien de StatCan : Les utilisateurs ont accès à des spécialistes, à des ressources méthodologiques et à l’équipe des SAD pour appuyer leurs projets. Certaines personnes consultées ont indiqué que cela était très utile pour répondre aux questions d’ordre méthodologique et cerner les besoins en matière de personnalisation de la plateforme. Comparativement, la PFDS s’utilise en libre-service.

Quelques autres options ont été signalées par les personnes consultées qui sont des utilisateurs externes pour appuyer leurs besoins en matière d’analyse et de données, comme les anciennes plateformes au sein d’autres ministères fédéraux et des CDR et du CFDR, mais il a été reconnu que ces systèmes n’étaient pas comparables aux SAD sur le plan des capacités d’analyse, de l’accès et de la collaboration. Quelques personnes consultées ont également mentionné les capacités géospatiales uniques de l’Environnement d’analyse géospatiale (EAG) comparativement à d’autres services. Toutefois, l’EAG est une composante plus récente des SAD, comparativement à l’EAC et à l’ETAA, de sorte que moins de personnes consultées ont été en mesure de parler de cet environnement.

2. Rendement : atteinte des résultats prévus

Dans quelle mesure les SAD ont-ils atteint les résultats prévus?

Les SAD ont connu un succès mitigé dans l’atteinte des résultats prévus. Bien que certains objectifs aient été atteints, comme permettre l’accès aux données et soutenir la collaboration, des défis comme les longs délais d’intégration, les retards d’accès et les enjeux d’harmonisation avec le mandat de Statistique Canada ont nui à son plein potentiel. Les utilisateurs internes indiquent une plus grande satisfaction que les utilisateurs externes, qui ont connu des pertes d’efficacité ayant une incidence sur le lancement de projets et l’expérience utilisateur globale. Bien que les SAD aient appuyé divers projets visant à sécuriser le partage des données et le soutien stratégique, de nombreux projets sont toujours en cours ou ont été abandonnés, ce qui limite l’évaluation de leurs répercussions complètes au moment de l’évaluation.

Bien que les SAD aient atteint la plupart de leurs objectifs originaux, certains sont toujours en cours et un n’a pas été réalisé parce qu’il a été jugé hors champ.

Vingt-cinq objectifs ont été énoncés pour les SAD au moment du lancement de la plateforme. La plupart ont été atteints, tandis que certains sont toujours en cours et un n’a pas été réalisé parce qu’il a été jugé hors champ. Ce qui suit résume les principaux points à retenir :

  • Pleinement atteints (15) : Les SAD sont une plateforme complète qui a intégré l’expérience utilisateur ainsi que la gestion et l’analyse avancées des données. Elle a soutenu l’IA et l’apprentissage automatique, a permis l’analyse de mégadonnées au moyen d’un calcul de pointe et a tiré avantage de la virtualisation pour assurer une livraison de données efficace et un stockage avancé. La plateforme des SAD a fourni des métadonnées en libre accès, a facilité des flux de travail opérationnels et a veillé à ce que l’accès soit sécurisé grâce à une authentification forte. Elle a amélioré l’accès aux données de StatCan grâce à l’ingénierie des pipelines et a offert des capacités d’exécution à distance. La plateforme a également pris en charge l’analyse au moyen d’outils libres et a fourni une infrastructure agile évolutive répondant à divers besoins des utilisateurs.
  • Partiellement atteints (9) : Les SAD ont favorisé la collaboration dans le partage d’algorithmes et de données avec les caractéristiques fondées sur Git et les robots conversationnels de l’IA, mais le contrôle de version des utilisateurs externes au moyen d’Azure DevOps est toujours en cours d’élaboration. Les objectifs d’audit et de production de rapports ont été partiellement atteints; l’achèvement est prévu pour le prochain exercice financier. Une fonction de découverte de données a été déployée, et il reste du travail à faire pour continuer de développer un navigateur de découverte de données. L’accès aux données pour la collectivité élargie est en cours, et le catalogue de données doit être peaufiné. Les SAD ont appuyé l’échange de données machine à machine, mais ont fait face à des défis d’intégration et à une courbe d’apprentissage abrupte. Les capacités en matière de données géospatiales sont améliorées, mais une intégration complète à la Plateforme géospatiale fédérale est en cours. Alors que des améliorations de la gouvernance sont en cours, le soutien à l’infrastructure de la plateforme et à l’analyse a été partiel, en raison de contraintes de coûts et d’enjeux budgétaires qui empêchent un soutien complet. La gouvernance de l’information devrait être atteinte en 2025-2026. Enfin, les SAD disposaient d’une architecture de lacs de données sécurisée, et des travaux sont en cours pour améliorer le partage sécurisé.
  • Non réalisé (1) : La gestion de la provenance et de l’historique a été jugée hors du champ des SAD parce qu’elle a été incluse comme composante de l’architecture intégrée cible.

Une liste de ces objectifs originaux et de leur état d’avancement figure à l’annexe E.

Depuis sa création, divers utilisateurs externes et internes ont accédé à la plateforme des SAD ou en ont demandé l’accès; la plupart des utilisateurs externes utilisant le LVD. Il y a environ un nouveau formulaire de demande pour les SAD déposé par mois par les utilisateurs externes (à l’exclusion de ceux utilisant le LVD). Toutefois, en raison des systèmes disparates des SAD, il a été plus compliqué de comprendre complètement l’adoption de la plateforme par les utilisateurs.

Selon les données sommaires fournies par le programme, il y avait 769 utilisateurs des SAD (figure 5). Environ la moitié (55 %) de ces utilisateurs étaient externes à StatCan, principalement ceux ayant accédé au LVD. Il y avait également des utilisateurs des SAD provenant de trois autres organismes gouvernementaux fédéraux (c.-à-d. le Secrétariat du Conseil du Trésor du Canada, Santé Canada et l’Agence de la santé publique du Canada), d’une municipalité et d’une université.

Les utilisateurs internes (45 %) provenaient de deux secteurs de StatCan (c.-à-d. la Division des méthodes d’intelligence artificielle [IA] [anciennement appelée la Division de la science des données et de l’innovation] et le Centre de données sur la santé de la population) et de sept programmes de StatCan (c.-à-d. LVD, Recensement de la population, Recensement de l’environnement, Programme de la statistique de la santé buccodentaire, Commerce intérieur, Centre canadien d’information sur l’énergie et Centre de géomatique statistique). Au moment de l’évaluation, la transition de ces utilisateurs internes vers La Zone de Statistique Canada avait commencé.

Figure 5. Nombre d’utilisateurs externes et internes des Services d’analyse des données et du Laboratoire virtuel de données (n = 769)
Figure 5. Nombre d’utilisateurs externes et internes des Services d’analyse des données et du Laboratoire virtuel de données (n = 769)
Description - Figure 5. Nombre d’utilisateurs externes et internes des Services d’analyse des données et du Laboratoire virtuel de données (n = 769)

La figure 5 présente le nombre d'utilisateurs externes et internes des Services d'analyse des données (SAD) et du Laboratoire virtuel de données (LVD) dans un graphique à colonnes.

  • Les utilisateurs externes se composent de 45 utilisateurs des SAD et de 375 utilisateurs du LVD.
  • Les utilisateurs internes se composent de 349 utilisateurs des SAD.

De plus, les données sommaires fournies par le programme suggèrent que la demande de SAD est continue et qu’il y a un intérêt constant pour les SAD. Par exemple, au cours d’une période de six mois en 2024-2025, sept nouveaux formulaires de demande pour les SAD ont été reçus d’utilisateurs externes (la moyenne étant d’environ un nouveau formulaire de demande par mois pour l’EAC, l’ETAA ou l’EAG). La demande pour le LVD s’est également accrue et devrait continuer sur cette lancée, avec une augmentation de 30 % sur trois ans.

Plus important encore, il n’existe actuellement aucune méthode fiable pour surveiller la demande et l’utilisation de ces produits. L’information provient de diverses sources, ce qui complique la compréhension de l’accès et de l’utilisation. L’équipe des SAD travaille actuellement à l’élaboration de couplages pour mieux comprendre qui accède à la plateforme.

Les niveaux de satisfaction étaient mitigés chez les utilisateurs de la plateforme des SAD (à l’exclusion de ceux utilisant le LVD), les utilisateurs internes déclarant généralement un niveau de satisfaction plus élevé que les utilisateurs externes. Toutefois, il a été difficile d’évaluer la satisfaction globale et il est nécessaire de recueillir de meilleures données sur l’expérience utilisateur à l’avenir.

On a demandé aux personnes consultées parmi les utilisateurs internes et externes dans quelle mesure elles étaient satisfaites de la plateforme des SAD sur une échelle allant de Très insatisfaite (1) à Très satisfaite (5). Cinq utilisateurs consultés n’ont pas fourni de réponse, et les 24 autres personnes consultées, soit 12 utilisateurs internes et 12 utilisateurs externes, ont fourni les cotes moyennes suivantes concernant leur satisfaction à l’égard des SAD.

Figure 6. Taux de satisfaction des utilisateurs des Services d’analyse des données
Figure 6. Taux de satisfaction des utilisateurs des Services d’analyse des données
Description - Figure 6. Taux de satisfaction des utilisateurs des Services d’analyse des données

La figure 6 présente les évaluations de la satisfaction des utilisateurs internes et externes des SAD dans un graphique en anneau. L'évaluation de la satisfaction des utilisateurs internes est de 4,3 sur 5, tandis que l'évaluation de la satisfaction des utilisateurs externes est de 3,3 sur 5.

Les utilisateurs consultés satisfaits étaient principalement des utilisateurs internes, mais quelques-uns étaient des utilisateurs externes (les premiers à adopter les SAD, en particulier). Ces utilisateurs ont apprécié le processus d’intégration amélioré, la communication efficace de l’équipe des SAD et le fait que les SAD aient atteint leur objectif prévu. Toutefois, presque toutes les personnes consultées ont signalé des enjeux en matière de coût, des bogues de système et des retards d’accès aux données. Les utilisateurs externes consultés dans le cadre du projet sur l’EPI pendant la pandémie de COVID-19 ont exprimé une grande satisfaction à l’égard des SAD. Toutefois, il a également été noté qu’après la pandémie, des obstacles significatifs à l’accès aux SAD étaient liés à un changement des exigences (c.-à-d. les projets pour lesquels un accès aux données de StatCan n’était pas nécessaire ont été exclus, car ils ne correspondaient pas au mandat de StatCan).

Les utilisateurs externes consultés étaient les plus insatisfaits; ils cherchaient souvent des solutions de rechange pour leurs projets. De plus amples renseignements sur les lacunes et les limites vécues par les utilisateurs externes sont fournis dans la section ci-dessous, mais en général, ils ont subi des retards dans leur utilisation des SAD (p. ex. retards d’intégration et d’accès aux données).

Les utilisateurs du LVD n’ont pas été inclus en tant que personnes consultées dans l’évaluation, car une évaluation distincte a déjà été effectuée pour cette composante. Dans l’ensemble, les personnes consultées sur le programme ont fait remarquer que le taux de satisfaction était plus élevé chez les utilisateurs du LVD. En effet, le LVD peut offrir une intégration et un accès plus efficaces grâce à des processus de gouvernance plus stricts ainsi qu’à des offres de services et à des cas d’utilisation plus simples.

Dans l’ensemble, il a été difficile d’évaluer la satisfaction des utilisateurs à l’égard des SAD, car la plupart des utilisateurs externes consultés n’avaient pas encore accès aux SAD ou attendaient d’autres données avant de poursuivre leurs projets; leur expérience était donc limitée. Malheureusement, les utilisateurs externes ont été le groupe le plus important à évaluer, parce qu’ils seront l’objet de la plateforme à l’avenir (les utilisateurs internes utiliseront La Zone et la solution de rechange aux SAD). Des efforts continus sont nécessaires pour évaluer la satisfaction de ces utilisateurs.

De plus, le programme a fourni des données sommaires d’enquête, qui ont mis en évidence des niveaux de satisfaction mitigés chez les utilisateurs en 2022 et 2024. Toutefois, ces données n’étaient pas comparables parce que les données de 2024 ne comprenaient pas de réponses d’utilisateurs externes et qu’il y avait beaucoup moins de réponses, comparativement aux données de 2022. À l’avenir, il est possible de recueillir des données d’enquête plus diversifiées auprès des utilisateurs pour évaluer leur satisfaction à l’égard des SAD.

Plusieurs limites de la plateforme des SAD ont été mises en évidence, la plus importante étant le long processus d’intégration. Ce retard a gêné le lancement des projets et a eu une incidence sur la planification et l’efficience des utilisateurs, en particulier les utilisateurs externes. L’accès et l’utilisation ont également posé des défis.

La documentation du programme et les données des entrevues ont mis en évidence plusieurs lacunes et limites de la plateforme des SAD, y compris les défis liés à l’intégration, à l’accès et à l’utilisation, aux projets exclus et à la gérance des données. Voici un résumé des principales lacunes et limites :

  • Intégration : La documentation du programme et les données des entrevues ont souvent décrit les retards d’intégration comme l’un des plus grands défis en matière d’accès aux SAD, en particulier pour les utilisateurs externes. Selon les données sommaires de l’enquête de 2024, environ la moitié des utilisateurs ont déclaré être sans opinion à l’égard du processus d’intégration, insatisfaits ou très insatisfaits de ce processus. Les personnes consultées sur le programme ont fait remarquer que l’intégration dépendait de la complexité du projet (p. ex. de six à huit mois pour les projets complexes, de trois à six semaines pour les projets moins complexes). Dans le premier cas, les utilisateurs ayant un projet très complexe attendaient depuis plus de deux ans de finaliser leur lettre d’entente. Des enjeux d’intégration ont non seulement retardé le lancement des projets des nouveaux utilisateurs, mais ont également eu une incidence sur leur planification et leur efficience; certains utilisateurs ayant décidé de cesser d’utiliser les SAD. Fait important, les personnes consultées sur le programme ont fait remarquer que lorsque le programme aura simplifié ses offres de services, les délais d’intégration devraient s’améliorer, car il sera plus évident d’identifier les projets qui peuvent aller de l’avant et ceux qui nécessitent une évaluation plus poussée. Il convient également de noter que le LVD avait un processus d’intégration distinct qui a été déterminé par les personnes consultées comme étant plus rapide que les SAD en raison des processus de gouvernance plus stricts du LVD ainsi que de ses offres de service et cas d’utilisation simples.
  • Accès et utilisation : La documentation du programme et les données des entrevues ont également permis de cerner plusieurs défis liés à l’utilisation de la plateforme des SAD. Certains des enjeux les plus couramment relevés comprenaient l’instabilité de la plateforme (p. ex. bogues, temps d’arrêt, pannes, déconnexion du serveur), les enjeux d’accès (p. ex. problèmes de nom d’utilisateur et de mot de passe, processus d’authentification onéreux, retards dans l’obtention des données), le soutien insuffisant pour les questions techniques (pour certains utilisateurs), des courbes d’apprentissage abruptes et un manque de conseils et de documentation adaptés aux débutants, des enjeux en matière d’estimations de coûts et d’espace dans l’unité de traitement graphique (p. ex. analyse géospatiale ou lourde en données) et des enjeux d’espace rencontrés par les nouveaux clients au moment d’accéder au LVD (c.-à-d. le LVD a atteint sa limite de capacité). De plus, il a été mentionné dans les documents de programme et les données des entrevues que les SAD (notamment l’environnement de l’ETAA) pouvaient être trop complexes pour le cas d’utilisation moyen (p. ex. exécution de statistiques descriptives).
  • Projets exclus : Comme il a été mentionné précédemment, en 2024-2025, les personnes clés consultées sur le programme ont relevé que plusieurs projets de SAD avaient été exclus parce qu’ils ne correspondaient pas au mandat de StatCan. Les utilisateurs consultés ont indiqué qu’ils essayaient maintenant de recréer une plateforme analytique semblable au sein de leur propre ministère fédéral et ont souligné l’inefficience de ce processus pour le gouvernement du Canada. D’autres ont exprimé leur frustration quant au temps perdu et aux efforts vains pendant la planification et l’intégration.
  • Gérance des données : Certaines personnes consultées ont fait remarquer que les SAD avaient réglé avec succès la question de l’accès aux données, du partage des données, de la sécurité et de la protection de la vie privée, et qu’ils progressent désormais en ce qui concerne les normes depuis le passage au secteur 6. Toutefois, d’autres personnes consultées ont relevé des limites à la gérance des données en raison des changements de mise en œuvre et des contraintes budgétaires, comme le manque d’optimisation pour l’utilisation du nuage, la promotion du cloisonnement des données et le fait de ne pas aborder la classification des données.

Les projets des utilisateurs comportaient un éventail d’objectifs, notamment créer de nouvelles façons de collaborer, activer des pipelines d’ingestion de données sécurisés pour le partage des données, fournir un accès à un plus grand nombre de données, soutenir des décisions stratégiques par l’entremise de sources de données multisectorielles et la production de statistiques officielles. Toutefois, de nombreux projets étaient en cours au moment de l’évaluation, et plusieurs autres ont été abandonnés par les utilisateurs ou annulés par le programme; ce qui a rendu difficile l’évaluation des répercussions de l’utilisation des SAD.

Selon les documents de programme et les entrevues, les projets menés par des utilisateurs externes dans le cadre desquels les SAD ont été utilisés visaient un éventail d’objectifs différents. La figure 7 présente ces objectifs clés, ainsi que des exemples de projets et leur état au moment de l’évaluation (c.-à-d. non intégré ou en attente d’accès, en cours ou terminé). Il s’agit d’une liste non exhaustive de projets dans le cadre desquels les SAD ont été ou sont actuellement utilisés; ils ont été sélectionnés pour mettre en évidence les thèmes des objectifs clés.

Figure 7. Objectifs des projets liés aux Services d’analyse des données
Figure 7. Objectifs des projets liés aux Services d’analyse des données
Description - Figure 7. Objectifs des projets liés aux Services d’analyse des données

La figure 7 présente cinq objectifs clés des Services d’analyse des données (DAS) ainsi qu'un exemple de projet des SAD pour chaque objectif et leur statut au moment de l'évaluation (c'est-à-dire, projet pas encore intégré, projet en cours ou projet terminé).

  • Créer de nouvelles façons de collaborer
    • Le projet SafeTO réunit de multiples parties prenantes pour tirer avantage de sources de données multisectorielles et aidera à élargir la définition de la sécurité des collectivités au-delà des statistiques de la criminalité et de l’application de la loi pour y inclure la prévention et le bien-être.
    • Projet pas encore intégré
  • Activer des pipelines d’ingestion de données
    • Le projet des fichiers d’immatriculation des véhicules et le projet de l’environnement d’analyse des prix permettent l’ingestion de grands ensembles de données aux fins de traitement et d’analyse.
    • Projets en cours
  • Fournir un accès à un plus grand nombre de données
    • Le Laboratoire de données sur les entreprises offre des données en temps réel et des outils interactifs pour aider les entreprises canadiennes à naviguer efficacement sur le marché des affaires.
    • Projets en cours
  • Soutenir des décisions stratégiques
    • Dans le cadre du projet sur l’équipement de protection individuelle, un tableau de bord a été créé au début de la pandémie pour veiller à ce que les fournitures essentielles soient attribuées aux régions où les besoins sont les plus grands.
    • Projet terminé
  • Produire des statistiques officielles
    • Le projet AgZéro fait appel à la Division de l’agriculture et à la Division des méthodes d’IA (anciennement appelée la Division de la science des données et de l’innovation) de StatCan, ainsi qu’à des partenaires externes, en utilisant l’Environnement d’analyse collaborative, l’Espace de travail d’analyse avancée et l’Environnement d’analyse géospatiale pour permettre à la Division des méthodes d’IA d’élaborer tôt ou tard des modèles d’apprentissage automatique et de produire des statistiques officielles.
    • Projet en cours

Remarque importante : Bon nombre des projets examinés étaient en cours au moment de l’évaluation; il est donc difficile d’évaluer les répercussions de l’utilisation des SAD. De plus, plusieurs autres projets ont été abandonnés par l’utilisateur ou annulés par le programme et n’ont donc pas été concernés. Une surveillance continue des projets et une évaluation de leur incidence seront nécessaires.

3. Efficience et durabilité : état actuel

Dans quelle mesure les SAD sont-ils durables dans leur état actuel?

Les SAD font face à d’importants défis en matière de durabilité en raison de déficits de financement, des limites de leur capacité en matière de TI et de la baisse de satisfaction des utilisateurs. Bien que les améliorations récentes soient prometteuses, leur incidence n’est pas encore mesurable, et des préoccupations continues pourraient entraîner une sous-utilisation et des coûts d’exploitation élevés. Plus de temps et de surveillance sont nécessaires pour déterminer la viabilité à long terme des SAD.

Lors du transfert de la responsabilité opérationnelle en 2023-2024, des changements ont été mis en œuvre dans les SAD pour régler les principaux enjeux concernant le processus d’intégration, le manque de gestion et de gouvernance solides du programme et les enjeux de capacité technique. À l’avenir, l’efficacité de ces efforts devrait être évaluée de façon continue.

La documentation du programme et les données des entrevues ont révélé plusieurs enjeux clés et défis liés aux SAD avant le transfert de la responsabilité opérationnelle en 2023-2024, comme les retards d’intégration, le manque de gestion et de gouvernance solides du programme et les enjeux de capacité technique. Il a été déterminé que la plupart d’entre eux découlaient de la mise en œuvre rapide des SAD pendant la pandémie, et d’un manque de participation du responsable opérationnel. Cela a entraîné une préparation insuffisante pour gérer un programme et fournir des services aux clients de façon efficace. Le tableau 2 présente les défis rencontrés par les SAD et les récentes améliorations mises en œuvre pour les relever.

Tableau 2. Défis et récentes améliorations des Services d’analyse des données
Enjeu clé Défis Récentes améliorations
Intégration
  • De nouveaux projets devaient être examinés dans diverses spécialités; ce qui a considérablement ralenti le processus d’intégration.
  • La compréhension initiale des besoins des clients n’était pas suffisamment solide et a entraîné des échanges répétés entre ceux-ci et l’équipe des Services d’analyse des données (SAD).
  • Un service de guichet a été créé, avec une équipe d’intégration multidisciplinaire pouvant examiner les nouveaux projets plus efficacement.
  • Un formulaire de demande amélioré sur le portail aide l’équipe à mieux comprendre les besoins des clients et à les harmoniser avec les offres de services simplifiées dès le départ.
Gestion du programme
  • Une mise en œuvre rapide et le manque de participation du responsable opérationnel ont entraîné une préparation insuffisante pour la gestion d’un programme et la prestation de services.
  • La mesure du rendement était insuffisante pour comprendre comment les SAD étaient utilisés, la satisfaction des utilisateurs et les répercussions sur ces derniers.
  • Il existe un modèle harmonisé de calcul des coûts des activités et de la technologie de l’information (TI) ainsi qu’un budget d’exploitation durable pour 2024-2025.
  • Un plan de travail et une nouvelle lettre d’entente entre le secteur 6 et le secteur 9 ont été élaborés.
  • Le suivi et la surveillance du déroulement des opérations du projet ont été améliorés.
Gouvernance
  • Les capacités des SAD ont été surmobilisées, créant des attentes de la part des clients qui ne pouvaient pas être satisfaites et de la déception parmi les utilisateurs.
  • Les coûts imprévisibles pour les clients liés au stockage, au traitement des données et aux ressources infonuagiques ont causé des frustrations aux utilisateurs.
  • Les conditions générales des lettres d’entente (y compris les offres de services simplifiées) ont été mises à jour.
  • Un addenda à l’évaluation des facteurs relatifs à la vie privée des SAD a été créé pour élargir la portée des SAD afin d’inclure des ensembles de données externes.
  • Le Conseil consultatif sur les SAD a été créé.
Capacité
  • Les défis en matière de ressources pour l’expertise requise en matière de TI ont entraîné un manque de tenue à jour et d’amélioration de la plateforme (p. ex. le laboratoire virtuel de données [LVD] est dans un état critique et manque d’espace pour accepter de nouveaux clients parce qu’il n’est pas suffisamment tenu à jour et modernisé).
  • Des enjeux de conformité en matière de sécurité ont été signalés.
  • Un manque de priorisation et d’orientation pour la TI a fait en sorte que les employés ne savaient pas où déployer leurs efforts.
  • Les besoins techniques, y compris la modernisation du LVD, les changements en matière de sécurité (c.-à-d. mise à jour perpétuelle, mise en œuvre du projet d’activation et de défense du nuage sécurisé), ainsi que la surveillance active et les éléments de protection, ont été priorisés.
  • Des plans ont été élaborés pour régler les enjeux de conformité en matière de sécurité; des travaux sont en cours.
  • Les activités de priorisation et de planification ont été officialisées et devraient être présentées lors des réunions trimestrielles du Conseil consultatif sur les SAD et des réunions mensuelles sur les SAD au niveau du statisticien en chef adjoint.

La plupart des améliorations apportées aux SAD ont été apportées au cours de la dernière année et sont trop récentes pour permettre une évaluation de leur efficacité. Bien que les améliorations semblent alignées sur les défis, elles devraient être évaluées de façon continue à l’avenir pour déterminer l’incidence sur l’efficience et la durabilité globales des SAD.

À la clôture du projet en 2023, les SAD enregistraient un déficit de 1,8 million de dollars. Depuis lors, les enjeux de financement ont persisté, le secteur 6 n’ayant pas reçu de financement pour ses travaux sur les SAD. Toutefois, en raison d’efforts récents, le programme prévoit maintenant une viabilité financière pour 2024-2025, et du financement a été alloué au secteur 6 dans le cadre d’une nouvelle lettre d’entente. Un examen sera nécessaire pour déterminer si les nouveaux arrangements financiers sont durables à long terme.

Grâce aux ressources fédérales et aux lettres d’entente signées avec les utilisateurs, les SAD ont reçu un financement d’un peu plus de 40 millions de dollars entre 2018-2019 et 2022-2023. Selon le rapport de clôture du projet de février 2023, le projet de SAD s’est terminé avec un déficit de programme de 1,8 million de dollars, notamment :

  • un déficit de 1,14 million de dollars lié aux coûts d’exploitation du nuage;
  • un déficit de 0,5 million de dollars en salaires pour les employés en service qui travaillent pour des activités de SAD non financées;
  • un déficit de 163 000 $ pour le Projet de gestion intégrée de l’information et des données non financé.

Le rapport a également souligné les principales leçons apprises, y compris le manque de planification des activités de production de la solution de SAD, particulièrement en ce qui concerne le financement. Il a également mis le doigt sur la nécessité d’améliorer les prévisions financières et d’un horizon de planification à plus long terme pour assurer la durabilité des SAD.

À la suite du transfert de la responsabilité opérationnelle, les dépenses pour les SAD ont été considérablement réduites. À la mi-octobre 2024, le programme prévoyait une viabilité financière pour 2024-2025, sur la base de frais d’exploitation révisés et de revenus prévus d’environ 4 millions de dollars.Note de bas de page 5 Toutefois, certains projets de SAD pris en compte dans les projections financières ne seront pas intégrés (parce qu’ils ne correspondent pas au mandat de StatCan); ce qui aura une incidence sur les revenus potentiels. De plus, plusieurs projets actuellement intégrés seront terminés et « désactivés » d’ici la fin de 2024-2025; ce qui aura une incidence sur l’exactitude des projections à l’avenir.

Dans l’ensemble, le budget nécessitera une surveillance continue. Les personnes consultées dans le cadre du programme ont fait remarquer que certains projets, comme le projet SafeTO de la Ville de Toronto, pouvaient générer d’autres demandes de la part d’autres municipalités en Ontario (parce que chaque municipalité doit avoir un plan de sécurité communautaire et démontrer des progrès). Toutefois, au moment de l’évaluation, aucune demande officielle d’autres municipalités n’avait été reçue de l’Ontario ou de l’ensemble du Canada, peut-être parce que le projet SafeTO n’a pas encore été intégré et qu’il n’y a pas encore d’avantages démontrables.

Enfin, bien que la responsabilité opérationnelle des SAD ait été transférée au secteur 6, l’autorité budgétaire exécutive est demeurée dans le secteur 9.

Le secteur 9 a indiqué que, comme les SAD étaient initialement une initiative dirigée par la TI, cette autorité cadre avec la responsabilité du dirigeant principal de l’information en ce qui concerne les plateformes informatiques polyvalentes et l’adoption de la gestion des produits. De plus, compte tenu de la nature de l’infrastructure des SAD, ainsi que des dépenses en immobilisations et des coûts connexes d’exploitation et d’entretien, le secteur 6 risque de sous-estimer les coûts liés à la TI.

Le secteur 6 explique qu’habituellement à StatCan, le responsable fonctionnel établit les priorités et, en tant que détenteur du budget, distribue les fonds lorsque les services sont fournis. De plus, le secteur 6 a fait remarquer que, comme il n’a pas d’autorité budgétaire, ses travaux sur les SAD n’ont pas été financés avant la récente signature de la nouvelle lettre d’entente, et qu’il a dû absorber ces coûts.

Malgré les récents changements apportés au programme de SAD, des risques importants subsistent quant à sa viabilité. L’investissement technologique continu, la capacité limitée de la TI pour la modernisation, la maintenance et le soutien, ainsi qu’une faible satisfaction des utilisateurs, pourraient entraîner une sous-utilisation et des coûts constamment élevés.

Malgré les efforts déployés pour améliorer l’efficience et la durabilité des SAD, les documents de programme et les données des entrevues suggèrent plusieurs risques continus pour leur viabilité. La figure 8 présente ces risques clés, notamment les défis liés à la capacité de la TI, la satisfaction des utilisateurs externes et l’adoption des SAD par ces derniers, ainsi que les progrès technologiques. Ces risques devront être pris en compte par le programme à l’avenir, et des mesures appropriées doivent être prises pour les atténuer.

Figure 8. Risques continus pour les Services d’analyse des données
Figure 8. Risques continus pour les Services d’analyse des données
Description - Figure 8. Risques continus pour les Services d’analyse des données

La figure 8 décrit les risques continus associés aux SAD, en détaillant les défis et les impacts potentiels.

  • Capacité de la technologie de l’information (TI)
    • Un nombre limité de spécialistes de la TI de Statistique Canada possèdent l’ensemble de compétences spécialisées nécessaires pour la modernisation, la maintenance et le soutien continus aux utilisateurs.
    • D’autres priorités concurrentes ont mené à une réaffectation des ressources de TI (p. ex. transformation des activités), ainsi qu’à un besoin de directives plus générales sur la priorisation des programmes, des services et des ressources.
    • Sans modernisation continue, les plateformes risquent de devenir désuètes et sous-utilisées.
  • Satisfaction des utilisateurs externes et adoption des SAD par ces derniers
    • Les enjeux liés à l’intégration, à la communication et au soutien, aux interruptions de service, à l’accès aux données, aux coûts et autres présentent un risque continu pour la satisfaction des utilisateurs externes et l’adoption des SAD par ces derniers (certains de ces enjeux dépendent également de la capacité en matière de TI).
    • Un manque de compréhension des répercussions pour les utilisateurs externes fait qu’il est difficile de déterminer la valeur que les SAD offriront aux utilisateurs et si ces derniers continueront de les utiliser ou les recommanderont à d’autres utilisateurs.
    • La sous-utilisation des SAD et la réduction des services qu’ils offrent constituent une menace pour les efforts de recouvrement des coûts et la viabilité du programme.
  • Progrès technologiques
    • La technologie progresse en ce qui concerne l’analyse de données et l’infonuagique ; par conséquent, les SAD auront besoin d’investissements continus en matière de modernisation et d’innovation pour demeurer pertinents pour les utilisateurs externes.
    • À mesure que la technologie progresse, certaines composantes des SAD sont désuètes (p. ex. environnements désuets du nuage, ancienne infrastructure de sécurité); des efforts sont en cours pour moderniser ces anciennes composantes.
    • On s’attend à ce que d’autres investissements dans la modernisation soient nécessaires à l’avenir.

En plus des risques ci-dessus, la dépendance du LVD à l’égard de l’infrastructure non infonuagique a entraîné des défis, comme la capacité de stockage limitée; ce qui a rendu nécessaire la prise de mesures pour répondre à la demande croissante des utilisateurs. Face à ces changements, il sera important d’examiner comment les environnements du LVD et des SAD plus vastes peuvent évoluer ensemble (c.-à-d. possibilités de développement conjoint) pour assurer une répartition efficace des ressources et éviter la redondance et le dédoublement.

Compte tenu de plusieurs incertitudes au moment de l’évaluation, il a été difficile d’évaluer l’optimisation des ressources fournies par les SAD. Bien que les SAD offrent un service pertinent et demandé, des enjeux de rendement doivent être résolus. De plus, les récents efforts visant à simplifier l’offre et à mettre en œuvre une gouvernance plus solide ont permis de réduire la portée et le public cible du programme, ce qui limite la valeur et l’accès pour certains utilisateurs externes.

En raison des récents changements apportés à la portée et de la possibilité de changements supplémentaires, il est difficile d’évaluer pleinement l’optimisation des ressources au moment de la présente évaluation. Le Secrétariat du Conseil du Trésor du Canada définit l’optimisation des ressources comme   la mesure dans laquelle un programme est pertinent et affiche un bon rendement. » Il existe un besoin évident d’une solution semblable aux SAD pour fournir un environnement sécurisé et collaboratif à l’aide de l’infrastructure infonuagique. Bien que le succès des SAD soit mitigé pour ce qui est d’avoir atteint leurs objectifs à ce jour, les changements à venir au programme ont le potentiel de relever les défis actuels et de mieux répondre à la demande croissante pour ce type de produit.

Toutefois, la plateforme des SAD a initialement été créée avec un investissement important pour proposer une plateforme d’analyse infonuagique qui fournirait des données, des outils d’analyse, des logiciels et une puissance de calcul à un large éventail d’utilisateurs externes. StatCan est assujettie à la Loi sur la statistique, qui établit le mandat de l’organisme. Des changements récents ont renforcé la gouvernance et introduit des procédures et processus plus rigoureux. Bien que ces améliorations aient renforcé la surveillance, elles ont également réduit la portée et le public cible du programme (p. ex. moins de personnalisation pour les utilisateurs; l’accent sera mis sur les utilisateurs externes de la plateforme à l’avenir; les projets doivent correspondre au mandat de StatCan). Par conséquent, les SAD offrent actuellement une valeur inférieure à celle prévue initialement, n’entraînant pas entièrement l’accessibilité et les effets généraux envisagés au départ.

Lorsqu’on a consulté les gens sur l’optimisation des ressources, au niveau des utilisateurs, certaines personnes ont convenu que les SAD valaient le coût (surtout pour les projets nécessitant des capacités d’analyse avancées). D’autres ont exprimé des préoccupations au sujet des coûts élevés liés au stockage, au traitement des données et aux ressources infonuagiques. Cela a été un enjeu en particulier pour les personnes travaillant sur des projets moins complexes ou limités par le budget; ce qui en a amené certaines à percevoir le service comme trop coûteux quant à sa valeur. Quelques utilisateurs internes consultés ont également relevé des solutions de rechange plus abordables, comme la PFDS de SPC.

Au niveau du programme, certaines personnes consultées ont convenu que le coût des SAD était actuellement élevé pour le nombre d’utilisateurs. Toutefois, il a été suggéré qu’avec une meilleure gestion et un plus grand nombre d’utilisateurs, le rendement financier global pourrait être amélioré, offrant potentiellement une proposition de valeur plus claire, même s’il faudra du temps pour l’évaluer pleinement.

Comment améliorer le programme

Recommandation 1

Le SCA du secteur 6, en collaboration avec le SCA du secteur 9, devrait veiller à ce que les efforts de modernisation déployés pour les SAD et le LVD soient harmonisés et non redondants. Cela permettra de s’aligner sur la vision à long terme des SAD tout en utilisant efficacement les ressources limitées de TI de StatCan.

Recommandation 2

Le SCA du secteur 6, en collaboration avec le SCA du secteur 9, devrait chercher des façons d’améliorer l’expérience des utilisateurs externes pour soutenir l’adoption des SAD et promouvoir des coûts durables. Selon les résultats de l’évaluation, les domaines d’amélioration devraient comprendre, sans s’y limiter, l’intégration, le catalogage des services, les modèles de calcul des coûts et l’accès rapide aux données.

Recommandation 3

Le SCA du secteur 6, en collaboration avec le SCA du secteur 9, devrait veiller à ce que le programme fasse l’objet d’une surveillance efficace et, plus précisément, à ce que :

  1. des processus soient en place pour suivre et surveiller les clients directs et indirects des SAD, afin de mieux comprendre la base de clients des SAD et leur adoption au fil du temps;
  2. des indicateurs de rendement pour les SAD, comme l’utilisation et la satisfaction des clients, soient établis et surveillés régulièrement;
  3. des évaluations continues des coûts globaux du programme, de l’efficience et du dédoublement des services (c.-à-d. LVD, ETAA, EAC) et de l’incidence sur les utilisateurs sont effectuées.

Recommandation 4

Le SCA du secteur 6, en collaboration avec le SCA du secteur 9, devrait explorer les possibilités de rendre la fonctionnalité et la technologie de la plateforme des SAD plus accessibles à un public plus vaste d’utilisateurs.

Recommandation 5

Les SCA des secteurs 6 et 9 devraient examiner la structure budgétaire actuelle pour s’assurer qu’elle est efficiente et efficace, et qu’elle est harmonisée avec les politiques et les pratiques organisationnelles.

Réponse et plan d’action de la direction

Recommandation 1

Le SCA du secteur 6, en collaboration avec le SCA du secteur 9, devrait veiller à ce que les efforts de modernisation déployés pour les SAD et le LVD soient harmonisés et non redondants. Cela permettra de s’aligner sur la vision à long terme des SAD tout en utilisant efficacement les ressources limitées de TI de StatCan.

Réponse de la direction

La direction accepte la recommandation.

L’actuel Conseil consultatif sur les SAD, coprésidé par les directeurs généraux des deux secteurs, examine les escalades des problèmes, la portée, le budget et l’harmonisation stratégique des activités. Il existe également une table de gouvernance des SAD dirigée par le SCA. Ces structures de gouvernance existantes passeront au nouveau Comité directeur sur les SAD.

Pour réaliser efficacement le potentiel de modernisation de la plateforme des SAD, le nouveau Comité directeur sur les SAD surveillera le plan stratégique des SAD à l’avenir, conformément à divers efforts horizontaux, y compris ceux visant à moderniser le LVD. Le Comité directeur examinera et approuvera les plans de travail annuels, conformément aux budgets globaux, et sera consulté sur les nouveaux travaux effectués à l’extérieur des plateformes existantes (offre de produit définie). Le Comité directeur examinera les escalades des problèmes, la portée, le budget et l’harmonisation stratégique des activités.

Produits livrables et échéancier

Un comité directeur de la haute direction composé de représentants des secteurs 6 et 9 ainsi que de cadres supérieurs et de gestionnaires clés d’autres secteurs de programme sera mis sur pied d’ici octobre 2025.

Le mandat indiquant les responsabilités et les obligations précises sera approuvé d’ici décembre 2025.

Recommandation 2

Le SCA du secteur 6, en collaboration avec le SCA du secteur 9, devrait chercher des façons d’améliorer l’expérience des utilisateurs externes pour soutenir l’adoption des SAD et promouvoir des coûts durables. Selon les résultats de l’évaluation, les domaines d’amélioration devraient comprendre, sans s’y limiter, l’intégration, le catalogage des services, les modèles de calcul des coûts et l’accès rapide aux données.

Réponse de la direction

La direction accepte la recommandation.

Le secteur 6, en collaboration avec le secteur 9, examinera et formulera une stratégie comprenant, sans s’y limiter, les domaines d’amélioration cernés par l’évaluation (c.-à-d. intégration, catalogage des services, modèles de calcul des coûts et accès rapide aux données). Une fois la stratégie approuvée, une feuille de route et des échéanciers seront élaborés et approuvés par le Comité directeur sur les SAD.

Produits livrables et échéancier

Une stratégie sera approuvée d’ici avril 2026. La feuille de route et les échéanciers seront approuvés d’ici septembre 2026.

Recommandation 3

Le SCA du secteur 6, en collaboration avec le SCA du secteur 9, devrait veiller à ce que le programme fasse l’objet d’une surveillance efficace et, plus précisément, à ce que :

  1. des processus soient en place pour suivre et surveiller les clients directs et indirects des SAD, afin de mieux comprendre la base de clients des SAD et leur adoption au fil du temps;
  2. que des indicateurs de rendement pour les SAD, comme l’utilisation et la satisfaction des clients, soient établis et surveillés régulièrement;
  3. des évaluations continues des coûts globaux du programme, de l’efficience et du dédoublement des services (c.-à-d. LVD, ETAA, EAC) et de l’incidence sur les utilisateurs sont effectuées.

Réponse de la direction

La direction accepte la recommandation.

Le secteur 6, en collaboration avec le secteur 9, élaborera un plan de surveillance efficace du programme de SAD, qui comprendra des processus de suivi et de surveillance des clients directs et indirects des SAD, l’établissement d’indicateurs de rendement et l’évaluation des répercussions et des coûts globaux du programme pour les utilisateurs. Une fois approuvé, le plan sera mis en œuvre dans le cadre du programme au moyen d’une feuille de route et d’échéanciers.

Produits livrables et échéancier

Ce plan, qui comprendra une feuille de route et des échéanciers de mise en œuvre, sera approuvé par le Comité directeur sur les SAD d’ici avril 2026.

Recommandation 4

Le SCA du secteur 6, en collaboration avec le SCA du secteur 9, devrait explorer les possibilités de rendre la fonctionnalité et la technologie de la plateforme des SAD plus accessibles à un public plus vaste d’utilisateurs.

Réponse de la direction

La direction accepte la recommandation.

Le secteur 6, en collaboration avec le secteur 9, explorera les possibilités d’étendre la disponibilité de la plateforme des SAD à un plus vaste ensemble d’utilisateurs.

Produits livrables et échéancier

Une analyse de rentabilisation analysant les options pour élargir la disponibilité de la plateforme des SAD, y compris les risques et les exigences connexes concernant les options, sera présentée au Comité de gestion stratégique d’ici septembre 2026.

Recommandation 5

Les SCA des secteurs 6 et 9 devraient examiner la structure budgétaire actuelle pour s’assurer qu’elle est efficiente et efficace, et qu’elle est harmonisée avec les politiques et les pratiques organisationnelles.

Réponse de la direction

La direction accepte la recommandation.

Le secteur 6, en collaboration avec les secteurs 9 et 3, examinera la structure budgétaire ainsi que les politiques et les pratiques organisationnelles, et formulera des recommandations concernant la structure budgétaire à long terme.

Produits livrables et échéancier

Un examen des politiques et des pratiques organisationnelles dans le contexte des SAD sera effectué d’ici décembre 2025. Les recommandations au Comité de gestion stratégique portant sur la structure budgétaire à long terme visant une gestion efficiente et efficace des SAD seront fournies d’ici avril 2026.

Annexe A : Représentation visuelle des Services d’analyse des données

Représentation visuelle des Services d’analyse des données
Annexe A : Représentation visuelle des Services d’analyse des données
Description - Représentation visuelle des Services d’analyse des données

L'annexe A fourni un diagramme détaillé des SAD, illustrant les différents composants et processus impliqués.

Les Services d’analyse des données (SAD) sont hébergés sur le Nuage de StatCan et offrent des comptes de stockage de projets sécurisés et flexibles. Les SAD comprennent la plateforme SAD elle-même ainsi que les services de soutien.

La plateforme SAD fournit l'infrastructure et les outils nécessaires pour l'analyse et la visualisation des données. Elle se compose de quatre environnements principaux :

  1. Environnement d'analyse collaborative (EAC)
    • Exemples de projets sous EAC :
      • Défi des données du service public : Un projet visant à exploiter l'analyse des données pour relever les défis du service public.
      • Environnement d'analyse des prix : Un projet axé sur l'analyse des données de tarification pour obtenir des informations et éclairer la prise de décision.
  2. Espace de travail d'analyse avancée (ETAA)
    • Exemples de projets sous ETAA :
      • Recensement – Codage par apprentissage automatique : Un projet impliquant le codage de l'apprentissage automatique pour l'analyse des données de recensement.
      • Postes isolés de la Division des prix à la production: Un projet axé sur l'analyse des postes isolés au sein de la Division des prix à la production.
      • Santé buccodentaire : Un projet visant à analyser les données sur la santé buccodentaire pour améliorer les résultats de santé publique.
  3. Environnement d’analyse géospatiale (EAG)
    • Exemples de projets sous EAG :
      • Visualiseur des ressources humaines : Un projet impliquant la création d'un visualiseur pour les données des ressources humaines.
      • Outil de soutien à la planification des projets d'infrastructure : Un outil conçu pour soutenir la planification des projets d'infrastructure grâce à l'analyse des données.
  4. .Stat SDM
    • .Stat SDM est une en source ouverte pour la production et la diffusion efficaces de données statistiques de grande qualité. Elle soutient l'échange de données et de métadonnées statistiques en utilisant la norme SDMX (Initiative d’échange de données et de métadonnées statistiques).
  • D'autres environnements peuvent être créés en combinant les fonctionnalités de l’EAC, de l’ETAA et/ou de l’EAG :
    • Exemples de projets hybrides :
      • Laboratoire de données sur les entreprises, qui combine les fonctionnalités de EAC et ETAA.
      • SafeTO, qui combine les fonctionnalités de EAC et EAG.
      • AgZéro, qui combine les fonctionnalités de EAC, ETAA et EAG.
  • Le LVD (Laboratoire virtuel de données) est une première ancienne version de l’EAC avec certains services et anciens outils. Il fournit un environnement virtuel pour l'analyse et l'expérimentation des données.

Les services de soutien fournis par les SAD comprennent :

  • Opérations et surveillance : La surveillance continue et le soutien opérationnel pour la plateforme SAD assurent que la plateforme fonctionne sans problème et que tout problème est rapidement résolu.
  • Services d'ingestion de données : Des services qui soutiennent l'ingestion de données dans la plateforme SAD. Cela inclut les processus et les outils nécessaires pour importer des données de diverses sources dans le système.
  • Accès approuvé aux données de StatCan : Assure que les utilisateurs ont les autorisations nécessaires pour accéder aux données de Statistique Canada. Cet accès est crucial pour mener des analyses de données et générer des informations.
  • Ingénierie de solutions, accompagnement à l'intégration, services de bac à sable : Ces services sont conçus pour faciliter l'intégration et l'utilisation des SAD. L'ingénierie des solutions implique la configuration technique et la personnalisation de la plateforme SAD. L’accompagnement à l'intégration aide les nouveaux utilisateurs à démarrer, tandis que les services de bac à sable fournissent un environnement sûr pour les tests et l'expérimentation.

Le diagramme montre également La Zone, qui est également hébergée sur le Nuage de StatCan mais se trouve en dehors des SAD. À l’interne, les utilisateurs accèdent à La Zone (semblable à l’ETAA). Comme il n’y a pas de collaboration avec des partenaires externes dans La Zone et qu'elle n'est pas connectée à Internet, elle offre un espace sécurisé pour l'analyse et l'expérimentation des données internes.

Les données entrantes dans les SAD proviennent de diverses sources :

  • Données de StatCan : Données de Statistique Canada.
  • Données externes : Données provenant de sources externes.
  • Données ouvertes : Données disponibles publiquement.
  • Données appartenant aux clients : Données détenues par les clients.

Ces données peuvent être téléchargées dans les SAD via :

  • Azure Data Factory : Un service d'intégration de données basé sur le cloud.
  • Système de transfert électronique de fichiers sécurisé : Transfert électronique de fichiers sécurisé.
  • Interfaces de programmation d’applications : Interfaces de programmation d'applications pour l'échange de données.
  • Connexion directe : Connexions de données directes à diverses sources.
  • Azure SQL : Un service de base de données cloud géré.
  • Azure Blob : Stockage d'objets pour les données non structurées.
  • Azure Data Lake : Un service de stockage et d'analyse de données évolutif.

Une fois téléchargées, les données sont stockées dans des comptes de stockage de projets sécurisés et flexibles. Les données sont stockées et chargées dans Azure SQL, Azure Blob Storage sur Datalake ou Azure Fileshares. Ces solutions de stockage offrent des options sécurisées et évolutives pour la gestion des données.

Les données sortantes peuvent être téléchargées à partir des SAD dans les produits suivants :

  • Tableaux : Tableaux de données structurées.
  • Graphiques : Représentations graphiques des données.
  • Visualisation des données : Outils visuels et tableaux de bord pour l'analyse des données.

Annexe B : Principaux projets liés aux Services d’analyse des données

Principaux projets liés aux Services d’analyse des données
Nom du projet Description État
Équipement de protection individuelle (EPI) Permettre une analyse collaborative pour fournir des renseignements et faciliter la prise de décisions sur la disponibilité de l’EPI pendant la pandémie. Terminé
Laboratoire de données sur les entreprises Travailler avec les clients pour combiner des ensembles de données; traiter, modéliser et produire des visualisations; et partager des aperçus économiques avec le milieu des affaires. En cours
Environnement d’analyse des prix Ingestion d’importants ensembles de données administratives pour produire des statistiques. En cours
Diffusion anticipée de l’Enquête sur la population active Fournir aux clients une visualisation sécurisée des données avant leur diffusion. En cours
Laboratoire virtuel de données Fournir aux chercheurs dans l’ensemble du pays les outils dont ils ont besoin pour tirer avantage en toute sécurité des données de Statistique Canada. En cours
Enquête canadienne sur la santé et les anticorps contre la COVID-19 Fournir un espace de travail d’analyse avancée pour l’ingestion et l’intégration de bout en bout des données avec des chercheurs externes. En cours
Fichiers d’immatriculation des véhicules Utiliser des pipelines d’ingestion de données sécurisés pour gérer de grands ensembles de données. En cours
AgZéro La Division de l’agriculture et la Division des méthodes d’IA (anciennement appelée la Division de la science des données et de l’innovation) de Statistique Canada et des partenaires externes utilisent l’Environnement d’analyse collaborative, les plateformes de l’espace de travail d’analyse avancée et de l’environnement d’analyse géospatiale pour permettre à la Division des méthodes d’IA d’élaborer des modèles d’apprentissage automatique afin de produire des statistiques officielles. En cours
Programme de la statistique de la santé buccodentaire de Statistique Canada Travailler avec les clients pour donner accès aux données d’enquête avant la diffusion anticipée. En cours
Carrefour canadien de données et d’information sur le commerce intérieur Fournir l’accès aux données sur le commerce intérieur à l’aide de normes relatives à l’initiative d’échange de données et de métadonnées statistiques. En cours
Centre canadien d’information sur l’énergie Fournir un guichet unique virtuel pratique offrant des renseignements indépendants et fiables sur l’énergie au Canada. En cours
SafeTO Tirer avantage de sources de données multisectorielles pour aider à élargir la définition de la sécurité des collectivités au-delà des statistiques de la criminalité et de l’application de la loi pour y inclure la prévention et le bien-être. Pas encore intégré

Annexe C : Questions et indicateurs d’évaluation

Questions et indicateurs d’évaluation
Questions d’évaluation Indicateurs d’évaluation
Dans quelle mesure les Services d’analyse des données (SAD) sont-ils toujours nécessaires?
  • Description des priorités à l’échelle fédérale et de l’organisme en ce qui concerne la modernisation des données, l’infrastructure de données et l’accès aux données (p. ex. programme de modernisation, stratégie de données de Statistique Canada, feuille de route de la Stratégie de données pour la fonction publique fédérale)
  • Mesure dans laquelle les SAD s’harmonisent avec les priorités et les mandats à l’échelle fédérale et de l’organisme
  • Raisons et motivations (besoins) derrière l’accès des utilisateurs finaux à l’environnement de SAD, y compris leurs objectifs prévus
  • Mesure dans laquelle les SAD répondent à un besoin continu, y compris des exemples de besoins et de lacunes
  • Élément probant permettant de déterminer si les SAD sont un dédoublement ou non d’autres services ou plateformes, et si les besoins en matière d’analyse de données seraient comblés sans les SAD (p. ex. accès à un service différent) et comment
  • Mesure dans laquelle les SAD ont été adaptés pour répondre aux priorités et aux besoins émergents (exemples)
Dans quelle mesure les SAD ont-ils atteint les résultats prévus?
  • Mesure dans laquelle les SAD ont accru la disponibilité des données et des renseignements statistiques pour les utilisateurs internes et externes
  • Mesure dans laquelle les SAD fournissent des caractéristiques techniques permettant une gérance efficace des données (p. ex. qualité, disponibilité, normes et harmonisation des données)
  • Mesure dans laquelle les SAD fournissent une plateforme technique aux utilisateurs pour accéder à l’information statistique et l’utiliser
  • Exemples de répercussions d’un accès accru à des renseignements statistiques pertinents par l’entremise des SAD (p. ex. pour éclairer l’élaboration de politiques et la prise de décisions, appuyer la collaboration)
  • Lacunes et limites de la plateforme (p. ex. technologie, infrastructure, processus, soutien disponible) et suggestions d’amélioration correspondantes
Dans quelle mesure les SAD sont-ils durables dans leur état actuel?
  • Efforts visant à soutenir l’efficience et la durabilité des SAD à ce jour (p. ex. changements apportés à la gouvernance, aux services de plateforme et à la portée, rationalisation des opérations, modèle de calcul des coûts)
  • Facteurs (c.-à-d. risques, leçons apprises, pratiques exemplaires) qui peuvent faciliter la durabilité ou la compromettre à l’avenir (p. ex. soutien interne et externe, stabilité du financement, portée, risques et protection de la vie privée, partenariats, capacité des programmes, interconnexion du nuage, communications, vision stratégique et harmonisation)
  • Affectations et dépenses de la plateforme des SAD et variance obtenue (le cas échéant) (rapport de clôture)
  • Temps moyen pour intégrer le cas d’utilisation et variation au fil du temps (estimation, si disponible)
  • Coût estimatif par utilisateur ou intégration et variation au fil du temps (estimation, si disponible)
  • Vérification par recoupement avec les indicateurs de pertinence et de rendement

Les réponses obtenues lors des entrevues sont quantifiées et catégorisées dans le présent rapport à l’aide de l’échelle illustrée dans le tableau ci-dessous.

Échelle de quantification des entrevues
Terme Définition
Un Utilisé lorsqu’un participant a fourni la réponse.
Peu Utilisé lorsque de 4 % à 15 % des participants ont répondu de façon semblable. Le sentiment de la réponse a été exprimé par ces participants, mais pas par d’autres participants.
Certains Utilisé lorsque de 16 % à 45 % des participants ont répondu de façon semblable.
Environ la moitié Utilisé lorsque de 46 % à 55 % des participants ont répondu de façon semblable.
La plupart ou une majorité Utilisé lorsque de 56 % à 89 % des participants ont répondu de façon semblable.
Presque tous Utilisé lorsque de 90 % à 99 % des participants ont répondu de façon semblable.
Tous Utilisé lorsque 100 % des participants ont répondu de façon semblable.

Annexe E : État des objectifs liés aux Services d’analyse des données

État des objectifs liés aux Services d’analyse des données
Objectif lié aux Services d’analyse des données (SAD) Description État
1. Produit de la plateforme des SAD Cette capacité met l’accent sur la création d’une expérience utilisateur cohésive, la conception de personas et de cartographies de parcours, ainsi que de solutions d’empaquetage. Entièrement atteint
2. Exploration et intégration de la science des données, y compris l’intelligence artificielle (IA) et l’apprentissage automatique À l’aide d’outils tant libres que commerciaux, les scientifiques et les analystes des données tirent parti de l’IA et de l’apprentissage automatique pour nettoyer, étiqueter et classer les données, détecter les tendances et créer des modèles prédictifs. Cette capacité garantit que la plateforme prend en charge l’intégration d’algorithmes émergents et leur utilisation efficace, avec la capacité nécessaire pour atteindre les objectifs de recherche. Entièrement atteint
3. Analyse et traitement des mégadonnées Les mégadonnées ont généralement des propriétés comme le volume (grande taille), la vitesse (traitement rapide) et la variabilité (formats mixtes). Alors que d’autres capacités abordent la vitesse et la variabilité, la réalisation d’analyses complexes et l’extraction de la valeur nécessitent des plateformes puissantes qui tirent parti des services d’infonuagique. Cette capacité prend en charge les mégadonnées au moyen d’un traitement parallèle, d’un traitement en mémoire, d’unités de traitement graphique (UTG) (pour un calcul rapide) et plus encore. Entièrement atteint
4. Services cognitifs et de connaissances Les SAD tirent parti de techniques avancées pour saisir et utiliser les connaissances des chercheurs, des utilisateurs et des experts internes. En analysant les requêtes, les recherches, l’IA, l’apprentissage automatique et les résultats publiés, les SAD visent à créer un Web des connaissances qui renforce ses efforts d’analyse. Entièrement atteint
5. Vieillissement et archivage des données La gestion des données tout au long de leur cycle de vie est essentielle pour se conformer aux politiques de gestion de l’information et optimiser l’utilisation des ressources. Des stratégies efficaces de stockage hiérarchique et de vieillissement des données garantissent l’optimisation des coûts. La plateforme des SAD ne centralisera pas toutes les données, mais combinera consolidation et catalogage avec des liens vers des données à d’autres emplacements. Entièrement atteint
6. Virtualisation des données La plateforme héberge des données complexes et diversifiées, sous diverses formes et structures. Bien que la normalisation des données dans les entrepôts ait été complexe, surtout pour une utilisation diversifiée, les techniques modernes de virtualisation des données permettent de stocker et de gérer les données sans normalisation complète, en les livrant sur demande dans le format requis. Le provisionnement de données prend en charge des données de présentation exhaustives, maximisant la valeur pour les utilisateurs et optimisant la gestion. Cette capacité offre des caractéristiques pour répondre à ces besoins. Entièrement atteint
7. Visualisation des données La visualisation et la narration convaincante sont essentielles dans l’utilisation des données afin de fournir des éléments probants aux fins des politiques, de mesure des résultats et de fourniture de renseignements et de prédictions. Dans ce domaine, les approches libre-service ont connu une croissance importante, permettant aux utilisateurs de créer des produits visuels personnalisés à partir de résultats analytiques. Les scientifiques des données ont besoin d’extrants visuels pour faire progresser leur travail. Les capacités doivent tenir compte des divers personas et contextes des utilisateurs et des chercheurs, afin de permettre aux chercheurs de publier efficacement leurs résultats sur diverses plateformes (publications, sites Web, etc.). Entièrement atteint
8. Gestion de l’identité et de l’accès Des services solides d’identité numérique, d’authentification et d’autorisation sont essentiels à la sécurité. Les SAD s’intégreront aux projets d’identité actuels et futurs, y compris l’identité numérique du gouvernement du Canada. Les services de répertoire et de gestion de l’accès liés aux services de gestion de données garantissent un accès bien géré et uniforme. Le programme respectera la Directive sur la gestion de l’identité du Conseil du Trésor et les politiques pertinentes. Les SAD sont utilisés dans le cadre des services d’identité numérique du gouvernement du Canada. Entièrement atteint
9. Gestion des métadonnées Des métadonnées riches sont essentielles pour soutenir les chercheurs et les utilisateurs tout au long de leurs activités. Elles offrent un contexte descriptif et statistique pour les outils de données, de classification et de taxonomie, les dispositions d’enregistrement et plus encore. La plateforme offrira un accès ouvert aux métadonnées au moyen de divers mécanismes (expérience utilisateur, interfaces de programmation d’applications [API]) et prendra en charge la création et l’évolution collaboratives de métadonnées partagées (p. ex. classifications élaborées conjointement avec d’autres ministères et organismes). Entièrement atteint
10. Orchestration et flux de travail Les entreprises modernes profitent de l’automatisation des processus et des flux de travail dans le cadre de laquelle des collections de services sont intégrées à des processus automatisés pour offrir une valeur opérationnelle (p. ex. services Netflix). Cette capacité fournira les moyens d’intégrer et d’automatiser les flux de travail opérationnels composés de services, offrant ainsi une valeur opérationnelle analytique. Entièrement atteint
11. Services de registres et de données de référence Statistique Canada détient de vastes données de registre maîtres, de référence et statistiques. Dans le cadre du travail sur la plateforme des SAD et conformément à la stratégie des données du gouvernement du Canada et à la plateforme d’expérience numérique, les SAD fourniront un accès contrôlé à ces données au moyen d’API, entre autres, en veillant à ce que des justificatifs d’identité soient requis et des contrôles appropriés, mis en place. Entièrement atteint
12. Accès des chercheurs à distance Il s’agit du point de départ de l’accès des chercheurs à la plateforme, offrant des fonctions clés comme :
  • un portail permettant de présenter une demande d’accès et de déterminer les domaines de recherche, les projets et les détails administratifs;
  • un guichet unique permettant aux chercheurs de gérer leurs comptes;
  • une capacité de connexion sécurisée, ce qui permet aux chercheurs de se connecter de n’importe où à l’aide de solutions infonuagiques d’accès à distance protégé du gouvernement du Canada.
Entièrement atteint
13. Riche espace de travail d’analyse Les chercheurs et les utilisateurs effectuent une analyse mathématique approfondie de leurs données à l’aide de divers espaces de travail regroupés prenant en charge des outils populaires comme R, Python, TensorFlow, SAS, SPSS et Stata. Une composante cruciale est la prise en charge des bibliothèques et fonctions externes provenant des collectivités internes et externes (voir la capacité de collaboration). Les SAD passent également d’approches fondées sur des outils traditionnels à des approches fondées sur des carnets analytiques dotées de capacités de création de documents intégrées. Entièrement atteint
14. Services d’infrastructure évolutifs La plateforme des SAD a besoin d’une infrastructure agile, flexible et évolutive pour répondre aux besoins des utilisateurs. Les données connaissent une croissance exponentielle, notamment les données de moissonnage du Web, de capteurs, satellitaires et d’observation de la Terre. Les utilisateurs doivent nettoyer, intégrer et provisionner ces données aux fins de traitement et d’analyse. Les catalyseurs essentiels comprennent le stockage évolutif, le calcul informatisé, la mémoire, l’accès aux UTG et la capacité du réseau. Cette capacité garantit un approvisionnement auprès de fournisseurs de services infonuagiques publics puissants et sécurisés. Entièrement atteint
15. Ingénierie des pipelines de données Les données sont recueillies auprès de diverses sources (ingestion, moissonnage du Web et API), puis traitées, nettoyées et préparées pour être utilisées. Elles passent par diverses équipes, depuis les points d’accès initiaux jusqu’à l’infrastructure statistique et aux domaines spécifiques. Pour optimiser cela, les SAD se concentrent sur l’élaboration de pipelines, conçus avec l’automatisation et d’autres capacités, afin d’avoir un flux de données simplifié et efficace qui maximise les ressources de l’entreprise. Entièrement atteint
16. Publication de capacités de données Alors que les chercheurs et les utilisateurs interagissent avec la plateforme, et que les experts et les producteurs internes créent plus de contenu, il est important de pouvoir publier pour la collectivité plus vaste au moyen de la plateforme. L’objectif est d’avoir un catalogue à guichet unique et des moyens d’accéder aux données. L’une des principales caractéristiques est la curation des données publiées pour veiller à ce qu’elles demeurent à jour et pertinentes. Partiellement atteint
17. Services de données et API et services d’interopérabilité et d’intégration L’échange et l’utilisation de données s’étendent au-delà des interactions utilisateur-logiciel; les systèmes et les solutions dans l’ensemble de l’espace des parties prenantes doivent également se connecter de machine à machine. Les SAD fourniront des services de données et des API, permettant aux ministères utilisateurs et aux entreprises d’extraire des données de référence, de registre, des données agrégées, etc. En tirant parti de la plateforme d’échange numérique et du magasin des API du gouvernement du Canada, les SAD permettront de publier des données et s’intégreront à d’autres parties prenantes. Tous les échanges entre les API doivent respecter les politiques et les directives pertinentes, en veillant à ce que l’accès aux données respecte les règles en matière de protection de la vie privée et les restrictions en matière d’utilisation statistique. Conformément à la Stratégie de données pour la fonction publique fédérale, des possibilités d’accès à des données de référence publiques par les API seront explorées. Partiellement atteint
18. Collaboration des analystes et partage des algorithmes Les chercheurs et les utilisateurs profitent grandement de la collaboration interne et externe pour élaborer et partager des algorithmes et des données. Un contrôle de version et une gestion de la configuration efficaces sont essentiels, surtout pour les activités d’apprentissage automatique. Cette capacité appuie la collaboration en matière de code et de données entre les utilisateurs, les équipes et les collectivités, tout en respectant les normes ouvertes de l’industrie. Partiellement atteint
19. Audits et rapports Les SAD renforcent la confiance au moyen d’une communication transparente sur le contenu consulté, par qui, à quelle fin et à quel moment. Pour assurer une utilisation appropriée, détecter les anomalies, régler les enjeux potentiels et améliorer la valeur de la plateforme, des capacités d’audit, de journalisation et de production de rapports solides et sécurisées sont essentielles. Ces processus couvrent tous les niveaux de la plateforme des SAD, y compris l’infrastructure, l’accès aux données, les solutions et les utilisateurs, et sont intégrés à la gestion de l’identité et aux contrôles d’accès. Partiellement atteint
20. Services géospatiaux Les données géospatiales sont essentielles à la recherche et à l’analyse, soit comme prisme à travers lequel les chercheurs interagissent avec les données, soit comme moyen de présenter efficacement les résultats d’analyse. La Plateforme géospatiale fédérale offre un service pangouvernemental important, auquel s’intégrera la capacité des SAD. Partiellement atteint
21. Gouvernance de l’information La gouvernance et la gérance sont essentielles à l’efficacité de la place de marché de données, tant dans le programme de modernisation que dans les stratégies nationales des données. Des flux de travail numériques ouverts sont nécessaires pour aider la communauté de gouvernance à définir la qualité, les modèles d’information et d’autres normes. L’une des composantes clés consiste à créer des mécanismes de contrôle de l’accès pour divers niveaux de sensibilité et à les gérer efficacement. Partiellement atteint
22. Services de plateforme évolutifs Pour que les capacités de la plateforme soient utilisées efficacement aux fins d’analyses complexes, la plateforme et l’infrastructure doivent être agiles, flexibles et rentables. Ces capacités comprennent les bases de données, les magasins de données et les composantes d’analyse de la plateforme apportés par les fournisseurs de services infonuagiques. Partiellement atteint
23. Calcul multipartite sécurisé (collaboration partagée de confiance en matière de données) Ce qui ressort souvent des entrevues auprès des utilisateurs et de la mobilisation des parties prenantes est la nécessité pour les partenaires de collaborer à l’aide de données sensibles sans divulguer l’ensemble de données complet (p. ex. extraire un enregistrement couplé de nature non délicate à partir de données sensibles qu’aucune des parties ne souhaite divulguer pleinement). Les technologies et les approches logicielles émergentes peuvent parvenir à ce résultat. Les SAD travaillent avec des universitaires, des partenaires internationaux et des fournisseurs commerciaux pour déterminer, évaluer, sélectionner et déployer des solutions répondant à des exigences strictes en matière de sécurité et de protection de la vie privée. Cette collaboration met à contribution des parties prenantes comme le Commissariat à la protection de la vie privée du Canada et d’autres ministères. Partiellement atteint
24. Découverte de données Les chercheurs et les utilisateurs ont besoin d’outils de recherche avancés pour trouver des algorithmes et des données pour créer des modèles, des visualisations et des aperçus. Les fonctions de découverte vont au-delà de la recherche de base, en utilisant l’inférence et d’autres techniques pour découvrir les ressources nécessaires, y compris les actifs en données cachés ou négligés sur la place de marché plus vaste de données. Partiellement atteint
25. Gestion de la provenance et de l’historique L’efficacité des extrants en matière de recherche et de qualité repose sur la connaissance de la provenance des données entrant dans une étape de traitement ou d’analyse et sur la compréhension de leur historique au fil du temps. Ces services offrent une provenance et un historique grossiers et précis, souvent dans le cadre de solutions plus vastes. Non réalisé; jugé hors champ