Réseau de la science des données pour la fonction publique fédérale (RSDFPF)

Les renseignement contenus dans ces articles sont fournis « tel quel » et Statistique Canada n'offre aucune garantie explicite ou implicite, ce qui comprend, sans s'y limiter, les garanties de qualité marchande et d'adaptation à un usage particulier. En aucun cas Statistique Canada ne sera tenu responsable des dommages directs, particuliers, indirects, consécutifs ou autres, quelle qu'en soit la cause.

Articles récents

Modèles de vision par ordinateur : projet de classification des semences

Sujets abordés dans cet article : Vision par ordinateur

En collaborant avec des membres des directions générales interministérielles du gouvernement, l'équipe du laboratoire d'intelligence artificielle de l'Agence canadienne d'inspection des aliments tire parti d'algorithmes d'apprentissage automatique à la fine pointe de la technologie pour offrir des solutions axées sur les données à des problèmes réels et favoriser un changement positif.

Continuer la lecture : Modèles de vision par ordinateur : projet de classification des semences


Introduction aux techniques cryptographiques d'amélioration de la confidentialité — Environnement d'exécution fiable

Sujets abordés dans cet article : Éthique et utilisation responsable de l'apprentissage automatique

Avec la popularité croissante des appareils connectés et la prévalence des technologies, comme l'infonuagique, l'informatique mobile et l'Internet des objets, les organisations qui traitent des renseignements identificatoires personnels doivent « atténuer les menaces qui ciblent la confidentialité et l'intégrité de l'application ou des données dans la mémoire système » (Confidential Computing Consortium, 2021). Cet article présente l'environnement d'exécution de confiance, un environnement construit avec des modules matériels spéciaux qui tient compte d'une zone sécurisée à l'intérieur de l'appareil.

Continuer la lecture : Introduction aux techniques cryptographiques d'amélioration de la confidentialité — Environnement d'exécution fiable


Code de niveau de production dans le domaine de la science des données

Sujets abordés dans cet article : Autre

Code de niveau de production dans le domaine de la science des données

Le présent article souligne l'importance de mettre en œuvre un code de niveau de production dans les projets en science des données, et il met en lumière les pratiques essentielles de ce processus et les avantages qu'il comporte. Il traite de l'extensibilité, de la robustesse et de la maintenabilité en tant qu'aspects clés d'un déploiement et d'une intégration efficaces des modèles de science des données. L'article présente aussi des pratiques souvent négligées, comme le contrôle de version, les tests, la documentation, les revues de code, la reproductibilité, les règles de style, les annotations de type, la journalisation des erreurs, la validation des données, le code de faible entretien et l'intégration et le déploiement continus (IC/DC). Une étude de cas réelle du projet de prétraitement des données administratives (PDA) montre les conséquences du non-respect des pratiques de programmation et l'efficacité de l'approche « Rouge-Vert-Réusinage ». Le fait de donner la priorité au code de niveau de production permet aux entreprises d'optimiser leurs investissements dans la science des données, d'acquérir un avantage concurrentiel et de prendre des décisions éclairées dans une économie axée sur les données.

Continuer la lecture : Code de niveau de production dans le domaine de la science des données


Collecte par approche participative des données des reçus d'épicerie dans les communautés autochtones à l'aide de la reconnaissance optique de caractères

Sujets abordés dans cet article : Vision par ordinateur Analyse et generation de texte

Indigenous Communities Food Receipts Crowdsourcing with Optical Character Recognition

De nombreux Canadiens qui vivent dans des communautés nordiques et isolées doivent composer avec des coûts accrus pour les tarifs d'expédition et les chaînes d'approvisionnement. Pour mieux comprendre les défis associés à la sécurité alimentaire, la Division de la science des données de Statistique Canada a évalué l'approche participative comme solution pour recueillir des données sur le prix des aliments. Il s'agissait notamment de déterminer s'il était possible d'utiliser la reconnaissance optique de caractères (ROC) et le traitement du langage naturel (TLN) pour extraire et totaliser des renseignements sur les prix à partir d'images de reçus d'épicerie, en plus de créer une application Web pour téléverser et traiter les images de reçus. Le présent article met l'accent sur un algorithme de détermination et d'extraction de texte. Il ne présente pas le volet réservé à l'application Web.

Continuer la lecture : Collecte par approche participative des données des reçus d'épicerie dans les communautés autochtones à l'aide de la reconnaissance optique de caractères


Autres articles récents

Parcourir les articles par sujet

Vision par ordinateur
Traitement et ingénierie des données
Analyses prédictives
Analyse et génération de texte
Éthique et utilisation responsable de l'apprentissage automatique
Autre