Réseau de la science des données pour la fonction publique fédérale (RSDFPF)

Participez au RSD!

Plus de renseignements

Les renseignement contenus dans ces articles sont fournis « tel quel » et Statistique Canada n'offre aucune garantie explicite ou implicite, ce qui comprend, sans s'y limiter, les garanties de qualité marchande et d'adaptation à un usage particulier. En aucun cas Statistique Canada ne sera tenu responsable des dommages directs, particuliers, indirects, consécutifs ou autres, quelle qu'en soit la cause.

Articles récents

Des données aux décisions : Visualisations et modélisation d'apprentissage automatique des données de propriétés locatives

Sujets abordés dans cet article : Traitement et ingénierie des données Vision par ordinateur

Selon le recensement de 2021, il y avait 5 millions de ménages locataires au Canada, ce qui signifie qu'environ un tiers des ménages canadiens sont locataires. Une grande partie de cette activité de location se fait toutefois dans le secteur privé, ce qui entraîne des données limitées et incohérentes. Pour combler ces lacunes dans les connaissances, NorQuest College a acquis, traité, analysé et représenté visuellement les annonces immobilières de la partie prenante, le Community Data Program, pour l'Ontario.

Continuer la lecture: Des données aux décisions : Visualisations et modélisation d'apprentissage automatique des données de propriétés locatives

Adoption d'une pratique de MLOps générale pour les applications de production de l'apprentissage automatique dans l'Indice des prix à la consommation canadien

Sujets abordés dans cet article : Traitement et ingénierie des données Analyse et production de texte Éthique et apprentissage automatique responsable

L'utilisation responsable de l'apprentissage automatique (AA) dans les statistiques officielles requiert divers processus pour veiller à ce que l'AA soit élaboré de manière fiable et axé sur les mesures, et qu'il soit directement lié à la satisfaction des besoins en matière de traitement d'un programme statistique précis. Ces processus peuvent être opérationnalisés dans un cadre connu sous le nom d'opérations d'apprentissage automatique (ML Operations ou MLOps). Se concentrant sur le cas d'utilisation de l'Indice des prix à la consommation (IPC) canadien, le présent article donne un aperçu de la manière dont divers processus de MLOps peuvent être créés pour garantir que les modèles d'AA qui classent des produits uniques dans les catégories du système de classification de l'IPC respectent des pratiques exemplaires en matière d'assurance de la qualité, de transparence, de gouvernance et de provenance, assurant ainsi la résolution du problème de détérioration du modèle et la fiabilité des statistiques de prix calculées à partir de données administratives. L'article décrit également comment le cadre des MLOps pourrait être mis en œuvre en offrant une vue d'ensemble d'un modèle de maturité, et se concentre sur plusieurs composantes clés importantes pour les statistiques de prix.

Continuer la lecture: Adoption d'une pratique de MLOps générale pour les applications de production de l'apprentissage automatique dans l'Indice des prix à la consommation canadien

Détection des renseignements identificatoires personnels dans les données non structurées à l'aide de Microsoft Presidio

Sujets abordés dans cet article : Éthique et utilisation responsable de l'apprentissage automatique

À l'ère numérique, les organisations recueillent et stockent de grandes quantités de données sur leurs clients, leurs employés et leurs partenaires. Ces données contiennent souvent des renseignements identificatoires personnels (RIP). Avec la multiplication des violations de données et des cyberattaques, la protection des RIP est devenue une préoccupation majeure pour les entreprises et les organismes gouvernementaux. Dans le présent article, Statistique Canada présente en détail Microsoft Presidio et la façon dont cet outil aide les organisations au Canada à se conformer aux lois en matière de protection de la vie privée.

Continuer la lecture: Détection des renseignements identificatoires personnels dans les données non structurées à l'aide de Microsoft Presidio

Autres articles récents

Introduction aux techniques cryptographiques d'amélioration de la confidentialité — Environnement d'exécution fiable

Code de niveau de production dans le domaine de la science des données

Collecte par approche participative des données des reçus d'épicerie dans les communautés autochtones à l'aide de la reconnaissance optique de caractères

S'attaquer à la surcharge de renseignements : l'application d'intelligence artificielle « Document Cracker » d'Affaires mondiales Canada rationalise les efforts de réponse aux crises

Parcourir les articles par sujet

Vision par ordinateur

Traitement et ingénierie des données

Analyses prédictives

Analyse et génération de texte

Éthique et utilisation responsable de l'apprentissage automatique

Autre

Sélection de la langue

WxT Language switcher

Recherche et menus

WxT Search form