Collecte par approche participative des données des reçus d’épicerie dans les communautés autochtones à l’aide de la reconnaissance optique de caractères
Sujets abordés dans cet article :
Vision par ordinateur Analyse et generation de texte
De nombreux Canadiens qui vivent dans des communautés nordiques et isolées doivent composer avec des coûts accrus pour les tarifs d’expédition et les chaînes d’approvisionnement. Pour mieux comprendre les défis associés à la sécurité alimentaire, la Division de la science des données de Statistique Canada a évalué l’approche participative comme solution pour recueillir des données sur le prix des aliments. Il s’agissait notamment de déterminer s’il était possible d’utiliser la reconnaissance optique de caractères (ROC) et le traitement du langage naturel (TLN) pour extraire et totaliser des renseignements sur les prix à partir d’images de reçus d’épicerie, en plus de créer une application Web pour téléverser et traiter les images de reçus. Le présent article met l’accent sur un algorithme de détermination et d’extraction de texte. Il ne présente pas le volet réservé à l’application Web.
S’attaquer à la surcharge de renseignements : l’application d’intelligence artificielle « Document Cracker » d’Affaires mondiales Canada rationalise les efforts de réponse aux crises
Sujets abordés dans cet article :
Vision par ordinateur
Comme la quantité de rapports et d’analyses générés en réponse aux événements mondiaux ne cesse d’augmenter, il est difficile pour les représentants du gouvernement de trouver rapidement les renseignements dont ils ont besoin pour prendre des décisions efficaces. Pour aider à relever ce défi, l’équipe de science des données d’Affaires mondiales Canada (AMC) a mis au point un outil de recherche fondé sur l’intelligence artificielle (IA), appelé « Document Cracker », qui intègre, analyse et résume automatiquement les renseignements provenant des principales sources de données internes et externes. L’application Document Cracker surveille les personnes et les sujets fréquemment mentionnés dans ces sources de données, tout en prenant en charge un large éventail de requêtes d’utilisateurs pour la recherche, le filtrage et la visualisation de renseignements à partir de la collection de documents sous-jacente.
Interface utilisateur à programmation schématisée avec Plotly Dash
Sujets abordés dans cet article :
Autre
Le présent article donne un aperçu de Plotly Dash, un cadre de conception d’interfaces utilisateurs à programmation schématisée en Python qui permet aux scientifiques des données de créer facilement de telles interfaces pour leurs modèles de données sans avoir besoin d’une expérience approfondie en la matière. Dash s’appuie sur la bibliothèque de visualisation des données à code source ouvert Plotly. Il permet aux personnes qui ne sont pas des spécialistes de l’interface utilisateur de concevoir rapidement des applications de données interactives en Python. Découvrez de quelle façon cet outil d’exécution rapide peut rehausser la valeur de vos projets, en les rendant plus accessibles aux utilisateurs non spécialistes et en augmentant le rendement sur l’investissement dans la conception d’interfaces utilisateurs pour les applications de données.
Continuer la lecture : Interface utilisateur à programmation schématisée avec Plotly Dash
Apprentissage auto-supervisé en vision par ordinateur : classification d'images
Sujets abordés dans cet article :
Vision par ordinateur
Aujourd’hui, nous disposons de modèles d’apprentissage profond capables de classer des images avec une grande précision. Ces modèles ont été formés dans le cadre d’une configuration d’apprentissage supervisé avec un grand nombre d’images et les étiquettes qui leur sont associées. Cependant, la création d’étiquettes pour chaque image est une tâche laborieuse et coûteuse. C’est pourquoi les nouvelles recherches sur la classification d’images ont examiné l’incidence de l’utilisation d’une configuration d’apprentissage auto-supervisé pour former efficacement ces modèles sans utiliser d’étiquettes tout en visant à atteindre le même degré de précision que leurs homologues d’apprentissage supervisé. Dans le présent article, nous verrons de quelle façon cette configuration d’entraînement a été adoptée pour la classification d’images.
Le raisonnement qui sous-tend les décisions prises par un réseau de neurones profond
Sujets abordés dans cet article :
Vision par ordinateur
Les réseaux neuronaux profonds sont une classe de réseaux de neurones artificiels qui sont composés de plusieurs couches de nœuds interconnectés, qui peuvent apprendre des caractéristiques et des modèles complexes à partir de données d’entrée. Cependant, le fonctionnement interne de ces réseaux peut être difficile à interpréter, ce qui rend difficile de comprendre la façon dont les décisions sont prises. L’approche Grad-CAM (méthode de cartographie de l’activation de classe pondérée par gradient) est une technique qui permet de visualiser les zones d’une image qui influencent le plus le résultat du réseau, en calculant les gradients de sortie par rapport à l’image d’entrée. Cela constitue une façon plus intuitive d’interpréter le comportement des réseaux neuronaux profonds et d’améliorer leur performance et leur fiabilité. Dans le présent article, nous explorons le raisonnement sous‑jacent aux réseaux neuronaux profonds et l’utilisation de la Grad-CAM comme outil d’interprétation de leur comportement, et nous démontrons son efficacité au moyen de diverses expériences et méthodes d’application.
Participez au RSD!
Devenez member
Présentez votre projet
Rencontre avec le scientifique des données
Sondage
Ressources en science des données
Plus de renseignements
Les renseignement contenus dans ces articles sont fournis « tel quel » et Statistique Canada n'offre aucune garantie explicite ou implicite, ce qui comprend, sans s'y limiter, les garanties de qualité marchande et d'adaptation à un usage particulier. En aucun cas Statistique Canada ne sera tenu responsable des dommages directs, particuliers, indirects, consécutifs ou autres, quelle qu'en soit la cause.
Autres articles récents
Parcourir les articles par sujet
Vision par ordinateur
- S'attaquer à la surcharge de renseignements : l'application d’intelligence artificielle « Document Cracker » d’Affaires mondiales Canada rationalise les efforts de réponse aux crises
- Collecte par approche participative des données des reçus d’épicerie dans les communautés autochtones à l’aide de la reconnaissance optique de caractères
- Comparaison des outils de reconnaissance optique de caractères pour les documents à forte densité de texte et les textes provenant de scènes
- Détection des serres à l'aide de la télédétection et de l'apprentissage automatique : étape un
- Extraction de tendances temporelles à partir d'images satellitaires
- Modélisation du contexte à l'aide de transformateurs : reconnaissance des aliments
- Pallier les lacunes dans les données pour l'entraînement d'un algorithme d'apprentissage automatique à l'aide d'une application fondée sur l'approche participative généralisée
- Segmentation d'image en imagerie médicale
Traitement et ingénierie des données
- Conception d'un système d'alerte et de surveillance des mesures
- Création d'une Application Web tout-en-un pour la science des données à l'aide de Python : évaluation de l'outil en source ouverte Django
- Créer des visualisations de données convaincantes
- Déploiement de votre projet d'apprentissage automatique en tant que servicee
- Écrire un pipeline d'imagerie satellite, deux fois : un véritable succès
- Ingénierie des données en Rust
- Interventions non pharmaceutiques et apprentissage par renforcement
- La plateforme infonuagique d'analyse avancée liée à la COVID-19
- Mise en œuvre des pratiques MLOps avec Azure
- MLflow Tracking : Une façon efficace de suivre les essais de modélisation
- Rendre la visualisation de données accessible aux personnes aveugles et malvoyantes
- Tirer des avantages pour le public à partir des données administratives : une méthode d’amélioration de l'analyse à l'aide de données couplées
- Un nouvel indicateur des mouvements hebdomadaires d'aéronefs
- Une image vaut mille mots : laissez votre tableau de bord parler en votre nom!
Analyses prédictives
- De l'exploration à l'élaboration de modèles d'apprentissage automatique interprétables et précis pour la prise de décision : privilégiez la simplicité et non la complexité
- L'Accélérateur numérique de RNCan – Révolutionner la façon dont Ressources Naturelles Canada (RNCan) sert les Canadiens grâce à l'innovation numérique
- Modélisation de la dynamique du SRAS-CoV-2 pour prévoir la demande d'EPI
- Prévisions en matière de consommation d'énergie dans les collectivités éloignées du Nord canadien
- Tirer le maximum de la synthèse de données grâce au guide d'utilisation des données synthétiques pour les statistiques officielles
- Utilisation de l'apprentissage automatique pour prédire le rendement des cultures
Analyse et génération de texte
- Cas d'utilisation sur la gestion des métadonnées
- Classification de texte des offres d'emploi dans la fonction publique
- Classification des commentaires sur le Recensement de 2021
- Considérations sur les biais dans le traitement bilingue des langues naturelles
- Communauté de pratique (CdP) de l'apprentissage automatique appliqué à l'analyse de texte : Bilan de l'année 2021
- Contrôle de version avec Git pour les professionnels de l'analyse
- Conversation sur les agents conversationnels – Compte rendu de l'atelier sur les agents conversationnels
- Intelligence documentaire : l'art de l'extraction d'information à partir des PDF
- Langues officielles et traitement du langage naturel
- Modélisation thématique et modélisation thématique dynamique : Une revue technique
- Utiliser la science des données et les outils infonuagiques pour évaluer les répercussions économiques de la COVID-19
Éthique et utilisation responsable de l'apprentissage automatique
- Apprentissage automatique explicable, théorie des jeux et valeurs de Shapley : un examen technique
- Charges de travail protégées dans le nuage public
- Technologies d'amélioration de la protection de la vie privée : un survol de l'apprentissage fédéré
- Technologies liées à la protection de la vie privée partie deux : introduction au chiffrement homomorphe
- Technologies liées à la protection de la vie privée, partie trois : Analyse statistique confidentielle et classification de texte confidentiel fondées sur le chiffrement homomorphe
- Une brève enquête sur les technologies liées à la protection de la vie privée
- Utilisation responsable de l'apprentissage automatique à Statistique Canada
- Utilisation responsable des systèmes décisionnels automatisés du gouvernement fédéral
Autre
Interface utilisateur à programmation schématisée avec Plotly Dash
- Ottawa accueille le Congrès mondial de la statistique en juillet 2023
- Célébrer les femmes et les filles dans le domaine des sciences : entrevue avec Mme Sevgui Erman (PH. D.)
- Élaboration de profils de compétences pour encadrer la science des données dans la fonction publique
- Le bulletin d'information du Réseau de la science des données a un an!
- Première rencontre du comité des directeurs du Réseau de la science des données
- Série sur les développements en matière d'apprentissage automatique : numéro deux
- Série sur les développements en matière d'apprentissage automatique – premier numéro
- Série sur les développements en matière d'apprentissage automatique : troisième numéro
- Sondage sur le bulletin d'information du Réseau de la science des données
- Un étudiant coop explore la puissance des mégadonnées