Cette activité en présentiel se déroulera en après-midi et réunira les participants à la conférence du RCCDR afin d’explorer les nouvelles données et méthodes passionnantes de Statistique Canada, tout en mettant l’accent sur les centres de données de recherche (CDR) de Statistique Canada. Les ateliers sont ouverts aux personnes qui assisteront à la conférence du RCCDR de 2025.
Les participants auront l’occasion d’entendre des spécialistes et des experts en couplage d’enregistrements de Statistique Canada, ainsi que de participer à des discussions qui les aideront à orienter leurs futures recherches.
Il y aura trois ateliers simultanés de 13 h à 15 h 30 (heure normale de l’Est) à Statistique Canada à Ottawa :
Cet atelier abordera les récents projets de recherche empirique sur le logement à Statistique Canada et fournira des renseignements détaillés sur les principaux ensembles de données disponibles dans les CDR.
Cet atelier proposera une exploration détaillée de la Base de données canadienne sur la dynamique employeurs-employés (BDCDEE) et de son sous-ensemble, les Microdonnées analytiques sur les entreprises et les employés (MAEE). La séance mettra en évidence les distinctions entre la BDCDEE et les MAEE, y compris à l’aide d’exemples de recherches qui ont été entreprises en utilisant ces ressources.
Cet atelier offrira une visite guidée du couplage et des données couplées aux chercheurs des CDR, y compris des conseils et des techniques pour réaliser des analyses à l’aide de données couplées. Si vous vous demandez comment les données couplées peuvent vous être utiles, cet atelier est parfait pour vous.
Les ateliers se dérouleront à Statistique Canada au 170, promenade Tunney’s Pasture, à Ottawa, en Ontario. Statistique Canada est accessible depuis le centre-ville d’Ottawa à l’aide du transport en commun, et on peut également s’y rendre en voiture (stationnement payant disponible sur place).
Pour les participants
Les ateliers seront présentés en anglais et des documents bilingues seront disponibles. Les questions peuvent être posées en français ou en anglais.
Des renseignements relatifs à l’inscription aux ateliers et à l’emplacement des pièces seront fournis par courriel avant les ateliers.
Les personnes qui présentent des affiches doivent créer, imprimer, transporter, installer et retirer leurs affiches.
Comme nous avons reçu un grand nombre de résumés, nous demandons à toutes les personnes qui présentent des affiches de s’inscrire à la conférence avant le 4 octobre 2024. Celles qui ne se sont pas inscrites à cette date risquent de perdre leur place au profit d’une personne inscrite sur la liste d’attente.
Création de l’affiche
Les affiches doivent mesurer au plus 4 pi sur 3 pi (c.-à-d. 48 po sur 36 po);
Les affiches doivent être imprimées sur un matériau d’affichage standard (papier ou toile) qui peut être fixé sur un panneau d’affichage conventionnel. Si vous souhaitez utiliser un matériau ou un dispositif d’installation différent, veuillez consulter le comité organisateur à l’avance;
Les affiches peuvent être rédigées dans la langue officielle choisie par la personne qui présente (français ou anglais);
Le langage utilisé doit être simple et les renseignements doivent être présentés de manière claire et accessible.
Installation
Toutes les affiches doivent être installées le 14 novembre 2024, de 8 h à 8 h 50 (HE);
Le personnel sur place pourra aider les participants et des matériaux seront fournis pour fixer l’affiche sur un tableau.
Pendant les séances de présentation d’affiches
Les personnes qui présentent des affiches doivent participer à la conférence en personne et rester près de leur affiche pendant les séances d’affichage, le plus possible.
Retrait
Le retrait des affiches aura lieu le 14 novembre 2024, de 16 h 30 à 16 h 45 (HE);
Toutes les personnes qui présentent des affiches doivent emporter leur affiche hors du site après la conférence. Les affiches laissées sur place seront éliminées.
Voici les délais d'inscription et les frais pour la Conférence des utilisateurs de données sur la santé de 2024.
Type
Frais*
Date limite
Préinscription
Étudiant
125 $
20 septembre 2024
Non-étudiant
225 $
Standard
Étudiant
175 $
1er novembre 2024
Non-étudiant
275 $
*TPS/TVH en sus
Pour être admissible au tarif réduit pour les étudiants, vous devez être inscrit à temps plein dans un établissement d'enseignement postsecondaire. Une preuve d'inscription peut être demandée.
Veuillez noter que pour les personnes qui s'inscrivent sur la liste d'attente après le 1er novembre, nous ne pouvons pas garantir que les demandes spéciales, y compris celles en lien avec des restrictions alimentaires, pourront être satisfaites.
Paiement
Une facture sera envoyée à l'adresse courriel indiquée dans le formulaire d'inscription. Nous vous demandons de bien vouloir payer la facture dans les cinq jours ouvrables suivant sa réception par carte de crédit, dépôt direct ou chèque. Nous communiquerons avec vous pour vous donner les détails du paiement une fois que votre inscription aura été soumise.
Politique d'annulation et de transfert
Si vous ne pouvez pas participer à l'événement, vous pouvez :
annuler votre inscription d'ici le 18 octobre pour recevoir un remboursement complet, moins des frais administratifs de 30 $.
annuler votre inscription d'ici le 8 novembre pour recevoir un remboursement de 50 %.
transférer votre inscription à quelqu'un d'autre avant le 8 novembre, sous réserve de l'approbation du comité organisateur.
La date limite de soumission des résumés est passée. Merci à toutes les personnes qui ont transmis leur travail.
Dates à retenir
Début de la soumission des résumés : 8 juillet 2024
Fin de la soumission des résumés : 22 août 2024
Communication des résultats : 9 septembre 2024
Tenue de la conférence : 14 novembre 2024
Toutes les personnes qui présentent des affiches doivent être inscrites à la conférence. Elles doivent y assister en personne et rester près de leur affiche imprimée pendant les séances d'affichage.
Le programme de la conférence présente des approches novatrices et collaboratives de l'utilisation des données et de la recherche pour aborder les principaux défis en matière de santé. Il est divisé en quatre thèmes : mobilisation des données durant les situations d'urgence, santé de la population, soins préventifs, et environnement et santé. Du temps est également consacré au réseautage, notamment au moyen de présentations par affiches et de kiosques d'information, qui favorisent l'interaction directe entre les utilisateurs et les fournisseurs de données.
Présidente de la conférence : Josée Bégin, statisticienne en chef adjointe, Statistique Canada
Le jeudi 14 novembre 2024 :
Heure
Événement
De 8 h à 8 h 50
Inscription et installation des affiches
De 9 h à 9 h 15
Accueil et mot de bienvenue
André Loranger, statisticien en chef du Canada
Josée Bégin, statisticienne en chef adjointe, Statistique Canada
De 9 h 15 h à 10 h 30
Mobilisation des données durant les situations d'urgence
De 9 h 15 à 9 h 45
Thème central : Créer les conditions pour des communautés résilientes
Conférencière : Theresa Tam (administratrice en chef de la santé publique)
Description : Dre Theresa Tam abordera la façon dont la santé publique peut tirer parti des données pour améliorer l'équité, la résilience du système et l'intervention d'urgence. Elle présentera des stratégies de collaboration avec les communautés et les partenaires de divers secteurs afin de favoriser la santé et la résilience des communautés. Elle mettra l'accent sur le rôle de l'utilisation des données sur la santé publique pour améliorer l'équité en matière de santé, en plaçant l'équité au cœur de la science, des données probantes et de la technologie relatives à la gestion des urgences.
Introduit par : André Loranger, statisticien en chef du Canada
De 9 h 45 à 10 h
Séance 1 : L'Enquête canadienne sur les eaux usées : un nouvel outil de santé publique pour surveiller les maladies infectieuses
Conférencière : Natalie Knox (directrice, division des Pathogènes bactériens, résistance aux antimicrobiens et eaux usées, Agence de la santé publique du Canada)
Description : Natalie Knox discutera du partenariat entre l'Agence de la santé publique du Canada et Statistique Canada pour surveiller les maladies infectieuses au moyen de l'Enquête canadienne sur les eaux usées et de la façon dont elle est en train d'être élargie pour aborder les menaces en matière de santé publique existantes et à venir, comme la résistance aux antimicrobiens (RAM).
De 10 h à 10 h 15
Séance 2 : Médecins légistes et coroners : une source sous-exploitée de données dans le contexte de la crise des opioïdes et au-delà
Conférencier : Matthew Bowes (médecin légiste en chef, gouvernement de la Nouvelle-Écosse)
Description : Matthew Bowes décrira l'investigation médico-légale au Canada : la façon dont elle est habituellement menée, le type de décès faisant l'objet d'une enquête, la façon dont les pratiques varient et le type de données disponibles pour les chercheurs.
De 10 h 15 à 10 h 30
Période de questions
Animateur : Josée Bégin (statisticienne en chef adjointe, Statistique Canada)
De 10 h 30 à 11 h
Pause-santé, réseautage et visionnement des affiches et des kiosques
De 11 h à 12 h
Séance plénière : l'approche relative à la santé de la population
De 11 h à 11 h 15
Partie 1 : Tirer parti des données sur la santé de Statistique Canada, une ressource clé
Conférencier : Jeff Latimer (directeur général, Direction de la statistique de la santé de Statistique Canada)
Description : Au Canada, Statistique Canada est la source fiable de renseignements actuels et exacts au sujet de la santé des Canadiens, des déterminants de la santé et de l'utilisation de ressources en matière de soins de santé. Dans cette présentation, M. Latimer donnera un aperçu de l'étendue des données hébergées à Statistique Canada, de la façon d'accéder à ces données et des services disponibles pour personnaliser et coupler des données pour vos recherches.
De 11 h 15 à 11 h 30
Partie 2 : Données désagrégées : progrès et réflexions
Conférencière : Gayatri Jayaraman (directrice générale, Direction de la statistique juridique, de la diversité et de la population de Statistique Canada)
Description : Gayatri Jayamaran discutera des progrès de Statistique Canada dans le cadre du Plan d'action sur les données désagrégées (PADD), qui vise à augmenter et à améliorer les statistiques sur diverses populations et à soutenir des méthodes de collecte de données plus représentatives dans l'ensemble de Statistique Canada.
Discussions en séance plénière : Comment les systèmes de santé peuvent-ils utiliser les données désagrégées pour aborder les disparités en matière de santé?
De 11 h 30 à 11 h 35
Commentaires: Kwame McKenzie (PDG, Wellesley Institute; professeur, Université de Toronto) partagera ses connaissances sur les progrès et les défis liés aux données sur la santé fondées sur la race.
De 11 h 35 à 11 h 40
Commentaires: Danièle Behn Smith (administratrice en chef adjointe de la santé des Autochtones, Bureau de l'administrateur en chef de la santé publique de la Colombie-Britannique) partagera ses connaissances sur les progrès et les défis liés aux données sur la santé des Autochtones.
De 11 h 40 à 12 h
Discussion ouverte
Animatrice : Josée Bégin (statisticienne en chef adjointe, Statistique Canada)
De 12 h à 13 h
Dîner, réseautage et visionnement des affiches et des kiosques
De 13 h à 14 h 30
Application des connaissances pour alléger le fardeau de la maladie
De 13 h à 13 h 20
Séance 1 : Modélisation des effets de la politique nationale de nutrition sur l'alimentation et la santé
Conférencière : Mary L'Abbé (professeure, Université de Toronto, et directrice, Centre collaborateur de l'OMS sur la politique nutritionnelle pour la prévention des maladies chroniques)
Description : Santé Canada exige que les aliments et boissons préemballés dont la teneur en sodium, en sucres ou en gras saturés dépasse les seuils établis présentent un symbole nutritionnel « Élevé en » sur le devant de l'emballage, d'ici janvier 2026. Mary L'Abbé expliquera comment elle a utilisé les données de l'Enquête sur la santé dans les collectivités canadiennes – Nutrition et de l'Enquête sur les dépenses des ménages, appariées aux données sur la composition nutritionnelle, pour modéliser les effets potentiels de ce nouvel étiquetage sur l'alimentation et la santé.
De 13 h 20 à 13 h 40
Séance 2 : Utilisation de la cartographie à petite échelle des cancers évitables pour éclairer et renforcer la prévention du cancer
Conférencière : Nathalie Saint-Jacques (épidémiologiste principale, Programme de soins contre le cancer de Santé Nouvelle-Écosse; professeure auxiliaire, Université Dalhousie; associée de recherche, Healthy Populations Institute de l'Université Dalhousie)
Description : Nathalie Saint-Jacques discutera de ses recherches sur l'analyse à petite échelle de l'incidence du cancer par rapport aux conditions environnementales, matérielles et sociales dans lesquelles vivent les personnes, démontrant la façon dont une approche axée sur la géographie peut éclairer et renforcer des activités équitables de prévention du cancer.
De 13 h 40 à 14 h
Séance 3 : Projection de l'incidence de la démence : le modèle de santé de la population pour la démence (POHEM-démence)
Conférencière : Stacey Fisher (boursière postdoctorale, Institut de recherche de l'Hôpital d'Ottawa)
Description : Stacey Fisher discutera d'un modèle de microsimulation pour la démence qui a été élaboré pour étudier l'effet des facteurs de risque modifiables sur l'incidence de la démence et pour évaluer les stratégies d'interventions potentielles et les options stratégiques.
De 14 h à 14 h 30
Discussion de groupe : Réduire le fardeau de la maladie au Canada : obstacles et possibilités
Animateur : Michael Tjepkema, Directeur adjoint, Division de l'analyse de la santé, Statistique Canada
De 14 h 30 à 15 h
Pause-santé, réseautage et visionnement des affiches et des kiosques
De 15 h à 16 h 15
Environnement et santé (« Une santé unique »)
De 15 h à 15 h 30
Thème central : Prendre les devants sur la courbe des changements climatiques : la science pour soutenir l'adaptation du secteur de la santé
Conférencier : Peter Berry (analyste principal des politiques et conseiller scientifique, Bureau des changements climatiques et de la santé, Santé Canada)
Description : Peter Berry discutera de la science actuelle relative aux risques pour la santé, aux vulnérabilités et aux besoins en matière d'adaptation liés aux changements climatiques, dans l'espoir de favoriser à l'avenir les collaborations et les solutions novatrices.
Introduit par : Josée Bégin (statisticienne en chef adjointe, Statistique Canada)
De 15 h 30 à 15 h 45
Séance 1 : Examen de l'incidence de la chaleur extrême sur la santé : surmortalité et morbidité liées à la température à venir au Canada
Description : ÉricLavigne présentera son travail au moyen de l'analyse de séries chronologiques pour estimer les liens entre les températures quotidiennes et la mortalité ou les hospitalisations dans l'ensemble du Canada jusqu'en 2099, donnant un aperçu des résultats en matière de santé prévus selon divers scénarios de changements climatiques et de croissance de la population.
De 15 h 45 à 16 h
Séance 2 : Utilisation de données de biosurveillance humaine dans l'évaluation des risques pour la santé humaine des substances du Plan de gestion des produits chimiques
Conférencier : Innocent Jayawardene (évaluateur scientifique et chimiste, Santé Canada)
Description : Innocent Jayawardene parlera des points saillants d'une étude de Santé Canada mesurant 12 éléments, dont 5 métaux terreux rares, dans des échantillons de sang entiers au moyen de la biobanque de l'Enquête canadienne sur les mesures de la santé (ECMS), pour évaluer les risques pour la santé des substances du Plan de gestion des produits chimiques.
De 16 h à 16 h 15
Période de questions
Animatrice : Josée Bégin (statisticienne en chef adjointe, Statistique Canada)
De 16 h 15 à 16 h 30
Mot de la fin : Regard sur l’avenir
Josée Bégin, statisticienne en chef adjointe, Statistique Canada
Statistique Canada et l'Agence de la santé publique du Canada seront les fiers hôtes de la Conférence des utilisateurs de données sur la santé de 2024 qui se tiendra au Musée canadien de la guerre, à Ottawa, le 14 novembre.
Cet événement d'une journée en personne réunira 150 utilisateurs et utilisatrices, et fournisseurs et fournisseuses de données sur la santé, et son objectif sera d'explorer les façons novatrices et collaboratives dont les données sur la santé sont utilisées pour s'attaquer aux nouveaux problèmes de santé au Canada.
Les participants et participantes auront l'occasion :
d'entendre quelques-uns des principaux intervenants et intervenantes qui utilisent ou fournissent des données au Canada, y compris le statisticien en chef du Canada et l'administratrice en chef de la santé publique du Canada;
d'en apprendre davantage sur les données et les services de santé de Statistique Canada et sur la façon de les exploiter;
de participer à des discussions qui contribuent à façonner l'avenir des données sur la santé;
de rencontrer directement des personnes œuvrant dans tous les aspects du pipeline de données, de la conception à l'application, en passant par la collecte;
de présenter leurs recherches et d'échanger leurs idées.
Cette conférence s'adresse aux chercheurs et chercheuses et aux analystes de la santé, y compris la population étudiante. Elle s'adresse également aux utilisateurs finaux et aux utilisatrices finales, comme les décideurs et décideuses en matière de politiques et de programmes de santé, des organisations gouvernementales et non gouvernementales.
Si vous avez des questions ou souhaitez figurer sur notre liste de diffusion pour la conférence, veuillez envoyer un courriel à statcan.hduc-cuds.statcan@statcan.gc.ca.
Le Carrefour de la qualité de vie de Statistique Canada fournit d'importants renseignements sur la qualité de vie au Canada, en rassemblant des ensembles de données économiques, sociales et environnementales clés.
Centre de données municipales et locales
Le Centre de données municipales et locales permet aux Canadiens d'accéder facilement aux données sur leur localité et de mieux les comprendre, et aide les décideurs et les chercheurs à prendre de meilleures décisions à partir de ces données.
Dans son budget de 2023, le gouvernement du Canada a annoncé la création d'un programme national de soins dentaires qui sera mis en œuvre par Santé Canada, et il s'est engagé à financer l'administration de ce programme à concurrence de plus de 13 milliards de dollars. Parallèlement, Statistique Canada s'est vu octroyer 23,1 millions de dollars sur deux ans pour « recueillir des données sur la santé buccodentaire et l'accès aux soins dentaires au Canada », qui serviront de base à la mise en œuvre du nouveau Régime canadien de soins dentaires. Avec les fonds qui lui sont versés, Statistique Canada est en train de mettre au point un programme statistique robuste qui comprend la collecte de données sur l'état de santé buccodentaire autodéclaré des Canadiens et Canadiennes et sur leurs besoins en matière de soins buccodentaires, et la collecte de données sur l'état du système canadien de soins buccodentaires. De plus, l'organisme est en train d'effectuer les investissements nécessaires à la création d'une infrastructure qui permettra de mener à bien les activités de collecte au-delà de 2025.
Le nouveau Programme de la statistique sur la santé buccodentaire (PSSD) de Statistique Canada vise à combler les besoins en données sur la santé buccodentaire au moyen d'une stratégie globale et intégrée axée sur deux activités principales : la création de nouvelles enquêtes sur la santé buccodentaire ainsi que l'acquisition et l'intégration de données administratives connexes.
Dans le cadre de la création de ce nouveau programme statistique, Statistique Canada a lancé une série de séances de consultation auprès des principales parties prenantes. L'objectif était de mieux comprendre leurs préférences en ce qui concerne l'accès aux résultats du PSSD, le format des produits de diffusion, et les utilisations possibles des données du PSSD. Cette activité visait également à sonder les différentes parties de manière informelle pour évaluer leur connaissance des sources de données sur la santé buccodentaire et les soins de santé buccodentaire.
Méthodes de mobilisation consultative
Les consultations sur le PSSD ont été menées sous la forme de séances d'information virtuelles, lesquelles comprenaient des discussions de groupe avec un large éventail de parties prenantes du milieu de la santé buccodentaire. Ainsi, des gens issus d'organismes de réglementation, d'associations professionnelles, de réseaux de recherche et d'autres groupes ont pu formuler leurs commentaires. Les séances de mobilisation consultative se sont déroulées en deux phases, l'une au cours des deux premières semaines de décembre 2023 et l'autre au cours des deux dernières semaines de janvier 2024. Ces séances ont été diffusées sur la page Consultation des Canadiens de Statistique Canada. Par ailleurs, les différentes parties ont été personnellement invitées par courriel à participer aux séances, et à partager l'invitation avec d'autres membres de leur réseau. En plus de prendre part aux séances en mode virtuel, les participants et participantes ont eu la possibilité de nous communiquer leurs commentaires au moyen de formulaires électroniques et par écrit.
Dans l'ensemble, Statistique Canada a animé 10 groupes de discussion dans les deux langues officielles et a recueilli des commentaires auprès de 115 personnes représentant un total de 61 organisations des secteurs public et privé. Ces organisations — fournisseuses ou utilisatrices potentielles de données — comprenaient des établissements d'enseignement, des administrations municipales et provinciales ainsi que des associations professionnelles provinciales et nationales de toutes les professions de la santé buccodentaire. Des professionnels et professionnelles de la santé buccodentaire (dentistes, chirurgiens/chirurgiennes-dentistes, hygiénistes et thérapeutes dentaires, assistants/assistantes dentaires, technologues et techniciens/techniciennes dentaires) ont pris part aux discussions. Des organismes fédéraux et provinciaux de réglementation des soins buccodentaires y ont également participé.
Ce que nous ont dit les parties prenantes
Les capacités et l'expérience en matière d'analyse des données de santé buccodentaire variaient grandement d'une organisation à l'autre. Il est ressorti de nos consultations que les établissements d'enseignement, les associations professionnelles et les organismes gouvernementaux ont généralement des équipes spécialisées dans l'analyse des données, tandis que les petites entités, comme les organismes de réglementation, ont généralement une faible capacité d'analyse indépendante des données.
Au sujet des difficultés rencontrées dans l'écosystème actuel des données sur la santé buccodentaire, plusieurs ont soulevé les points suivants : ressources limitées pour effectuer des analyses; obstacles à l'accès aux données; ensembles de données incomplets en raison de l'absence d'intégration des données sur les demandes de règlement avec les dossiers de santé électroniques, les données sur les admissions à l'hôpital pour des problèmes de santé buccodentaire et les données des programmes de soins dentaires provinciaux; silos organisationnels; et fatigue liée à la participation aux enquêtes qui se traduit par de faibles taux de réponse. Malgré ces difficultés, la grande majorité des participants et participantes ont cité les retombées potentielles de l'utilisation des données du PSSD pour soutenir les efforts de sensibilisation et pour éclairer la prise de décisions stratégiques. Ils ont aussi souligné l'importance de permettre l'accès à des données agrégées faciles à analyser, ainsi que de garantir la possibilité de demander des ensembles de données précis au besoin. La plupart des organisations ont notamment déclaré ne pas mener leurs propres enquêtes sur la santé buccodentaire ou ne pas tenir de dépôts de données indépendants, choisissant plutôt d'utiliser de multiples sources de données externes. En résumé, les acteurs de la santé buccodentaire recherchent activement des données complètes et exploitables pour traiter efficacement d'enjeux clés et améliorer les résultats en matière de santé buccodentaire.
Statistique Canada tient à remercier toutes les personnes et organisations participantes de leur contribution à cette initiative de mobilisation consultative. Leurs points de vue et leurs expériences seront essentiels à l'élaboration de produits et de stratégies de diffusion de données pertinentes et actuelles pour aider les utilisatrices et utilisateurs de données.
Par : Uchenna Mgbaja, Nazmus Sakeef, Kendrick Moreno, Catrina Llamas et Roe Alincastre; NorQuest College
Présentation
Le projet Edmonton Food Drive (EFD) est le fruit d’une collaboration entre le NorQuest College, l’Église LDS, etc. visant à améliorer la logistique de l’une des plus grandes initiatives communautaires de dons alimentaires de l’Alberta. Le système actuel de gestion des dons alimentaires rencontre des difficultés dans la coordination des lieux de dépôt, des processus de collecte et de la planification des itinéraires. Il est nécessaire d’automatiser et d’améliorer ces processus afin de garantir la collecte des dons en temps voulu et de minimiser les complexités logistiques.
Ce projet multipartite vient en aide à plus de 40 000 personnes chaque mois en distribuant plus de 400 000 repas à des personnes dans le besoin. Ces chiffres montrent l’importance de la demande au sein de la communauté et soulignent le rôle essentiel des efforts de collaboration dans la lutte contre l’insécurité alimentaire.
L’objectif de ce projet était de développer une solution d’apprentissage automatique afin d’améliorer la gestion des activités de dons alimentaires en Alberta. Le projet vise à accroître l’efficacité et l’efficience des processus de dépôt et de collecte, à rationaliser la planification des itinéraires et à améliorer l’allocation des ressources.
Solutions proposées
Un élément clé de l’Edmonton Food Drive est le rôle joué par les paroisses et les pieux, les unités organisationnelles au sein de l’Église de Jésus-Christ des Saints des Derniers Jours (LDS), qui facilitent la participation des bénévoles et la coordination logistique.
Dans l’Église LDS, une paroisse est une congrégation locale qui dessert une zone géographique spécifique, tandis qu’un pieu est une unité administrative plus grande composée de plusieurs paroisses. Dans le cadre du projet EFD, les pieux supervisent plusieurs paroisses, fournissant un soutien organisationnel et des ressources, tandis que les paroisses coordonnent les efforts des bénévoles, la collecte des dons et la gestion des itinéraires dans leurs zones respectives.
Sur la base des objectifs du projet, les solutions suivantes ont été proposées et développées pour relever les défis identifiés :
Amélioration de la collecte de données :
Créer des formulaires d’acquisition de données pour collecter des données auprès des paroisses par le biais d’enquêtes structurées, permettant aux bénévoles de répondre aux questions aussi rapidement et efficacement que possible.
Analyse des tendances :
Utiliser la visualisation des données et des techniques statistiques pour effectuer une analyse d’une année sur l’autre, révélant les tendances critiques et les indicateurs de performance.
Tableaux de bord interactifs :
Créer des tableaux de bord interactifs et conviviaux qui permettent aux parties prenantes d’explorer et de comparer facilement les données, facilitant ainsi une prise de décision plus éclairée.
Modélisation prédictive :
Mettre en œuvre des techniques d’apprentissage automatique pour développer un modèle prédictif qui prévoit les tendances en matière de dons et identifie les nouvelles tendances.
Prévisions d’efficacité :
Construire un modèle prédictif pour estimer quels paroisses ou pieux auront le plus grand impact en termes d’efficacité pour 2025.
Application de cartographie des itinéraires :
Développer une application de numérisation des itinéraires qui génère automatiquement des cartes numérisées pour les bénévoles, améliorant ainsi l’efficacité opérationnelle. Créer une application de cartographie des itinéraires qui génère des cartes interactives pour les bénévoles, en se concentrant sur les adresses à forte demande ou les zones sensibles pour une efficacité opérationnelle à long terme.
Ces solutions proposées visaient à rationaliser les processus opérationnels, à renforcer l’engagement des parties prenantes et à tirer parti des informations prédictives pour améliorer la planification et l’exécution des futures collectes alimentaires.
Méthodologie
Collecte de données
Les données sur les volumes de dons, les itinéraires et la participation des bénévoles ont été recueillies lors de la collecte alimentaire d’Edmonton en septembre 2023 et septembre 2024. Les données ont été collectées auprès de 6 pieux et 27 paroisses. Ces données ont été systématiquement collectées auprès de centres de collecte désignés, assignés par les représentants des clients, afin de garantir une couverture précise des itinéraires et des régions spécifiques. Bien que complètes dans le cadre du champ d’application assigné, les données ne représentaient pas tous les points de collecte d’Edmonton, ce qui limitait leur applicabilité à l’ensemble de la ville.
Ensembles de données :
Nous avons commencé notre analyse sur les données collectées en 2023 auprès des paroisses. En 2024, nous avons ajouté des règles de validation des données afin de réduire les risques d’erreurs de saisie tout en veillant à ce que le temps nécessaire aux bénévoles pour remplir le formulaire reste aussi court qu’auparavant.
Figure 1 : Formulaire de collecte de données pour la collecte alimentaire d’Edmonton 2024 Description : Cet ensemble de données comprend 653 échantillons et 31 caractéristiques, recueillis à l’aide d’un formulaire Microsoft rempli par des bénévoles. Le formulaire a été utilisé pour enregistrer les détails liés à la logistique des sacs de dons réclamés lors de la collecte alimentaire d’Edmonton 2024, fournissant des données précieuses pour l’analyse et l’optimisation des ressources.
Les données collectées en 2023 se concentraient sur les renseignements essentiels relatifs à la collecte des dons, aux bénévoles et aux itinéraires. Bien qu’elles aient fourni une base solide, elles étaient limitées en termes de validation des données et de richesse des caractéristiques. L’ensemble de données comprenait 13 caractéristiques et 454 échantillons.
Nom de la colonne
Description
Date
Date à laquelle la collecte alimentaire a eu lieu.
Lieu
Zone ou quartier spécifique où la collecte alimentaire a été effectuée.
Pieu
L’organisation ou le groupe responsable de la gestion des bénévoles dans la zone.
Nombre de bénévoles adultes
Nombre de bénévoles adultes ayant participé à l’activité.
Nombre de jeunes bénévoles
Le nombre de jeunes bénévoles qui ont participé à l’activité.
Sacs de dons collectés
Le nombre total de sacs de dons collectés pendant l’activité.
Temps nécessaire pour terminer (min)
Le temps total (en minutes) nécessaire pour terminer le ou les itinéraires assignés.
Plus d’un itinéraire parcouru
Indique si plus d’un itinéraire a été parcouru (p. ex., Oui/Non).
Paroisse
Paroisse municipale où la collecte alimentaire a eu lieu.
Itinéraires parcourus
Nombre total d’itinéraires parcourus par les bénévoles.
Portes sur l’itinéraire
Nombre total de portes couvertes dans l’itinéraire attribué.
Numéro/nom de l’itinéraire.1
Identifiant ou nom de l’itinéraire attribué aux bénévoles.
Temps passé
Durée totale passée par les bénévoles pendant l’activité de collecte alimentaire.
Nombre de bénévoles adultes
Nombre de bénévoles adultes ayant participé à l’activité.
Tableau 1 : Informations sur les caractéristiques de l’ensemble de données EFD 2023
Description : Cet ensemble de données comprend les données collectées au moyen d’un formulaire Google pendant la collecte alimentaire d’Edmonton 2023. Nombre de caractéristiques : 13; nombre d’échantillons : 454.
Nom de la colonne
Description
Identifiant
Identifiant unique attribué à chaque formulaire soumis.
Heure de début
Heure à laquelle le bénévole a commencé à remplir le formulaire.
Heure de fin
Heure à laquelle le bénévole a terminé de remplir le formulaire.
Courriel
Adresse courriel fournie par le bénévole.
Nom
Nom du bénévole.
Comment avez-vous reçu le formulaire?
Méthode par laquelle le bénévole a reçu le formulaire (p. ex., courriel, lien).
Adresse courriel
Adresse courriel de contact pour toute communication ultérieure.
Lieu de dépôt
Lieu principal où les dons ont été déposés.
Autres lieux de dépôt
Autres lieux où les dons ont été déposés.
Pieu
Pieu spécifique responsable de l’organisation de la participation du bénévole.
Pieux de Bonnie Doon
Indique l’implication dans le pieu de Bonnie Doon.
Pieu d’Edmonton Nord
Indique l’implication dans le pieu d’Edmonton Nord.
Pieu de Gateway
Indique la participation dans le pieu de Gateway.
Pieu de Riverbend
Indique la participation dans le pieu de Riverbend.
Pieu de Sherwood Park
Indique la participation dans le pieu de Sherwood Park.
Pieu YSA
Indique la participation dans le pieu des jeunes adultes seuls (Young Single Adults; YSA).
Numéro/nom de l’itinéraire
Identifiant ou nom de l’itinéraire de collecte des dons.
Temps passé à collecter les dons
Temps total passé à collecter les dons pour l’itinéraire.
Nombre d’adultes bénévoles ayant participé à cet itinéraire
Nombre d’adultes bénévoles ayant participé à cet itinéraire spécifique.
Nombre de jeunes bénévoles ayant participé à cet itinéraire
Nombre de jeunes bénévoles ayant participé à cet itinéraire spécifique.
Nombre de portes sur l’itinéraire
Nombre total de portes couvertes sur l’itinéraire.
Nombre de sacs de dons collectés
Nombre total de sacs de dons collectés sur l’itinéraire.
Avez-vous effectué plus d’un itinéraire?
Indique si le bénévole a effectué plus d’un itinéraire (p. ex., Oui/Non).
Combien d’itinéraires avez-vous effectués?
Le nombre total d’itinéraires effectués par le bénévole.
Détails concernant un troisième itinéraire supplémentaire parcouru, le cas échéant.
Itinéraires supplémentaires parcourus (plus de 3
itinéraires)
Détails concernant les itinéraires supplémentaires parcourus au-delà de trois, le cas échéant.
Itinéraires supplémentaires parcourus (plus de 3 itinéraires)2
Détails supplémentaires concernant les itinéraires parcourus au-delà de trois, le cas échéant.
Itinéraires supplémentaires parcourus (plus de 3 itinéraires)3
Détails supplémentaires concernant les itinéraires parcourus au-delà de trois, le cas échéant.
Commentaires ou retours
Tout commentaire, suggestion ou retour supplémentaire fourni par le bénévole II.
Tableau 2 : renseignements sur les caractéristiques de l’ensemble de données EFD 2024
Description : Cet ensemble de données comprend les données collectées via un formulaire Microsoft pendant la collecte alimentaire d’Edmonton 2023. Nombre de caractéristiques : 31; nombre d’échantillons : 653
Extraction de renseignements géographiques : ensemble de données sur les quartiers de la ville d’Edmonton
Afin de compléter les données de la collecte alimentaire, l’ensemble de données sur les quartiers de la ville d’Edmonton [Lien] a été intégré à l’analyse. Cet ensemble de données a fourni des coordonnées géographiques et les noms des quartiers, permettant ainsi une analyse géospatiale des tendances en matière de dons et de l’efficacité des itinéraires.
Les renseignements géographiques ont été extraits de l’ensemble de données sur les évaluations foncières et fusionnées avec les données de la collecte alimentaire à l’aide des noms uniques des quartiers. Ces données ont ensuite été utilisées pour générer des cartes qui fournissent des renseignements visuels sur les modèles et les tendances en matière de dons au niveau des quartiers. Les colonnes présentées dans le tableau 3 ont été spécialement extraites à cette fin :
Nom de la colonne
Description
Nom de la colonne
Nom officiel du quartier dans la ville d’Edmonton.
Latitude
Coordonnée géographique indiquant la position nord-sud du quartier.
Longitude
Coordonnée géographique indiquant la position est-ouest du quartier.
Tableau 3 : Renseignements sur les caractéristiques de l’ensemble de données sur les quartiers de la ville d’Edmonton
Description : Les données géographiques des quartiers de la ville d’Edmonton fournissent des renseignements complets sur les limites des quartiers, la démographie, l’utilisation des sols et d’autres caractéristiques utiles pour l’urbanisme et l’analyse. Nombre de caractéristiques : 3; nombre d’échantillons : 427
Ces renseignements ont été essentiels pour créer des visualisations géospatiales interactives et des cartes numériques des itinéraires pour la collecte alimentaire d’Edmonton.
Analyse exploratoire des données
Les données collectées ont été nettoyées et préparées pour l’analyse afin d’en garantir l’exactitude et la cohérence. Des visualisations clés ont été générées afin de fournir des renseignements comparatifs, en mettant l’accent sur l’identification des tendances et des modèles en matière de volumes de dons, d’affectation des bénévoles et d’efficacité des itinéraires. Les renseignements se limitaient aux données collectées auprès des centres de collecte désignés, soulignant la nécessité d’une stratégie de collecte de données plus complète pour les futures collectes. Notre stratégie d’analyse exploratoire des données consistait à examiner chaque caractéristique individuellement et à effectuer des analyses détaillées pour chacune d’entre elles.
Nous avons procédé à une analyse complète des données de la collecte alimentaire d’Edmonton, en nous concentrant sur la mise en évidence de modèles et de relations afin d’améliorer la compréhension des variables clés et d’optimiser les efforts futurs. L’analyse a commencé par l’examen de la fréquence et de la répartition des lieux de dépôt, en explorant leur relation avec des variables telles que le nombre de sacs de dons collectés et le nombre de bénévoles impliqués. La fréquence des différentes valeurs de « pieux » a été évaluée et leur impact sur les caractéristiques numériques, notamment le nombre de portes et de sacs de dons, a été analysé de près.
En outre, nous avons exploré les aspects liés au temps, en analysant la fréquence des différentes catégories de temps et en étudiant les différences de temps passé entre les « pieux » et les « paroisses ». La répartition des données entre les paroisses a également fait l’objet d’une attention particulière, en examinant comment certaines paroisses influençaient d’autres variables, telles que le nombre de sacs de dons et d’itinéraires. La participation des bénévoles a également été analysée, en accordant une attention particulière à la corrélation entre les bénévoles adultes et d’autres caractéristiques numériques, ainsi qu’à la répartition globale des bénévoles entre les différentes zones.
La répartition du nombre de portes a été évaluée par rapport à des variables catégorielles, et le nombre moyen de portes par « pieu » a été calculé. En outre, la relation entre les sacs de dons et le nombre d’itinéraires a été analysée, en comparant les variations du nombre de sacs de dons entre les différents lieux et paroisses. Les tendances annuelles ont également été étudiées, afin d’identifier les changements dans les volumes de dons et le nombre total de bénévoles au fil du temps.
Grâce à cette analyse, nous avons découvert des renseignements précieux sur les relations entre les lieux de dépôt, les bénévoles et les tendances en matière de dons.
Affiner les données :
Pour l’ensemble de données EFD 2024, nous avons identifié les problèmes suivants et appliqué les méthodes respectives pour les résoudre.
Problèmes détectés
Méthode d’affinage
Noms de colonnes trop longs
Renommer les noms de colonnes pour plus de clarté
Formats de chaînes incohérents
Suppression des espaces avant et après
Conversion au format titre
Suppression des caractères inutiles
Types de données incorrects et incohérents
Conversion des variables aux types de données corrects
Valeurs nulles détectées
Variables numériques : Imputation de la moyenne pour remplacer les valeurs nulles, en conservant la distribution de l’ensemble de données à l’aide de la moyenne de la caractéristique.
Variables catégorielles : Aucune valeur nulle détectée
Valeurs vides détectées
Marquage des champs catégoriels vides avec des espaces réservés (p. ex., « Itinéraires inconnus »)
Valeurs dupliquées
Suppression des valeurs et des colonnes dupliquées
Trop de données non pertinentes
Suppression des colonnes non pertinentes
Identification des valeurs aberrantes
Détection à l’aide de la méthode IQR et imputation à l’aide de la moyenne
Tableau 4 : Problèmes identifiés dans l’ensemble de données EFD 2024 et leurs solutions respectives
Après avoir affiné les données de l’ensemble EFD 2024, nous l’avons fusionné avec l’ensemble EFD 2023 et l’ensemble de données sur les quartiers de la ville d’Edmonton. Nous avons utilisé notre ensemble de données final nettoyé pour une analyse plus approfondie.
Visualisation des données :
Nous avons créé des visualisations interactives à l’aide de Tableau afin de rendre nos conclusions EDA faciles à comprendre. Ces visualisations permettent aux utilisateurs d’explorer les données et d’obtenir des renseignements grâce à des graphiques et des cartes dynamiques. Le tableau de bord comprend divers graphiques et cartes qui présentent les aspects clés de notre analyse de manière simple et claire. La figure 2 montre les visualisations incluses dans le tableau de bord qui viennent étayer notre analyse globale.
Figure 2 : Tableau de bord interactif de la collecte alimentaire d’Edmonton 2024 visualisé à l’aide de Tableau Description : Ce tableau de bord fournit un aperçu des indicateurs clés liés à la collecte alimentaire d’Edmonton, notamment les tendances en matière de dons, les données de distribution et l’engagement communautaire. Grâce aux fonctionnalités interactives de Tableau, les utilisateurs peuvent explorer les données pour obtenir des renseignements sur l’impact et les performances de la collecte alimentaire tout au long de l’année 2024.
Les principales fonctionnalités du tableau de bord sont les suivantes :
Carte des ICR pour les fonctionnalités clés : affiche le nombre total de sacs de dons, de maisons, d’itinéraires, de bénévoles et le temps moyen passé, en fonction des critères sélectionnés.
Nombre total de sacs de dons par paroisse : cette carte d’Edmonton montre la répartition des sacs de dons dans les différentes paroisses, offrant une comparaison claire de leur répartition dans la ville.
Les dix paroisses les plus efficaces : met en évidence les 10 paroisses les plus efficaces, en présentant leurs performances à l’aide d’indicateurs clés.
Nombre total de bénévoles : graphique à barres comparant le nombre de bénévoles au fil des ans, offrant un aperçu des tendances et des changements au fil du temps.
Principaux contributeurs par paroisse : carte thermique montrant les contributions de chaque paroisse, utilisant des dégradés de couleurs pour mettre en évidence les zones où les contributions sont les plus élevées et les plus faibles.
Graphique sacs de dons c. temps passé : visualisation comparant le nombre de sacs de dons au temps passé, donnant un aperçu de l’efficacité du processus de dons.
Apprentissage automatique
Avant de développer et d’évaluer des modèles d’apprentissage automatique, nous avons effectué plusieurs étapes de préparation des données afin de garantir des entrées de haute qualité.
Ingénierie des caractéristiques
Afin d’améliorer l’ensemble de données, nous avons introduit trois nouvelles caractéristiques :
Nombre total de bénévoles : somme du nombre total de bénévoles adultes et du nombre total de bénévoles jeunes.
Sacs de dons par porte : Le nombre de sacs de dons divisé par le nombre de portes.
Sacs de dons par itinéraire : le nombre de sacs de dons divisé par le nombre d’itinéraires.
De plus, nous avons appliqué un encodage one-hot à la caractéristique « Paroisses » afin de traiter les données catégorielles et de garantir que toutes les variables étaient correctement formatées pour la modélisation.
Division et normalisation des données
Nous avons divisé les données en ensembles d’entraînement et de test, en utilisant les données de 2023 pour l’entraînement et celles de 2024 pour le test. Cette approche nous a permis de valider les performances du modèle sur des données non vues. Afin de maintenir la cohérence entre les caractéristiques numériques, nous avons appliqué une normalisation, en veillant à ce que toutes les valeurs soient sur une échelle comparable avant de les intégrer dans les modèles.
Développement et évaluation du modèle
Après la préparation des données, nous avons mis en œuvre et testé six modèles d’apprentissage automatique différents pour deux tâches de prédiction :
Nombre total de sacs de dons.
Temps passé pour chaque paroisse.
Chaque modèle a été évalué afin d’identifier le plus précis pour chaque tâche de prédiction. Les résultats ci-dessous résument leur rendement et leur efficacité.
Modèle
EMQ
EMQR
EAM
R²
R² ajusté
Linéaire
Régression
3393,986256
58,257929
26,828851
-0,100185
-0,168338
Régression polynomiale
49,838645
7,059649
2,388835
0,983844
1,146869
Régression par arbre de décision
2356,665557
48,545500
8,232945
0,236070
0,188747
Régression par forêt aléatoire
1990,524740
44,615297
8,457754
0,354757
0,314786
Renforcement par gradation
Régression
2144,987415
46,314009
8,164502
0,304687
0,261615
Régression des K plus proches voisins (K-Nearest Neighbors)
3092,228686
55,607811
17,474875
-0,002368
-0,064461
Tableau 5 : Indicateurs de rendement des modèles prédisant le nombre total de sacs de dons
D’après les résultats, le meilleur modèle pour prédire le nombre total de sacs de dons est la régression polynomiale, car il obtient les valeurs EMQ (7,059649) et EAM (2,388835) les plus faibles tout en atteignant le résultat R² le plus élevé (0,983844), ce qui indique un ajustement solide et une performance prédictive élevée.
Modèle
EMQ
EMQR
EAM
R²
R² ajusté
Linéaire
Régression
1,583989
1,258566
0,917151
0,075887
2,771216
Régression polynomiale
0,708581
0,841772
0,634814
0,586608
1,014787
Régression par arbre de décision
0,192435
0,438674
0,356527
0,887732
1,215181
Régression par forêt aléatoire
0,216073
0,464836
0,377927
0,873941
1,241613
Régression par renforcement par gradation
0,256885
0,506838
0,391840
0,850131
1,287249
Régression des K plus proches voisins (K-Nearest Neighbors)
0,278344
0,527583
0,394887
0,837612
1,311244
Tableau 6 : Indicateurs de rendement pour les modèles prédisant le temps passé
Pour prédire le temps passé, le modèle de régression par arbre de décision se distingue comme le meilleur parmi les options répertoriées. Il obtient les valeurs EMQR (0,438674) et EAM (0,356527) les plus faibles, associées à un R² positif élevé (0,887732) et un R² ajusté (1,215181), ce qui indique une précision supérieure et une forte adéquation avec les données par rapport aux autres modèles.
Optimisation du modèle :
Pour le modèle de régression polynomiale utilisé pour prédire le nombre total de sacs de dons, nous avons choisi de ne pas effectuer de réglage supplémentaire afin d’éviter le risque de surajustement. Les mesures étant déjà acceptables, avec un résultat R² de 0,98, augmenter davantage la complexité du modèle pourrait entraîner une diminution de la généralisation et un surajustement des données d’apprentissage.
Analyse avancée :
Nous avons utilisé les modèles de régression polynomiale et d’arbre de décision pour prédire le nombre de sacs de dons et le temps passé par paroisse pour 2025. Vous trouverez ci-dessous quelques renseignements clés basés sur les valeurs prédites.
Figure 3 : Nombre total prévu de sacs de dons pour 2025 Description : Cette figure visualise le nombre estimé de sacs de dons pour 2025 sur la base du modèle prédictif le plus performant.
Le nombre prévu de sacs de dons pour l’année prochaine affiche une augmentation constante. Partant de 14 817 en 2023 et 14 751 en 2024, le nombre total de sacs de dons devrait augmenter pour atteindre 16 600 en 2025.
Figure 4 : Prévisions sur 12 mois concernant les sacs de dons : les trois pieux les plus performants et les trois moins performants Description : Cette figure présente le nombre prévu de sacs de dons pour les 12 prochains mois, en mettant en évidence les trois meilleurs et les trois moins bons pieux en fonction des contributions attendues. Elle permet d’identifier les zones où les dons prévus sont les plus élevés et les plus faibles, ce qui facilite la mise en place d’actions ciblées et l’allocation des ressources.
Les prévisions sur 12 mois concernant les sacs de dons révèlent les pieux les plus performants et les moins performants. Les trois pieux les plus performants, qui devraient contribuer le plus aux sacs de dons, sont Gateway, Bonnie Doon et Riverbend. En revanche, les trois pieux les moins performants, qui contribuent moins aux sacs de dons, sont YSA, Edmonton North et Riverbend.
Figure 5 : Prévisions sur 12 mois concernant les sacs de dons : les 10 paroisses les plus performantes et les moins performantes Description : Cette figure présente le nombre prévu de sacs de dons pour les 12 prochains mois, en identifiant les 10 paroisses les plus performantes et les 10 paroisses les moins performantes sur la base des contributions prévues. Ces renseignements permettent de hiérarchiser le soutien et d’optimiser les efforts de collecte de dons dans différentes zones.
Les prévisions sur 12 mois concernant les sacs de dons révèlent les paroisses les plus performantes et les moins performantes. Les 10 paroisses qui devraient contribuer le plus en termes de sacs de dons sont Lee Ridge, Crawford Plains, Silver Berry, Clareview, Blackmud Creek, Griesbach, Londonderry, Griesbach, Ellerslie, Rabbit Hill et Terwillegar. En revanche, les 10 paroisses les moins performantes, qui devraient contribuer moins de sacs de dons, sont Mill Creek YSA, Lago Lindo, Onoway, Whitemud Creek YSA, Devon, Beaumont, Wild Rose, Wainwright, Windsor Park et Pioneer. Ces renseignements montrent une variation notable dans les contributions aux dons entre les différentes paroisses.
Figure 6 : Perspectives d’efficacité sur 12 mois : les trois pieux les plus performants et les trois moins performants Description : Cette figure illustre l’efficacité prévue des efforts de collecte de dons au cours des 12 prochains mois, en mettant en évidence les trois pieux les plus performants et les trois moins performants sur la base d’indicateurs de performance. Elle fournit une comparaison des zones où l’impact prévu est le plus élevé et le plus faible, ce qui permet de concentrer les ressources là où elles sont le plus nécessaires.
Les trois pieux les plus efficaces (c’est-à-dire celles qui devraient générer le plus grand nombre de sacs de dons par unité de temps consacré) sont Gateway, Riverbend et Bonnie Doon. À l’inverse, les trois pieux les moins efficaces, c’est-à-dire celles qui devraient générer le moins de sacs de dons par unité de temps consacré, sont YSA, Edmonton North et Riverbend.
Figure 7 : Perspectives d’efficacité sur 12 mois : les 10 paroisses les plus performantes et les moins performantes Description : Cette figure présente l’efficacité prévue des efforts de collecte de dons au cours des 12 prochains mois, en mettant en évidence les 10 paroisses les plus performantes et les 10 paroisses les moins performantes sur la base de mesures de performance. Elle offre des renseignements précieux sur les endroits où les efforts de collecte de dons devraient être les plus efficaces et les moins efficaces, ce qui permet d’orienter les stratégies ciblées.
Les 10 paroisses les plus efficaces, c’est-à-dire celles qui devraient générer le plus grand nombre de sacs de dons par unité de temps passé, sont Lee Ridge, Silver Berry, Clareview, Rio Vista, Woodbend, Coronation Park, Londonderry, Greenfield, Clareview, Blackmud Creek et Griesbach. Ces paroisses devraient être plus efficaces pour convertir le temps passé en sacs de dons.
À l’inverse, les 10 paroisses les moins efficaces, c’est-à-dire ceux qui devraient générer le moins de sacs de dons par unité de temps passé, sont Mill Creek YSA, Lago Lindo Branch, Onoway, Whitemud Creek YSA, Devon, Beaumont, Strathcona Married Student, Wild Rose, Namao et Forest Heights. Ces paroisses devraient nécessiter plus de temps pour atteindre un nombre similaire de sacs de dons, ce qui reflète une moindre efficacité dans leurs efforts de collecte.
Déploiement
L’application finale a été divisée en six sections : la page de renseignements, la page du tableau de bord, la page des tendances, la page de prévision des sacs de dons, la page de prévision du temps passé et la page de l’application de cartographie des itinéraires. Chaque page possède une fonctionnalité distincte conçue pour fournir des renseignements spécifiques et utiles à ses utilisateurs, garantissant ainsi une expérience complète. Ensemble, ces sections permettent aux utilisateurs de naviguer facilement entre les différentes fonctionnalités, rendant les décisions basées sur les données plus accessibles et plus efficaces. La figure 8 montre la page du tableau de bord de l’application.
Figure 8 : Tableau de bord interactif de l’application déployée pour la collecte alimentaire à Edmonton Description : Cette figure présente l’interface interactive de l’application pour la collecte alimentaire à Edmonton, développée pour améliorer la logistique des dons alimentaires à Edmonton. L’application intègre l’apprentissage automatique et des outils conviviaux, permettant aux parties prenantes d’optimiser la collecte des dons et la coordination des bénévoles.
L’application a été déployée sur Tableau, où des visualisations interactives ont été créées pour représenter les tendances en matière de dons, la participation des bénévoles et les renseignements sur la cartographie des itinéraires.
La cartographie des itinéraires a été encore améliorée grâce à Gradio de Hugging Face, qui a permis aux utilisateurs d’explorer de manière interactive les itinéraires de dons.
Un robot conversationnel , également intégré à l’aide de Gradio, a fourni aux utilisateurs des réponses rapides aux questions relatives aux itinéraires et aux processus de dons.
Application de cartographie des itinéraires :
L’application de cartographie des itinéraires a été développée en réponse aux difficultés récurrentes du client pour générer des cartes précises et efficaces pour les itinéraires des bénévoles. Le processus précédent consistait à imprimer manuellement des parties de la carte d’Edmonton, à surligner les itinéraires à la main, puis à distribuer les cartes aux bénévoles, ce qui prenait beaucoup de temps et était source d’erreurs. Cette approche manuelle ralentissait non seulement les opérations, mais augmentait également le risque d’erreurs susceptibles d’affecter l’efficacité du processus de collecte des dons. Notre application simplifie et automatise la génération et la visualisation des itinéraires, améliorant ainsi l’efficacité globale, la précision et la facilité d’utilisation pour les bénévoles. Vous trouverez ci-dessous des images des cartes imprimées manuellement qui étaient utilisées auparavant, soulignant la nécessité d’une solution plus efficace.
Figure 9 : Exemple de cartes imprimées manuellement utilisées pour l’affectation des bénévoles Description : Cette figure présente un exemple de cartes imprimées manuellement utilisées pour l’affectation des bénévoles lors de la collecte alimentaire d’Edmonton. Annotées avec les limites des itinéraires et les points de repère clés, ces cartes ont été créées pour guider les bénévoles dans la navigation efficace dans les zones qui leur ont été attribuées. Ces cartes marquées manuellement soulignent la nécessité d’une planification claire des itinéraires et mettent en évidence les améliorations potentielles qui peuvent être apportées grâce à des outils de génération automatique de cartes.Figure 10 : Avant et après : comparaison de la génération de cartes à l’aide du mode fixe. Description : Contrairement au mode personnalisé, le mode fixe est conçu pour la cartographie des itinéraires en se concentrant sur des itinéraires prédéfinis spécifiques. Le processus consiste à identifier les adresses des zones sensibles, à saisir les paramètres requis dans l’application, à générer la carte, à la télécharger et à la distribuer aux bénévoles. Les adresses des zones sensibles font référence aux foyers qui font régulièrement des dons, ce qui les rend cruciales pour rationaliser le processus de collecte des dons et optimiser les efforts des bénévoles.
L’application propose deux modes : le mode fixe et le mode personnalisé. Le mode fixe vise à numériser le processus de génération de cartes pour notre client, afin de rationaliser son flux de travail. Le mode personnalisé, quant à lui, est conçu pour la planification à long terme, générant des cartes basées sur les zones sensibles identifiées afin d’améliorer l’efficacité des itinéraires.
Pour générer des cartes en mode fixe, le client n’a qu’à sélectionner la paroisse et l’itinéraire souhaités, cliquer sur « Soumettre », télécharger la carte générée, puis l’envoyer facilement par courriel aux bénévoles. Ce processus simplifié élimine le besoin de créer manuellement des cartes, ce qui permet de gagner du temps et d’économiser des efforts. L’image fournie montre les résultats avant et après la génération de cartes à l’aide du mode fixe, soulignant l’efficacité et la facilité de la nouvelle approche.
Figure 11 : Avant et après : comparaison de la génération de cartes à l’aide du mode personnalisé Description : L’image compare les processus de génération de cartes manuels et automatisés. Les épingles représentent les adresses des zones sensibles des itinéraires 1, 2 et 3. Auparavant, le client devait saisir manuellement ces six adresses, mais désormais, l’application calcule l’ordre optimal des itinéraires en fonction de la distance qui les sépare. Cela garantit que les bénévoles suivent le chemin le plus efficace, ce qui permet de gagner du temps. Les bénévoles n’ont plus besoin de couvrir les trois itinéraires; ils peuvent désormais se concentrer sur des portions spécifiques de chaque itinéraire, ce qui améliore considérablement l’efficacité et rationalise le processus de collecte des dons.
Cette méthodologie met non seulement en évidence les points forts de l’analyse, mais montre également les domaines à améliorer en matière de collecte et de couverture des données afin d’optimiser les futurs processus décisionnels.
Résultats et conclusions
Le projet Edmonton Food Drive a permis d’obtenir plusieurs renseignements précieux et résultats pratiques grâce à l’analyse et à la modélisation des données collectées. Ces conclusions sont classées en plusieurs domaines clés d’amélioration opérationnelle : collecte de données, analyse de données, modélisation prédictive et déploiement d’applications.
Collecte de données
Observations clés :
Les données ont révélé des tendances notables d’une année sur l’autre, certaines paroisses affichant des schémas de dons constants, tandis que d’autres présentaient une variabilité importante dans les volumes de dons.
La paroisse de Belmead, bien qu’il ait fait l’objet d’une analyse détaillée, a mis en évidence les limites de l’exhaustivité des données, car tous les itinéraires n’ont pas été pris en compte en raison de la granularité des données rapportées par les bénévoles.
Analyse des données
Figure 12 : Points forts de l’EFD 2024 par rapport à 2023 Description : Cette figure compare les indicateurs clés et les résultats de la collecte alimentaire d’Edmonton en 2024 et 2023, en soulignant les améliorations et les différences en matière de collecte de dons et de coordination des bénévoles entre les deux années. La comparaison donne un aperçu de l’efficacité des nouvelles stratégies et des nouveaux outils mis en œuvre en 2024.
Par rapport à la collecte alimentaire de 2023, les résultats de 2024 ont montré une diminution de plusieurs indicateurs clés : le nombre de sacs de dons, le nombre de bénévoles, le nombre de maisons et le temps moyen passé par itinéraire ont diminué respectivement de 0,4 %, 38,17 %, 38,17 % et 6,67 %.
Figure 13 : Les trois pieux les plus et les moins efficaces de 2023 et 2024 Description : Cette figure compare les trois pieux les plus et les moins efficaces résultats de la collecte alimentaire d’Edmonton en 2023 et 2024, mettant en évidence les changements dans les niveaux de dons et les performances des différents pieux. La comparaison permet d’identifier les domaines à améliorer et souligne l’impact des nouvelles stratégies mises en œuvre en 2024.
Les meilleurs pieux en 2024 sont restés largement similaires à ceux de 2023, Gateway, Bonnie Doon, Riverbend, Edmonton North et YSA occupant les premières places du classement. Cependant, Riverbend et Bonnie Doon ont échangé leurs positions, ce qui indique un léger changement dans leur rendement relatif entre les deux années.
Figure 14 : Les cinq paroisses les plus et les moins efficaces en 2023 et 2024 Description : Ce graphique compare les cinq paroisses les plus et les moins efficaces pour la collecte alimentaire d’Edmonton en 2023 et 2024, mettant en évidence les changements dans les habitudes de dons et les efforts des bénévoles dans différentes zones. L’analyse fournit des renseignements sur les paroisses qui ont connu les améliorations les plus significatives et ceux qui pourraient nécessiter une attention particulière.
En 2024, Crawford Plains est resté dans le top 5, tout comme en 2023. De nouvelles paroisses, tels que Terwillegar Park et Griesbach, ont rejoint le haut du classement. En revanche, des paroisses tels que Coronation Park, Drayton Valley et Pioneer se sont retrouvés parmi les cinq derniers en 2024, remplaçant les paroisses en queue de peloton de l’année dernière, tels que Devon et Mill Creek YSA.
Modélisation prédictive
Prévision du nombre total de sacs de dons
Nous avons développé six modèles d’apprentissage automatique pour prédire le nombre total de sacs de dons pour chaque paroisse en 2025. Les principales conclusions de l’évaluation des modèles sont résumées ci-dessous :
Meilleur modèle : la régression polynomiale s’est révélée être le modèle le plus efficace, avec les valeurs EMQR (7,0596) et EAM (2,3888) les plus faibles, associées au score R² le plus élevé (0,9838). Ce modèle a su trouver un équilibre efficace entre simplicité et performance.
Observations clés : la régression polynomiale a surpassé les autres modèles, tels que la forêt aléatoire et le renforcement par gradation, grâce à sa capacité à saisir efficacement les relations non linéaires dans les données.
Prévision du temps passé
Six modèles ont été évalués pour prévoir le temps nécessaire pour effectuer les itinéraires de collecte. Les conclusions suivantes ont été tirées :
Meilleur modèle : la régression par arbre de décision a fourni les prévisions les plus précises, avec les valeurs EMQR (0,4387) et EAM (0,3565) les plus faibles, ainsi qu’un score R² élevé (0,8877) et un R² ajusté (1,2152). Ce modèle a su trouver un équilibre efficace entre simplicité et performance.
Observations clés : la régression par arbre de décision a surpassé la régression polynomiale et le gradient boosting pour cette tâche en raison de sa flexibilité dans le traitement des variations des données, telles que la complexité des itinéraires et les différences entre les bénévoles.
De plus, une analyse géospatiale a été intégrée pour concevoir des cartes numériques des itinéraires de collecte, identifiant les zones présentant le plus fort potentiel de dons. Cette tâche visait à rationaliser la logistique et à optimiser l’allocation des ressources lors des prochaines collectes.
Nous avons procédé à un réglage des hyperparamètres du modèle de régression décisionnelle pour prédire le temps passé, mais cela n’a pas donné lieu à des améliorations significatives. Le modèle ajusté a atteint une erreur moyenne quadratique (EMQ) de 0,2041, une erreur quadratique moyenne racine (EQMR) de 0,4517, une erreur absolue moyenne (EAM) de 0,3652, un R² de 0,8810 et un R² ajusté de 1,2282.
Figure 15 : Visualisation du comportement de la régression polynomiale Description : Cette figure présente les principales visualisations issues du processus d’évaluation du modèle d’apprentissage automatique utilisé pour prédire les volumes de dons pour la collecte alimentaire d’Edmonton. Les graphiques fournissent des renseignements sur les performances du modèle, le comportement résiduel et la progression de l’apprentissage. Graphique résiduel (en haut à gauche) : représente les résidus (différences entre les valeurs réelles et prédites) par rapport aux valeurs prédites; valeurs réelles c. valeurs prévues (en haut à droite) : compare les volumes de dons prévus aux valeurs réelles. La plupart des prévisions correspondent étroitement aux valeurs réelles le long de la ligne diagonale, ce qui indique une bonne performance du modèle, à l’exception de quelques valeurs aberrantes. Distribution des résidus (en bas à gauche) : montre la distribution des résidus afin d’évaluer leur normalité. Courbe d’apprentissage (en bas à droite) : affiche les résultats d’entraînement et de validation croisée en fonction de la taille de l’entraînement. La convergence rapide des résultats d’entraînement et de validation croisée avec une erreur minimale suggère que le modèle est bien entraîné avec une faible variance.
Ces visualisations issues de l’évaluation du modèle mettent en évidence les points forts du modèle, tels que ses faibles taux d’erreur et ses performances prédictives élevées pour la plupart des prédictions, tout en identifiant les domaines, comme les biais résiduels, qui pourraient être optimisés pour obtenir de meilleurs résultats.
Les modèles ont réussi à prédire à la fois les volumes de dons et le temps passé, permettant aux parties prenantes de prendre des décisions éclairées pour les futures collectes alimentaires.
Déploiement de l’application
L’application a été déployée afin de fournir aux parties prenantes une plateforme interactive et conviviale permettant de prédire les résultats des dons et d’améliorer la logistique. Le modèle le plus performant a été déployé sur Gradio de Hugging Face et intégré à Tableau afin de faciliter la prise de décision pour les futures collectes alimentaires.
Figure 16 : Interface utilisateur du module de prédiction des sacs de dons Description : Cette figure représente l’interface utilisateur de l’application Edmonton Food Drive, un outil interactif conçu pour prédire les résultats des dons en fonction de paramètres d’entrée spécifiques. L’application fournit une plateforme accessible aux parties prenantes pour prévoir les volumes de dons, ce qui permet une allocation plus efficace des ressources et une meilleure prise de décision.
Paramètres d’entrée de l’application pour la prédiction :
Paroisse : sélectionne la paroisse spécifique pour lequel des prédictions sont nécessaires. Temps passé (minutes) : saisit le temps estimé que les bénévoles passent à parcourir les itinéraires. Nombre de portes : saisit le nombre total de portes couvertes dans la paroisse sélectionnée. Nombre d’itinéraires : permet aux utilisateurs de spécifier le nombre d’itinéraires inclus dans l’analyse. Année : permet de faire des prévisions pour les futures collectes alimentaires, de 2025 à 2030. Nombre total de bénévoles : spécifie le nombre de bénévoles affectés à la tâche.
L’application utilise les données fournies pour générer une valeur prévisionnelle du nombre total de sacs de dons. Cette prévision aide les parties prenantes à évaluer l’efficacité de leur planification et de leur allocation de ressources pour les collectes à venir.
Défis rencontrés :
Le projet de collecte alimentaire d’Edmonton a rencontré plusieurs défis qui ont eu un impact sur la collecte de données, l’analyse et la précision des prévisions. Ces défis, bien que importants, ont fourni des renseignements précieux pour améliorer les futures collectes alimentaires.
Limites de la collecte de données :
En raison de contraintes de ressources, les données n’ont été collectées qu’à partir de certains points de collecte à Bearspaw, Londonderry, Riverbend, Gateway et Bonnie Doon. Cette couverture limitée a donné lieu à des ensembles de données incomplets qui ne représentaient pas entièrement toutes les zones participantes à Edmonton.
Le fait que plusieurs bénévoles géraient le même itinéraire et déposaient un grand nombre de sacs de dons a entraîné des entrées de données incomplètes ou dupliquées, ce qui a compliqué davantage la précision des données collectées.
Incohérences dans la structure des ensembles de données :
Les ensembles de données pour 2023 et 2024 contenaient des divergences dues aux adaptations apportées au nouveau formulaire afin d’améliorer les saisies des utilisateurs. Bien que ces changements visaient à améliorer la convivialité, ils ont introduit des différences dans la structure des fonctionnalités, ce qui a nécessité des efforts importants pour harmoniser et normaliser les données en vue de leur analyse. De plus, l’absence de normes uniformes de saisie des données dans les différentes paroisses a contribué à des incohérences, créant des difficultés supplémentaires lors du prétraitement.
Écarts dans les prévisions :
Les chiffres prévisionnels de croissance des dons basés sur les données collectées ne correspondaient pas aux rapports internes du client, qui indiquaient une augmentation globale des dons en 2024 par rapport à 2023.
Pour remédier à cet écart, les données ont été réactualisées afin d’ajuster les chiffres de 2024 et de les rapprocher des tendances réelles.
Difficultés opérationnelles :
La granularité des renseignements sur les itinéraires a rendu difficile la standardisation des saisies de données dans plusieurs paroisses. L’absence d’un système centralisé de saisie des données a entraîné des variations dans la manière dont les données étaient enregistrées et soumises, ce qui a compliqué davantage l’analyse.
Conclusions et recommandations :
Afin d’améliorer l’efficacité globale, il convient d’envisager une répartition plus équilibrée des bénévoles, en mettant l’accent à la fois sur l’amélioration des performances des zones les moins performantes et sur le maintien de la dynamique dans les paroisses et les pieux les plus performants. Les recommandations suivantes sont proposées :
La régression polynomiale est recommandée pour prévoir les volumes de dons, en particulier lorsqu’il s’agit de saisir des modèles complexes dans les données historiques.
La régression par arbre de décision est idéale pour prédire le temps passé, fournissant des renseignements exploitables pour l’optimisation des itinéraires et la répartition des bénévoles.
Ces prévisions peuvent guider la planification et la répartition des ressources en identifiant les paroisses susceptibles de générer les volumes de dons les plus élevés et en estimant le temps nécessaire aux bénévoles pour parcourir efficacement les itinéraires, améliorant ainsi la coordination logistique.
L’amélioration continue des processus de collecte de données (p. ex., la normalisation des données sur les bénévoles et la numérisation des renseignements sur les itinéraires) renforcera encore la précision des prévisions et l’utilité de ces modèles.
En combinant les renseignements tirés des données et la modélisation prédictive, ce projet fournit des recommandations exploitables pour améliorer la logistique de l’initiative Edmonton’s Food Drive.
Le projet a atteint avec succès ses objectifs en recommandant des améliorations dans le processus de dons alimentaires de l’Edmonton Food Drive. Des outils permettant de prévoir les tendances en matière de dons et le temps nécessaire ont été mis en place, aidant les bénévoles et les organisateurs à mieux planifier. L’application de cartographie des itinéraires simplifie la coordination des bénévoles et permet de gagner un temps considérable par rapport aux processus manuels traditionnels. De plus, des tableaux de bord interactifs permettent aux parties prenantes de comprendre et d’analyser plus facilement les données, ce qui facilite la prise de décision. Dans l’ensemble, le projet rationalise les opérations et contribue à rendre la collecte de dons alimentaires plus efficace et plus efficiente.
Si vous avez des questions à propos de mon article ou si vous souhaitez en discuter davantage, je vous invite à Rencontrez les scientifiques des données, un événement au cours duquel les auteurs rencontrent les lecteurs, présentent leur sujet et discutent de leurs résultats.
Où construire des banques alimentaires et des banques alimentaires : une approche d’apprentissage automatique à deux niveaux. (n.d.). arXiv. https://arxiv.org/pdf/2410.15420 (en anglais seulement)
Automatisation de la distribution alimentaire : le pouvoir de deux choix pour une allocation alimentaire dynamique et équitable. (2024). arXiv. https://arxiv.org/abs/2406.06363 (en anglais seulement)