Ateliers

Mardi 6 novembre 2018

Atelier 1

Intégration des données d'enquête
Jae-Kwang Kim, Iowa State University, États-Unis

Résumé

L'intégration de renseignements issus d'un éventail de sources est une difficulté courante dans le domaine de la statistique. Les organismes de statistique explorent différents moyens de combiner les renseignements tirés de sources multiples afin de produire des statistiques officielles de meilleure qualité, et la recherche en intégration de données d'enquête prend de plus en plus d'ampleur. Pendant l'atelier, nous passons en revue les méthodes de pointe utilisées dans le domaine de l'intégration des données d'enquête et nous discutons de l'orientation future de la recherche. Les thèmes suivants sont abordés : la théorie de base des données manquantes, l'imputation massive, la pondération fondée sur les scores de propension pour l'intégration des données, et la modélisation et l'estimation des données manquantes non ignorables.

Biographie : Jae-Kwang Kim

Jae-Kwang Kim est professeur de statistiques à la Iowa State University et il occupe également un poste au département de sciences mathématiques de l'Institut coréen de science et de technologie (KAIST), en Corée. Fellow de l'ASA et lauréat du prix Gertrude M. Cox de 2015, il est le coauteur du recueil Statistical Methods for Handling Incomplete Data, et a publié plus de 70 articles dans le domaine de l'échantillonnage et de l'analyse des données manquantes. Il est actuellement membre du comité de rédaction d'un certain nombre de revues savantes, notamment Annals of Applied Statistics, Statistica Sinica, la Revue canadienne de statistique, Techniques d'enquête, Annals of the Institute of Statistical Mathematics et Journal of the Korean Statistical Society.

Atelier 2

Apprentissage automatique avec des applications dans la production des statistiques officielles
Jean-François Plante, HEC Montréal, Canada

Résumé

L'atelier sur l'apprentissage automatique avec des applications dans la production des statistiques officielles se divise en quatre parties. Des exemples de science des données dans l'industrie sont d'abord présentés. Les principes de base de l'apprentissage automatique sont décrits, suivis d'une présentation des méthodes classiques d'apprentissage supervisé et non-supervisé. Finalement, des exemples d'utilisation de méthodes d'apprentissage automatique dans la production des statistiques officielles seront discutés.

Biographie : Jean-François Plante

Jean-François Plante est professeur agrégé à HEC Montréal. Il est titulaire d'un doctorat en statistique de l'Université de la Colombie-Britannique. Son programme de recherche scientifique consiste à développer des méthodes statistiques pour l'inférence et la prévision adaptées aux architectures distribuées qui servent au traitement des mégadonnées. À HEC Montréal, Jean-François enseigne la science des données et supervise les projets, mémoires et thèses d'étudiants dans ce domaine aux trois cycles. Jean-François est également membre du Comité aviseur sur la méthodologie de Statistique Canada depuis octobre 2017.

Atelier 3

Utilisation des données administratives dans un recensement
Li-Chun Zhang, University of Southampton, Royaume-Uni

Résumé

L'utilisation de données administratives est répandue dans les organismes statistiques. Cet atelier donne l'occasion aux participants de découvrir des méthodes qui font appel à ces données dans le contexte de la statistique officielle, surtout pour les recensements. L'atelier se divise en quatre séances. Pendant la première séance, on présentera aux participants un aperçu des méthodes pouvant être utilisées pour produire des registres statistiques de caractéristiques socioéconomiques et pour évaluer les incertitudes liées à ces caractéristiques à partir de données administratives. Ensuite, au cours de la deuxième séance, les hypothèses de l'estimateur de système dual de base d'une population feront l'objet de discussion. On présentera les différences dans la méthodologie existant lorsque l'une des listes est fondée sur des données administratives plutôt que sur un recensement classique. La troisième séance portera sur le dénombrement erroné dans les registres administratifs. Certaines des plus récentes nouveautés seront décrites, notamment en matière de modélisation et de traitement du dénombrement erroné et du sous dénombrement dans les registres disponibles, qui peuvent s'appliquer à un niveau d'agrégation détaillée. Enfin, l'atelier se terminera par le sujet des statistiques de type censitaire sur les ménages et le logement. On présentera certaines techniques pertinentes pour la micro intégration des données sur les ménages et le logement et les méthodes d'évaluation de l'incertitude connexes.

Biographie : Li-Chun Zhang

Li-Chun Zhang est professeur de statistique sociale à l'Université de Southampton, chercheur principal à Statistics Norway et professeur de statistique officielle à l'Université d'Oslo. Son travail et ses publications ont porté sur un certain nombre de sujets touchant la statistique officielle, tels que le plan et la coordination d'échantillonnage, l'estimation d'enquête-échantillon, la non réponse, les erreurs de mesure, l'estimation pour les petits domaines, le calcul d'indices, la vérification et l'imputation, la statistique fondée sur les registres, l'appariement statistique et l'estimation de la taille d'une population.

Date de modification :