Combler les vides : comprendre les données manquantes

Les données manquantes proviennent à la fois de la non-réponse totale et partielle, mais elles ne se limitent pas à ces sources. Des enregistrements entiers peuvent être manquants en raison de l’échantillonnage — associés aux individus non sélectionnés dans la population — ou de trous dans un enregistrement appelés « sauts valides » qui résultent des parcours intégrés au questionnaire. Contrairement à la non-réponse, toutefois, l’échantillonnage et la conception de questionnaire sont contrôlés par l’équipe de l’enquête, qui peut anticiper les schémas de données manquantes qui en découlent. La non-réponse, en revanche, échappe à leur contrôle et exige une attention particulière aux schémas de données manquantes qu’elle génère. Dans cette présentation, nous adoptons une perspective unifiée de la question des données manquantes, en mettant l’accent sur les points communs entre les processus qui les produisent au lieu de les traiter séparément. Cette approche permettra de capitaliser sur les discussions qui ont eu lieues dans les présentations antérieures de cette série pour montrer comment la repondération et l’imputation peuvent contribuer à atténuer l’impact de la non-réponse sur les inférences.

Présentateur : Claude Girard, Méthodologiste principal, Centre de ressources en analyse de données

Pour vous inscrire au webinaire en français, veuillez remplir le formulaire suivant :

Pour vous inscrire au webinaire en anglais, veuillez remplir le formulaire suivant :