Conjuguer des données synthétiques et le sous-échantillonnage pour créer des fichiers de microdonnées à grande diffusion pour les enquêtes à grande échelle - ARCHIVÉ

Articles et rapports : 12-001-X201200111687

Description :

Afin de créer des fichiers de données à grande diffusion à partir d'enquêtes à grande échelle, les organismes statistiques diffusent parfois des sous­échantillons aléatoires des enregistrements originaux. Le sous­échantillonnage aléatoire amenuise la taille des fichiers transmis aux analystes secondaires des données et réduit les risques de divulgation accidentelle de renseignements confidentiels sur les participants aux enquêtes. Cependant, le sous­échantillonnage n'élimine pas entièrement le risque, de sorte qu'il faut altérer les données avant leur diffusion. Nous proposons de créer des sous­échantillons protégés contre la divulgation provenant d'enquêtes à grande échelle en recourant à l'imputation multiple. L'idée consiste à remplacer dans l'échantillon original les valeurs identificatoires ou sensibles par des valeurs tirées de modèles statistiques et de diffuser des sous­échantillons de ces données protégées contre la divulgation. Nous présentons des méthodes permettant de faire des inférences fondées sur les multiples sous­échantillons synthétiques.

Numéro d'exemplaire : 2012001
Auteur(s) : Reiter, J.P.

Produit principal : Techniques d'enquête

FormatDate de sortieInformations supplémentaires
PDF27 juin 2012