Conjuguer des données synthétiques et le sous-échantillonnage pour créer des fichiers de microdonnées à grande diffusion pour les enquêtes à grande échelle - ARCHIVÉ
Articles et rapports : 12-001-X201200111687
Afin de créer des fichiers de données à grande diffusion à partir d'enquêtes à grande échelle, les organismes statistiques diffusent parfois des souséchantillons aléatoires des enregistrements originaux. Le souséchantillonnage aléatoire amenuise la taille des fichiers transmis aux analystes secondaires des données et réduit les risques de divulgation accidentelle de renseignements confidentiels sur les participants aux enquêtes. Cependant, le souséchantillonnage n'élimine pas entièrement le risque, de sorte qu'il faut altérer les données avant leur diffusion. Nous proposons de créer des souséchantillons protégés contre la divulgation provenant d'enquêtes à grande échelle en recourant à l'imputation multiple. L'idée consiste à remplacer dans l'échantillon original les valeurs identificatoires ou sensibles par des valeurs tirées de modèles statistiques et de diffuser des souséchantillons de ces données protégées contre la divulgation. Nous présentons des méthodes permettant de faire des inférences fondées sur les multiples souséchantillons synthétiques.
Produit principal : Techniques d'enquête
Format | Date de sortie | Informations supplémentaires |
---|---|---|
27 juin 2012 |
Information connexe
- Date de modification :