Contrôle de la divulgation et diffusion de données
Filtrer les résultats par
Aide à la rechercheMot(s)-clé(s)
Résultats
Tout (1)
Tout (1) ((1 résultat))
- Articles et rapports : 12-001-X201200111687Description :
Afin de créer des fichiers de données à grande diffusion à partir d'enquêtes à grande échelle, les organismes statistiques diffusent parfois des souséchantillons aléatoires des enregistrements originaux. Le souséchantillonnage aléatoire amenuise la taille des fichiers transmis aux analystes secondaires des données et réduit les risques de divulgation accidentelle de renseignements confidentiels sur les participants aux enquêtes. Cependant, le souséchantillonnage n'élimine pas entièrement le risque, de sorte qu'il faut altérer les données avant leur diffusion. Nous proposons de créer des souséchantillons protégés contre la divulgation provenant d'enquêtes à grande échelle en recourant à l'imputation multiple. L'idée consiste à remplacer dans l'échantillon original les valeurs identificatoires ou sensibles par des valeurs tirées de modèles statistiques et de diffuser des souséchantillons de ces données protégées contre la divulgation. Nous présentons des méthodes permettant de faire des inférences fondées sur les multiples souséchantillons synthétiques.
Date de diffusion : 2012-06-27
Données (0)
Données (0) (0 résultat)
Aucun contenu disponible actuellement
Analyses (1)
Analyses (1) ((1 résultat))
- Articles et rapports : 12-001-X201200111687Description :
Afin de créer des fichiers de données à grande diffusion à partir d'enquêtes à grande échelle, les organismes statistiques diffusent parfois des souséchantillons aléatoires des enregistrements originaux. Le souséchantillonnage aléatoire amenuise la taille des fichiers transmis aux analystes secondaires des données et réduit les risques de divulgation accidentelle de renseignements confidentiels sur les participants aux enquêtes. Cependant, le souséchantillonnage n'élimine pas entièrement le risque, de sorte qu'il faut altérer les données avant leur diffusion. Nous proposons de créer des souséchantillons protégés contre la divulgation provenant d'enquêtes à grande échelle en recourant à l'imputation multiple. L'idée consiste à remplacer dans l'échantillon original les valeurs identificatoires ou sensibles par des valeurs tirées de modèles statistiques et de diffuser des souséchantillons de ces données protégées contre la divulgation. Nous présentons des méthodes permettant de faire des inférences fondées sur les multiples souséchantillons synthétiques.
Date de diffusion : 2012-06-27
Références (0)
Références (0) (0 résultat)
Aucun contenu disponible actuellement
- Date de modification :