Statistiques par sujet – Diffusion de données

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Contenu

1 facettes affichées. 0 facettes sélectionnées.

Autres ressources disponibles pour appuyer vos recherches.

Aide pour trier les résultats
Explorer notre base centrale des principaux concepts normalisés, définitions, sources de données et méthodes.
En cours de chargement
Chargement en cours, veuillez patienter...
Tout (40)

Tout (40) (25 of 40 results)

  • Articles et rapports : 12-001-X201700114818
    Description :

    La protection de la confidentialité des données qui figurent dans des tableaux de données quantitatives peut devenir extrêmement difficile lorsqu’on travaille avec des tableaux personnalisés. Une solution relativement simple consiste à perturber au préalable les microdonnées sous-jacentes, mais cela peut avoir un effet négatif excessif sur la précision des agrégats. Nous proposons plutôt une méthode perturbatrice qui vise à mieux concilier les besoins de protection et de précision des données en pareil cas. La méthode consiste à traiter par niveaux les données de chaque cellule en appliquant une perturbation minime, voire nulle, aux valeurs inférieures et une perturbation plus importante aux valeurs supérieures. La méthode vise avant tout à protéger les données personnelles, qui sont généralement moins asymétriques que les données des entreprises.

    Date de diffusion : 2017-06-22

  • Produits techniques : 11-522-X201700014735
    Description :

    La diffusion de microdonnées exige habituellement des méthodes de réduction et de modification des données, et le degré d’application de ces méthodes dépend des méthodes de contrôle qui seront nécessaires pour accéder aux données et les utiliser. Le calcul sécurisé est une approche qui, dans certaines circonstances, convient davantage pour accéder aux données à des fins statistiques; il permet le calcul de fonctions analytiques à l’égard de données chiffrées sans qu’il soit nécessaire de déchiffrer les données sources sous-jacentes pour procéder à une analyse statistique. Cette approche permet aussi à plusieurs emplacements de fournir des données, tout en garantissant une protection rigoureuse de la vie privée. De cette façon, les données peuvent être regroupées, et les fournisseurs de données peuvent calculer des fonctions analytiques, sans qu’aucune des parties ne connaisse les entrées des autres. À l’aide de certains résultats théoriques et d’exemples réels issus du domaine des soins de santé, nous expliquerons comment le calcul sécurisé peut être appliqué dans des contextes pratiques.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014733
    Description :

    La valeur sociale des collectes de données est améliorée de façon marquée par la vaste diffusion des fichiers de recherche et l’augmentation en découlant de la productivité scientifique. À l’heure actuelle, la plupart des études sont conçues en vue de recueillir des données utiles et exactes au niveau analytique, en se préoccupant peu de la façon dont elles seront mises en commun. Tant les ouvrages publiés que la pratique reposent sur le principe que l’analyse de la divulgation aura lieu après la collecte. Toutefois, pour produire des données à grande diffusion comportant la plus grande utilité analytique possible pour le groupe d’utilisateurs le plus important, on doit tenir compte du risque de divulgation au début du processus de recherche. À partir de cadres théoriques de décisions économiques et statistiques et de recherches en méthodes d’enquête, cette communication vise à améliorer la productivité scientifique des données de recherche partagées en décrivant comment le risque de divulgation peut être résolu aux étapes les plus précoces de la recherche, grâce à la formulation de « plans sécuritaires » et de « simulations de divulgation », une approche statistique appliquée ayant été adoptée pour : 1) l’élaboration et la validation de modèles qui prédisent la composition des données d’enquête selon différents plans d’échantillonnage; 2) la sélection et/ou l’élaboration de mesures et de méthodes utilisées pour déterminer le risque de divulgation, l’utilité analytique et les coûts de la divulgation des données d’enquête qui conviennent le mieux pour l’évaluation des plans d’échantillonnage et de bases de données; et 3) la tenue de simulations pour recueillir des estimations du risque, de l’utilité et du coût des études comportant une vaste gamme de caractéristiques d’échantillonnage et de conception de bases de données.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014721
    Description :

    L’accès aux données ouvertes s’inscrit de plus en plus dans les attentes des Canadiens, des chercheurs et des concepteurs. Apprenez comment et pourquoi le gouvernement du Canada a créé le portail « ouvert.canada.ca » afin de centraliser l’accès à toutes ses données ouvertes et en quoi cette initiative continuera de favoriser l’utilisation de renseignements statistiques.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014719
    Description :

    Les initiatives de données ouvertes transforment la façon dont les gouvernements et d’autres institutions publiques interagissent et fournissent des services à leurs mandants. Elles accroissent la transparence et la valeur de l’information pour les citoyens, réduisent les inefficacités et les obstacles à l’information, rendent possible des applications guidées par les données qui améliorent la prestation des services publics, et fournissent des données publiques pouvant susciter des possibilités économiques novatrices. Étant l’un des premiers organismes internationaux à adopter une politique de données ouvertes, la Banque mondiale a orienté et offert des conseils techniques aux pays en voie de développement qui envisagent de mettre en place ou qui conçoivent leurs propres initiatives. La présente communication donnera un aperçu des faits nouveaux en matière de données ouvertes sur le plan international, ainsi que des expériences, des défis et des possibilités actuels et futurs. M. Herzog discutera des raisons qui poussent les gouvernements à adopter les données ouvertes, des avantages prouvés de celles-ci pour les secteurs public et privé, de l’éventail d’approches que suivent les gouvernements, et des outils à la disposition des décideurs, en insistant tout spécialement sur les rôles et perspectives des bureaux nationaux de la statistique au sein d’une initiative pangouvernementale.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014720
    Description :

    La présente communication vise à fournir un bref aperçu de l’engagement de Statistique Canada à l’égard des données ouvertes. Nous aborderons tout d’abord la façon dont les principes des données ouvertes sont intégrés dans les pratiques courantes de diffusion de Statistique Canada. Puis, nous discuterons de la participation de l’organisme à l’initiative de données ouvertes de l’ensemble du gouvernement. Cette participation comporte deux volets : Statistique Canada est le principal fournisseur de données au portail de données ouvertes du gouvernement du Canada, mais il joue aussi un rôle important en arrière-plan, en tant que fournisseur de services responsable du développement et de la mise à jour du portail de données ouvertes (qui fait maintenant partie du portail plus large Gouvernement ouvert).

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014732
    Description :

    L’Institute for Employment Research (IAB) est le service de recherche de l’Agence fédérale allemande de placement. Par l’entremise du Centre de données de recherche (FDZ) à l’IAB, des données administratives et des données d’enquête sur les personnes et les établissements sont fournies aux chercheurs. En collaboration avec l’Institute for the Study of Labor (IZA), le FDZ a mis en œuvre l’application de soumission des travaux (JoSuA), qui permet aux chercheurs de soumettre des travaux, en vue du traitement des données à distance grâce à une interface Web personnalisée. Par ailleurs, deux types de fichiers de sortie produits pour l’utilisateur peuvent être reconnus dans l’environnement JoSuA, ce qui permet de fournir des services d’examen de la divulgation plus rapides et plus efficaces.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014731
    Description :

    Cette communication décrit divers facteurs qui posent un problème lorsque l’on évalue le risque de divulgation de microdonnées contextualisées, ainsi que certaines des étapes empiriques qui sont comprises dans leur évaluation. À partir d’ensembles synthétiques de répondants d’enquête, nous illustrons comment différents postulats modulent l’évolution du risque lorsque l’on tient compte : 1) des probabilités estimées que des régions géographiques non identifiées soient représentées dans une enquête; 2) du nombre de personnes dans la population qui partagent les mêmes identificateurs personnels et contextuels qu’un répondant; et 3) de l’ampleur prévue de l’erreur de couverture dans les chiffres de population du recensement et les fichiers existants qui fournissent des données d’identification (p. ex., le nom, l’adresse).

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014734
    Description :

    La protection des données et la protection de la vie privée sont des défis clés qui doivent être relevés de façon prioritaire, afin de permettre l’utilisation des mégadonnées dans la production de statistiques officielles. C’est ce qu’ont préconisé, en 2013, les directeurs des Instituts nationaux de statistique (INS) du Comité du Système statistique européen (CSSE) dans le mémorandum de Scheveningen. Le CSSE a demandé à Eurostat et aux INS d’élaborer un plan d’action comportant un carnet de route, en vue d’assurer le suivi de la mise en œuvre du mémorandum. À la réunion de Riga, le 26 septembre 2014, le CSSE a adopté le plan d’action et carnet de route 1.0 des mégadonnées (BDAR) présenté par le Groupe de travail d’Eurostat chargé des mégadonnées (TFBD), et il a convenu de l’intégrer dans le portefeuille de la Vision du SSE pour 2020. Eurostat collabore aussi dans ce domaine avec des partenaires externes comme la Commission économique des nations unies pour l’Europe (UNECE). Le projet de mégadonnées du Goupe de haut niveau de la UNECE est un projet international sur le rôle des mégadonnées dans la modernisation de la production de statistiques. Il comprenait quatre équipes de travail chargées de différents aspects des mégadonnées pertinentes pour les statistiques officielles : protection de la vie privée, partenariats, Sandbox et qualité. L’équipe de travail chargée de la protection de la vie privée a terminé ses travaux en 2014 et a donné un aperçu des outils existants pour la gestion des risques concernant la protection de la vie privée, a décrit comment le risque d’identification se rapporte aux caractéristiques des mégadonnées et a élaboré des recommandations à l’intention des Bureaux de statistique nationaux (BSN). Elle a conclu principalement que le prolongement des cadres existants, y compris l’utilisation de nouvelles technologies, était nécessaire pour traiter les risques liés à la protection de la vie privée dans le contexte de l’utilisation des mégadonnées. Le BDAR tire parti des travaux des équipes de la UNECE. De façon plus particulière, il reconnaît qu’un certain nombre de sources de mégadonnées comprennent des données de nature délicate, que leur utilisation pour les statistiques officielles peut entraîner des perceptions négatives dans le grand public et chez les autres intervenants, et que ce risque devrait être atténué à court et à moyen termes. Il propose le lancement de plusieurs mesures : par exemple, un examen approprié des principes éthiques régissant les rôles et les activités des INS et une stratégie de communication bien établie. La communication présente les différentes mesures entreprises à l’intérieur du SSE et en collaboration avec la UNECE, ainsi que les solutions techniques et légales possibles à mettre en place pour résoudre les risques liés à la protection des données et à la protection de la vie privée, dans le contexte de l’utilisation des mégadonnées pour les statistiques officielles.

    Date de diffusion : 2016-03-24

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2014-11-12

  • Produits techniques : 11-522-X201300014285
    Description :

    L’Enquête nationale auprès des ménages (ENM) de 2011 est une enquête à participation volontaire qui a remplacé le questionnaire complet obligatoire traditionnel du recensement de la population du Canada. L’ENM a été réalisée auprès d’un échantillon d’environ 30 % des ménages canadiens et a donné un taux de réponse pondéré selon le plan de sondage de 77 %. Comparativement, le dernier questionnaire complet du recensement a été envoyé à 20 % des ménages et a produit un taux de réponse de 94 %. Au moyen des données du questionnaire complet, Statistique Canada produit habituellement deux fichiers de microdonnées à grande diffusion (FMGD) : le FMGD des particuliers et le FMGD hiérarchique. Ces fichiers donnent tous deux des renseignements sur les particuliers, mais le FMGD hiérarchique fournit aussi des renseignements sur les liens entre les particuliers d’un même ménage ou d’une même famille. Afin de produire, en se basant sur les données de l’ENM, deux FMGD qui couvrent uniformément l’ensemble du pays et qui ne se chevauchent pas, nous avons appliqué une stratégie spéciale de sous-échantillonnage. Les analyses de confidentialité sont devenues plus difficiles, en raison des nombreuses nouvelles variables, de l’information géographique plus détaillée et de la nature volontaire de l’ENM. Le présent article décrit la méthodologie des FMGD de 2011 et la façon dont elle établit un équilibre entre le besoin de disposer de plus d’information et la nécessité que le risque de divulgation soit faible.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 12-001-X201300111826
    Description :

    Il est courant que les organismes d'enquête fournissent des poids de rééchantillonnage dans les fichiers de données d'enquête. Ces poids de rééchantillonnage servent à produire de manière simple et systématique des estimations valides et efficaces de la variance pour divers estimateurs. Cependant, la plupart des méthodes existantes de construction de poids de rééchantillonnage ne sont valides que pour des plans d'échantillonnage particuliers et nécessitent habituellement un très grand nombre de répliques. Dans le présent article, nous montrons d'abord comment produire les poids de rééchantillonnage en se basant sur la méthode décrite dans Fay (1984) de manière que l'estimateur de la variance par rééchantillonnage résultant soit algébriquement équivalent à l'estimateur de la variance par linéarisation entièrement efficace pour tout plan d'échantillonnage donné. Puis, nous proposons une nouvelle méthode de calage des poids afin que l'estimation soit simultanément efficace et parcimonieuse au sens où un petit nombre de jeux de poids de rééchantillonnage peuvent produire des estimateurs de la variance par rééchantillonnage valides et efficaces pour les paramètres de population importants. La méthode que nous proposons peut être conjuguée aux méthodes de rééchantillonnage existantes pour les enquêtes complexes à grande échelle. Nous discutons également de la validité des méthodes proposées et de leur extension à certains plans d'échantillonnage équilibrés. Les résultats de simulations montrent que les estimateurs de variance que nous proposons suivent très bien les probabilités de couverture des intervalles de confiance. Les stratégies que nous proposons auront vraisemblablement des répercussions sur la façon de produire les fichiers de données d'enquête à grande diffusion et d'analyser ces ensembles de données.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 12-001-X201200111687
    Description :

    Afin de créer des fichiers de données à grande diffusion à partir d'enquêtes à grande échelle, les organismes statistiques diffusent parfois des sous­échantillons aléatoires des enregistrements originaux. Le sous­échantillonnage aléatoire amenuise la taille des fichiers transmis aux analystes secondaires des données et réduit les risques de divulgation accidentelle de renseignements confidentiels sur les participants aux enquêtes. Cependant, le sous­échantillonnage n'élimine pas entièrement le risque, de sorte qu'il faut altérer les données avant leur diffusion. Nous proposons de créer des sous­échantillons protégés contre la divulgation provenant d'enquêtes à grande échelle en recourant à l'imputation multiple. L'idée consiste à remplacer dans l'échantillon original les valeurs identificatoires ou sensibles par des valeurs tirées de modèles statistiques et de diffuser des sous­échantillons de ces données protégées contre la divulgation. Nous présentons des méthodes permettant de faire des inférences fondées sur les multiples sous­échantillons synthétiques.

    Date de diffusion : 2012-06-27

  • Produits techniques : 11-522-X200600110433
    Description :

    Le processus de création de fichiers de microdonnées à grande diffusion compte un certain nombre de composantes. L'un de ses éléments clés est la méthode novatrice MASSC mise au point par RTI International. Cependant, ce processus comporte d'autres composantes importantes, comme le traitement des variables d'identification non essentielles et des résultats extrêmes en guise de protection supplémentaire. Le contrôle de la divulgation statistique a pour but de contrer l'intrusion interne ainsi qu'externe. Les composantes du processus sont conçues en conséquence.

    Date de diffusion : 2008-03-17

  • Produits techniques : 11-522-X20050019487
    Description :

    Le but de cette présentation est de passer en revue les différentes mesures de qualité qui ont servi à évaluer et à gérer le processus de collecte liée à la méthodologie du premier contact par téléphone de l'EPA.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019488
    Description :

    Nous exposons l'importance des mesures de qualité qui peuvent être utilisées en vue de la surveillance des besoins courants et futurs d'information à cet égard dans le SSE. L'accent est mis tout spécialement sur la nécessité de généraliser les initiatives du SSE visant à développer et à mettre en oeuvre des mesures opérationnelles de la qualité destinées à améliorer la qualité des processus statistiques.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019483
    Description :

    Tous les pays membres de l'Union européenne font face à des problèmes semblables de contrôle de la divulgation statistique (CDS). Tous doivent trouver un juste équilibre entre la protection des renseignements confidentiels fournis par les répondants et les demandes fort légitimes de la société, des chercheurs et des décideurs qui souhaitent obtenir des données de plus en plus détaillées. Cette demande croissante suscitée par l'avènement de l'ère de l'information et de la société du savoir est un problème commun du système statistique européen (SSE). La communication expose les questions et les stratégies relatives à la confidentialité des données en vigueur à l'heure actuelle à Eurostat et décrit une approche européenne du CDS grâce à l'établissement de centres et de réseaux d'excellence (CENEX pour Centres and Networks of Excellence).

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019434
    Description :

    Parmi les méthodes traditionnelles visant à limiter la divulgation statistique dans les données tabulaires, on retrouve la suppression de cellules, l'arrondissement de données et la perturbation de données. Parce que le mécanisme de suppression n'est pas descriptible en termes probabilistes, les tableaux supprimés ne peuvent être traités au moyen de méthodes statistiques telles que l'imputation. Aussi les caractéristiques de qualité des données des tableaux supprimés sont-elles faibles.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019460
    Description :

    Les utilisateurs analysent et interprètent les séries chronologiques d'estimations de différentes manières, en faisant souvent appel à des estimations portant sur plusieurs périodes. Malgré la taille importante des échantillons et le degré de chevauchement entre eux pour certaines périodes, les erreurs d'échantillonnage peuvent encore affecter substantiellement les estimations des mouvements et les fonctions connexes qui servent à interpréter la série d'estimations. Nous considérons comment tenir compte des erreurs d'échantillonnage dans l'interprétation des estimations provenant d'enquêtes à passages répétés et comment informer les utilisateurs et les analystes de leur incidence éventuelle.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019451
    Description :

    Le Generations and Gender Program, programme international comparatif coordonné par la Population Activities Unit de la Commission des Nations Unies pour l'Europe, combine une enquête par panel réalisée dans divers pays d'Europe, au Japon et en Australie à une base de données contextuelle créée en tant que partie intégrante du programme.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019489
    Description :

    La présentation 1) explore les divers sens du mot qualité dans le contexte d'un organisme statistique national, 2) examine les utilisateurs et les utilisations des mesures de la qualité, 3) relève les problèmes particuliers que posent les mesures de la qualité et 4) soutient qu'il est nécessaire d'établir un ensemble équilibré de mesures. Certains problèmes dont il est discuté sont les rôles des mesures de la satisfaction de la clientèle, des mesures habituelles de la qualité des enquêtes et des mesures financières, ainsi que la fiabilité des mesures de la qualité proprement dite. La discussion s'inspire de la littérature statistique et de celle sur la gestion de la qualité, et comprend des exemples provenant de divers organismes statistiques nationaux.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019461
    Description :

    On propose une généralisation du coefficient de variation habituel (CV) pour solutionner certains des problèmes connus lorsqu'il est utilisé pour mesurer la qualité des estimations Certains problèmes associés au CV comprennent notamment l'interprétation lorsque l'estimation se rapproche de zéro, et l'incohérence de l'interprétation quant à la précision lorsqu'elle est générée en vue de transformations individuelles monotones différentes.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019437
    Description :

    Les renseignements explicatifs qui accompagnent les données statistiques sont appelés métadonnées, et leur présence est essentielle à la bonne compréhension et à la bonne interprétation des données. Le présent article décrit l'expérience de Statistique Canada en ce qui concerne la conceptualisation, la dénomination et l'organisation des variables au sujet desquelles sont produites des données.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019463
    Description :

    Les statisticiens définissent de nouveaux concepts pour communiquer les erreurs liées aux estimations. Bon nombre de ces concepts sont faciles à comprendre pour les statisticiens, mais sont encore plus difficiles à expliquer aux utilisateurs que le traditionnel intervalle de confiance. La solution proposée, pour communiquer avec des non-statisticiens, consiste à améliorer les estimations de façon à réduire au minimum la nécessité d'expliquer les erreurs. On évite ainsi de déconcerter l'utilisateur en lui fournissant trop de chiffres à comprendre.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019484
    Description :

    La communication comprenait un examen des problèmes méthodologiques que pose l'anonymisation d'une base de données européenne, problèmes que magnifie la multiplicité des perceptions et réalités du risque de divulgation observées dans les divers pays. Les meilleures pratiques sont étalonnées en fonction des problèmes pratiques. La communication a débuté par un exposé détaillé de la politique d'Eurostat et des dispositions pratiques prises en ce qui concerne la diffusion de la base de microdonnées de l'EU SILC, puis a porté sur les options méthodologiques choisies pour anonymiser la base de données. La communication met l'accent sur la relation étroite entre ces deux aspects du problème. La solution représente un compromis entre la réduction du risque de divulgation dans chaque composante nationale et l'utilité des microdonnées diffusées grâce à la préservation du contenu informationnel et de l'harmonisation des procédures utilisées. Enfin, on a discuté des perspectives d'avenir en ce qui concerne la diffusion de microdonnées européennes.

    Date de diffusion : 2007-03-02

Données (0)

Données (0) (Aucun résultat)

Votre recherche pour «» n’a donné aucun résultat dans la présente section du site.

Vous pouvez essayer :

Analyses (8)

Analyses (8) (8 of 8 results)

  • Articles et rapports : 12-001-X201700114818
    Description :

    La protection de la confidentialité des données qui figurent dans des tableaux de données quantitatives peut devenir extrêmement difficile lorsqu’on travaille avec des tableaux personnalisés. Une solution relativement simple consiste à perturber au préalable les microdonnées sous-jacentes, mais cela peut avoir un effet négatif excessif sur la précision des agrégats. Nous proposons plutôt une méthode perturbatrice qui vise à mieux concilier les besoins de protection et de précision des données en pareil cas. La méthode consiste à traiter par niveaux les données de chaque cellule en appliquant une perturbation minime, voire nulle, aux valeurs inférieures et une perturbation plus importante aux valeurs supérieures. La méthode vise avant tout à protéger les données personnelles, qui sont généralement moins asymétriques que les données des entreprises.

    Date de diffusion : 2017-06-22

  • Le Quotidien
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2014-11-12

  • Articles et rapports : 12-001-X201300111826
    Description :

    Il est courant que les organismes d'enquête fournissent des poids de rééchantillonnage dans les fichiers de données d'enquête. Ces poids de rééchantillonnage servent à produire de manière simple et systématique des estimations valides et efficaces de la variance pour divers estimateurs. Cependant, la plupart des méthodes existantes de construction de poids de rééchantillonnage ne sont valides que pour des plans d'échantillonnage particuliers et nécessitent habituellement un très grand nombre de répliques. Dans le présent article, nous montrons d'abord comment produire les poids de rééchantillonnage en se basant sur la méthode décrite dans Fay (1984) de manière que l'estimateur de la variance par rééchantillonnage résultant soit algébriquement équivalent à l'estimateur de la variance par linéarisation entièrement efficace pour tout plan d'échantillonnage donné. Puis, nous proposons une nouvelle méthode de calage des poids afin que l'estimation soit simultanément efficace et parcimonieuse au sens où un petit nombre de jeux de poids de rééchantillonnage peuvent produire des estimateurs de la variance par rééchantillonnage valides et efficaces pour les paramètres de population importants. La méthode que nous proposons peut être conjuguée aux méthodes de rééchantillonnage existantes pour les enquêtes complexes à grande échelle. Nous discutons également de la validité des méthodes proposées et de leur extension à certains plans d'échantillonnage équilibrés. Les résultats de simulations montrent que les estimateurs de variance que nous proposons suivent très bien les probabilités de couverture des intervalles de confiance. Les stratégies que nous proposons auront vraisemblablement des répercussions sur la façon de produire les fichiers de données d'enquête à grande diffusion et d'analyser ces ensembles de données.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 12-001-X201200111687
    Description :

    Afin de créer des fichiers de données à grande diffusion à partir d'enquêtes à grande échelle, les organismes statistiques diffusent parfois des sous­échantillons aléatoires des enregistrements originaux. Le sous­échantillonnage aléatoire amenuise la taille des fichiers transmis aux analystes secondaires des données et réduit les risques de divulgation accidentelle de renseignements confidentiels sur les participants aux enquêtes. Cependant, le sous­échantillonnage n'élimine pas entièrement le risque, de sorte qu'il faut altérer les données avant leur diffusion. Nous proposons de créer des sous­échantillons protégés contre la divulgation provenant d'enquêtes à grande échelle en recourant à l'imputation multiple. L'idée consiste à remplacer dans l'échantillon original les valeurs identificatoires ou sensibles par des valeurs tirées de modèles statistiques et de diffuser des sous­échantillons de ces données protégées contre la divulgation. Nous présentons des méthodes permettant de faire des inférences fondées sur les multiples sous­échantillons synthétiques.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 12-001-X20040027755
    Description :

    Plusieurs organismes statistiques utilisent, ou considèrent utiliser, l'imputation multiple pour limiter le risque de divulguer l'identité des répondants ou certains attributs délicats dans les fichiers de données à grande diffusion. Par exemple, ces organismes peuvent diffuser des ensembles de données partiellement synthétiques comprenant les unités étudiées originellement, où certaines valeurs recueillies, comme les valeurs délicates posant un risque élevé de divulgation ou les valeurs d'identificateurs clés, sont remplacées par des imputations multiples. Le présent article décrit une approche permettant de générer des ensembles de données partiellement synthétiques multi imputés pour traiter simultanément le contrôle de la divulgation et les données manquantes. L'idée fondamentale consiste à imputer d'abord les valeurs manquantes pour produire m ensembles de données complets, puis à remplacer dans chaque ensemble de données complet les valeurs délicates ou permettant l'identification par r valeurs imputées. L'article décrit aussi des méthodes permettant de faire des inférences valides à partir d'ensembles de données multi imputés de ce genre. De nouvelles règles sont nécessaires pour combiner les estimations ponctuelles et de variances multiples, parce que les deux étapes d'imputation multiple introduisent dans les estimations ponctuelles deux sources de variabilité que les méthodes existantes d'obtention d'inférences à partir d'ensembles de données multi imputés ne mesurent pas correctement. Une loi t de référence appropriée pour l'inférence quand les valeurs de m et r sont moyennes est établie au moyen d'approximations par appariement de moments et par développement en série de Taylor.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 12-001-X199600114381
    Description :

    Les problèmes que pose le contrôle statistique de la divulgation, lequel a pour but d’empêcher les utilisateurs des données de divulguer des renseignements sur des répondants particuliers, se sont multipliés rapidement au cours des dernières années. La situation est due principalement à l’augmentation de la demande de données détaillées provenant des bureaux de la statistique, elle-même causée par l’accroissement continuel de l’usage des ordinateurs. Auparavant, ces bureaux produisaient des tableaux contenant relativement peu d’information. Aujourd’hui, par contre, les utilisateurs de données demandent des tableaux beaucoup plus détaillés et, qui plus est, des microdonnées à analyser eux-mêmes. Or, l’augmentation du contenu informatique des données rend le contrôle statistique de la divulgation beaucoup plus difficile. Les auteurs se fondent sur l’expérience qu’ils ont acquise dans le domaine du contrôle statistique de la divulgation à Statistics Netherlands pour exposer les problèmes qu’il faut, selon eux, surmonter quand on essaie de protéger les microdonnées contre la divulgation.

    Date de diffusion : 1996-06-14

  • Articles et rapports : 12-001-X199400214420
    Description :

    De nombreuses méthodes de protection du caractère confidentiel des microdonnées sont décrites dans les ouvrages de statistique. Cependant, l’usage qu’en font les organismes statistiques et la compréhension qu’on a de leurs propriétés et de leurs effets sont limités. Afin de favoriser la recherche sur ces méthodes ainsi que leur usage et pour faciliter leur évaluation et l’assurance de la qualité, il est souhaitable de formuler ces méthodes selon une seule approche. Dans cet article, nous présentons une approche appelée masquage de matrice - qui repose sur le calcul matriciel ordinaire - et nous formulons des masques de matrice pour les principales méthodes de protection du caractère confidentiel de microdonnées actuellement en usage, ce qui permettra aux organismes statistiques et aux autres spécialistes du domaine d’avoir une meilleure compréhension de ces méthodes et de les mettre en application.

    Date de diffusion : 1994-12-15

  • Articles et rapports : 12-001-X198800214582
    Description :

    Bibliographie complète des ouvrages, comptes rendus de recherche et articles publiés sur la théorie, l’application et le développement des techniques associées à la méthode des réponses randomisées; avec une classification par sujet.

    Date de diffusion : 1988-12-15

Références (32)

Références (32) (25 of 32 results)

  • Produits techniques : 11-522-X201700014735
    Description :

    La diffusion de microdonnées exige habituellement des méthodes de réduction et de modification des données, et le degré d’application de ces méthodes dépend des méthodes de contrôle qui seront nécessaires pour accéder aux données et les utiliser. Le calcul sécurisé est une approche qui, dans certaines circonstances, convient davantage pour accéder aux données à des fins statistiques; il permet le calcul de fonctions analytiques à l’égard de données chiffrées sans qu’il soit nécessaire de déchiffrer les données sources sous-jacentes pour procéder à une analyse statistique. Cette approche permet aussi à plusieurs emplacements de fournir des données, tout en garantissant une protection rigoureuse de la vie privée. De cette façon, les données peuvent être regroupées, et les fournisseurs de données peuvent calculer des fonctions analytiques, sans qu’aucune des parties ne connaisse les entrées des autres. À l’aide de certains résultats théoriques et d’exemples réels issus du domaine des soins de santé, nous expliquerons comment le calcul sécurisé peut être appliqué dans des contextes pratiques.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014733
    Description :

    La valeur sociale des collectes de données est améliorée de façon marquée par la vaste diffusion des fichiers de recherche et l’augmentation en découlant de la productivité scientifique. À l’heure actuelle, la plupart des études sont conçues en vue de recueillir des données utiles et exactes au niveau analytique, en se préoccupant peu de la façon dont elles seront mises en commun. Tant les ouvrages publiés que la pratique reposent sur le principe que l’analyse de la divulgation aura lieu après la collecte. Toutefois, pour produire des données à grande diffusion comportant la plus grande utilité analytique possible pour le groupe d’utilisateurs le plus important, on doit tenir compte du risque de divulgation au début du processus de recherche. À partir de cadres théoriques de décisions économiques et statistiques et de recherches en méthodes d’enquête, cette communication vise à améliorer la productivité scientifique des données de recherche partagées en décrivant comment le risque de divulgation peut être résolu aux étapes les plus précoces de la recherche, grâce à la formulation de « plans sécuritaires » et de « simulations de divulgation », une approche statistique appliquée ayant été adoptée pour : 1) l’élaboration et la validation de modèles qui prédisent la composition des données d’enquête selon différents plans d’échantillonnage; 2) la sélection et/ou l’élaboration de mesures et de méthodes utilisées pour déterminer le risque de divulgation, l’utilité analytique et les coûts de la divulgation des données d’enquête qui conviennent le mieux pour l’évaluation des plans d’échantillonnage et de bases de données; et 3) la tenue de simulations pour recueillir des estimations du risque, de l’utilité et du coût des études comportant une vaste gamme de caractéristiques d’échantillonnage et de conception de bases de données.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014721
    Description :

    L’accès aux données ouvertes s’inscrit de plus en plus dans les attentes des Canadiens, des chercheurs et des concepteurs. Apprenez comment et pourquoi le gouvernement du Canada a créé le portail « ouvert.canada.ca » afin de centraliser l’accès à toutes ses données ouvertes et en quoi cette initiative continuera de favoriser l’utilisation de renseignements statistiques.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014719
    Description :

    Les initiatives de données ouvertes transforment la façon dont les gouvernements et d’autres institutions publiques interagissent et fournissent des services à leurs mandants. Elles accroissent la transparence et la valeur de l’information pour les citoyens, réduisent les inefficacités et les obstacles à l’information, rendent possible des applications guidées par les données qui améliorent la prestation des services publics, et fournissent des données publiques pouvant susciter des possibilités économiques novatrices. Étant l’un des premiers organismes internationaux à adopter une politique de données ouvertes, la Banque mondiale a orienté et offert des conseils techniques aux pays en voie de développement qui envisagent de mettre en place ou qui conçoivent leurs propres initiatives. La présente communication donnera un aperçu des faits nouveaux en matière de données ouvertes sur le plan international, ainsi que des expériences, des défis et des possibilités actuels et futurs. M. Herzog discutera des raisons qui poussent les gouvernements à adopter les données ouvertes, des avantages prouvés de celles-ci pour les secteurs public et privé, de l’éventail d’approches que suivent les gouvernements, et des outils à la disposition des décideurs, en insistant tout spécialement sur les rôles et perspectives des bureaux nationaux de la statistique au sein d’une initiative pangouvernementale.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014720
    Description :

    La présente communication vise à fournir un bref aperçu de l’engagement de Statistique Canada à l’égard des données ouvertes. Nous aborderons tout d’abord la façon dont les principes des données ouvertes sont intégrés dans les pratiques courantes de diffusion de Statistique Canada. Puis, nous discuterons de la participation de l’organisme à l’initiative de données ouvertes de l’ensemble du gouvernement. Cette participation comporte deux volets : Statistique Canada est le principal fournisseur de données au portail de données ouvertes du gouvernement du Canada, mais il joue aussi un rôle important en arrière-plan, en tant que fournisseur de services responsable du développement et de la mise à jour du portail de données ouvertes (qui fait maintenant partie du portail plus large Gouvernement ouvert).

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014732
    Description :

    L’Institute for Employment Research (IAB) est le service de recherche de l’Agence fédérale allemande de placement. Par l’entremise du Centre de données de recherche (FDZ) à l’IAB, des données administratives et des données d’enquête sur les personnes et les établissements sont fournies aux chercheurs. En collaboration avec l’Institute for the Study of Labor (IZA), le FDZ a mis en œuvre l’application de soumission des travaux (JoSuA), qui permet aux chercheurs de soumettre des travaux, en vue du traitement des données à distance grâce à une interface Web personnalisée. Par ailleurs, deux types de fichiers de sortie produits pour l’utilisateur peuvent être reconnus dans l’environnement JoSuA, ce qui permet de fournir des services d’examen de la divulgation plus rapides et plus efficaces.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014731
    Description :

    Cette communication décrit divers facteurs qui posent un problème lorsque l’on évalue le risque de divulgation de microdonnées contextualisées, ainsi que certaines des étapes empiriques qui sont comprises dans leur évaluation. À partir d’ensembles synthétiques de répondants d’enquête, nous illustrons comment différents postulats modulent l’évolution du risque lorsque l’on tient compte : 1) des probabilités estimées que des régions géographiques non identifiées soient représentées dans une enquête; 2) du nombre de personnes dans la population qui partagent les mêmes identificateurs personnels et contextuels qu’un répondant; et 3) de l’ampleur prévue de l’erreur de couverture dans les chiffres de population du recensement et les fichiers existants qui fournissent des données d’identification (p. ex., le nom, l’adresse).

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201700014734
    Description :

    La protection des données et la protection de la vie privée sont des défis clés qui doivent être relevés de façon prioritaire, afin de permettre l’utilisation des mégadonnées dans la production de statistiques officielles. C’est ce qu’ont préconisé, en 2013, les directeurs des Instituts nationaux de statistique (INS) du Comité du Système statistique européen (CSSE) dans le mémorandum de Scheveningen. Le CSSE a demandé à Eurostat et aux INS d’élaborer un plan d’action comportant un carnet de route, en vue d’assurer le suivi de la mise en œuvre du mémorandum. À la réunion de Riga, le 26 septembre 2014, le CSSE a adopté le plan d’action et carnet de route 1.0 des mégadonnées (BDAR) présenté par le Groupe de travail d’Eurostat chargé des mégadonnées (TFBD), et il a convenu de l’intégrer dans le portefeuille de la Vision du SSE pour 2020. Eurostat collabore aussi dans ce domaine avec des partenaires externes comme la Commission économique des nations unies pour l’Europe (UNECE). Le projet de mégadonnées du Goupe de haut niveau de la UNECE est un projet international sur le rôle des mégadonnées dans la modernisation de la production de statistiques. Il comprenait quatre équipes de travail chargées de différents aspects des mégadonnées pertinentes pour les statistiques officielles : protection de la vie privée, partenariats, Sandbox et qualité. L’équipe de travail chargée de la protection de la vie privée a terminé ses travaux en 2014 et a donné un aperçu des outils existants pour la gestion des risques concernant la protection de la vie privée, a décrit comment le risque d’identification se rapporte aux caractéristiques des mégadonnées et a élaboré des recommandations à l’intention des Bureaux de statistique nationaux (BSN). Elle a conclu principalement que le prolongement des cadres existants, y compris l’utilisation de nouvelles technologies, était nécessaire pour traiter les risques liés à la protection de la vie privée dans le contexte de l’utilisation des mégadonnées. Le BDAR tire parti des travaux des équipes de la UNECE. De façon plus particulière, il reconnaît qu’un certain nombre de sources de mégadonnées comprennent des données de nature délicate, que leur utilisation pour les statistiques officielles peut entraîner des perceptions négatives dans le grand public et chez les autres intervenants, et que ce risque devrait être atténué à court et à moyen termes. Il propose le lancement de plusieurs mesures : par exemple, un examen approprié des principes éthiques régissant les rôles et les activités des INS et une stratégie de communication bien établie. La communication présente les différentes mesures entreprises à l’intérieur du SSE et en collaboration avec la UNECE, ainsi que les solutions techniques et légales possibles à mettre en place pour résoudre les risques liés à la protection des données et à la protection de la vie privée, dans le contexte de l’utilisation des mégadonnées pour les statistiques officielles.

    Date de diffusion : 2016-03-24

  • Produits techniques : 11-522-X201300014285
    Description :

    L’Enquête nationale auprès des ménages (ENM) de 2011 est une enquête à participation volontaire qui a remplacé le questionnaire complet obligatoire traditionnel du recensement de la population du Canada. L’ENM a été réalisée auprès d’un échantillon d’environ 30 % des ménages canadiens et a donné un taux de réponse pondéré selon le plan de sondage de 77 %. Comparativement, le dernier questionnaire complet du recensement a été envoyé à 20 % des ménages et a produit un taux de réponse de 94 %. Au moyen des données du questionnaire complet, Statistique Canada produit habituellement deux fichiers de microdonnées à grande diffusion (FMGD) : le FMGD des particuliers et le FMGD hiérarchique. Ces fichiers donnent tous deux des renseignements sur les particuliers, mais le FMGD hiérarchique fournit aussi des renseignements sur les liens entre les particuliers d’un même ménage ou d’une même famille. Afin de produire, en se basant sur les données de l’ENM, deux FMGD qui couvrent uniformément l’ensemble du pays et qui ne se chevauchent pas, nous avons appliqué une stratégie spéciale de sous-échantillonnage. Les analyses de confidentialité sont devenues plus difficiles, en raison des nombreuses nouvelles variables, de l’information géographique plus détaillée et de la nature volontaire de l’ENM. Le présent article décrit la méthodologie des FMGD de 2011 et la façon dont elle établit un équilibre entre le besoin de disposer de plus d’information et la nécessité que le risque de divulgation soit faible.

    Date de diffusion : 2014-10-31

  • Produits techniques : 11-522-X200600110433
    Description :

    Le processus de création de fichiers de microdonnées à grande diffusion compte un certain nombre de composantes. L'un de ses éléments clés est la méthode novatrice MASSC mise au point par RTI International. Cependant, ce processus comporte d'autres composantes importantes, comme le traitement des variables d'identification non essentielles et des résultats extrêmes en guise de protection supplémentaire. Le contrôle de la divulgation statistique a pour but de contrer l'intrusion interne ainsi qu'externe. Les composantes du processus sont conçues en conséquence.

    Date de diffusion : 2008-03-17

  • Produits techniques : 11-522-X20050019487
    Description :

    Le but de cette présentation est de passer en revue les différentes mesures de qualité qui ont servi à évaluer et à gérer le processus de collecte liée à la méthodologie du premier contact par téléphone de l'EPA.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019488
    Description :

    Nous exposons l'importance des mesures de qualité qui peuvent être utilisées en vue de la surveillance des besoins courants et futurs d'information à cet égard dans le SSE. L'accent est mis tout spécialement sur la nécessité de généraliser les initiatives du SSE visant à développer et à mettre en oeuvre des mesures opérationnelles de la qualité destinées à améliorer la qualité des processus statistiques.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019483
    Description :

    Tous les pays membres de l'Union européenne font face à des problèmes semblables de contrôle de la divulgation statistique (CDS). Tous doivent trouver un juste équilibre entre la protection des renseignements confidentiels fournis par les répondants et les demandes fort légitimes de la société, des chercheurs et des décideurs qui souhaitent obtenir des données de plus en plus détaillées. Cette demande croissante suscitée par l'avènement de l'ère de l'information et de la société du savoir est un problème commun du système statistique européen (SSE). La communication expose les questions et les stratégies relatives à la confidentialité des données en vigueur à l'heure actuelle à Eurostat et décrit une approche européenne du CDS grâce à l'établissement de centres et de réseaux d'excellence (CENEX pour Centres and Networks of Excellence).

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019434
    Description :

    Parmi les méthodes traditionnelles visant à limiter la divulgation statistique dans les données tabulaires, on retrouve la suppression de cellules, l'arrondissement de données et la perturbation de données. Parce que le mécanisme de suppression n'est pas descriptible en termes probabilistes, les tableaux supprimés ne peuvent être traités au moyen de méthodes statistiques telles que l'imputation. Aussi les caractéristiques de qualité des données des tableaux supprimés sont-elles faibles.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019460
    Description :

    Les utilisateurs analysent et interprètent les séries chronologiques d'estimations de différentes manières, en faisant souvent appel à des estimations portant sur plusieurs périodes. Malgré la taille importante des échantillons et le degré de chevauchement entre eux pour certaines périodes, les erreurs d'échantillonnage peuvent encore affecter substantiellement les estimations des mouvements et les fonctions connexes qui servent à interpréter la série d'estimations. Nous considérons comment tenir compte des erreurs d'échantillonnage dans l'interprétation des estimations provenant d'enquêtes à passages répétés et comment informer les utilisateurs et les analystes de leur incidence éventuelle.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019451
    Description :

    Le Generations and Gender Program, programme international comparatif coordonné par la Population Activities Unit de la Commission des Nations Unies pour l'Europe, combine une enquête par panel réalisée dans divers pays d'Europe, au Japon et en Australie à une base de données contextuelle créée en tant que partie intégrante du programme.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019489
    Description :

    La présentation 1) explore les divers sens du mot qualité dans le contexte d'un organisme statistique national, 2) examine les utilisateurs et les utilisations des mesures de la qualité, 3) relève les problèmes particuliers que posent les mesures de la qualité et 4) soutient qu'il est nécessaire d'établir un ensemble équilibré de mesures. Certains problèmes dont il est discuté sont les rôles des mesures de la satisfaction de la clientèle, des mesures habituelles de la qualité des enquêtes et des mesures financières, ainsi que la fiabilité des mesures de la qualité proprement dite. La discussion s'inspire de la littérature statistique et de celle sur la gestion de la qualité, et comprend des exemples provenant de divers organismes statistiques nationaux.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019461
    Description :

    On propose une généralisation du coefficient de variation habituel (CV) pour solutionner certains des problèmes connus lorsqu'il est utilisé pour mesurer la qualité des estimations Certains problèmes associés au CV comprennent notamment l'interprétation lorsque l'estimation se rapproche de zéro, et l'incohérence de l'interprétation quant à la précision lorsqu'elle est générée en vue de transformations individuelles monotones différentes.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019437
    Description :

    Les renseignements explicatifs qui accompagnent les données statistiques sont appelés métadonnées, et leur présence est essentielle à la bonne compréhension et à la bonne interprétation des données. Le présent article décrit l'expérience de Statistique Canada en ce qui concerne la conceptualisation, la dénomination et l'organisation des variables au sujet desquelles sont produites des données.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019463
    Description :

    Les statisticiens définissent de nouveaux concepts pour communiquer les erreurs liées aux estimations. Bon nombre de ces concepts sont faciles à comprendre pour les statisticiens, mais sont encore plus difficiles à expliquer aux utilisateurs que le traditionnel intervalle de confiance. La solution proposée, pour communiquer avec des non-statisticiens, consiste à améliorer les estimations de façon à réduire au minimum la nécessité d'expliquer les erreurs. On évite ainsi de déconcerter l'utilisateur en lui fournissant trop de chiffres à comprendre.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019484
    Description :

    La communication comprenait un examen des problèmes méthodologiques que pose l'anonymisation d'une base de données européenne, problèmes que magnifie la multiplicité des perceptions et réalités du risque de divulgation observées dans les divers pays. Les meilleures pratiques sont étalonnées en fonction des problèmes pratiques. La communication a débuté par un exposé détaillé de la politique d'Eurostat et des dispositions pratiques prises en ce qui concerne la diffusion de la base de microdonnées de l'EU SILC, puis a porté sur les options méthodologiques choisies pour anonymiser la base de données. La communication met l'accent sur la relation étroite entre ces deux aspects du problème. La solution représente un compromis entre la réduction du risque de divulgation dans chaque composante nationale et l'utilité des microdonnées diffusées grâce à la préservation du contenu informationnel et de l'harmonisation des procédures utilisées. Enfin, on a discuté des perspectives d'avenir en ce qui concerne la diffusion de microdonnées européennes.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019462
    Description :

    La façon habituelle de présenter l'information sur la variance aux utilisateurs de données consiste à publier des estimations de la variance ou de statistiques connexes, comme les écarts types, les coefficients de variation, les limites de confiance ou de simples systèmes de classement. La communication porte sur les sources éventuelles de variance, comme le plan de sondage, la répartition de l'échantillon, la sélection de l'échantillon et la non réponse, et sur les meilleures mesures qui pourraient être prises pour réduire la variance. Enfin, elle donne une brève évaluation des coûts financiers qu'occasionne aux producteurs et aux utilisateurs de données le fait de réduire ou de ne pas réduire la variance et décrit comment un compromis pourrait être établi entre les coûts associés à la production de statistiques plus exactes et les avantages financiers d'une plus grande précision.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019486
    Description :

    À l'heure actuelle, les méthodes de suppression de cellules complémentaires sont surtout utilisées par les organismes statistiques pour protéger les données tabulaires confidentielles contre la divulgation. On croit généralement que les méthodes de suppression de cellules complémentaires fondées sur la programmation linéaire (PL) offrent la meilleure protection contre la divulgation injustifiée de renseignements statistiques. Dans le présent exposé, nous abordons les lacunes des conclusions tirées à l'aide de méthodes de vérification fondées sur la PL.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019436
    Description :

    Quelles que soient les particularités d'un schéma de métadonnées, il existe des construits communs de métadonnées qui servent à décrire les données statistiques. Le présent document donne un aperçu des différentes approches adoptées pour atteindre l'objectif commun de fournir des renseignements cohérents.

    Date de diffusion : 2007-03-02

  • Produits techniques : 11-522-X20050019485
    Description :

    En vertu de sa loi constitutive, l'ISQ doit s'assurer de préserver la confidentialité des renseignements qu'il recueille. À cette fin, il s'est doté d'une politique relative à la confidentialité des tableaux de résultats pour diffusion. Un des volets de cette politique concerne la confidentialité des tableaux de résultats produits à partir des évènements démographiques.Après un court examen des différentes composantes en matière de diffusion de tableaux, la méthodologie développée pour le contrôle statistique de la divulgation des tableaux produits à partir des évènements démographiques sera présentée. L'approche informatisée qui a été conçue pour automatiser ce processus sera présentée en utilisant comme toile de fond les données du Registre des évènements démographique du Québec.

    Date de diffusion : 2007-03-02

Date de modification :