Foire aux questions sur l’ajustement tabulaire aléatoire (ATA)

Pourquoi certaines estimations ne figurent-elles pas dans les tableaux actuels du Recensement de l’agriculture ou dans ceux publiés auparavant?

Certaines estimations pourraient ne pas figurer dans les tableaux de données du Recensement de l’agriculture pour l’une des deux raisons suivantes :

  • Suppression des données : L’une des méthodes utilisées pour protéger les renseignements de chaque membre de la population est la suppression des données. Cette méthode a été utilisée dans le cadre du Recensement de l’agriculture de 2016. Cependant, en 2021, la suppression des données a été remplacée par une nouvelle méthode appelée l’ajustement tabulaire aléatoire (ATA).
  • Qualité des données : Pour la première fois, le Recensement de l’agriculture de 2021 publiera un indicateur de qualité pour la plupart de ses estimations afin de tenir compte du degré d’incertitude attribuable à la non-réponse, au traitement des données et à l’ATA des estimations individuelles. Cet indicateur prend la forme d’une lettre, allant de A à F. Les estimations de niveau A sont considérées comme étant les plus fiables, tandis que celles de niveau F sont considérées comme ayant un degré d’incertitude si élevé qu’elles sont jugées trop peu fiables pour être publiées. Lorsqu’il est impossible de publier une estimation, la cellule dans le tableau affichera tout simplement la lettre F.

Qu’est-ce qu’une technique de suppression des données?

Statistique Canada utilise habituellement des techniques de suppression pour protéger les renseignements statistiques de nature délicate. Ces techniques comprennent la suppression de points de données qui peuvent révéler des renseignements, directement ou indirectement, au sujet d’un répondant. Cela peut souvent mener à la suppression d’un grand nombre de points de données et réduire de façon importante la quantité de données disponibles. Dans les tableaux de données de Statistique Canada, les cellules supprimées pour des raisons de confidentialité sont marquées d’un « x ».

Qu’est-ce que l’ajustement tabulaire aléatoire?

L’ajustement tabulaire aléatoire (ATA) est une nouvelle méthode qu’emploie Statistique Canada pour tenir compte de la nécessité de fournir des données d’une grande qualité aux utilisateurs, tout en protégeant les renseignements confidentiels des répondants lors de la diffusion d’estimations de données économiques. Au moyen de l’ATA, Statistique Canada peut repérer les estimations de nature délicate qui peuvent révéler des renseignements au sujet d’un répondant, et ajuster leur valeur de façon aléatoire au lieu de les supprimer.

Comment l’ajustement tabulaire aléatoire diffère-t-il des autres techniques de suppression des données?

L’ajustement tabulaire aléatoire (ATA) augmente l’utilité des tableaux de données économiques diffusés par Statistique Canada. Les techniques de suppression de données traditionnelles utilisent des règles semblables à celles de l’ATA pour déterminer si une cellule renferme des renseignements de nature délicate, mais elles suppriment la cellule ou ne la publient pas. Dans le cas de l’ATA, les estimations de la cellule peuvent tout de même être publiées, car les valeurs individuelles ne sont pas divulguées. Cette méthode permet à Statistique Canada d’accroître le nombre de données utiles que l’organisme peut publier tout en assurant la protection des renseignements confidentiels.

Comment l’ajustement tabulaire aléatoire fonctionne-t-il?

L’ajustement tabulaire aléatoire (ATA) repère les estimations de nature délicate et ajuste leur valeur de façon aléatoire, ou ajoute du bruit, afin que les estimations demeurent confidentielles et puissent être diffusées. Autrement dit, au lieu de faire l’objet d’une suppression, les estimations sont « perturbées ». L’ampleur de l’ajustement est calculée pour protéger la confidentialité des réponses individuelles qui font partie de l’estimation.

Après avoir ajusté la valeur, Statistique Canada attribue un indicateur de qualité (A, B, C, D, E ou F) à l’estimation, afin d’indiquer aux utilisateurs le degré de confiance qu’ils peuvent avoir dans sa précision. Cet indicateur tient compte de l’incertitude à l’échelle des étapes de collecte des données, de traitement et de confidentialité. L’indicateur ne tient pas uniquement compte de l’incertitude découlant de l’ATA.

L’ajustement tabulaire aléatoire a-t-il les mêmes répercussions sur toutes les estimations?

L’ajustement tabulaire aléatoire (ATA) n’a pas les mêmes répercussions sur toutes les estimations. L’ATA évalue chaque cellule de manière individuelle afin de déterminer si elle renferme des renseignements de nature délicate. Bien que la plupart des cellules liées au Recensement de l’agriculture ne contiennent pas de renseignements identificatoires et que l’ATA n’aura pas à être appliqué, l’ATA sera appliqué à un certain nombre de cellules, car celles-ci renferment des renseignements qui pourraient être directement associés à au moins l’une des valeurs individuelles formant l’estimation totale de la cellule.

Lorsque l’ATA est appliqué à une cellule, le programme détermine la quantité de bruit unique à ajouter. Les utilisateurs seront incapables de déterminer si l’ATA a été appliqué à une cellule ou non. Ainsi, l’ATA offre un degré de protection à toutes les cellules d’un tableau.

Dans le cas du Recensement de l’agriculture, l’ATA n’a pas été appliqué aux tableaux suivants :

  • Caractéristiques des exploitants agricoles : âge, sexe et nombre d’exploitants déclarés dans l’exploitation agricole, Recensement de l’agriculture, 2021 (tableau 32-10-0381-01);
  • Caractéristiques des exploitants agricoles : travail agricole et autre travail rémunéré, Recensement de l’agriculture, 2021 (tableau 32-10-0382-01).

De plus, l’ATA n'est pas appliqué aux estimations des comptes, telles que le nombre d'exploitations avec une certaine caractéristique.

Quels avantages l’ajustement tabulaire aléatoire procure-t-il?

L’ajustement tabulaire aléatoire permet de diffuser un plus grand nombre de données, augmentant l’utilité des tableaux de données. Au lieu de faire l’objet d’une suppression, les estimations sont « perturbées », c’est-à-dire que les renseignements de nature délicate sont modifiés de façon aléatoire pour protéger la confidentialité des réponses individuelles faisant partie de l’estimation. Pour ce faire, il faut ajuster l’estimation en question afin qu’une valeur précise ne puisse pas être attribuée à une donnée individuelle qui en fait partie.

Cette méthode a également l’avantage de ne pas avoir d’incidence sur les cellules qui ne sont pas jugées renfermer des renseignements de nature délicate. Seules les cellules renfermant des renseignements de nature délicate et leurs agrégats sont touchées. Dans le cadre d’autres techniques de suppression des données qu’utilise Statistique Canada, certaines cellules doivent être supprimées pour protéger la confidentialité d’une autre cellule. Par exemple, si une partie d’un total est supprimée, il faut également supprimer une autre partie pour empêcher qu’il soit possible de calculer la valeur de la cellule confidentielle à partir du total.

Où puis-je obtenir de plus amples renseignements sur l’ajustement tabulaire aléatoire?

Pour obtenir de plus amples renseignements techniques sur l’ajustement tabulaire aléatoire, veuillez consulter le document intitulé Contrôle de la divulgation et ajustement tabulaire aléatoire de Mark Stinner, présenté lors du Congrès annuel de 2017 de la Société statistique du Canada à Winnipeg.

Date de modification :