Préparation d’un programme

Pour que le système d’accès à distance en temps réel (ADTR) puisse automatiser les processus nécessaires pour assurer la confidentialité, vos programmes doivent être rédigés dans un format normalisé. Pour rédiger un programme du SAS selon le format approprié, les utilisateurs doivent appliquer les renseignements tirés du document des paramètres de l’ADTR et créer des statistiques en utilisant les macros normalisées de l’ADTR.

Paramètres de l'ADTR

Paramètres de l'ADTR

Le document portant sur les paramètres de l’ADTR contient des renseignements essentiels dont les utilisateurs ont besoin pour mettre au point leurs programmes SAS.

Les termes figurant dans ce document sont expliqués ci-dessous.

Préfixe SAS – Terme de référence unique, propre à chaque bibliothèque d’enquête accessible au moyen de l’ADTR. Pour garantir l’accès à la bibliothèque d’enquête appropriée, le préfixe doit figurer dans le titre de votre programme SAS. Veuillez consulter la section nom du programme dans  le guide l’utilisateur de l’accès à distance en temps réel afin d’obtenir des instructions sur la manière de nommer votre programme SAS.

Ensemble de données SAS – Le nom de l’ensemble de données SAS doit être indiqué au moyen du nom standard de la bibliothèque (libname), appelé RTRAData. Pour vous assurer d’utiliser le bon ensemble de données d’enquête, veuillez consulter la liste complète des ensembles de données à la page de données de l’accès à distance en temps réel.

Base d'arrondissement – Les fréquences sont arrondies conformément à la base d’arrondissement déterminée pour chaque ensemble de données d’enquête. La base d’arrondissement est élaborée à partir de renseignements relatifs à la répartition du facteur de pondération, aux règles relatives au nombre minimal de répondants et à la pratique d’arrondissement en vigueur pour chaque ensemble de données d’enquête.

Variables renommées – Pour des raisons de compatibilité du système d’ADTR, certaines variables sont renommées.

Variables éliminées – Les variables sensibles qui présentent un risque de divulgation sont supprimées des fichiers de microdonnées.

Poids – Les variables de poids pour chaque ensemble de données d’enquête sont fournies dans ce document. Un nom standard pour « WEIGHT » doit être entré dans le système d’ADTR pour passer à la macro des fichiers de données administratives. Pour ces derniers, cette variable « WEIGHT » est égale à 1.

Temps limite d'exécution – Le temps limite d’exécution permet de préciser la durée maximale d’exécution de la soumission du programme. Ce temps limite empêche le programme SAS de fonctionner pendant une durée excessive et de consommer inutilement les ressources informatiques.

Nom du programme

Nom du programme

Pour garantir l’accès à la bibliothèque d’enquête appropriée, le préfixe doit figurer dans le titre de votre programme SAS. Veuillez consulter la page de données de l’accès à distance en temps réel pour obtenir la liste complète des préfixes.

Le nom de votre programme SAS doit respecter des règles standard d’affectation des noms. Selon ces règles, le nom de votre programme doit commencer par le « préfixe » approprié, suivi d’un trait de soulignement, puis d’un nom de votre choix. Par exemple, les chercheurs qui soumettent un programme dans le cadre de l’Enquête sociale générale de 2006 nommeraient leur programme comme suit : GSS2006_nomchoisi.sas. Veuillez prendre note que le nom du programme ne peut pas comprendre plus de 70 caractères ni inclure les caractères & et %.

Contenu du programme : statistiques

Contenu du programme : statistiques

Veillez à ce que votre programme SAS respecte la structure des sections mentionnées ci-dessous.

Partie 1 : éléments du programme

  • Les utilisateurs doivent indiquer un nom de bibliothèque (libname) standard, appelé RTRAData. La liste des noms d’ensembles de données correspondants peut être consultée à la page des Paramètres de l’ADTR. Par exemple, ensemble RTRAdata.GSS2007.
  • N’utilisez pas un nom standard SAS libref; inclure un énoncé de bibliothèque (libname) met fin à votre programme.
  • Dans cette section, vous pouvez manipuler les données en utilisant les commandes « proc sort  » et « data steps  ».
  • Si vous utilisez l’énoncé « keep » (pour définir les variables à inclure dans le produit) ou l’option d’ensemble de données « keep= » dans SAS, vous devez inclure la variable « ID ». Par exemple, ensemble RTRAdata.GSS2007 (keep = AGE SEX ID);.

Partie 2 : statistiques

Cette section permet de créer des tabulations en faisant appel aux macros de procédures d’ADTR personnalisées. Vous pouvez utiliser ces procédures 10 fois par programme tout au plus.

Il est possible de calculer trois types de statistiques dans l’ADTR :

  • 1. Statistiques de base : Ces statistiques ne calculent qu’une statistique à la fois. Les statistiques de base disponibles dans le système d’ADTR sont la fréquence, la moyenne, les centiles, la répartition en pourcentage, les proportions, le ratio et la part.
  • 2. Statistiques de niveau 5 (L5) : Aussi appelées statistiques d’ordre supérieur, ces statistiques calculent les différences entre les statistiques de base disponibles dans le système d’ADTR.
    • Il existe trois types de statistiques L5 :
      • 1. Variation de niveau (LC) : La variation de niveau désigne la différence entre les valeurs des statistiques calculées dans un tableau.
      • 2. Variation en pourcentage (PC) : La variation en pourcentage désigne la différence de pourcentage entre les valeurs des statistiques calculées dans un tableau. On la calcule en divisant la différence de deux valeurs dans un tableau par la valeur de départ.
      • 3. Test d’hypothèse (ST) : Les tests de signification permettent de calculer si deux valeurs d’un tableau présentent une différence significative sur le plan statistique.
    • Trois méthodes permettent de calculer des statistiques L5. Ces méthodes renvoient à la façon dont peuvent être comparées les valeurs des cellules du tableau :
      • 1. Global (global) : Dans le cas des statistiques L5 globales, chaque valeur de cellule est comparée à la valeur du domaine entier comprenant ces cellules.
      • 2. Valeur de base (base) : Des statistiques L5 de base permettent de comparer la valeur de chaque cellule à une autre cellule donnée (la valeur de base).
      • 3. Séquentielle (sequential) : Des statistiques L5 séquentielles permettent de comparer la valeur de chaque cellule à celle de la cellule se trouvant directement sous elle dans le tableau. Note : l’ordre des domaines dans un tableau importe lorsque l’on utilise des statistiques L5 séquentielles.
  • 3. Statistique de niveau 5 séquentielle dans le temps (L5SOT) : Aussi appelées statistiques d’ordre supérieur, ces statistiques permettent de calculer les différences entre les statistiques de base disponibles dans le système d’ADTR. Des statistiques L5SOT séquentielles permettent de comparer la valeur de chaque cellule à celle de la cellule se trouvant directement sous elle dans le tableau d’une façon séquentielle dans le temps. Il faut ainsi établir un intervalle de temps dans la macro afin de dégager la séquence. Ces intervalles de temps peuvent être annuels (L5YrVar), mensuels (L5MonVar), trimestriels (L5QtrVar) ou déterminés (L5TimeInt). Note : l’ordre des domaines dans un tableau importe lorsque l’on utilise des statistiques L5SOT.
    • Il existe trois types différents de statistiques L5SOT :
      • 1. Variation de niveau (LC) : La variation de niveau désigne la différence entre les valeurs des statistiques calculées dans un tableau.
      • 2. Variation en pourcentage (PC) : La variation en pourcentage désigne la différence de pourcentage entre les valeurs des statistiques calculées dans un tableau. On la calcule en divisant la différence de deux valeurs dans un tableau par la valeur de départ.
      • 3. Test d’hypothèse (ST) : Les tests de signification permettent de calculer si deux valeurs d’un tableau présentent une différence significative sur le plan statistique.

Avant de pouvoir être utilisées, des statistiques L5 et L5SOT exigent que des statistiques de base soient calculées. Par conséquent, les macros L5 et L5SOT contiennent un champ indiquant les statistiques de base.

Date de modification :