Préparer un program

Paramètres de l'ADTR
Nom du programme
Contenu du programme : Statistiques

Pour que l’ADTR puisse automatiser les processus nécessaires pour assurer la confidentialité, vos programmes doivent être rédigés dans un format normalisé. Pour rédiger un programme en SAS dans le format approprié, les utilisateurs doivent appliquer les renseignements tirés du document des paramètres de l’ADTR et créer des statistiques en utilisant les macros normalisées de l’ADTR. Les modalités et l’utilisation de ces normes sont expliquées ci-après.

Paramètres de l'ADTR

Le document des paramètres contient les renseignements essentiels dont les utilisateurs auront besoin pour mettre au point leur programme SAS. Les modalités figurant dans ce document sont expliquées ci-dessous.

Préfixe SAS – Un préfixe est un terme de référence unique pour chaque bibliothèque d'enquête disponible grâce à l'ADTR. Pour garantir l'accès à la bibliothèque d'enquête appropriée; le préfixe doit être indiqué dans le titre de votre programme SAS. Veuillez vous reporter à la section Nom du programme afin de connaître les directives concernant la convention d'appellation appropriée pour votre programme SAS.

Ensemble de données SAS – Le nom de l'ensemble des données SAS doit être indiqué dans le nom de la bibliothèque (libname) standard appelé « RTRAData ». Veuillez vous reporter à la section paramètres de l'ADTR pour obtenir des renseignements détaillés sur l'énoncé du nom de la bibliothèque (libname) standard.

Base d'arrondissement – Les fréquences sont arrondies conformément à la base d'arrondissement précisée pour chaque ensemble de données d'enquête. La base d'arrondissement est élaborée à l'aide des renseignements sur la répartition du facteur de pondération; les règles relatives au nombre minimal de répondants et la pratique actuelle consistant à arrondir pour chaque ensemble de données d'enquête.

Variables renommées – Pour des raisons de compatibilité de l'ADTR certaines variables sont renommées.

Variables éliminées – Les variables sensibles qui présentent un risque de divulgation sont supprimées des fichiers de microdonnées.

Poids – Les variables de poids pour chaque ensemble de données d'enquête sont disponibles dans le présent document. Bien qu’il n’existe pas de poids d’échantillonnage pour les ensembles de données administratives, un nom standard de « WEIGHT » doit être entré dans le système d’ADTR pour passer au macro. Pour les fichiers de données administratives, cette variable « WEIGHT » est égale à 1.

Temps limite d'exécution – Le temps limite d'exécution permet de préciser la durée maximale pour exécuter la soumission du programme. Ce temps limite empêche le programme SAS de fonctionner pendant une durée excessive et de consommer inutilement les ressources informatiques.

Nom du programme

Pour garantir l'accès à la bibliothèque d'enquête appropriée; le préfixe doit être indiqué dans le titre de votre programme SAS. Veuillez consulter les paramètres de l'ADTR pour obtenir la liste complète des préfixes.

Le nom de votre programme SAS devra débuter par le « nom de préfixe » suivi d'un trait de soulignement. Vous pouvez faire suivre ce trait de soulignement du nom de programme de votre choix. Par exemple; les chercheurs qui soumettent un programme à l'aide de l'Enquête sociale générale de 2006 devront nommer leur programme ainsi : GSS2006_nomquevousvoulezdonnerauprogramme.sas. Veuillez noter que le nom du programme ne peut pas dépasser 70 caractères ou inclure les caractères & et %.

Contenu du programme : Statistiques

Veuillez vous assurer que votre programme suit la structure des sections mentionnées ci-dessous.

Partie 1 : éléments du programme

  • Les utilisateurs doivent indiquer un nom de bibliothèque (libname) standard appelé RTRAData. La liste des noms des ensembles de données correspondants est disponible dans le document des paramètres.
  • Ne tentez pas de créer un nom de bibliothèque (SAS libref). La création d'un énoncé de bibliothèque (libname) mettra fin à votre programme et un message d'erreur s'affichera dans votre registre SAS.
  • Dans cette section; vous pouvez manipuler les données en utilisant les commandes « proc sort » et « data steps ».
  • Si vous utilisez l'énoncé « keep » dans le SAS; vous devez inclure la variable « ID ».

Partie 2 : statistiques

Dans cette section des tabulations sont créés en appelant la procédure d’ADTR personnalisée. Vous pouvez faire appel à ces procédure dix fois par programme tout au plus.

Il est possible de calculer trois types de statistiques dans l’ADTR :

  • 1. Statistiques de base : Ces statistiques ne calculent qu’une statistique à la fois. Les statistiques de base qui se trouvent dans le système d’ADTR sont la fréquence, la moyenne, les centiles, la répartition en pourcentage, les proportions, le ratio et la part.
  • 2. Statistiques de niveau 5 (L5) : Aussi appelées statistiques d’ordre supérieur, ces statistiques calculent les différences entre les statistiques de base disponibles dans le système d’ADTR.
    • Il existe trois types différents de statistiques L5 :
      • 1. Variation de niveau (LC) : La variation de niveau est définie comme la différence entre les valeurs de la statistique calculée dans un tableau.
      • 2. Variation en pourcentage (PC) : La variation en pourcentage est définie comme la différence de pourcentage entre les valeurs de la statistique dans un tableau. On la calcule en prenant la différence de deux valeurs dans un tableau et en la divisant par la valeur de départ.
      • 3. Test d’hypothèse (ST) : Les tests d’hypothèse calculent si deux valeurs dans un tableau présentent une différence significative sur le plan statistique.
    • On calcule les statistiques L5 avec trois méthodes. Ces méthodes renvoient à la façon dont les valeurs dans les cellules du tableau se comparent :
      • 1. Global (global) : Dans le cas d’une statistique L5 globale, chaque valeur d’une cellule est comparée à la valeur du domaine entier qui englobe ces cellules.
      • 2. Valeur de base (base) : Une statistique L5 de base compare la valeur de chaque cellule à une autre cellule donnée (la valeur de base).
      • 3. Séquentielle (sequential) : Une statistique L5 séquentielle compare la valeur de chaque cellule à la valeur de la cellule directement sous elle dans le tableau. Note : L’ordre des domaines dans un tableau importe lorsqu’on utilise une statistique L5 séquentielle.
  • 3. Statistique de niveau 5 séquentielle dans le temps (L5SOT) : Aussi appelées statistiques d’ordre supérieur, ces statistiques calculent les différences entre les statistiques de base disponibles dans le système d’ADTR. Les statistiques L5SOT comparent la valeur de chaque cellule à la valeur de la cellule directement sous elle dans le tableau d’une façon qui se veut séquentielle dans le temps. Ainsi, il faut établir un intervalle de temps dans la macro afin de dégager la séquence. Ces intervalles de temps peuvent être annuels (L5YrVar), mensuels (L5MonVar), trimestriels (L5QtrVar) ou un intervalle de temps déterminé (L5TimeInt). Note : L’ordre des domaines dans un tableau importe lorsqu’on utilise des statistiques L5SOT.
    • Il existe trois types différents de statistiques L5SOT :
      • 1. Variation de niveau (LC) : La variation de niveau est définie comme la différence entre les valeurs de la statistique calculée dans un tableau.
      • 2. Variation en pourcentage (PC) : La variation en pourcentage est définie comme la différence de pourcentage entre les valeurs de la statistique dans un tableau. On la calcule en prenant la différence de deux valeurs dans un tableau et en la divisant par la valeur de départ.
      • 3. Test d’hypothèse (ST) : Les tests d’hypothèse calculent si deux valeurs dans un tableau présentent une différence significative sur le plan statistique.

Les statistiques L5 et L5SOT exigent qu’une statistique de base soit calculée avant de pouvoir être utilisées. Par conséquent, les macros L5 et L5SOT contiennent un champ dans lequel la statistique de base est indiquée.

Date de modification :