Centiles pour l'ADTR

Télécharger la version PDF (PDF, 235.27 Ko)

Centiles de base pour l'ADTR

1. Un centile représente la valeur d'une variable en dessous de laquelle se retrouve un certain pourcentage d'observations. Par exemple, la procédure de centile de l'ADTR peut servir à trouver le revenu médian des hommes et des femmes. Pour calculer des statistiques de centile, utilisez la procédure suivante de l'ADTR :

%RTRAPercentile (
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVar=,
Percentiles=,
UserWeight=);

2. Définition des paramètres de %RTRAPercentile :

InputDataset = détermination de l'ensemble de données d'entrée de la librairie   « WORK » de SAS à utiliser dans la procédure.

OutputName = détermination du nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères, et le premier caractère doit être une lettre).

ClassVarList = détermination d'un maximum de cinq variables pour les dimensions du centile. Ces variables doivent être délimitées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une valeur unique, mais pas plus de 500.

AnalysisVar = détermination d'une et une seule variable pour la statistique de centile. Cette variable doit être numérique.

Percentiles = détermination de trois centiles au maximum à partir de la liste suivante : 1, 5, 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 95, 99. Les valeurs de centile doivent être délimitées par des espaces.

UserWeight = renvoi au document des paramètres de l'ADTR pour déterminer un poids d'enquête. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable d'identification.

3. Exemple : Cette procédure peut être utilisée pour calculer des centiles de revenu. Supposons que vous exécutiez la procédure suivante de l'ADTR pour calculer le premier quartile, la médiane et  le troisième quartile d'une variable appelée « Revenu » pour produire un tableau appelé « Tableau 1 ». Vous aimeriez calculer cette statistique pour chaque sexe à partir d'une variable appelée « Sexe ».

%RTRAPercentile (
InputDataset=work.LFS,
OutputName=Tableau1,
ClassVarList=Sexe,
AnalysisVar=Revenu,
Percentiles=25 50 75,
UserWeight=Finalwt);

Le tableau suivant affiche les résultats pour l'exemple de la macro ci-dessus.

Tableau 1
Résultats pour l'exemple de la macro
Sexe Revenu_P25 Revenu_P50 Revenu_P75 Revenu_Count
  20000 45000 110000 27268000
Femmes 28000 50000 100000 13448000
Hommes 16000 38000 620000 13820000
Note : À noter que les produits des enquêtes comportant des poids bootstrap comprendront des renseignements additionnels sur des mesures de précision, par exemple, des indicateurs de qualité, des erreurs-types, des intervalles de confiance, etc.

Centiles de niveau 5 dans le cadre de l'ADTR

1. Un centile est la valeur d'une variable en dessous de laquelle est compris un certain pourcentage d'observations. L'utilisation de la fonction de niveau 5 relative aux centiles permet à l'utilisateur de calculer la différence entre d'autres statistiques en cours d'exécution. Par exemple, la procédure d'ADTR permettant la production de tableaux de centiles de niveau 5 peut être utilisée pour trouver le revenu médian des hommes et des femmes, tout en déterminant une variation en pourcentage. Pour calculer les centiles de niveau 5, faites l'appel de procédure d'ADTR suivant :

%RTRAPercentileL5(
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVar=,
Percentiles=,
L5STAT=,
L5TYPE=,
L5BYVAR=,
USERWEIGHT=);

2. Définition du paramètre %RTRAPercentileL5 :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères et le premier caractère ne doit pas être un trait de soulignement).

ClassVarList = détermine un maximum de cinq variables pour établir les dimensions de la procédure de production de centiles. Ces variables doivent être séparées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une, mais pas plus de 500 valeurs uniques.

AnalysisVar = détermine une seule variable aux fins de la procédure de production de centiles. Cette variable doit être de type numérique.

Percentiles = détermine jusqu'à trois centiles parmi les suivants : 1, 5, 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 95 et 99. Les valeurs en centiles doivent être séparées par des espaces.

L5Stat = détermine quelle statistique d'ordre supérieur vous souhaitez utiliser. Cette statistique doit être l'une des suivantes : LC (variation de niveau), PC (variation en pourcentage) ou ST (test de signification).

L5ByVar = détermine la variable « BY ». La variable indiquée doit également être comprise dans <ClassVarList>.

L5BaseVal = détermine la manière dont les valeurs comprises dans les cellules du tableau se compareront. Cette manière doit être l'une des suivantes : « Sequential », « Base » ou « Global ».

UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».

3. Exemple : La procédure suivante peut être utilisée pour calculer des centiles de revenu selon le sexe avec une variation en pourcentage. Supposons que vous exécutiez la procédure d'ADTR suivante pour calculer le premier quartile, la médiane et le troisième quartile d'une variable appelée « revenu » afin de générer un tableau nommé « Tableau2 ». Vous souhaitez calculer ces centiles pour chaque sexe à l'aide d'une variable appelée « sexe ».

Votre appel de procédure d'ADTR ressemblera à ceci :

%RTRAPercentileL5(
InputDataset=work.LFS,
OutputName=Table2,
ClassVarList=Sex,
AnalysisVar=Income,
Percentiles=25 50 75,
L5STAT=PC,
L5TYPE=global,
L5BYVAR=Sex,
USERWEIGHT=Finalwt);

Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus.

Tableau 2
Résultats de l'exemple de procédure

Sexe
Revenu_P25 Revenu_P50 Revenu_P75 Revenu_P25_PCG Revenu_P50_PCG Revenu_P75_PCG Revenu_Count
 

1640

2200

2600

0

0

0

231750

Féminin

1510

2200

2550

-0,08

0

-0,0192

94250

Masculin

1800

2250

2600

0,101

0,023

0

137500

Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc.

Centiles L5SOT dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'ADTR permettant la production de tableaux de centiles comprenant une statistique de niveau 5 séquentielle dans le temps (L5SOT) donnée. Un centile est la valeur d'une variable en dessous de laquelle est compris un certain pourcentage d'observations. Par exemple, la procédure d'ADTR permettant la production de tableaux de centiles peut être utilisée pour trouver le revenu médian des hommes et des femmes. Pour calculer les centiles, faites l'appel de procédure d'ADTR suivant :

%RTRAPercentileL5SOT(
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVar=,
Percentiles=,
L5Stat=,
L5YrVar=,
L5MonVar=,
L5QtrVar=,
UserWeight=);

2. Définition du paramètre %RTRAPercentileL5SOT :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom donné aux fichiers de sortie définitifs correspondant à cet appel de la procédure RTRAPercentileL5SOT. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs.

ClassVarList = détermine un maximum de cinq variables pour établir les dimensions de la procédure de production de centiles. Ces variables doivent être séparées par des espaces ou des astérisques.

AnalysisVar = détermine une seule variable aux fins de la procédure de production de centiles. Cette variable doit être de type numérique.

Centiles = détermine jusqu'à trois centiles parmi les suivants : 1, 5, 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 95 et 99. Les valeurs en centiles doivent être séparées par des espaces.

L5Stat = Les valeurs valides sont « LC », « PC » et « ST » (insensibles à la casse).

L5YrVar = détermine le nom de la variable utilisée comme variable relative à l'année de niveau 5.

L5MonVar = (facultatif) détermine la variable relative au mois de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5MonVar est indiqué, L5QtrVar doit être laissé vide ou omis.

L5QtrVar = (facultatif) détermine la variable relative au quart de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5QtrVar est indiqué, L5MonVar doit être laissé vide ou omis.

L5TimeInt = (facultatif) détermine l'intervalle de temps de niveau 5. La valeur indiquée doit être un entier supérieur à 0. On peut omettre ce paramètre, mais l'entier par défaut doit alors être « 1 ».

UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».

3. Exemple : La procédure suivante peut être utilisée pour analyser la variation en pourcentage de la rémunération hebdomadaire selon le sexe tout au long de l'année.

%RTRAPercentileL5SOT(
 InputDataset=work.LFS,
OutputName=Table3,
ClassVarList=Sex,
AnalysisVar=NUM_WKLYEARN,
Percentiles = 25 50 75,
L5Stat=PC,
L5YrVar=NUM_SYEAR,
L5MonVar=NUM_MONTH,
L5TimeInt=1,
UserWeight=FINALWT);

Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites. Dans le cadre de cet exemple, nous utiliserons uniquement les résultats pour le premier tiers de l'année 2016, avec une variation de 25 %.

Tableau 3
Résultats de l'exemple de procédure
NUM_MONTH SEXE NUM_WKLYEARN_P25 NUM_WKLYEARN_P25_PCS NUM_WKLYEARN_COUNT
Janvier Masculin 1500 0 6750
Janvier Féminin 1730 0 12250
Février Masculin 2100 0,4 9750
Février Féminin 1900 0,101 15500
Mars Masculin 2000 -0,048 11750
Mars Féminin 1550 -0,184 14000
Avril Masculin 2000 0 8500
Avril Féminin 1200 -0,23 14750
Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc.