Décomposition des inégalités salariales selon le sexe par calage : application à l’Enquête suisse sur la structure des salaires
Section 1. Introduction

La discrimination salariale peut être fondée sur différents critères, dont le sexe, la race ou la religion. La discrimination salariale selon le sexe a lieu quand un homme et une femme sont rémunérés différemment pour un travail qui requiert les mêmes qualifications ou qui implique une productivité identique (voir, par exemple, Neumark, 1988; Gardeazabal et Ugidos, 2005). Puisqu’il faut quantifier la discrimination pour en évaluer l’importance, le sujet a suscité l’intérêt des statisticiens. La technique originale proposée par Blinder (1973) et Oaxaca (1973) consiste à estimer la part de l’écart entre les salaires moyens des hommes et des femmes qui est due à la discrimination. Cependant, en général, la répartition des hommes et des femmes entre les emplois n’est pas uniforme (voir, par exemple Bielby et Baron, 1986). Si les membres d’un de ces deux groupes, habituellement les femmes, sont concentrés dans les emplois faiblement rémunérés, l’écart entre les salaires moyens pourrait ne pas être très pertinent. Donc, au lieu d’analyser le niveau de discrimination dans les salaires moyens, il serait peut-être intéressant de voir si la discrimination se produit uniformément dans tous les types d’emplois. Une bibliographie détaillée des différents articles statistiques consacrés à l’estimation de la discrimination peut être consultée dans Fortin, Lemieux et Firpo (2011).

Bien que les méthodes de décomposition offertes dans la littérature soient nombreuses, deux d’entre elles seulement seront discutées dans le présent article. Ces deux méthodes ne sont pas présentées dans leur forme originale, mais plutôt en tenant compte des poids de sondage. Il s’agit de la méthode de Blinder-Oaxaca (ci-après nommée BO) et la méthode semi-paramétrique élaborée par DiNardo, Fortin et Lemieux (1996) (ci-après nommée DFL). La méthode BO originale analyse la différence entre les salaires moyens des hommes et les salaires moyens des femmes. Cependant, elle ne permet pas d’analyser l’écart salarial pour d’autres paramètres, comme les quantiles. La méthode DFL originale résout ce problème. Son point de départ est un modèle logistique dans lequel, pour chaque observation, la probabilité d’être un homme ou une femme est modélisée comme une fonction des caractéristiques observées. Le ratio de ces probabilités est utilisé pour construire un facteur de repondération. L’objectif de la méthode est de rapprocher la distribution des caractéristiques des femmes de la distribution des caractéristiques des hommes. En disposant de distributions similaires des caractéristiques, il est possible d’obtenir une estimation du niveau de discrimination pour d’autres paramètres que la moyenne. Cependant, la variance du facteur de repondération peut être grande dans les cas où une ou plusieurs caractéristiques sont de bons prédicteurs du sexe. En outre, la distribution repondérée des caractéristiques des femmes peut ne pas concorder avec la distribution des caractéristiques des hommes. Nous abordons les problèmes associés aux deux méthodes par une approche de calage. L’idée qui sous-tend le calage est la même que celle qui sous-tend la méthode DFL. Elle consiste à rapprocher la distribution des caractéristiques des femmes de celle des hommes, afin d’estimer le niveau de discrimination tout le long de la distribution des salaires.

La présentation de l’article est la suivante. À la section 2, nous définissons la notation et à la section 3, nous réexprimons la décomposition BO en nous servant de données d’enquête. Les poids de sondage sont pris en compte afin de corriger l’écart entre l’échantillon et la population d’intérêt. Par conséquent, la décomposition sera nommée « BO pondérée ». Nous présentons aussi le concept clé de la distribution contrefactuelle des salaires des femmes. Elle est définie comme étant la distribution des salaires des femmes si celles-ci avaient les mêmes caractéristiques que les hommes. Ensuite, nous discutons de l’utilisation de la distribution contrefactuelle des salaires dans la décomposition de l’écart salarial. À la section 4, nous développons la méthode DFL, de nouveau en utilisant les poids de sondage. Puisque la méthode originale n’inclut pas ces poids, nous nommons cette nouvelle méthode « DFL pondérée ». Ensuite, à la section 5, nous proposons une nouvelle approche pour calculer la distribution contrefactuelle des salaires, en utilisant la méthode de calage (Deville et Särndal, 1992). Nous discutons de deux cas particuliers de calage, à savoir le calage linéaire et le calage par raking ratio (ou ratissage croisé). Le premier cas produit le même résultat que la méthode BO pondérée pour les salaires moyens. Le deuxième cas présente une approche similaire à la méthode DFL pondérée, mais sans émettre l’hypothèse d’un modèle logistique. Autrement dit, la technique proposée peut être considérée comme une généralisation des deux méthodes susmentionnées. La section 6 comprend un aperçu de l’ensemble de données utilisé, ainsi que les statistiques descriptives sur les salaires observés. Nous donnons aussi une brève description du modèle utilisé et des résultats obtenus en appliquant les méthodes discutées. Enfin, à la section 7, nous résumons les conclusions et à l’annexe B, nous présentons le calcul de la variance du salaire contrefactuel.


Date de modification :