2. L’approche d’ajustement minimal
Jeroen Pannekoek et Li-Chun Zhang
Précédent | Suivant
2.1 Le problème d’optimisation
Nous proposons de résoudre le problème
de cohérence décrit plus haut en ajustant les variables libres simultanément et
aussi peu que possible, de manière à ce que toutes les règles de vérification soient
satisfaites. Représentons la partie ajustable de l’enregistrement avant l’ajustement par le vecteur
de dimension
et après l’ajustement, par le vecteur
de dimension
correspondant. Le problème d’optimisation peut
être formulé comme suit :
où
est une fonction
mesurant la distance (ou divergence) entre
et
et
est la matrice
comptable de dimensions
associée aux
contraintes sur
données en
(1.1). Nous considérerons différentes fonctions
à la section 2.2.
Les conditions pour une solution du
problème de minimisation (2.1) peuvent être trouvées en inspectant le lagrangien
pour ce problème, lequel peut s’écrire sous la forme
où
est un vecteur
de dimension
de multiplicateurs de Lagrange, ou
variables duales, avec composantes
une pour chacune
des
contraintes, et
est la
ligne (correspondant
à la contrainte
de la matrice comptable
Notons qu’une contrainte
de non-négativité additionnelle doit être appliquée à chaque
correspondant à une
contrainte d’inégalité, mais non aux
des contraintes
d’égalité.
La théorie de l’optimisation montre
bien que, pour une fonction convexe
et des contraintes linéaires,
la solution de (2.1) est donnée par les vecteurs
qui satisfont ce qu’il est
convenu d’appeler les conditions de Karush-Kuhn-Tucker
(KKT) (voir, par exemple, Luenberger 1984;
Boyd et Vandenberghe 2004). L’une d’elles est que le gradient du lagrangien
en ce qui concerne
est nul quand il est évalué à
c’est-à-dire
où
est l’élément
de
et
le gradient de
en ce qui
concerne
évalué à
et
et
celui de
L’examen de (2.3)
montre comment divers choix de
mènent à
différentes solutions du problème d’ajustement, auxquelles nous donnons le nom
de modèles d’ajustement.
2.2 Fonctions de distance et modèles d’ajustement
Une fonction de distance d’usage très
répandu dans de nombreux domaines de la statistique est la fonction des
moindres carrés pondérés (MCP) donnée par
où
est une matrice diagonale dont
les éléments diagonaux sont
pour
Nous obtenons alors, à partir
de (2.3), le modèle d’ajustement
Le
critère MCP aboutit donc à des ajustements additifs : l’ajustement total
de la valeur initiale
est égal à la somme
pondérée des ajustements qui correspondent à chacune des
contraintes. L’ajustement
dû à la
contrainte dépend
des éléments suivants :
-
le paramètre d’ajustement (c’est-à-dire
la variable duale)
qui décrit la grandeur de
l’ajustement. Une plus petite valeur de
(en valeur absolue si
désigne une contrainte d’égalité)
correspond à un plus petit ajustement; une valeur nulle de
signifie qu’aucun ajustement dû à
la contrainte en question n’a lieu;
-
la constante
(c’est-à-dire un élément de la matrice
comptable) qui décrit la direction et la grandeur de l’ajustement de la
variable
Souvent,
vaut 1, -1 ou 0 et décrit alors
si
est ajustée par
ou ne l’est pas du tout;
-
le poids
les variables dont les poids
sont élevés sont moins ajustées que celles dont les poids sont faibles. Le cas
particulier de
donne le critère des moindres
carrés ordinaires (MCO), où la quantité
d’ajustement due à chaque contrainte est la même pour toutes les variables
pertinentes.
Un choix particulier des poids est
pour
auquel cas les carrés des
ajustements relatifs sont minimisés, et une grande valeur initiale (c’est-à-dire
fait l’objet d’un plus grand
ajustement qu’une valeur plus petite en valeur absolue. En divisant (2.4)
par
nous obtenons
qui
est un modèle d’ajustement additif pour le ratio entre les valeurs
ajustée et non ajustée. On notera qu’il s’agit du développement en série de Taylor
d’ordre un (c’est-à-dire autour de 0 pour tous les
de l’ajustement
multiplicatif donné par
Partant
de (2.5) nous voyons que
détermine la variation relative de
la valeur initiale
à la valeur ajustée
qui en valeur
absolue est habituellement beaucoup plus petite que l’unité. Par exemple,
implique un ajustement
de
de
si
ce qui est grand
en pratique. Les produits des
sont par
conséquent souvent beaucoup plus petits que les
proprement dits,
auquel cas (2.5) devient une bonne approximation de (2.6), et l’on peut
considérer l’ajustement MCP comme étant donné approximativement par le produit
de tous les ajustements multiplicatifs propres aux contraintes.
L’ajustement multiplicatif par (2.6) peut
changer le signe de
si
pour une certaine unité
Les ajustements
multiplicatifs qui préservent le signe de la valeur initiale
peuvent être obtenus en
utilisant la mesure de divergence de Kullback-Leibler
(KL) (qui n’est pas formellement une fonction de distance) donnée par
Nous avons alors, à partir de
(2.3), le modèle d’ajustement
L’ajustement
dû à la contrainte
est égal à si
vaut (c’est-à-dire
aucun ajustement), il est égal à
si
vaut , et il
est égal à
si
vaut
Puisque
est l’approximation
d’ordre un de
autour de
si
on peut
s’attendre à ce que les critères MCP et KL donnent des ajustements similaires à
condition que ceux-ci soient petits ou moyens.
2.3 Méthodes de résolution du problème d’ajustement
minimal
Le problème général d’optimisation convexe
(2.1) peut être résolu explicitement si la fonction d’objectif est celle des
moindres carrés pondérés et qu’il existe seulement des contraintes d’égalité. Dans
ce cas, le lagrangien est
et les équations qu’il faut
résoudre sont
En
résolvant (2.8) pour trouver
et en
substituant le résultat dans (2.9), nous obtenons
et alors,
par substitution inverse dans (2.8), nous obtenons explicitement
Pour d’autres fonctions d’objectif et avec
des contraintes d’inégalité en général, il n’existe pas de solution explicite
du problème (2.1). Cependant, de nombreux algorithmes en accès libre ou
commerciaux sont disponibles pour résoudre le problème d’optimisation convexe. Pour
l’application décrite dans le présent article, nous avons utilisé le langage de
programmation R et appliqué le Successive Projection Algorithm (SPA) (ou row action algorithm)
voir par exemple, Censor et
Zenios (1997). Le SPA est un algorithme itératif qui utilise les contraintes
(lignes de la matrice comptable) une à une. En une itération, le vecteur
est ajusté séquentiellement à chacune des
contraintes. L’opération d’ajustement avec une seule contrainte requiert
uniquement la mise à jour des éléments du vecteur
qui interviennent dans cette contrainte (correspondant
aux éléments non nuls de la ligne traitée de la matrice comptable). Une fois
que toutes les contraintes ont été traitées, l’itération s’achève et la
suivante commence. Pour le critère MCP, il existe un module (ou package) R qui
met en œuvre l’algorithme SPA et est conçu spécialement pour le problème
d’ajustement (van der Loo 2012).
2.4 Retour à l’exemple
Le tableau 2.1 montre les
ajustements minimaux apportés à l’enregistrement du tableau 1.1 en utilisant
les critères MCO, MCP et KL, respectivement. Les valeurs observées sont
traitées comme fixes et inscrites en caractères gras, et les valeurs imputées sont
ajustables. Pour la méthode MCP, nous utilisons
ce qui donne des résultats
égaux à ceux produits par le critère KL jusqu’à la première décimale.
Pour les deux schémas de réponse, la procédure
d’ajustement MCO donne pour la variable Autre chiffre d’affaires une valeur négative
qui n’est pas acceptable (tableau 2.1). Quand la procédure MCO est
réexécutée avec une contrainte de non-négativité pour la variable Autre chiffre
d’affaires, le résultat est simplement zéro pour cette variable et 950 pour la
variable Chiffre d’affaires principal en raison de la contrainte
Sans la contrainte de
non-négativité, les ajustements MCO sont de -40 pour
et
et de -16 pour
et
c’est-à-dire le même ajustement pour chaque paire de variables
figurant dans la même contrainte. La variable Total des coûts
fait partie de deux
contraintes et son ajustement total comprend deux composantes additives. Une composante
est due à la contrainte
et l’autre, à
Pour le schéma de
réponse (I), la première composante est -48 et la deuxième composante est
16, et leur somme est égale à -32 dans le
tableau 2.1.
Tableau 2.1
Imputation et ajustement de l’enregistrement d’entreprise du tableau 1.1. ID : Imputation partielle par donneur sans ajustement; MCO : distance selon les moindres carrés ordinaires; MCP : distance selon les moindres carrés pondérés; KL : mesure de divergence de Kullback-Leibler; RG : ajustement par le ratio généralisé
Sommaire du tableau
Le tableau montre les résultats de Imputation et ajustement de l’enregistrement d’entreprise du tableau 1.1. ID : Imputation partielle par donneur sans ajustement; MCO : distance selon les moindres carrés ordinaires; MCP : distance selon les moindres carrés pondérés; KL : mesure de divergence de Kullback-Leibler; RG : ajustement par le ratio généralisé. Les données sont présentées selon Variable (titres de rangée) et Nom, Réponse (I) et Réponse (II)(figurant comme en-tête de colonne).
Variable |
Nom |
Réponse (I) |
Réponse (II) |
ID |
MCO |
MCP/KL |
RG |
ID |
MCO |
MCP/KL |
RG |
|
Profit |
330 |
282 |
291 |
304 |
330 |
260 |
249 |
239 |
|
Effectif |
20 |
20 |
20 |
18 |
25 |
25 |
25 |
25 |
|
Chiffre d’affaires principal |
1 000 |
960 |
922 |
922 |
1 000 |
960 |
922 |
921 |
|
Autre chiffre d’affaires |
30 |
-10 |
28 |
28 |
30 |
-10 |
28 |
29 |
|
Chiffre d’affaires |
950 |
950 |
950 |
950 |
950 |
950 |
950 |
950 |
|
Rémunération |
500 |
484 |
470 |
461 |
550 |
550 |
550 |
550 |
|
Autres coûts |
200 |
184 |
188 |
184 |
200 |
140 |
151 |
161 |
|
Total des coûts |
700 |
668 |
658 |
646 |
700 |
690 |
701 |
711 |
Les ajustements MCP/KL sont plus grands,
en valeur absolue, pour les grandes valeurs imputées que pour les valeurs plus
petites. En particulier, l’ajustement pour Autre chiffre d’affaires n’est que
de -2,3, de sorte qu’aucune valeur ajustée négative n’est produite dans ce cas,
tandis que l’ajustement pour Chiffre d’affaires principal est de -77,7. On peut
observer la nature multiplicative de ces ajustements car le facteur d’ajustement
pour ces variables est égal à 0,92 (pour les deux schémas de réponse). Le facteur
d’ajustement pour les variables Rémunération et Autres coûts sous le schéma de
réponse (I) est égal à 0,94 dans les deux cas parce que ces variables figurent
dans la même contrainte
de sorte que le ratio de leurs
valeurs initiales n’est pas modifié par cet ajustement. Cependant, le ratio initial
de chacune de ces variables à la variable Total des coûts n’est pas préservé,
parce que le total des coûts possède un signe différent dans la contrainte
et, de surcroît, il fait
aussi partie de la contrainte
si bien qu’il est sujet à
deux facteurs d’ajustement.
Précédent | Suivant