Recherche par

2. L’approche d’ajustement minimal

Jeroen Pannekoek et Li-Chun Zhang

2.1 Le problème d’optimisation

Nous proposons de résoudre le problème de cohérence décrit plus haut en ajustant les variables libres simultanément et aussi peu que possible, de manière à ce que toutes les règles de vérification soient satisfaites. Représentons la partie ajustable de l’enregistrement avant l’ajustement par le vecteur $x_{0}$ de dimension $J$ et après l’ajustement, par le vecteur $\tilde{x}$ de dimension $J$ correspondant. Le problème d’optimisation peut être formulé comme suit :

$\begin{array}{l} \tilde{x} & = & \arg \min_{x} D (x, x_{0}) \\ s .c . & A \tilde{x} \leq b, \end{array} (2.1)$

où $D (x, x_{0})$ est une fonction mesurant la distance (ou divergence) entre $x$ et $x_{0},$ et $A$ est la matrice comptable de dimensions $K \times J$ associée aux $K$ contraintes sur $\tilde{x}$ données en (1.1). Nous considérerons différentes fonctions $D$ à la section 2.2.

Les conditions pour une solution du problème de minimisation (2.1) peuvent être trouvées en inspectant le lagrangien pour ce problème, lequel peut s’écrire sous la forme

$L (x, α) = D (x, x_{0}) + α^{T} (A x - b) (2.2)$

où $α$ est un vecteur de dimension $K$ de multiplicateurs de Lagrange, ou variables duales, avec composantes $α_{k},$ une pour chacune des $K$ contraintes, et $a_{k}$ est la $k^{e}$ ligne (correspondant à la contrainte $k)$ de la matrice comptable $A_{K \times J} .$ Notons qu’une contrainte de non-négativité additionnelle doit être appliquée à chaque $α_{k}$ correspondant à une contrainte d’inégalité, mais non aux $α_{k}$ des contraintes d’égalité.

La théorie de l’optimisation montre bien que, pour une fonction convexe $D (x, x_{0})$ et des contraintes linéaires, la solution de (2.1) est donnée par les vecteurs $\tilde{x}, \tilde{α}$ qui satisfont ce qu’il est convenu d’appeler les conditions de Karush-Kuhn-Tucker (KKT) (voir, par exemple, Luenberger 1984; Boyd et Vandenberghe 2004). L’une d’elles est que le gradient du lagrangien en ce qui concerne $x$ est nul quand il est évalué à $\tilde{x}, \tilde{α},$ c’est-à-dire

${L^{'}}_{x_{j}} (\tilde{x}, \tilde{α}) = {D^{'}}_{x_{j}} (\tilde{x}, x_{0}) + \sum_{k} a_{k j} {\tilde{α}}_{k} = 0, (2.3)$

où $a_{k j}$ est l’élément $(k, j)$ de $A,$ et ${L^{'}}_{x_{j}} (\tilde{x}, \tilde{α}),$ le gradient de $L$ en ce qui concerne $x_{j}$ évalué à $\tilde{x}$ et $\tilde{α},$ et ${D^{'}}_{x_{j}},$ celui de $D .$ L’examen de (2.3) montre comment divers choix de $D$ mènent à différentes solutions du problème d’ajustement, auxquelles nous donnons le nom de modèles d’ajustement.

2.2 Fonctions de distance et modèles d’ajustement

Une fonction de distance d’usage très répandu dans de nombreux domaines de la statistique est la fonction des moindres carrés pondérés (MCP) donnée par $D (x, x_{0}) = 1 / 2 {(x - x_{0})}^{T} W (x - x_{0}),$ où $W$ est une matrice diagonale dont les éléments diagonaux sont $w_{j},$ pour $j = 1, ..., J .$ Nous obtenons alors, à partir de (2.3), le modèle d’ajustement

${\tilde{x}}_{j} = x_{0, j} - \frac{1}{w_{j}} \sum_{k} a_{k j} {\tilde{α}}_{k} . (2.4)$

Le critère MCP aboutit donc à des ajustements additifs : l’ajustement total de la valeur initiale $x_{0, j}$ est égal à la somme pondérée des ajustements qui correspondent à chacune des $K$ contraintes. L’ajustement dû à la $k^{e}$ contrainte dépend des éléments suivants :

le paramètre d’ajustement (c’est-à-dire la variable duale) ${\tilde{α}}_{k}$ qui décrit la grandeur de l’ajustement. Une plus petite valeur de ${\tilde{α}}_{k}$ (en valeur absolue si $k$ désigne une contrainte d’égalité) correspond à un plus petit ajustement; une valeur nulle de ${\tilde{α}}_{k}$ signifie qu’aucun ajustement dû à la contrainte en question n’a lieu;
la constante $a_{k j}$ (c’est-à-dire un élément de la matrice comptable) qui décrit la direction et la grandeur de l’ajustement de la variable $j .$ Souvent, $a_{k j}$ vaut 1, -1 ou 0 et décrit alors si $x_{0, j}$ est ajustée par ${\tilde{α}}_{k}, - {\tilde{α}}_{k}$ ou ne l’est pas du tout;
le poids $w_{j} :$ les variables dont les poids sont élevés sont moins ajustées que celles dont les poids sont faibles. Le cas particulier de $w_{j} \equiv 1$ donne le critère des moindres carrés ordinaires (MCO), où la quantité d’ajustement due à chaque contrainte est la même pour toutes les variables pertinentes.

Un choix particulier des poids est $w_{j} = 1 / x_{0, j},$ pour $j = 1, ..., J,$ auquel cas les carrés des ajustements relatifs sont minimisés, et une grande valeur initiale (c’est-à-dire $x_{0, j})$ fait l’objet d’un plus grand ajustement qu’une valeur plus petite en valeur absolue. En divisant (2.4) par $x_{0, j},$ nous obtenons

$\frac{{\tilde{x}}_{j}}{x_{0, j}} = 1 - \sum_{k} a_{k j} {\tilde{α}}_{k}, (2.5)$

qui est un modèle d’ajustement additif pour le ratio entre les valeurs ajustée et non ajustée. On notera qu’il s’agit du développement en série de Taylor d’ordre un (c’est-à-dire autour de 0 pour tous les ${\tilde{α}}_{k})$ de l’ajustement multiplicatif donné par

$\frac{{\tilde{x}}_{j}}{x_{0, j}} = \prod_{k} (1 - a_{k j} {\tilde{α}}_{k}) . (2.6)$

Partant de (2.5) nous voyons que ${\tilde{α}}_{k}$ détermine la variation relative de la valeur initiale $x_{0, j}$ à la valeur ajustée ${\tilde{x}}_{j},$ qui en valeur absolue est habituellement beaucoup plus petite que l’unité. Par exemple, ${\tilde{α}}_{k} = \pm 0,2$ implique un ajustement de $| 20 % |$ de $x_{0, j}$ si $a_{k j} = \pm 1,$ ce qui est grand en pratique. Les produits des ${\tilde{α}}_{k}$ sont par conséquent souvent beaucoup plus petits que les $α_{k}$ proprement dits, auquel cas (2.5) devient une bonne approximation de (2.6), et l’on peut considérer l’ajustement MCP comme étant donné approximativement par le produit de tous les ajustements multiplicatifs propres aux contraintes.

L’ajustement multiplicatif par (2.6) peut changer le signe de $x_{0, j}$ si $a_{k j} {\tilde{α}}_{k} > 1$ pour une certaine unité $k .$ Les ajustements multiplicatifs qui préservent le signe de la valeur initiale $x_{0, j}$ peuvent être obtenus en utilisant la mesure de divergence de Kullback-Leibler (KL) (qui n’est pas formellement une fonction de distance) donnée par $D_{K L} = \sum_{j} x_{j} (\ln x_{j} - \ln x_{0, j} - 1) .$ Nous avons alors, à partir de (2.3), le modèle d’ajustement

${\tilde{x}}_{j} = x_{0, j} \prod_{k} \exp (- a_{k j} {\tilde{α}}_{k}) . (2.7)$

L’ajustement dû à la contrainte $k$ est égal à $1$ si $a_{k j}$ vaut $0$ (c’est-à-dire aucun ajustement), il est égal à $\exp ({\tilde{α}}_{k})$ si $a_{k j}$ vaut $1$ , et il est égal à $1 / \exp ({\tilde{α}}_{k})$ si $a_{i k}$ vaut $- 1.$ Puisque $1 - a_{k j} {\tilde{α}}_{k}$ est l’approximation d’ordre un de $\exp (- a_{k j} {\tilde{α}}_{k})$ autour de ${\tilde{α}}_{k} = 0$ si $a_{k j} \pm 1,$ on peut s’attendre à ce que les critères MCP et KL donnent des ajustements similaires à condition que ceux-ci soient petits ou moyens.

2.3 Méthodes de résolution du problème d’ajustement minimal

Le problème général d’optimisation convexe (2.1) peut être résolu explicitement si la fonction d’objectif est celle des moindres carrés pondérés et qu’il existe seulement des contraintes d’égalité. Dans ce cas, le lagrangien est $L (x, α) = 1 / 2 {(x - x_{0})}^{T} W (x - x_{0}) + α^{T} (A x - b),$ et les équations qu’il faut résoudre sont

${L^{'}}_{x} (x, α) = W (x - x_{0}) + A^{T} α = 0 (2.8)$

${L^{'}}_{α} (x, α) = A x - b = 0 . (2.9)$

En résolvant (2.8) pour trouver $x$ et en substituant le résultat dans (2.9), nous obtenons

$\tilde{α} = {(A W^{- 1} A^{T})}^{- 1} (A x_{0} - b)$

et alors, par substitution inverse dans (2.8), nous obtenons explicitement

$\tilde{x} = x_{0} - W^{- 1} A^{T} {(A W^{- 1} A^{T})}^{- 1} (A x_{0} - b) . (2.10)$

Pour d’autres fonctions d’objectif et avec des contraintes d’inégalité en général, il n’existe pas de solution explicite du problème (2.1). Cependant, de nombreux algorithmes en accès libre ou commerciaux sont disponibles pour résoudre le problème d’optimisation convexe. Pour l’application décrite dans le présent article, nous avons utilisé le langage de programmation R et appliqué le Successive Projection Algorithm (SPA) (ou row action algorithm) $-$ voir par exemple, Censor et Zenios (1997). Le SPA est un algorithme itératif qui utilise les contraintes (lignes de la matrice comptable) une à une. En une itération, le vecteur $x$ est ajusté séquentiellement à chacune des contraintes. L’opération d’ajustement avec une seule contrainte requiert uniquement la mise à jour des éléments du vecteur $x$ qui interviennent dans cette contrainte (correspondant aux éléments non nuls de la ligne traitée de la matrice comptable). Une fois que toutes les contraintes ont été traitées, l’itération s’achève et la suivante commence. Pour le critère MCP, il existe un module (ou package) R qui met en œuvre l’algorithme SPA et est conçu spécialement pour le problème d’ajustement (van der Loo 2012).

2.4 Retour à l’exemple

Le tableau 2.1 montre les ajustements minimaux apportés à l’enregistrement du tableau 1.1 en utilisant les critères MCO, MCP et KL, respectivement. Les valeurs observées sont traitées comme fixes et inscrites en caractères gras, et les valeurs imputées sont ajustables. Pour la méthode MCP, nous utilisons $w_{j} = 1 / x_{0, j},$ ce qui donne des résultats égaux à ceux produits par le critère KL jusqu’à la première décimale.

Pour les deux schémas de réponse, la procédure d’ajustement MCO donne pour la variable Autre chiffre d’affaires une valeur négative qui n’est pas acceptable (tableau 2.1). Quand la procédure MCO est réexécutée avec une contrainte de non-négativité pour la variable Autre chiffre d’affaires, le résultat est simplement zéro pour cette variable et 950 pour la variable Chiffre d’affaires principal en raison de la contrainte $a 2.$ Sans la contrainte de non-négativité, les ajustements MCO sont de -40 pour $x_{3}$ et $x_{4},$ et de -16 pour $x_{6}$ et $x_{7},$ c’est-à-dire le même ajustement pour chaque paire de variables figurant dans la même contrainte. La variable Total des coûts $(x_{8})$ fait partie de deux contraintes et son ajustement total comprend deux composantes additives. Une composante est due à la contrainte $a 1,$ et l’autre, à $a 3.$ Pour le schéma de réponse (I), la première composante est -48 et la deuxième composante est 16, et leur somme est égale à -32 dans le tableau 2.1.

Tableau 2.1
Imputation et ajustement de l’enregistrement d’entreprise du tableau 1.1. ID : Imputation partielle par donneur sans ajustement; MCO : distance selon les moindres carrés ordinaires; MCP : distance selon les moindres carrés pondérés; KL : mesure de divergence de Kullback-Leibler; RG : ajustement par le ratio généralisé
Sommaire du tableau
Le tableau montre les résultats de Imputation et ajustement de l’enregistrement d’entreprise du tableau 1.1. ID : Imputation partielle par donneur sans ajustement; MCO : distance selon les moindres carrés ordinaires; MCP : distance selon les moindres carrés pondérés; KL : mesure de divergence de Kullback-Leibler; RG : ajustement par le ratio généralisé. Les données sont présentées selon Variable (titres de rangée) et Nom, Réponse (I) et Réponse (II)(figurant comme en-tête de colonne).
Variable	Nom	Réponse (I)				Réponse (II)
Variable	Nom	ID	MCO	MCP/KL	RG	ID	MCO	MCP/KL	RG
$x_{1}$	Profit	330	282	291	304	330	260	249	239
$x_{2}$	Effectif	20	20	20	18	25	25	25	25
$x_{3}$	Chiffre d’affaires principal	1 000	960	922	922	1 000	960	922	921
$x_{4}$	Autre chiffre d’affaires	30	-10	28	28	30	-10	28	29
$x_{5}$	Chiffre d’affaires	950	950	950	950	950	950	950	950
$x_{6}$	Rémunération	500	484	470	461	550	550	550	550
$x_{7}$	Autres coûts	200	184	188	184	200	140	151	161
$x_{8}$	Total des coûts	700	668	658	646	700	690	701	711

Les ajustements MCP/KL sont plus grands, en valeur absolue, pour les grandes valeurs imputées que pour les valeurs plus petites. En particulier, l’ajustement pour Autre chiffre d’affaires n’est que de -2,3, de sorte qu’aucune valeur ajustée négative n’est produite dans ce cas, tandis que l’ajustement pour Chiffre d’affaires principal est de -77,7. On peut observer la nature multiplicative de ces ajustements car le facteur d’ajustement pour ces variables est égal à 0,92 (pour les deux schémas de réponse). Le facteur d’ajustement pour les variables Rémunération et Autres coûts sous le schéma de réponse (I) est égal à 0,94 dans les deux cas parce que ces variables figurent dans la même contrainte $a 3,$ de sorte que le ratio de leurs valeurs initiales n’est pas modifié par cet ajustement. Cependant, le ratio initial de chacune de ces variables à la variable Total des coûts n’est pas préservé, parce que le total des coûts possède un signe différent dans la contrainte $a 3$ et, de surcroît, il fait aussi partie de la contrainte $a 1,$ si bien qu’il est sujet à deux facteurs d’ajustement.

Précédent | Suivant

Date de modification :: 2015-11-27

Sélection de la langue

Recherche et menus

Recherche

Publications

Techniques d’enquête