Une généralisation du paradigme de Fellegi-Holt pour la localisation automatique des erreurs 7. Étude par simulations

Pour mettre à l’essai l’utilité potentielle de la nouvelle méthode de localisation des erreurs, on a mené une étude par simulations de petite envergure dans l’environnement R pour calcul statistique (R Development Core Team 2015). Une mise en œuvre prototype de l’algorithme de la figure 6.1 a été créée dans R. Dans le cadre de cet exercice, on a largement utilisé la fonctionnalité de vérification automatique fondée sur le paradigme de Fellegi-Holt du progiciel editrules (van der Loo et de Jonge 2012; de Jonge et van der Loo 2014). Le programme n’était pas optimisé pour assurer l’efficacité du calcul, mais il s’est révélé suffisamment rapide pour les problèmes de localisation des erreurs d’envergure relativement petite de l’étude par simulations. (Remarque : L’auteur peut fournir le code R utilisé sur demande.)

L’étude par simulations a été réalisée à l’aide d’enregistrements contenant cinq variables numériques qui devaient satisfaire les neuf règles de vérification linéaires suivantes :

x 1 + x 2 = x 3 , x 3 x 4 = x 5 , x j 0 , j { 1 , 2 , 3 , 4 } , x 1 x 2 , x 5 0 , 1 x 3 , x 5 0 , 5 x 3 . MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaafaqaaeGbda aaaeaaqaaaaaaaaaWdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqa baGccqGHRaWkpeGaamiEa8aadaWgaaWcbaWdbiaaikdaa8aabeaaaO qaaiabg2da98qacaWG4bWdamaaBaaaleaapeGaaG4maaWdaeqaaOWd biaacYcaa8aabaaabaWdbiaadIhapaWaaSbaaSqaa8qacaaIZaaapa qabaGccqGHsislpeGaamiEa8aadaWgaaWcbaWdbiaaisdaa8aabeaa aOqaaiabg2da98qacaWG4bWdamaaBaaaleaapeGaaGynaaWdaeqaaO WdbiaacYcaa8aabaaabaWdbiaaykW7caaMc8UaaGPaVlaaykW7caaM c8UaaGPaVlaaysW7caaMc8UaamiEa8aadaWgaaWcbaWdbiaadQgaa8 aabeaaaOqaa8qacqGHLjYScaaIWaGaaiilaaWdaeaapeGaamOAaiab gIGiopaacmaapaqaa8qacaaIXaGaaiilaiaaikdacaGGSaGaaG4mai aacYcacaaI0aaacaGL7bGaayzFaaGaaiilaaWdaeaapeGaaGPaVlaa ykW7caaMc8UaaGPaVlaaykW7caaMc8UaaGPaVlaaysW7caWG4bWdam aaBaaaleaapeGaaGymaaWdaeqaaaGcbaWdbiabgwMiZkaadIhapaWa aSbaaSqaa8qacaaIYaaapaqabaGcpeGaaiilaaWdaeaaaeaapeGaaG PaVlaaykW7caaMc8UaaGPaVlaaykW7caaMc8UaaGPaVlaaysW7caWG 4bWdamaaBaaaleaapeGaaGynaaWdaeqaaaGcbaWdbiabgwMiZkabgk HiTiaaicdacaqGSaGaaGymaiaadIhapaWaaSbaaSqaa8qacaaIZaaa paqabaGcpeGaaiilaaWdaeaaaeaapeGaaGPaVlaaykW7caaMc8UaaG PaVlaaykW7caaMc8UaaGPaVlaaysW7caWG4bWdamaaBaaaleaapeGa aGynaaWdaeqaaaGcbaWdbiabgsMiJkaaicdacaqGSaGaaGynaiaadI hapaWaaSbaaSqaa8qacaaIZaaapaqabaGcpeGaaiOlaaWdaeaaaaaa aa@A605@

On trouve généralement ce genre de règles de vérification pour les SSE, dans le cadre d’un ensemble de règles de vérification beaucoup plus vaste (Scholtus 2014).

Un ensemble aléatoire de données exempt d’erreurs contenant 2 000 enregistrements a été bâti à partir d’une distribution normale multivariée (à l’aide du progiciel mvtnorm) selon les paramètres suivants :

μ = ( 500 250 750 600 150 )           et           Σ = ( 10 000 -1 250 8 750 7 500 1 250 -1 250 5 000 3 750 4 000 -250 8 750 3 750 12 500 11 500 1 000 7 500 4 000 11 500 11 750 -250 1 250 -250 1 000 -250 1 250 ) . MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaahY7acqGH9aqpdaqadaWdaeaafaqabeqbbaaaaeaapeGaaGyn aiaaicdacaaIWaaapaqaa8qacaaIYaGaaGynaiaaicdaa8aabaWdbi aaiEdacaaI1aGaaGimaaWdaeaapeGaaGOnaiaaicdacaaIWaaapaqa a8qacaaIXaGaaGynaiaaicdaaaaacaGLOaGaayzkaaGaaiiOaiaacc kacaGGGcGaaiiOaiaacckacaqGLbGaaeiDaiaacckacaGGGcGaaiiO aiaacckacaGGGcGaaC4Odiabg2da9maabmaapaqaauaabiqafuaaaa aabaWdbiaabgdacaqGWaGaaeiiaiaabcdacaqGWaGaaeimaaWdaeaa peGaaeylaiaabgdacaqGGaGaaeOmaiaabwdacaqGWaaapaqaa8qaca qG4aGaaeiiaiaabEdacaqG1aGaaeimaaWdaeaapeGaae4naiaabcca caqG1aGaaeimaiaabcdaa8aabaWdbiaabgdacaqGGaGaaeOmaiaabw dacaqGWaaapaqaa8qacaqGTaGaaeymaiaabccacaqGYaGaaeynaiaa bcdaa8aabaWdbiaabwdacaqGGaGaaeimaiaabcdacaqGWaaapaqaa8 qacaqGZaGaaeiiaiaabEdacaqG1aGaaeimaaWdaeaapeGaaeinaiaa bccacaqGWaGaaeimaiaabcdaa8aabaWdbiaab2cacaqGYaGaaeynai aabcdaa8aabaWdbiaabIdacaqGGaGaae4naiaabwdacaqGWaaapaqa a8qacaqGZaGaaeiiaiaabEdacaqG1aGaaeimaaWdaeaapeGaaeymai aabkdacaqGGaGaaeynaiaabcdacaqGWaaapaqaa8qacaqGXaGaaeym aiaabccacaqG1aGaaeimaiaabcdaa8aabaWdbiaabgdacaqGGaGaae imaiaabcdacaqGWaaapaqaa8qacaqG3aGaaeiiaiaabwdacaqGWaGa aeimaaWdaeaapeGaaeinaiaabccacaqGWaGaaeimaiaabcdaa8aaba WdbiaabgdacaqGXaGaaeiiaiaabwdacaqGWaGaaeimaaWdaeaapeGa aeymaiaabgdacaqGGaGaae4naiaabwdacaqGWaaapaqaa8qacaqGTa GaaeOmaiaabwdacaqGWaaapaqaa8qacaqGXaGaaeiiaiaabkdacaqG 1aGaaeimaaWdaeaapeGaaeylaiaabkdacaqG1aGaaeimaaWdaeaape GaaeymaiaabccacaqGWaGaaeimaiaabcdaa8aabaWdbiaab2cacaqG YaGaaeynaiaabcdaa8aabaWdbiaabgdacaqGGaGaaeOmaiaabwdaca qGWaaaaaGaayjkaiaawMcaaiaac6caaaa@B52A@

Seuls les enregistrements satisfaisant à toutes les règles de vérification susmentionnées ont été inclus dans l’ensemble de données. Soulignons que Σ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrVfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa Wdbiaaho6aaaa@38EE@ est une matrice singulière de covariances comprenant les deux règles de vérification fondées sur une égalité. Techniquement, les données obtenues suivent une distribution normale singulière multivariée tronquée; voir de Waal et coll. (2011, pages 318ff) ou Tempelman (2007).

Les neuf opérations de vérification autorisées retenues dans le cadre de l’étude sont présentées au tableau 7.1. Soulignons que les cinq premières lignes correspondent aux opérations FH pour cet ensemble de données. Comme il est précisé dans le tableau, chaque opération de vérification est associée à un type d’erreur. Un ensemble de données synthétiques à vérifier a été créé par l’ajout aléatoire d’erreurs de ces types à l’ensemble de données exempt d’erreur susmentionné. La probabilité de chaque type d’erreur est indiquée dans la quatrième colonne du tableau 7.1. Le poids « idéal » qui y est associé selon (4.2) est précisé dans la dernière colonne.

Pour restreindre l’ampleur des calculs à effectuer, seuls les enregistrements exigeant trois opérations de vérification ou moins ont été pris en compte. Les enregistrements ne contenant aucune erreur ont aussi été retirés. Il restait donc 1 025 enregistrements à vérifier, chacun contenant une, deux ou trois des erreurs énumérées au tableau 7.1.

Tableau 7.1
Opérations de vérification autorisées aux fins de l’étude par simulations
Sommaire du tableau
Le tableau montre les résultats de Opérations de vérification autorisées aux fins de l’étude par simulations. Les données sont présentées selon nom (titres de rangée) et opération, type d’erreur associé, XXXX et XXXX(figurant comme en-tête de colonne).
nom opération type d’erreur associé p g MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meqabeqadiWaceGabeqabeWabeqaeeaakeaaqaaaaaaaaa WdbiaadchapaWaaSbaaSqaa8qacaWGNbaapaqabaaaaa@3C26@ w g MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meqabeqadiWaceGabeqabeWabeqaeeaakeaaqaaaaaaaaa WdbiaadEhapaWaaSbaaSqaa8qacaWGNbaapaqabaaaaa@3C2D@
FH1 imputer x 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ valeur erronée de x 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ 0,10 2,20
FH2 imputer x 2 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ valeur erronée de x 2 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ 0,08 2,44
FH3 imputer x 3 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ valeur erronée de x 3 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ 0,06 2,75
FH4 imputer x 4 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ valeur erronée de x 4 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ 0,04 3,18
FH5 imputer x 5 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ valeur erronée de x 5 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ 0,02 3,89
IC34 intervertir x 3 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ et x 4 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ valeurs réelles de x 3 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ et x 4 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ interverties 0,07 2,59
TF21 transférer une partie de x 2 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ à x 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ partie de la valeur réelle de x 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ déclarée comme faisant partie de x 2 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ 0,09 2,31
CS4 changer le signe de x 4 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ erreur de signe dans x 4 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ 0,11 2,09
CS5 changer le signe de x 5 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ erreur de signe dans x 5 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadIhapaWaaSbaaSqaa8qacaaIXaaapaqabaaaaa@3BF3@ 0,13 1,90

Plusieurs méthodes de localisation des erreurs ont été appliquées à l’ensemble de données. On a tout d’abord utilisé la méthode de localisation des erreurs fondée sur le paradigme de Fellegi-Holt (c’est-à-dire à l’aide des opérations de vérification FH1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXafv3ySLgzGmvETj2BSbqefm0B1jxALjhiov2D aebbfv3ySLgzGueE0jxyaibaieYhf9irVG0di9WrFfeaY=Hhbbf9Gq pepq0xc9vqpq0xbba9r8frFfeaY=biNkVc=f0xGqVeFfuj0=tqpue9 Wqpepec9sr=xfr=xfr=xmeaabaqaciGacaGaaeqabaWaaeaaeaaake aaieaajugybabaaaaaaaaapeGaa83eGaaa@39F1@ FH5 uniquement) et sur le nouveau paradigme (c’est-à-dire à l’aide de toutes les opérations de vérification du tableau 7.1). Les deux méthodes ont été mises à l’essai une fois à l’aide des poids « idéaux » indiqués dans le tableau 7.1 et une fois à l’aide de poids tous fixés à 1 (« aucun poids »). Ce dernier cas simule une situation où les opérations de vérification pertinentes sont connues, mais pas leurs fréquences respectives. Enfin, pour vérifier la robustesse de la nouvelle méthode de localisation des erreurs en cas de manque d’information à propos des opérations de vérification pertinentes, la méthode a aussi été appliquée en retirant l’une des opérations non-FH du tableau 7.1 de l’ensemble des opérations de vérification autorisées.

La qualité de la localisation des erreurs a été évaluée de deux façons. Tout d’abord, on a évalué dans quelle mesure les chemins optimaux des opérations de vérification trouvés par l’algorithme correspondaient à la distribution réelle des erreurs, en utilisant le tableau de contingences ci-dessous pour toutes les 1 025 × 9 = 9 225 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaacaqGXaGaae iiaiaabcdacaqGYaGaaeynaiabgEna0kaaiMdacqGH9aqpcaqG5aGa aeiiaiaabkdacaqGYaGaaeynaaaa@4276@ combinaisons possibles des enregistrements et des opérations de vérification :

Tableau 7.2
Tableau de contingences des erreurs et des opérations de vérification suggérées par l’algorithme
Sommaire du tableau
Le tableau montre les résultats de Tableau de contingences des erreurs et des opérations de vérification suggérées par l’algorithme opération de vérification suggérée et opération de vérification non suggérée (figurant comme en-tête de colonne).
  opération de vérification suggérée opération de vérification non suggérée
l’erreur associée s’est produite VP MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadAfacaWGqbaaaa@3B91@ FN MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadAeacaWGobaaaa@3B7F@
l’erreur associée ne s’est pas produite FP MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadAeacaWGqbaaaa@3B81@ VN MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa WdbiaadAfacaWGobaaaa@3B8F@

À partir de ce tableau, on a calculé des indicateurs mesurant la proportion de faux négatifs (FN), de faux positifs (FP) et de l’ensemble des mauvaises décisions, respectivement :

α = F N V P + F N ;           β = F P F P + V N ;           δ = F N + F P V P + F N + F P + V N MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa Wdbiabeg7aHjabg2da9maalaaapaqaa8qacaWGgbGaamOtaaWdaeaa peGaamOvaiaadcfacqGHRaWkcaWGgbGaamOtaaaacaGG7aGaaiiOai aacckacaGGGcGaaiiOaiaacckacqaHYoGycqGH9aqpdaWcaaWdaeaa peGaamOraiaadcfaa8aabaWdbiaadAeacaWGqbGaey4kaSIaamOvai aad6eaaaGaai4oaiaacckacaGGGcGaaiiOaiaacckacaGGGcGaeqiT dqMaeyypa0ZaaSaaa8aabaWdbiaadAeacaWGobGaey4kaSIaamOrai aadcfaa8aabaWdbiaadAfacaWGqbGaey4kaSIaamOraiaad6eacqGH RaWkcaWGgbGaamiuaiabgUcaRiaadAfacaWGobaaaaaa@6684@

Des indicateurs similaires sont présentés dans de Waal et coll. (2011, pages 410-411). On a aussi calculé ρ ¯ = 1 ρ , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa Wdbiqbeg8aY9aagaqea8qacqGH9aqpcaaIXaGaeyOeI0IaeqyWdiNa aiilaaaa@3ED3@ ρ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa Wdbiabeg8aYbaa@397E@ correspond à la fraction des enregistrements de l’ensemble de données pour lesquels l’algorithme de localisation des erreurs a trouvé exactement la bonne solution. Un bon algorithme de localisation des erreurs devrait donner des notes faibles pour les quatre indicateurs.

Il importe de souligner que les indicateurs de qualité ci-dessus désavantagent la méthode originale de Fellegi-Holt, qui ne fait pas appel à toutes les opérations de vérification énumérées au tableau 7.1. On a donc aussi calculé un deuxième ensemble d’indicateurs de qualité α , β , δ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa Wdbiabeg7aHjaacYcacqaHYoGycaGGSaGaeqiTdqgaaa@3E03@ et ρ ¯ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa Wdbiqbeg8aY9aagaqeaaaa@39A5@ portant sur les valeurs erronées plutôt que sur les opérations de vérification. Dans ce cas, α MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meaabaqaciGacaGaaeqabaWaaeaaeaaakeaaqaaaaaaaaa Wdbiabeg7aHbaa@395D@ mesure la proportion des valeurs de l’ensemble de données comportant des erreurs, mais non modifiées par la solution optimale au problème de localisation des erreurs, et de même pour les autres mesures.

Le tableau 7.3 présente les résultats de l’étude par simulations pour les deux ensembles d’indicateurs de qualité. Dans les deux cas, on constate une amélioration notable de la qualité des résultats de la localisation des erreurs de la méthode faisant appel à toutes les opérations de vérification, comparativement à la méthode utilisant uniquement les opérations FH. En outre, le fait d’omettre une seule opération de vérification pertinente de l’ensemble des opérations de vérification autorisées compromettait la qualité de la localisation des erreurs. Dans certains cas, cet effet était assez important MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXafv3ySLgzGmvETj2BSbqefm0B1jxALjhiov2D aebbfv3ySLgzGueE0jxyaibaieYhf9irVG0di9WrFfeaY=Hhbbf9Gq pepq0xc9vqpq0xbba9r8frFfeaY=biNkVc=f0xGqVeFfuj0=tqpue9 Wqpepec9sr=xfr=xfr=xmeaabaqaciGacaGaaeqabaWaaeaaeaaake aaieaajugybabaaaaaaaaapeGaa83eGaaa@39F1@ particulièrement en ce qui concerne les opérations de vérification utilisées MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXafv3ySLgzGmvETj2BSbqefm0B1jxALjhiov2D aebbfv3ySLgzGueE0jxyaibaieYhf9irVG0di9WrFfeaY=Hhbbf9Gq pepq0xc9vqpq0xbba9r8frFfeaY=biNkVc=f0xGqVeFfuj0=tqpue9 Wqpepec9sr=xfr=xfr=xmeaabaqaciGacaGaaeqabaWaaeaaeaaake aaieaajugybabaaaaaaaaapeGaa83eGaaa@39F1@ , mais les résultats de la nouvelle méthode de localisation des erreurs demeurent considérablement supérieurs à ceux de la méthode de Fellegi-Holt. Contrairement aux attentes, le fait de ne pas utiliser des poids de confiance différents a contribué à améliorer légèrement la qualité des résultats de la localisation des erreurs pour cet ensemble de données selon la méthode de Fellegi-Holt (pour les deux ensembles d’indicateurs) et aussi, dans une certaine mesure, selon la nouvelle méthode (second ensemble d’indicateurs seulement). Enfin, il semble que l’utilisation de toutes les opérations de vérification ait contribué à accroître le temps de calcul nécessaire par rapport à l’utilisation des opérations FH uniquement, mais pas de façon spectaculaire.

Tableau 7.3
Qualité de la localisation des erreurs en fonction des opérations de vérification utilisées et des valeurs erronées recensées; temps de calcul requis
Sommaire du tableau
Le tableau montre les résultats de Qualité de la localisation des erreurs en fonction des opérations de vérification utilisées et des valeurs erronées recensées; temps de calcul requis. Les données sont présentées selon méthode (titres de rangée) et indicateurs de qualité (opérations de vérification), indicateurs de qualité (valeurs erronées) et temps*, calculées selon XXXX unités de mesure (figurant comme en-tête de colonne).
méthode indicateurs de qualité (opérations de vérification) indicateurs de qualité (valeurs erronées) tempsNote *
α MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meqabeqadiWaceGabeqabeWabeqaeeaakeaaqaaaaaaaaa Wdbiabeg7aHbaa@3B8A@ β MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meqabeqadiWaceGabeqabeWabeqaeeaakeaaqaaaaaaaaa Wdbiabek7aIbaa@3B8C@ δ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meqabeqadiWaceGabeqabeWabeqaeeaakeaaqaaaaaaaaa Wdbiabes7aKbaa@3B90@ ρ ¯ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meqabeqadiWaceGabeqabeWabeqaeeaakeaaqaaaaaaaaa Wdbiqbeg8aY9aagaqeaaaa@3BD2@ α MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meqabeqadiWaceGabeqabeWabeqaeeaakeaaqaaaaaaaaa Wdbiabeg7aHbaa@3B8A@ β MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meqabeqadiWaceGabeqabeWabeqaeeaakeaaqaaaaaaaaa Wdbiabek7aIbaa@3B8C@ δ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meqabeqadiWaceGabeqabeWabeqaeeaakeaaqaaaaaaaaa Wdbiabes7aKbaa@3B90@ ρ ¯ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqk0Jf9crFfpeea0xh9v8qiW7rqqrFfpeea0xe9Lqpe0x e9q8qqvqFr0dXdHiVc=bYP0xH8peuj0lXxdrpe0=1qpeeaY=rrVue9 Fve9Fve8meqabeqadiWaceGabeqabeWabeqaeeaakeaaqaaaaaaaaa Wdbiqbeg8aY9aagaqeaaaa@3BD2@
Fellegi-Holt (avec poids) 74 % 12 % 23 % 80 % 19 % 10 % 13 % 32 % 46
Fellegi-Holt (sans poids) 70 % 12 % 21 % 74 % 13 % 8 % 9 % 24 % 33
toutes les opérations (avec poids) 14 % 3 % 5 % 24 % 10 % 5 % 7 % 17 % 98
sauf IC34 29 % 5 % 9 % 35 % 15 % 9 % 11 % 29 % 113
sauf TF21 34 % 5 % 10 % 37 % 10 % 5 % 7 % 18 % 80
sauf CS4 28 % 6 % 9 % 39 % 10 % 5 % 7 % 17 % 80
sauf CS5 35 % 7 % 10 % 47 % 11 % 6 % 7 % 18 % 82
toutes les opérations (sans poids) 27 % 5 % 8 % 36 % 6 % 4 % 5 % 13 % 99
Date de modification :