Détermination conjointe de la stratification et de la répartition optimales de l'échantillon en utilisant un algorithme génétique

Warning Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Marco Ballin et Giulio Barcaroli1

Résumé

Le présent article offre une solution au problème de la détermination de la stratification optimale de la base de sondage de la population disponible en vue de minimiser le coût de l'échantillon requis pour satisfaire aux contraintes de précision sur un ensemble d'estimations cibles différentes. La solution est recherchée en explorant l'univers de toutes les stratifications qu'il est possible d'obtenir par classification croisée des variables auxiliaires catégoriques disponibles dans la base de sondage (les variables auxiliaires continues peuvent être transformées en variables catégoriques par des méthodes appropriées). Par conséquent, l'approche suivie est multivariée en ce qui concerne les variables cibles ainsi que les variables auxiliaires. L'algorithme proposé est fondé sur une approche évolutionniste non déterministe qui fait appel au paradigme de l'algorithme génétique. La caractéristique principale de l'algorithme est que l'on considère chaque stratification possible comme un individu susceptible d'évoluer dont l'adaptation est mesurée par le coût de l'échantillon associé requis pour satisfaire à un ensemble de contraintes de précision, ce coût étant calculé en appliquant l'algorithme de Bethel pour une répartition multivariée. Cet algorithme de stratification optimale, implémenté dans un module (ou package) R (SamplingStrata), a été appliqué jusqu'à présent à un certain nombre d'enquêtes courantes à l'Institut national de statistique de l'Italie : les résultats montrent systématiquement une amélioration importante de l'efficacité des échantillons obtenus comparativement aux stratifications adoptées antérieurement.

Mots clés

algorithme génétique; stratification optimale; plan de sondage; répartition de l'échantillon; module (ou package) R.

Table des matières

1 Introduction

2 Formalisation du problème d'optimisation

3 Application de l'algorithme génétique au problème de stratification optimale

4 Un exemple fondé sur le jeu de données Fleurs d'iris

5 Une application : l'Enquête italienne sur la structure des exploitations agricoles (ESEA)

6 Une autre application : l'Enquête mensuelle sur le lait et les produits laitiers

7 Conclusion et futurs travaux

 

 

 

 

 


1Marco Ballin et Giulio Barcaroli, Istituto Nazionale di Statistica, via C.Balbo 16 - 00184 Rome (Italie). Courriel : ballin@istat.it, barcarol@istat.it.

Date de modification :