3.5 Estimation
3.5.2 Erreur d’échantillonnage

Début du texte

Une autre partie importante de l'estimation consiste à estimer l'ampleur de l'erreur d'échantillonnage dans l'estimation. Ceci permet de mesurer la précision des estimations de l'enquête pour le plan d'échantillonnage spécifique. L'erreur d'échantillonnage ne peut être estimée que si un échantillonnage probabiliste est utilisé.

L'erreur d'échantillonnage est l'erreur causée par l'observation d'un échantillon au lieu de l'ensemble de la population. Elle résulte de l'estimation d'une caractéristique de la population en examinant seulement une partie de la population plutôt que la population entière, et se réfère à la différence entre l'estimation dérivée d'une enquête par sondage et la vraie valeur qui serait obtenue si un recensement de la population entière était effectué dans les mêmes conditions. Il n'y a pas d'erreur d'échantillonnage dans un recensement, car les calculs sont basés sur l'ensemble de la population.

Estimation de l'erreur d'échantillonnage

Comme mentionné précédemment, toute estimation dérivée d'un échantillon est sujette à une erreur d'échantillonnage, car seule une partie de la population a été observée. Un échantillon différent pourrait produire des estimations différentes. L'erreur d'échantillonnage est à l'origine de la variabilité des estimations dérivées de différents échantillons, même si la taille et le plan d'échantillonnage sont identiques, de même que la méthode d'estimation utilisée. Elle est généralement mesurée par la variance d'échantillonnage, qui dépend de nombreux facteurs, notamment la méthode d'échantillonnage, la méthode d'estimation, la taille de l'échantillon et la variabilité de la caractéristique estimée.

Variance d'échantillonnage

Dans les plans d'échantillonnage simples, comme l'échantillonnage aléatoire simple, la variance d'échantillonnage peut être calculée directement à l'aide d'une formule. Cependant, il n'existe généralement pas de formule pour les plans plus complexes. Dans ce cas, une estimation de la variance d'échantillonnage peut être calculée en utilisant des méthodes telles que la linéarisation de Taylor ou des méthodes de rééchantillonnage telles que le jackknife et le bootstrap.

Quelle que soit la méthode utilisée pour l'estimation de la variance, elle doit intégrer les propriétés du plan d'échantillonnage telles que la stratification, la mise en grappes et la sélection en plusieurs étapes ou phases, le cas échéant.

Les autres facteurs qui influent sur l'ampleur de la variance d'échantillonnage sont les suivants :

  • En général, la variance d'échantillonnage diminue lorsque la taille de l'échantillon augmente, mais le changement n'est pas proportionnel.
  • La taille de la population a un impact sur la variance d'échantillonnage pour les populations de taille petite à moyenne. Pour les grandes populations, son impact est mineur. 
  • La variabilité de la caractéristique d'intérêt dans la population affecte également la taille de l'erreur d'échantillonnage. Plus la différence entre les unités de la population est grande, plus la taille de l'échantillon nécessaire pour atteindre un niveau de précision spécifique est importante.
  • Le plan d'échantillonnage, qui comprend un plan de sondage et une procédure d'estimation, influe également sur l'ampleur de l'erreur d'échantillonnage. La méthode d'échantillonnage, appelée « plan d'échantillonnage », peut grandement affecter la taille de l’erreur d'échantillonnage. Les enquêtes impliquant un plan d'échantillonnage complexe peuvent entraîner une erreur d'échantillonnage plus importante qu'un plan plus simple. La procédure d'estimation a également un impact majeur sur l'erreur d'échantillonnage. Ces concepts sont examinés plus en détail dans la section portant sur l’échantillonnage.

Autres mesures de l'erreur d'échantillonnage

Outre l'utilisation de la variance d'échantillonnage pour mesurer l'erreur d'échantillonnage, il existe d'autres méthodes fréquemment utilisées, notamment : l'erreur type, le coefficient de variation, la marge d'erreur et l'intervalle de confiance.

  • L'erreur type est la racine carrée de la variance d'échantillonnage. Cette mesure est plus facile à interpréter puisqu'elle donne une indication de l'erreur d'échantillonnage en utilisant la même échelle que l'estimation alors que la variance est basée sur les différences au carré.
  • Le coefficient de variation (CV) évalue la taille de l'erreur type par rapport à l'estimation de la caractéristique mesurée. Il s'agit du ratio entre l'erreur type de l'estimation et la valeur moyenne de l'estimation elle-même. Le CV est très utile pour comparer la précision des estimations d'un échantillon, lorsque leurs tailles ou leurs échelles diffèrent les unes des autres. Même si le CV est largement utilisé dans les publications officielles de Statistique Canada, il n'est pas recommandé pour mesurer la précision des proportions, surtout lorsque les proportions estimées sont proches de 0 ou de 1. Dans ce cas, il est plus approprié d'utiliser l'intervalle de confiance.
  • L'intervalle de confiance (IC) donne un intervalle de valeurs autour de l'estimation qui a une certaine probabilité d’inclure la vraie valeur de la mesure d’intérêt dans la population. Cette probabilité est le niveau de confiance de l’IC. Pour une estimation donnée dans un échantillon donné, l'utilisation d'un niveau de confiance plus élevé génère un IC plus large, c’est-à-dire un IC moins précis. Le niveau de confiance le plus couramment utilisé est de 95 %, mais des niveaux de confiance de 99 % ou 90 % sont également utilisés dans certaines circonstances.
  • La marge d'erreur correspond à la moitié de la largeur de l’IC. Plus la marge d'erreur est grande, moins on peut avoir confiance dans le fait que le résultat d'un sondage reflète le résultat d'une enquête sur l'ensemble de la population. Elle est souvent utilisée pour rendre compte de l'erreur d'échantillonnage par les sondeurs ou les journalistes.

Exemple 1

Il est fréquent de voir les résultats d'une enquête publiés dans un journal comme ci-dessous :

Selon un récent sondage, 15 % des résidents d'Ottawa assistent à des services religieux chaque semaine. Les résultats, basés sur un échantillon de 1 345 résidents, sont considérés comme exacts à plus ou moins trois points de pourcentage 19 fois sur 20.

Dans cet exemple, l’expression « 19 fois sur 20 » signifie que, si le sondage était répété de nombreuses fois, alors l'intervalle de confiance couvrirait la vraie valeur dans la population 19 fois sur 20. C’est équivalent à un niveau de confiance de 95 %. L’expression « plus ou moins trois points de pourcentage » signifie que la marge d’erreur est de 3 %. Par conséquent, la valeur de l’estimation est de 15 % et l’IC à 95 % correspondant à cette estimation est de 12 % à 18 %.


Date de modification :