Plans autopondérés
Ajustement des poids
Autres méthodes d'estimation
Estimation de l'erreur d'échantillonnage
Exemples d'estimations à l'aide d'un plan d'échantillonnage aléatoire simple
Estimation de la moyenne de la population
Estimation du total de la population
Comme nous le savons maintenant, une enquête a pour but d'obtenir de l'information sur une population donnée. Lorsque l'échantillon a été sélectionné et que les données ont été recueillies (voir le chapitre Collecte de données) et traitées (voir le chapitre Traitement des données), il reste à s'acquitter de la tâche consistant à apparier les données rassemblées à partir de l'échantillon à l'ensemble de la population.
L'estimation est le processus consistant à déterminer une valeur vraisemblable pour une variable de la population observée, en se fondant sur des données recueillies à partir de l'échantillon. Les chercheurs sont habituellement intéressés à examiner pour différentes variables des estimations d'un grand nombre de statistiques—des totaux, des moyennes et des proportions le plus souvent. On pourrait, par exemple, utiliser une enquête-échantillon pour produire les statistiques suivantes : des estimations de la proportion de fumeurs chez les 15 à 24 ans, les gains moyens des hommes et des femmes titulaires d'un grade universitaire et le nombre total de voitures que possède l'ensemble de la population observée.
Ce qui sous-tend le processus d'estimation, c'est le poids d'échantillonnage d'une unité, qui indique le nombre d'unités incluses dans la population (y compris le poids d'échantillonnage lui-même) et qui sont représentées par cette unité échantillonnée. Le poids d'échantillonnage est l'inverse de la probabilité de sélection de l'unité.
| Numéro de ménage | Nombre de personnes | Nombre de voitures | Probabilité de sélection | Poids d'échantillonnage |
|---|---|---|---|---|
| 1 | 1 |
0 |
1/4 |
4 |
| 2 | 4 |
2 |
1/4 |
4 |
| 3 | 2 |
1 |
1/4 |
4 |
| 4 | 2 |
1 |
1/4 |
4 |
| 5 | 3 |
2 |
1/4 |
4 |
Toutes les unités échantillonnées n'ont pas toujours le même poids d'échantillonnage. Certains plans donnent aux unités une probabilité inégale d'être sélectionnées, ce qui fait que des unités incluses dans le même échantillon ont des poids d'échantillonnage différents. Les réponses d'un ménage ou d'une entreprise à un questionnaire pourraient représenter celles de 200 unités de la population, tandis que les réponses d'un autre ménage ou d'une autre entreprise au même questionnaire pourraient ne représenter que 50 unités faisant partie de la population.
Lorsque chaque unité incluse dans l'échantillon a le même poids d'échantillonnage, on dit que le plan d'échantillonnage est autopondéré. Ce genre de plan épargne du temps et est pratique sur le plan opérationnel, pour des échantillons de grande taille en particulier. Parce que chaque unité a le même poids, on peut ne pas tenir compte de tels poids lorsqu'on estime des moyennes et des proportions. La moyenne établie pour l'échantillon donne une estimation appropriée de la moyenne pour l'ensemble de la population.
Les plans d'échantillonnage aléatoire simple et d'échantillonnage systématique sont des exemples de plans autopondérés. Ils auraient pu, pour cette raison, faciliter les calculs dans le cas de l'exemple n° 2. Pour estimer le nombre moyen de voitures par ménage inclus dans la population, par exemple, nous aurions pu utiliser la même moyenne que celle employée à l'intérieur de l'échantillon. Les 5 ménages échantillonnés possèdent au total 6 voitures, ce qui donne une moyenne de 1,2 voiture par ménage. C'est le même résultat que celui obtenu à l'aide de la procédure de calcul d'un poids d'échantillonnage.
On ajuste parfois les poids d'échantillonnage avant une estimation, et ce, pour deux raisons fondamentalement :
Évidemment, la stratification par date de parution sur les écrans avant l'échantillonnage aurait réglé le problème. Dans bien des cas, cependant, nous avons des totaux au niveau de la population, mais nous ignorons l'attribut de chaque unité incluse dans la base de sondage. Nous savons, par exemple, à partir du Recensement de la population, combien d'hommes et de femmes il y a dans une localité donnée, mais tout ce dont nous disposons pour un échantillonnage, c'est d'une liste de ménages. Il serait donc impossible de stratifier notre population selon le sexe. On utilise souvent des projections démographiques suivant l'âge et le sexe pour chaque province dans le cadre d'enquêtes sociales afin d'ajuster les poids d'échantillonnage.
On emploie les poids ajustés pour tenir compte des non-réponses à un questionnaire d'enquête et/ou de dénombrements externes à des fins d'estimation de la même façon qu'on a employé le poids d'échantillonnage dans l'exemple n° 1.
L'utilisation des poids pour extrapoler les résultats de l'échantillonnage n'est pas l'unique méthode d'estimation qui existe, mais c'est la plus simple et la seule dont nous traiterons. Il est, néanmoins, important de savoir qu'il existe d'autres méthodes pouvant mener à des estimations plus précises (comme l'utilisation de données auxiliaires). Le processus d'estimation doit tenir compte du plan d'échantillonnage qui a été utilisé. Les estimations qui en résulteraient pourraient, autrement, être sérieusement biaisées.
Comme nous l'avons déjà mentionné, toutes les estimations calculées à partir d'échantillons sont exposées à ce qu'on appelle l'erreur d'échantillonnage, qui découle du fait qu'on n'a observé qu'une partie, au lieu de la totalité, de la population. Un échantillon différent aurait pu fournir des résultats différents également. L'erreur d'échantillonnage est le degré de variation qui existe entre les estimations établies à partir des différents échantillons possibles. (Comme il y a en gros 14 millions de combinaisons différentes de 6 numéros de 1 à 49, imaginez alors combien il y a de façons de sélectionner un échantillon de 25 000 ménages canadiens!). On ne connaît pas, évidemment, cette erreur d'échantillonnage, puisque nous devrions connaître la réponse pour chaque unité de la population afin de la calculer. On peut, cependant, l'estimer en utilisant les données d'enquête. L'ampleur de l'erreur d'échantillonnage dépend de bien des éléments, y compris de la méthode d'échantillonnage, de la méthode d'estimation, de la taille de l'échantillon et de la variabilité de la caractéristique estimée. C'est pourquoi chaque estimation d'un échantillon entraîne une erreur d'échantillonnage qui lui est propre. On devrait donc lisser cette erreur pour chaque estimation d'un total, d'une moyenne, d'une proportion, etc., fournie par une enquête.
L'échantillonnage aléatoire simple est la plus simple de toutes les méthodes d'échantillonnage. On a déjà beaucoup étudié l'estimation effectuée à l'aide de la méthode d'échantillonnage aléatoire simple. Il existe des formules toute simples permettant d'estimer l'erreur d'échantillonnage pour bien des statistiques lorsqu'on a recours à un plan d'AES, étant donné surtout qu'il s'agit d'un plan d'échantillonnage autopondéré. Nous présentons ici l'estimateur le plus courant pour établir une moyenne (arithmétique) et un total d'une population, sous l'échantillonnage aléatoire simple.
Dans le cas de l'échantillonnage aléatoire simple, l'estimation de la moyenne d'une population est identique à la moyenne de l'échantillon :
![]()
où
x = une valeur observée,
Nota : On devrait utiliser x et n (minuscules) si l'on renvoie à une enquête-échantillon et X et N (majuscules) lorsqu'on renvoie à une population.
Si les résultats de l'échantillonnage ont été résumés à l'intérieur d'une table des fréquences, l'estimation de la moyenne d'une population est alors la même que la moyenne de l'échantillon. Ainsi,
![]()
où
x = une valeur observée,
f = la fréquence de la valeur (le nombre de fois que cette valeur a été observée dans l'échantillon),
Exemple n° 2 : Un producteur agricole sélectionne au hasard 10 œufs à partir d'une grosse (12 douzaines) d'œufs (144 œufs) qu'il trouve dans son poulailler. Il pèse soigneusement chacun des 10 œufs. Les poids suivants ont été enregistrés en grammes :
0,75, 0,70, 0,55, 0,50, 0,60, 0,65, 0,75, 0,65, 0,75 et 0,50
Quel est le poids moyen de ces œufs?
Nous pouvons déterminer à l'aide de la formule figurant ci-dessus le poids moyen des 10 œufs sélectionnés :

Dans le cas d'un échantillonnage aléatoire simple, la formule d'estimation d'un total pour la population est :
![]()
où
x = une valeur observée,
C'est simplement l'estimation de la valeur moyenne multipliée par le nombre d'unités incluses dans la population. Dans l'exemple précédent, le poids moyen d'un œuf est 0,64 gramme; il est donc logique de penser que le poids total des 144 œufs serait 92,16 grammes (144 x 0,64 = 92,16 grammes).
Si les résultats de l'échantillonnage étaient résumés à l'intérieur d'une table des fréquences, la formule d'estimation pour la population totale serait :
![]()
où
x = une valeur observée,