Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Échantillonnage non probabiliste

Contenu archivé

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

La différence entre l'échantillonnage probabiliste et l'échantillonnage non probabiliste tient à une hypothèse de base au sujet de la nature de la population étudiée. Dans le cas de l'échantillonnage probabiliste, chaque unité a une chance d'être sélectionnée. Dans celui de l'échantillonnage non probabiliste, on suppose que la distribution des caractéristiques à l'intérieur de la population est égale. C'est ce qui fait que le chercheur croit que n'importe quel échantillon serait représentatif et que les résultats, par conséquent, seront exacts. Pour l'échantillonnage probabiliste, la randomisation est une caractéristique du processus de sélection, plutôt qu'une hypothèse au sujet de la structure de la population.

Dans le cas de l'échantillonnage non probabiliste, puisqu'on choisit arbitrairement des unités, il n'existe aucune façon d'estimer la probabilité pour une unité quelconque d'être incluse dans l'échantillon. Également, comme la méthode en question ne fournit aucunement l'assurance que chaque unité aura une chance d'être incluse dans l'échantillon, on ne peut estimer la variabilité de l'échantillonnage ni identifier le biais possible.

On ne peut mesurer la fiabilité d'un échantillonnage non probabiliste; la seule façon de mesurer la qualité des données en résultant consiste à comparer certains des résultats de l'enquête à l'information dont on dispose au sujet de la population. Encore une fois, rien ne fournit l'assurance que les estimations ne dépasseront pas un niveau acceptable d'erreur. Les statisticiens hésitent à utiliser les méthodes d'échantillonnage non probabiliste, parce qu'il n'existe aucun moyen de mesurer la précision des échantillons en découlant.

Malgré ces inconvénients, les méthodes d'échantillonnage non probabiliste peuvent être utiles lorsqu'on désire des commentaires descriptifs au sujet des échantillons eux-mêmes. Deuxièmement, leur utilisation prend peu de temps tout en étant plus économique et plus pratique. Il existe aussi des domaines, comme la recherche sociale appliquée, où il est impossible ou presque impossible d'effectuer un échantillonnage probabiliste. Statistique Canada utilise l'échantillonnage probabiliste pour presque toutes ses enquêtes, mais emploie l'échantillonnage non probabiliste afin de tester ses questionnaires et aux fins de certaines études préliminaires durant le stade d'élaboration d'une enquête.

L'application de la plupart des méthodes d'échantillonnage non probabiliste exige un certain effort et une certaine organisation, mais d'autres méthodes d'échantillonnage non probabiliste, comme l'échantillonnage de commodité, sont à l'occasion appliquées et n'exigent pas de plan d'action formel.

Voici les types les plus courants des méthodes en question :

Échantillonnage de commodité ou à l'aveuglette

On appelle parfois l'échantillonnage de commodité l'échantillonnage à l'aveuglette ou accidentel. Cet échantillonnage n'est pas normalement représentatif de la population cible, parce qu'on ne sélectionne des unités d'échantillonnage dans son cas que si on peut y avoir facilement et commodément accès.

Il arrive que monsieur ou madame Tout-le-monde utilise l'échantillonnage de commodité. Un critique gastronomique, par exemple, peut goûter plusieurs entrées ou plats principaux pour juger de la qualité et de la variété d'un menu. Les reporters des stations de télévision sont, en outre, souvent à la recherche de soi-disant « interviews de gens de la rue » pour déterminer comment la population perçoit un enjeu ou une question. Dans ces deux cas, on choisit l'échantillon au hasard, sans utiliser de méthode d'enquête particulière.

L'avantage évident de la méthode, c'est qu'elle est facile à utiliser, mais la présence de biais annule énormément ce dernier. Même si ses applications utiles sont limitées, la technique peut donner des résultats exacts lorsque la population est homogène.

Un scientifique pourrait, par exemple, utiliser cette méthode pour déterminer si un lac est pollué. En supposant que l'eau du lac est bien mélangée, tout échantillon donnerait de l'information identique. Un scientifique pourrait en toute sécurité puiser de l'eau n'importe où dans le lac, sans se tracasser au sujet de la représentativité de son échantillon.

Parmi les autres exemples d'échantillonnage de commodité, mentionnons :

  • les femmes qui au cinéma s'assoient dans la première rangée;
  • les 100 premiers clients à entrer dans un grand magasin;
  • les trois premières personnes qui téléphonent à une station de radio dans le cadre d'un concours qu'elle a organisé.

Échantillonnage volontaire

Comme l'expression le laisse entendre, ce type d'échantillonnage intervient lorsque des gens offrent volontairement leurs services pour l'étude dont il est question. Il serait, par exemple, difficile et contraire à l'éthique dans le cadre d'expériences psychologiques ou d'essais de produits pharmaceutiques (de tests de médicaments) de recruter au hasard pour y participer des gens du grand public. En pareils cas, on prélève l'échantillon à partir d'un groupe de volontaires. Il arrive parfois qu'un chercheur offre de l'argent à des gens pour les inciter à participer à son étude. En échange, les volontaires acceptent la possibilité d'avoir à se prêter à des processus longs, exigeants ou quelques fois désagréables.

Le fait d'échantillonner des participants volontaires plutôt que la population en général peut introduire des biais marqués. Souvent, à l'occasion des sondages d'opinion, seuls les gens qui se soucient assez fortement d'une façon ou d'une autre de la question étudiée ont tendance à y répondre. La majorité silencieuse n'y répond généralement pas, ce qui entraîne un important biais sur le plan de la sélection.

Les stations de radio et de télévision ont souvent recours à des sondages par ligne ouverte pour interroger un auditoire ou un public sur ses vues. Le canal de télévision Much Music a recours à ce genre de sondages à l'intérieur de son émission CombatZone. Le canal demande durant cette dernière aux téléspectateurs de voter pour l'un des deux vidéoclips au sujet desquels il les invite à exprimer leur préférence en utilisant le téléphone, le courriel ou son site Web en ligne.

Bien souvent, on ne limite ni la fréquence ni le nombre des appels téléphoniques qu'un répondant peut effectuer en pareil cas. Une personne pourrait malheureusement, de ce fait, voter à plusieurs reprises. Il faut aussi noter que les gens qui participent à de tels sondages pourraient avoir des vues différentes de celles des gens qui ne le font pas.

Échantillonnage au jugé

On utilise la méthode d'échantillonnage au jugé lorsqu'on prélève un échantillon en se fondant sur certains jugements au sujet de l'ensemble de la population. L'hypothèse qui sous-tend son utilisation est que l'enquêteur sélectionnera des unités qui seront caractéristiques de la population. La question cruciale dans ce cas est l'objectivité : Dans quelle mesure peut-on se fier à son jugement pour en arriver à un échantillon typique? L'échantillonnage au jugé est exposé aux préjugés du chercheur et est peut-être encore davantage biaisé que l'échantillonnage de commodité ou à l'aveuglette. Étant donné que l'échantillonnage au jugé reflète toutes les idées préconçues que risque d'avoir le chercheur, il peut y avoir introduction de biais importants si ces idées sont inexactes.

Les statisticiens utilisent souvent cette méthode dans le cadre d'études préparatoires comme des tests préalables de questionnaires et des discussions en groupe. Ils préfèrent également avoir recours à cette méthode à l'intérieur du cadre de laboratoires où le choix des sujets des expériences (comme des animaux, des êtres humains et des végétaux) reflète les croyances ou les convictions antérieures de l'enquêteur au sujet de la population.

La réduction du coût et du temps qu'exige l'acquisition de l'échantillon est l'un des avantages de l'échantillonnage au jugé.

Échantillonnage par quotas

L'échantillonnage par quotas est l'une des formes les plus courantes d'échantillonnage non probabiliste. Il s'effectue jusqu'à ce qu'un nombre précis d'unités (de quotas) pour diverses sous-populations ait été sélectionné. Puisqu'il n'existe aucune règle qui régirait la façon dont il faudrait s'y prendre pour remplir ces quotas, l'échantillonnage par quotas est réellement un moyen de satisfaire aux objectifs en matière de taille d'échantillon pour certaines sous-populations.

Les quotas peuvent être fondés sur des proportions de la population. Si une population, par exemple, compte 100 hommes et 100 femmes et s'il faut en prélever un échantillon de 20 personnes pour qu'elles participent à un concours de dégustation de colas, il se peut que vous vouliez diviser l'échantillon en proportions égales entre les sexes, ce qui donnerait 10 hommes et 10 femmes. On peut penser que l'échantillonnage par quotas est préférable à d'autres formes d'échantillonnage non probabiliste (comme l'échantillonnage au jugé), parce qu'il impose l'inclusion dans l'échantillon de membres de différentes sous-populations.

L'échantillonnage par quotas est un peu similaire à l'échantillonnage stratifié parce que dans son cas également les unités semblables sont regroupées. Toutefois, il en diffère, cependant, sur le plan du mode de sélection. Dans le cas d'un échantillonnage probabiliste, on sélectionne les unités au hasard, tandis que dans celui d'un échantillonnage par quotas, on laisse habituellement à l'intervieweur le soin de déterminer qui sera échantillonné. Cela peut donner lieu à des biais de sélection. Les responsables d'études de marché utilisent donc souvent l'échantillonnage par quotas (pour des enquêtes ou des sondages téléphoniques, en particulier), plutôt que l'échantillonnage stratifié, parce qu'il est relativement peu coûteux et facile à administrer et a la propriété souhaitable de respecter les proportions de la population. L'échantillonnage par quotas camoufle toutefois des biais pouvant être significatifs.

Comme dans le cas de toutes les autres méthodes d'échantillonnage non probabiliste, il faut supposer pour l'échantillonnage par quotas que les personnes sélectionnées sont semblables à celles qu'on ne sélectionne pas, afin de formuler des inférences au sujet de la population. Des hypothèses aussi audacieuses sont rarement valables.

Exemple n° 1 : Le conseil des élèves de l'école publique de la vallée de la rivière Rouge veut jauger l'opinion de ces derniers au sujet de la qualité de leurs activités parascolaires. Il décide d'interroger 100 des 1 000 élèves de l'école en utilisant comme sous-population les années d'études (c'est-à-dire les 7, 8, 9, 10, 11 et 12e années).

Le tableau ci-dessous fournit le nombre d'élèves.

Tableau 1. Nombre d'élèves inscrits à l'école publique de la vallée de la rivière Rouge, par année d'études
Année d'études Nombre d'élèves Pourcentage des élèves (%) Quota d'élèves à l'intérieur de l'échantillon de 100
7
150
15
15
8
220
22
22
9
160
16
16
10
150
15
15
11
200
20
20
12
120
12
12
Total
1 000
100
100

Le conseil des élèves veut s'assurer que l'échantillon reflète le pourcentage d'élèves de chacune des années d'études. La formule est la suivante :

Pourcentage d'élèves en 10e année
= (nombre d'élèves de 10e année ÷ nombre total d'élèves) x 100 %
= (150 ÷ 1 000) x 100
= 15 %

Puisque 15 % des membres de la population de l'école sont en 10e année, l'échantillon devrait être constitué dans une proportion de 15 % d'élèves de 10e année. Utilisez, par conséquent, la formule suivante pour calculer le nombre d'élèves de 10e année qui devrait être inclus dans l'échantillon :

Échantillon d'élèves de 10e année
= (15 % de 100) x 100
= 0,15 x 100
= 15 élèves

La principale différence entre l'échantillonnage stratifié et l'échantillonnage par quotas tient au fait que le premier entraînerait la sélection des élèves à l'aide d'une méthode d'échantillonnage probabiliste comme l'échantillonnage aléatoire simple ou l'échantillonnage systématique. On n'utilise pas une telle technique dans le cas de l'échantillonnage par quotas. On pourrait sélectionner les 15 élèves en choisissant les 15 premiers élèves de 10e année qui entreraient à l'école une journée donnée ou en choisissant 15 élèves dans les deux premières rangées d'une classe en particulier. N'oubliez pas que les élèves qui arrivent en retard ou qui s'assoient dans le fond de la classe peuvent avoir des opinions différentes de celles des élèves qui arrivent plus tôt à l'école ou qui s'assoient en avant lorsqu'ils entrent dans la classe.

Le fait que l'échantillonnage par quotas ne respecte pas l'exigence fondamentale du hasard est le principal argument militant contre son utilisation. Certaines unités peuvent n'avoir aucune chance d'être sélectionnées ou on risque de ne pas connaître leur chance de l'être. L'échantillon peut donc être biaisé.

Il est courant, mais il n'est pas nécessaire, que l'échantillonnage par quotas fasse appel à des procédures de sélection au hasard aux stades de départ, en grande partie de la même façon que le fait l'échantillonnage probabiliste. La première étape de l'échantillonnage à plusieurs degrés, par exemple, consisterait à sélectionner au hasard les régions géographiques. La différence se situe au niveau de la sélection des unités aux stades finals du processus.

Dans le cas de l'échantillonnage à plusieurs degrés, les unités reposent sur des listes à jour pour ce qui est des régions sélectionnées et on sélectionne un échantillon suivant un processus aléatoire. Dans le cas de l'échantillonnage par quotas, on indique à chaque intervieweur combien de répondants devraient être des hommes et combien d'entre eux, des femmes, de même que combien de gens devraient représenter les divers groupes d'âge. On calcule donc les quotas à partir des données dont on dispose pour la population; par conséquent, le sexe, les groupes d'âge ou d'autres variables démographiques sont représentés dans les bonnes proportions à l'intérieur des échantillons. Les intervieweurs peuvent, cependant, ne pas obtenir un échantillon représentatif de répondants dans le cas de chacun des quotas. Supposez, par exemple, qu'une organisation veut trouver de l'information sur les professions des hommes de 20 à 25 ans. Une intervieweuse se rend sur un campus d'université et sélectionne les 50 premiers hommes de 20 à 25 ans qu'elle rencontre par hasard et qui acceptent de participer à l'enquête de son organisation. Toutefois, cet échantillon ne signifie pas que ces 50 hommes sont représentatifs de tous les hommes de 20 à 25 ans.

L'échantillonnage par quotas est généralement moins coûteux que l'échantillonnage aléatoire. Il est également facile à administrer, compte tenu notamment du fait qu'on peut omettre de la procédure les tâches consistant à dresser la liste de la population entière, à sélectionner au hasard l'échantillon et à exercer un suivi auprès des non-répondants. L'échantillonnage par quotas, qui est une méthode d'échantillonnage efficace lorsqu'on a instamment besoin d'information, peut être effectué indépendamment des bases de sondage qui existent. Il peut être la seule méthode d'échantillonnage appropriée dans bien des cas où il n'existe pas de base de sondage convenable pour la population étudiée.