3.2 Échantillonnage
3.2.1 Sélection d'un échantillon

Début du texte

L’échantillonnage permet d’estimer des caractéristiques d’une population en observant directement une partie de la population. Les chercheurs ne s’intéressent pas à l’échantillon lui-même, mais à ce qu’il leur permet d’apprendre sur l’ensemble de la population. L’enquête-échantillon doit être correctement définie et organisée. Si on pose les mauvaises questions, l’information recueillie ne permettra pas de répondre aux objectifs de l’enquête. Si on pose les questions aux mauvaises personnes, l’information ne représentera pas bien la population à laquelle on s’intéresse. Les résultats seront biaisés. 

Voici les étapes à suivre pour sélectionner un échantillon et vous assurer qu’il vous permettra de répondre aux objectifs de l’enquête.

Établir les objectifs de l’enquête

Clarifier les objectifs de l’enquête de façon aussi détaillée que possible est essentiel à son succès définitif. Il faudrait à ce stade identifier les utilisateurs initiaux et définir les utilisations initiales des données. C’est aussi à cette étape que l’on devrait déterminer le type de données le plus approprié à employer parmi le recensement, l’enquête-échantillon, les données administratives ou une source de données alternatives.

Définir la population cible

Peu importe le type de données choisi, il faut bien définir la population cible, c’est-à-dire la population totale pour laquelle on a besoin d’information. Pour ce faire, il faut décrire les unités qui composent la population sous forme de caractéristiques les identifiant clairement. Les caractéristiques suivantes définissent la population cible :

  • La nature des unités : des personnes, des hôpitaux, des écoles, etc.
  • L’emplacement géographique : il faut déterminer les limites géographiques qui circonscrivent la population et le degré de détail géographique dont on a besoin pour l’estimation découlant de l’enquête (par province, par ville, etc.).
  • La période de référence : la période visée par l’enquête.
  • D’autres caractéristiques, comme des caractéristiques sociodémographiques (un groupe d’âge particulier, par exemple) ou le type d’industrie.

Déterminer les données à recueillir

Il faut établir les besoins en données. Il faut aussi définir les termes relatifs aux données et s’assurer que ces définitions répondent aux besoins sur le plan opérationnel.

Fixer le degré de précision

Il y a un degré d’incertitude associé aux estimations établies à partir d’un échantillon. Il s’agit de l’erreur d’échantillonnage. Lors de la conception de l’enquête, il faut établir le degré acceptable d’incertitude des estimations à produire. Ce degré dépend de l’utilisation finale des résultats et du budget global de l’enquête. Plus le budget de l’enquête sera élevé, plus on disposera de ressources pour contrôler la qualité. La taille de l’échantillon déterminera aussi le degré d’incertitude. L’accroissement de la taille de l’échantillon entraîne une diminution de l’erreur d’échantillonnage. Par exemple, si vous échantillonnez 24 des 25 élèves de votre classe, il n’y aura pas autant de variation d’un échantillon à un autre qu’il y en aurait si vous n’échantillonniez que 5 élèves parmi les 25 élèves de la classe.

Le plan d’échantillonnage

Les étapes suivantes permettent de définir le plan d’échantillonnage :

  1. Déterminer ce que sera la population observée (par exemple, des élèves, des hommes de 20 à 35 ans, des nouveau-nés, etc.).
  2. Choisir le délai d’exécution de l’enquête le plus approprié.
  3. Définir les unités d’enquête.
  4. Établir la taille de l’échantillon (par exemple, un échantillon de 100 pour une population de 1 000).
  5. Sélectionner une méthode d’échantillonnage.

Les techniques d’estimation à utiliser, c’est-à-dire la façon dont les résultats seront généralisés à l’ensemble de la population et dont l’erreur d’échantillonnage sera calculée, découleront directement du plan d’échantillonnage et seront décrites dans la section à venir sur l’estimation.

La population observée

Certaines unités de la population cible doivent être exclues en raison de contraintes opérationnelles comme le coût élevé de la collecte des données dans certaines régions éloignées, la difficulté d’identifier et de contacter les personnes appartenant à certains groupes, etc. La population qui est réellement prise en compte pour l’enquête est alors la population observée. Bref, la population cible est la population que nous voulons observer, tandis que la population observée est la population que nous pouvons observer.

Il faut faire en sorte que la population observée se rapproche autant que possible de la population cible. Il est également très important d’informer les utilisateurs des données des différences entre les deux populations, étant donné que les résultats de l’enquête ne s’appliqueront qu’à la population observée.

Par exemple, la population cible d’une enquête pourrait se composer de tous les Canadiens de 15 ans et plus (à une date de référence particulière) tandis que la population observée pourrait exclure les résidents du Yukon, du Nunavut et des Territoires du Nord-Ouest, les personnes vivant sur des réserves autochtones, les membres à temps plein des Forces armées canadiennes et les personnes vivant dans un établissement hospitalier ou carcéral. Ces Canadiens pourraient être exclus pour diverses raisons : parce que sonder des gens dans les territoires pourrait s’avérer difficile et coûteux, parce que le personnel militaire risque de ne pas être disponible à des fins d’enquête s’il est en mission, etc. Dans cet exemple, environ 2 % de la population cible serait exclue de la population observée.

La base de sondage

La base de sondage est l’outil utilisé pour avoir accès à la population. Il existe deux types de bases de sondage : les bases liste et les bases aréolaires. Une base liste est simplement une liste des unités de la population. Chaque unité y est identifiable et la base contient des informations permettant d’accéder aux unités. Une bonne base de sondage devrait être complète et à jour. Aucun membre de la population observée ne devrait en être exclu ni y apparaître plus d’une fois et aucune unité ne faisant pas partie de la population (comme une personne décédée) ne devrait y être inscrite. Le choix de la base de sondage aura des répercussions directes sur la définition de la population observée. Par exemple, si une liste de numéros de téléphone est utilisée pour sélectionner un échantillon de ménages, tous les ménages n’ayant pas le téléphone seront alors exclus de la population observée.

La base aréolaire est une liste d’aires géographiques. Plutôt que de sélectionner directement les unités comme avec une base liste, certaines aires géographiques de la base aréolaire sont sélectionnées et un moyen d’accéder aux unités situées dans ces aires géographiques est identifié, comme visiter ces unités en personne par exemple. Supposons que vous êtes en train d’étudier une ville du Québec située en milieu rural pour déterminer quel pourcentage de ses résidents sont des exploitants agricoles. L’échantillon de la base aréolaire pourrait vous permettre de localiser les routes où rendre visite à des gens, mais vous devriez quand même trouver les noms et les adresses des personnes domiciliées sur chacune de ces routes.

Les unités d’enquête

Il existe trois types d’unités qu’il faut identifier correctement afin d’éviter des problèmes durant la sélection, la collecte et l’analyse des données. Ces unités sont :

  • L’unité d’échantillonnage, qui fait partie de la base de sondage et donc qui peut être sélectionnée.
  • L’unité déclarante, qui fournit l’information demandée dans le cadre de l’enquête.
  • L’unité de référence, ou l’unité d’analyse, qui est l’unité au sujet de laquelle de l’information est fournie et qui sert à analyser les résultats de l’enquête.

Par exemple, dans le cadre d’une enquête sur les nouveau-nés à Edmonton, l’unité d’échantillonnage pourrait être un ménage, l’unité déclarante, l’un des parents ou le tuteur légal, et l’unité de référence, le bébé.

Les unités d’échantillonnage peuvent différer selon la base de sondage utilisée. C’est pourquoi la population observée, la base de sondage et les unités d’enquête sont définies les unes par rapport aux autres.

La taille de l’échantillon

Le degré de précision nécessaire pour les estimations découlant de l’enquête aura des répercussions sur la taille de l’échantillon. Il n’est toutefois pas aussi facile de déterminer la taille de l’échantillon qu’on pourrait le penser. En règle générale, la taille réelle de l’échantillon d’une enquête est un compromis entre le degré de précision à atteindre, le budget de l’enquête et toutes les autres contraintes opérationnelles. Pour atteindre un certain degré de précision, la détermination de la taille de l’échantillon doit reposer entre autres choses sur les facteurs suivants :

  • La variabilité des caractéristiques à observer. Si toutes les personnes d’une population gagnaient le même salaire, un échantillon d’une seule personne serait alors tout ce dont vous auriez besoin pour estimer le salaire moyen de la population en question. Si les salaires sont très différents d’une personne à l’autre, vous auriez alors besoin d’un échantillon plus grand pour en produire une estimation fiable.
  • La taille de la population : Dans une certaine mesure, plus la population est grande, plus l’échantillon doit être grand. Une fois une certaine taille de population atteinte, une augmentation de la population n’a plus d’influence sur la taille de l’échantillon. La taille de l’échantillon nécessaire pour atteindre un certain degré de précision, par exemple, sera à peu près la même pour une population d’un million que pour une population deux fois plus importante.
  • Les méthodes d’échantillonnage et d’estimation : Toutes les méthodes d’échantillonnage et d’estimation ne sont pas aussi efficaces les unes que les autres. Plus la méthode est efficace, moins l’échantillon requis pour obtenir une certaine précision est grand. En raison des contraintes opérationnelles et des limites de la base de sondage utilisée, il se peut que la technique la plus efficace ne puisse pas être utilisée.

La méthode d’échantillonnage

Il existe deux types de méthodes d’échantillonnage : l’échantillonnage probabiliste et l’échantillonnage non probabiliste. La différence entre les deux tient au fait que dans le cas de l’échantillonnage probabiliste chaque unité a une probabilité d’être sélectionnée qui peut être quantifiée, ce qui n’est pas vrai pour l’échantillonnage non probabiliste. Les deux sections suivantes décrivent en détail les méthodes de chaque type.


Date de modification :