Qualité des données

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Recensement de l'agriculture de 2006 — concepts, méthodologie et qualité des données

L'utilisation des renseignements ci-après aidera à comprendre clairement les concepts de base qui définissent les données fournies dans ce produit, la méthodologie du recensement qui les sous-tend et les aspects clés de la qualité des données. Leur utilisation vous aidera à mieux comprendre comment employer et analyser efficacement les données en fonction de ce qu'elles permettent de révéler et de leurs limitations. Les renseignements peuvent être particulièrement importants dans les comparaisons avec les données d'autres enquêtes ou sources de renseignements et dans les conclusions tirées au sujet de la variation dans le temps.

Sources de données et méthodologie

Le Recensement de l'agriculture sert à recueillir et à publier une vaste gamme de données sur le secteur agricole, comme le nombre et le genre de fermes, les caractéristiques des exploitants agricoles, la forme juridique de l'entreprise, les pratiques de gestion des terres, les superficies en culture, le nombre d'animaux d'élevage et de volailles, le capital agricole, les dépenses et revenus d'exploitation, et la machinerie, le matériel et l'équipement agricoles. Ces données donnent un tableau complet du secteur agricole au Canada tous les cinq ans, aux échelons national, provincial et territorial, ainsi qu'aux niveaux géographiques inférieurs.

Méthodologie générale

Population cible

La population cible est constituée de toutes les fermes de recensement du Canada. En 2006, une ferme de recensement était définie comme une exploitation agricole produisant, dans l'intention de vendre, au moins un des produits suivants : cultures (foin, grandes cultures, fruits ou noix, petits fruits ou raisin, légumes, graines de semence), animaux d'élevage (bovins, porcs, moutons, chevaux, gibier à poil, autres animaux), volaille (poules, poulets, dindons et dindes, poussins, gibier à plume, autres volailles), produits d'origine animale (lait ou crème, œufs, laine, fourrure, viande) ou autres produits agricoles (arbres de Noël, produits de serre ou de pépinière, champignons, gazon, miel, produits de la sève d'érable). La définition de ferme de recensement a cependant évoluée; pour un résumé de ces changements depuis 1921, consultez Ferme de recensement.

Le Recensement de l'agriculture sert aussi à recueillir et à publier des données sur une sous-population connexe : les exploitants agricoles. En 2006, les « exploitants agricoles » étaient définis comme les personnes responsables de prendre des décisions de gestion nécessaires à la bonne marche d'une ferme de recensement ou d'une exploitation agricole. On pouvait inscrire jusqu'à trois exploitants agricoles par ferme. Avant le Recensement de l'agriculture de 1991, l'exploitant était la personne qui prenait les décisions nécessaires à la bonne marche de l'exploitation agricole et il ne pouvait y en avoir qu'un.

Collecte

En 2006, le questionnaire du Recensement de l'agriculture était distribué avec le questionnaire du Recensement de la population lorsqu'un membre du ménage était un exploitant agricole. Une fois rempli, le questionnaire était renvoyé par la poste pour vérification. S'il était établi qu'un questionnaire n'avait pas été livré, ou s'il manquait des données, on effectuait un suivi par téléphone ou lors d'une visite sur place. Pour une description plus détaillée du processus de collecte, consultez Collecte des données.

Traitement des données

De retour au bureau central, les questionnaires étaient enregistrés, balayés, puis les données étaient saisies automatiquement grâce à la technologie de reconnaissance intelligente des caractères (RIC). Les données saisies étaient ensuite soumises à de nombreux et rigoureux contrôles de la qualité et du traitement, dont l'objet était de repérer et de régler les problèmes que posent les données inexactes, manquantes ou incohérentes. Des analystes spécialisés examinaient également les données agrégées et les valeurs individuelles afin de repérer et de corriger les erreurs résiduelles de couverture, de déclaration, de saisie des données ou autres. Pour plus de renseignements, consultez Traitement des données.

Période de référence

Le Recensement de l'agriculture a lieu en même temps que le Recensement de la population, tous les cinq ans, depuis 1951. Le Recensement de l'agriculture de 2006 a eu lieu le 16 mai 2006.

Révisions

Les données du Recensement de l'agriculture ne sont pas sujettes à révision.

Redressements

Les données du Recensement de l'agriculture ne sont pas sujettes à la désaisonnalisation et ne se servent pas de données repères provenant d'autres sources de données.

Concepts et variables mesurées

Pour obtenir une description complète des concepts du recensement, des variables dérivées et des niveaux géographiques, consultez Terminologie du recensement et Définitions des unités géographiques.

Exactitude des données

Une partie intégrante de chaque Recensement de l'agriculture est la mise en œuvre de méthodes, de procédures et de technologies, nouvelles ou améliorées, qui facilitent non seulement la collecte, mais aussi le traitement, la validation et la diffusion des données. Les nouvelles méthodes, procédures et technologies adoptées pour le Recensement de l'agriculture de 2006 comprennent l'envoi par la poste de questionnaires aux 6,5 % de la population agricole qui ont une adresse postale valide, la possibilité de remplir le questionnaire en ligne et deux enquêtes de suivi : l'Enquête de suivi des fermes manquantes et l'Enquête de suivi général des fermes. En outre, pour veiller à ce que les données du Recensement de l'agriculture de 2006 soient toujours de grande qualité, on a intégré des procédures améliorées d'assurance et de contrôle de la qualité à chacune des étapes de la collecte et du traitement des données.

Essentiellement, grâce à l'adoption de ces méthodes, procédures et technologies, les données du Recensement de l'agriculture de 2006 sont de très bonne qualité, y compris les données pour les produits principaux qui sont de très grande qualité. Un taux de réponse de 95,7 % et un faible taux de sous-dénombrement des fermes estimé de 3,4 % sont des indications du succès global du Recensement de l'agriculture de 2006. Veuillez noter que les fermes ayant déclaré des ventes de moins de 10 000 $ en 2005 représentent plus de la moitié du sous-dénombrement estimé. Par conséquent, le taux de sous-dénombrement pour les produits principaux est inférieur à 2 %.

Les estimations qui découlent de projets aussi vastes et complexes que les recensements de l'agriculture et de la population sont inévitablement sujettes à un certain degré d'erreur. En déterminant les types d'erreurs susceptibles de se poser et la façon dont elles se répercutent sur certaines variables, les utilisateurs peuvent plus facilement évaluer la pertinence des données pour leurs applications particulières ainsi que les risques qu'ils prennent en appuyant leurs conclusions ou leurs décisions sur ces données.

Des erreurs peuvent survenir pour ainsi dire à chaque stade du processus de recensement, depuis la préparation de documents en passant par la collecte des données jusqu'au traitement. En outre, les erreurs peuvent être plus fréquentes dans certaines régions du pays ou peuvent varier selon la caractéristique mesurée. Certaines erreurs sont aléatoires, et, lorsque les réponses individuelles sont agrégées pour un nombre suffisamment considérable, elles ont tendance à s'annuler. En ce qui touche les erreurs de cette nature, plus le groupe est grand, plus l'estimation correspondante est exacte. Pour cette raison, on conseille aux utilisateurs des données d'être prudents lorsqu'ils se servent des estimations fondées sur un petit nombre de réponses. Par contre, certaines erreurs pourraient être plus systématiques et donner lieu à des estimations « faussées ». Parce que le biais découlant de ces erreurs est constant, quelle que soit l'ampleur du groupe dont les réponses sont agrégées, et parce qu'il est particulièrement difficile à mesurer, les erreurs systématiques posent un problème plus grave que les erreurs aléatoires pour la plupart des utilisateurs de données.

Les types d'erreurs les plus fréquents sont décrits ci-après.

Erreurs de couverture

Malgré les efforts déployés par les recenseurs pour repérer et dénombrer toutes les exploitations agricoles au Canada, certaines d'entre elles nous échappent à chaque Recensement de l'agriculture, particulièrement en raison de la difficulté que pose le repérage d'une exploitation agricole près de laquelle ou sur laquelle aucun des exploitants n'habite. Afin de réduire l'importance de ce sous-dénombrement, les recenseurs devaient demander aux membres de chaque ménage si l'un d'eux était un exploitant agricole. En outre, depuis 1991, une question — visant à déterminer si l'un des membres du ménage est exploitant — apparaît dans le questionnaire du Recensement de la population. Si la réponse à cette question est affirmative dans le questionnaire du Recensement de la population, l'Enquête de suivi des fermes manquantes communique par téléphone avec ces ménages afin de remplir un questionnaire du Recensement de l'agriculture. Cette enquête permet également de dénombrer toutes les grandes fermes de chaque province dans le Registre des fermes de Statistique Canada (une liste des fermes au Canada régulièrement mise à jour) qui auraient pu nous échapper dans le Recensement de l'agriculture. On communiquait avec les exploitants de ces fermes par téléphone pour pouvoir remplir le questionnaire. Finalement, l'Enquête de l'évaluation de la couverture a donné un taux de sous-dénombrement estimé à 3,4 % pour le Recensement de l'agriculture de 2006.

Erreurs de non-réponse

Certains questionnaires du Recensement de l'agriculture et du Recensement de la population sont remplis partiellement ou laissés en blanc, habituellement parce que le répondant était absent pendant la période du recensement ou parce qu'il a refusé de remplir les questionnaires. Dans les deux cas, si le suivi pour tenter d'obtenir les renseignements appropriés se révèle infructueux, les réponses manquantes sont estimées à l'étape subséquente du traitement des données au moyen d'une procédure d'imputation automatique. Cette procédure remplace la réponse manquante ou incohérente soit par une valeur compatible avec les autres données fournies dans le questionnaire, soit par une réponse obtenue d'une exploitation agricole semblable. Les données découlant de cette procédure n'ont généralement que peu d'incidence sur les chiffres définitifs publiés.

Erreurs de réponse

Des répondants inscrivent parfois des réponses inexactes parce qu'ils interprètent mal une question, qu'ils inscrivent leurs réponses au mauvais endroit ou qu'ils donnent une réponse approximative. Dans le Recensement de l'agriculture, il faut confirmer ou corriger les réponses peu vraisemblables ou incohérentes en communiquant avec les répondants, puisque celles-ci peuvent fausser considérablement les totaux, tant à l'échelle provinciale qu'infraprovinciale.

Erreurs de traitement

Des erreurs peuvent survenir à n'importe quel stade du traitement des données. Il peut s'agir d'une erreur de balayage ou de reconnaissance des caractères pendant la saisie de données, d'erreurs de codage manuel ou de classement, ou d'erreurs liées à la procédure d'imputation (dont l'objet est de corriger les réponses manquantes ou incohérentes, comme décrit dans « Erreurs de non-réponse »). Pour repérer ces erreurs en vue de les corriger ultérieurement, on procède à un ensemble détaillé de contrôles informatisés à chaque stade du traitement des données. De plus, des procédures d'assurance de la qualité ont été élaborées pour toutes les étapes du traitement.

Erreurs de couplage

Pendant la création de la base de données du couplage agriculture–population, les renseignements manquants, incomplets ou incorrects portant sur l'identification de l'exploitant dans l'un ou l'autre recensement sont susceptibles d'introduire des erreurs dans le processus de couplage. À titre d'exemples de couplage erroné, mentionnons le cas où la même personne exploitant deux fermes différentes est confondue à tort avec deux personnes différentes ou celui où deux exploitants séparés sont assimilés incorrectement à la même personne dans la base de données du Recensement de la population. Il peut également arriver que des erreurs survenues dans l'identification des exploitants empêchent certains couplages exacts d'être faits. Les effets de ces couplages erronés sont minimisés au stade de l'imputation ou de la pondération.

Erreurs d'échantillonnage

Les erreurs d'échantillonnage entrent en ligne de compte dans le cas de toutes les données relatives aux questions posées dans les formulaires complets du Recensement de la population, auxquelles un échantillon composé d'un cinquième des ménages seulement doit répondre. Ces erreurs découlent du fait que les données recueillies en réponse à ces questions, lorsqu'elles sont pondérées pour être représentatives de l'ensemble de la population, diffèrent inévitablement quelque peu des résultats qui auraient été obtenus si tous les ménages avaient été priés de répondre à ces questions. Lorsque des variables s'appliquant à l'ensemble de la population (soit dans le Recensement de l'agriculture, soit dans le Recensement de la population) sont présentées dans le même tableau que les variables s'appliquant à l'échantillon de 20 %, tous les chiffres figurant dans ce tableau sont forcément des estimations-échantillon et donc susceptibles de comporter des erreurs d'échantillonnage.

L'erreur susceptible d'être introduite par l'échantillonnage variera en fonction de la rareté relative de la caractéristique étudiée au sein de la population. Lorsque les valeurs sont élevées, l'éventuelle erreur attribuable à l'échantillonnage, exprimée sous la forme d'une proportion de la valeur globale, sera relativement faible. Lorsque les valeurs sont faibles, l'éventuelle erreur sera relativement importante. L'erreur susceptible d'être introduite par l'échantillonnage est d'ordinaire exprimée sous forme d'« erreur-type ». Chaque population présente un écart-type qui lui est propre et qui est défini comme la racine carrée de l'écart carré moyen des valeurs obtenues pour l'ensemble de la population relativement à la moyenne. L'erreur-type est une estimation de l'écart-type de la population corrigé pour tenir compte de la taille de l'échantillon par rapport à la taille de la population.

Le tableau ci-dessous fournit des mesures approximatives de l'erreur-type d'échantillonnage estimées en fonction de la taille des valeurs contenues dans une case du tableau de données. Ces mesures sont données uniquement à titre indicatif. Il est à noter qu'elles ne doivent pas être utilisées directement pour effectuer des estimations relatives aux données moyennes sur la population, les familles et les fermes (p. ex. taille moyenne de la famille de recensement).


Tableau 1 Erreur-type d'échantillonnage approximative dans les données du couplage agriculture–population de 2006. Une nouvelle fenêtre s'ouvrira.

Tableau 1 Erreur-type d'échantillonnage approximative dans les données du couplage agriculture–population de 2006


Les utilisateurs qui souhaitent déterminer l'erreur d'échantillonnage approximative pour une valeur donnée, quelle qu'elle soit, fondée sur le couplage agriculture–population doivent choisir l'erreur-type correspondant à la valeur qui se rapproche le plus de celle qui figure dans un tableau particulier du couplage agriculture–population. Dans 95 % des cas (c.-à-d. 19 fois sur 20), un intervalle construit à partir de la valeur totalisée plus ou moins deux fois l'erreur-type contient la valeur réelle pour la population dénombrée (si l'on ne tient pas compte des formes d'erreurs autres que l'erreur d'échantillonnage). À titre d'exemple, l'utilisateur qui se sert des erreurs-types approximatives ci-dessus peut être raisonnablement certain que si la valeur contenue dans la case est 1 000, la fourchette de 1,000 ± (2 x 60) ou de 1,000 ± 120 comprendra la valeur réelle de la caractéristique qui est totalisée.

Cependant, l'effet du plan d'échantillonnage et de la méthode de pondération utilisés dans le cadre du Recensement de 2006 variera d'une caractéristique à l'autre et d'une région géographique à l'autre. Il est donc possible que les valeurs de l'erreur-type données dans le tableau sous-estiment ou surestiment l'erreur d'échantillonnage.

Comparabilité des données et des sources connexes

Le processus de validation des données a fait ressortir certains cas où les données n'étaient pas directement comparables avec celles des recensements précédents, ou que celles-ci étaient de qualité moindre, essentiellement à cause d'erreurs de couverture ou de réponse. L'analyse approfondie de chaque cas a mené à la rédaction de notes précisant les variables touchées et expliquant la situation liée à chacune.

Après chaque Recensement de l'agriculture, d'autres enquêtes agricoles utilisent les données du Recensement de l'agriculture comme base, ou point de repère, pour la production régulière d'estimations pour le secteur agricole.

Autres indicateurs et évaluations de la qualité

Enquête d'évaluation de la couverture

L'objet de l'Enquête d'évaluation de la couverture (EEC) est d'estimer la couverture du Recensement de l'agriculture de 2006, qui a eu lieu le 16 mai 2006.

La couverture est un problème qui touche la qualité des estimations de tous les recensements. Pour le Recensement de l'agriculture, les erreurs de couverture surviennent lorsque des fermes sont oubliées, recensées par erreur ou comptées en double. L'EEC vise à mesurer le niveau de couverture et les méthodes d'évaluation de la qualité au chapitre des estimations du Recensement de l'agriculture.

L'EEC tire du Registre des fermes de Statistique Canada un échantillon aléatoire de petites exploitations agricoles pour lesquelles on n'a pas reçu de questionnaire du Recensement de l'agriculture. L'EEC tire également un échantillon aléatoire des ménages non contactés par l'Enquête de suivi des fermes manquantes qui avaient identifié un exploitant agricole faisant partie de leur ménage, mais qui n'ont pas rempli le questionnaire du Recensement de l'agriculture. Aux fins d'enquête, on utilise un questionnaire abrégé pour recueillir des renseignements clés au sujet du statut d'exploitation et de la taille de la ferme. Prière de noter qu'il n'y a pas eu d'estimations du sous-dénombrement pour le Yukon, les Territoires du Nord-Ouest et le Nunavut.


Tableau 2 Sous-dénombrement des fermes : répartition selon la province. Une nouvelle fenêtre s'ouvrira.

Tableau 2 Sous-dénombrement des fermes : répartition selon la province



Tableau 3 Sous-dénombrement de la superficie agricole totale : répartition selon la province/région. Une nouvelle fenêtre s'ouvrira.

Tableau 3 Sous-dénombrement de la superficie agricole totale : répartition selon la province/région



Tableau 4 Sous-dénombrement des revenus agricoles bruts totaux : répartition selon la province/région. Une nouvelle fenêtre s'ouvrira.

Tableau 4 Sous-dénombrement des revenus agricoles bruts totaux : répartition selon la province/région



Tableau 5 Sous-dénombrement des fermes : répartition selon les revenus agricoles bruts totaux. Une nouvelle fenêtre s'ouvrira.

Tableau 5 Sous-dénombrement des fermes : répartition selon les revenus agricoles bruts totaux