Un modèle intégré de rendement des cultures au moyen de la télédétection, de données agroclimatiques et de données d'assurance-récolte

1. Introduction

Le présent rapport fournit le contexte, les méthodes générales et les résultats d'une approche étendue de l'utilisation de la télédétection, de données agroclimatiques et de données provinciales d'assurance-récolte pour modéliser des estimations fiables du rendement des cultures au début et au milieu de la saison dans le cadre de la Série de rapports sur les grandes cultures de Statistique Canada. Ces travaux s'inspirent du processus de modélisation initial qui a remplacé l'estimation du rendement des cultures de l'enquête de septembre en 2016.

2. Méthodologie générale pour la modélisation du rendement des cultures

La méthodologie étendue de modélisation du rendement des cultures a été mise au point et testée sur les cultures ensemencées au Manitoba. Statistique Canada a été en mesure d'adapter le modèle de rendement existant grâce à une entente avec la Société des services agricoles du Manitoba (Manitoba Agricultural Services Corporation, MASC) dans le cadre de laquelle les données d'assurance-récolte historiques et de l'année en cours au niveau parcellaire ont été fournies, à titre confidentiel, à Statistique Canada pour contribuer à modéliser les rendements des cultures de l'année en cours.

3. Sources de données utilisées dans le modèle

La méthodologie de modélisation est fondée sur trois sources de données : (1) les données à basse résolution de satellites utilisées dans le cadre du Programme d'évaluation de l'état des cultures de Statistique Canada; (2) les données agroclimatiques et (3) les données d'assurance-récolte de la MASC. Les deux premiers ensembles de données, ainsi que les méthodes de traitement et d'extraction, sont décrits en détail dans le rapport mentionné précédemment. Seuls les changements incorporés dans ce modèle de rendement étendu seront soulignés dans le présent rapport.

3.1 Indice de végétation par différence normalisée

L'Indice de végétation par différence normalisée (IVDN), un indice de végétation spectral, a été utilisé comme substitut pour le potentiel photosynthétique des cultures. L'une des principales différences entre le modèle de rendement initial et l'autre modèle de rendement est l'utilisation d'imagerie à spectroradiomètre imageur à résolution moyenne (MODIS) pour calculer les valeurs de l'IVDN. L'ensemble de données satellites précédent avait une résolution par pixel de 1 kilomètre, tandis que les données du MODIS ont une résolution par pixel de 250 mètres. La meilleure résolution des données du MODIS procure une augmentation de 16 fois le nombre de pixels de l'image comparativement à l'imagerie satellite utilisée précédemment, ce qui est essentiel pour le niveau géographique requis pour cette méthodologie. Ces deux ensembles de données d'IVDN sont diffusés chaque semaine tout au long de la saison de végétation (de mi-avril à mi-octobre) par le biais du Programme d'évaluation de l'état des cultures (PEEC) de Statistique Canada : Les données du MODIS remontent jusqu'à l'année 2000.

3.2 Indices agroclimatiques

Les données quotidiennes sur la température et sur les précipitations fournies par les stations climatologiques utilisées dans le modèle ont été fournies par Environnement et Changement climatique Canada et d'autres institutions partenaires et ont été utilisées pour générer les prédicteurs climatiques. Afin de former une gamme gérable de prédicteurs potentiels du rendement des cultures, Agriculture et Agroalimentaire Canada a regroupé les indices agroclimatiques quotidiens en sommes et moyennes mensuelles pour les mois de mai à août et fourni les données agrégées à Statistique Canada pour les utiliser dans le modèle de rendement.

3.3 Données d'assurance-récolte

MASC a fourni les données d'assurance-récolte historiques de 2000 à 2018 à Statistique Canada. Cet ensemble de données comprend les superficies ensemencées, les superficies récoltées et le rendement au niveau parcellaire pour toutes les cultures assurées par les exploitants agricoles au Manitoba. L'ensemble de données de 2019 comprend uniquement la superficie ensemencée au niveau parcellaire pour toutes les cultures assurées. Ces données sont d'excellente qualité et elles ont été utiles afin de mettre au point le modèle de rendement étendu.

4. Modélisation des rendements d'enquête

4.1 Méthodes de modélisation

Les rendements des cultures ont été estimés à l'aide d'un modèle linéaire multivarié robuste. Le modèle a été construit en utilisant les relations historiques entre les rendements déclarés à la MASC par les exploitants agricoles à la fin de la saison de végétation (la variable dépendante du modèle) et l'IVDN et les mesures agroclimatiques prises à différents moments pendant la saison de végétation. Le modèle a également fait appel à une variable temporelle pour tenir compte de l'ensemble des variations de rendement à travers les années. Les données des 10 saisons de végétation précédentes ont été utilisées pour dériver le modèle.

L'unité utilisée dans le modèle était la parcelle individuelle, telle que déclarée à la MASC. Les plus vastes parcelles étaient à l'échelle du quart de section, représentant 160 acres de terres. Le modèle a estimé le rendement des cultures par parcelle. Ce rendement a par la suite été pondéré selon la quantité de terres ensemencées dans la parcelle déclarée à la MASC par l'exploitant agricole au début de la saison de végétation pour dériver une estimation initiale du rendement à l'échelon provincial. Seules les parcelles ayant au moins 145 acres d'une culture unique ont été utilisées dans le modèle. Un ajustement supplémentaire a été apporté à l'estimation modélisée pour tenir compte des parcelles plus petites. Pour plus de détails, voir la section 4.2. « Ajustement des estimations initiales ».

En raison du grand nombre d'IVDN et de lectures agroclimatiques disponibles, il n'était pas raisonnable d'inclure toutes les variables dans le modèle. Les variables à retenir dans le modèle ont été sélectionnées en utilisant la procédure GLMSELECT dans SAS avec l'option LASSO (Least Absolute Shrinkage and Selection Operator). À quelques exceptions, un minimum de cinq variables étaient requises pour le modèle, et l'ensemble final de variables à retenir a été déterminé en utilisant la méthode de critère d'information bayésien de Schwarz.

Un plus grand nombre de points de données sont disponibles pour les cultures plus courantes. Dans le cas des cultures les plus courantes, les modèles individuels ont été construits à l'échelon de la région écologique infraprovinciale et ont par la suite été agrégés à l'échelon provincial. On dénombre sept régions écologiques de la sorte au Manitoba. Elles ont été dérivées à partir de grappes d'écodistricts (Écodistricts terrestres du Canada). Les rendements des cultures sont influencés par des facteurs tels que le climat, la physiographie et le type de sol, et ces régions se prêtent bien à la caractérisation de ces facteurs. Pour ce qui est des cultures moins courantes, le modèle a été construit à l'échelon provincial. Voir la liste des cultures et du niveau géographique auquel le modèle a été construit à l'annexe A.

4.2 Ajustement des estimations initiales

Le modèle a été construit en utilisant les parcelles de terres assurées où une culture unique d'au moins 145 acres a été ensemencée. Cela permet d'attribuer avec exactitude l'IVDN à la culture qui est cultivée. Les résultats directs du modèle représentent le rendement estimé de ces parcelles. Par conséquent, les parcelles de terres qui n'étaient pas assurées ou qui avaient moins de 145 acres d'une culture unique n'ont pas été incluses directement dans les estimations modélisées.

Dans le cas des parcelles de terres non assurées, aucun ajustement n'a été apporté aux estimations pour en tenir compte. Cela suppose que le rendement des parcelles de terres non assurées est similaire à celui des parcelles assurées ayant plus de 145 acres d'une culture unique. La quantité de terres non assurées a été estimée en comparant les renseignements sur les superficies issus des fichiers de 2016, 2017 et 2018 de la MASC aux estimations des superficies de la Série de rapports sur les grandes cultures de Statistique Canada par culture. Voir les estimations du pourcentage de cultures non assurées à l'annexe B.

Dans le cas des parcelles de terres qui avaient moins de 145 acres d'une culture unique, il a été possible d'utiliser les renseignements historiques sur l'assurance-récolte pour comparer les rendements par culture des parcelles qui avaient au moins 145 acres d'une culture unique avec les rendements des parcelles de moindres superficies. Il a par la suite été possible d'ajuster les estimations directes du modèle selon le ratio de ces deux valeurs, pondéré par la superficie ensemencée dans l'année en cours. Le ratio a été calculé en utilisant 10 années d'observations à partir des fichiers historiques d'assurance-récolte. Voir le ratio moyen du rendement des deux superficies de terres par culture et l'écart type de ces ratios au cours des 10 années précédentes à l'annexe C.

4.3 Comparaison des rendements des cultures modélisés avec d'autres indicateurs de rendement

Pendant le cycle d'élaboration du modèle, de nombreux paramètres du modèle ont été étudiés, notamment : le nombre d'années de données historiques à utiliser dans le modèle, l'échelon auquel le modèle a été construit (échelon provincial ou de la région écologique), la façon de sélectionner les variables explicatives pour le modèle, la définition d'une parcelle de terre, les méthodes d'ajustement des valeurs du modèle pour mieux représenter l'ensemble de la population des producteurs de cultures, ainsi que d'autres facteurs.

Une façon d'évaluer le succès du modèle était de comparer ses résultats avec d'autres statistiques qui mesurent le rendement des cultures. Aux fins de la présente étude, deux sources de données ont été examinées :

  • les rendements des cultures déclarés à la MASC par les exploitants agricoles à la fin de l'année
  • les résultats des enquêtes de la Série de rapports sur les grandes cultures de Statistique Canada.

Statistique Canada mesure les rendements des cultures à trois moments de la saison de végétation afin de produire

  • des estimations en début de saison, en utilisant une enquête qui a lieu en juillet, appelée l'enquête de juillet
  • des estimations en milieu de saison, en utilisant une enquête qui a lieu au début de septembre, appelée l'enquête de septembre
  • des estimations en fin de saison, en utilisant une enquête qui a lieu à la fin d'octobre.

Dans le cadre de son évaluation, le modèle de rendement des cultures a été utilisé pour produire des estimations du rendement des cultures tant en début de saison qu'en milieu de saison.

Neuf ensembles d'estimations du rendement des cultures en début de saison et en milieu de saison (représentant les années de cultures de 2010 à 2018) ont été produits en utilisant le modèle et comparés aux résultats des autres sources de données, par culture lorsque cela était possibleNote de bas de page 1. Une mesure de la différence relative, par rapport à l'estimation du rendement des fichiers d'assurance-récolte, a été calculée pour les valeurs de l'enquête et les valeurs modélisées :

différence relative méthode i = estimation du rendement méthode i - estimation du rendement assurance-récolte estimation du rendement assurance-récolte

où la méthode i est soit l'estimation du rendement modélisé, soit l'estimation du rendement de l'enquête.

Trois statistiques fondées sur la différence relative ont été produites pour chacune des cultures :

  • la différence relative moyenne à travers les neuf années
  • la moyenne de la valeur absolue de la différence relative à travers les neuf années
  • la différence relative absolue maximale à travers les neuf années

5. Résultats

Les résultats sont présentés au tableau 1 pour les estimations en début de saison; ceux pour les estimations en milieu de saison sont présentés au tableau 2.

Tableau 1 : Comparaison des différences relatives avec les estimations de rendement de l'assurance-récolte pour les estimations de rendement en début de saison de l'enquête de juillet et du modèle, de 2010 à 2018
    Différence relative moyenne Différence relative absolue moyenne Différence relative absolue maximale
Culture Superficie ensemencée en 2018 (acres) Enquête de juillet (%) Valeurs modélisées (%) Enquête de juillet (%) Valeurs modélisées (%) Enquête de juillet (%) Valeurs modélisées (%)
Orge 324 000 2,0 1,6 12,5 10,8 35,6 25,9
Sarrasin 5 400 31,4 -10,1 31,4 22,4 52,7 36,9
Graines de l'alpiste des Canaries -12,4 -1,0 28,9 18,0 77,1 67,2
Canola (colza) 3 416 000 -9,8 1,2 13,2 9,7 23,9 31,2
Maïs-grain 421 000 -12,7 5,5 13,2 10,1 22,0 30,6
Pois, secs 85 000 -7,0 -0,5 12,9 12,3 30,7 22,4
Fèveroles 7,7 -1,7 24,7 11,6 51,1 36,2
Graines de lin 37 500 2,6 3,7 12,3 11,7 23,3 37,3
Chanvre 11 300 ... -4,0 ... 14,4 ... 28,4
Lentilles 2 000 ... 111,3 ... 111,3 ... 164,5
Graines de moutarde 4 900 ... 33,3 ... 52,2 ... 90,4
Avoine 484 900 -7,5 -1,4 11,2 7,8 19,8 15,8
Haricots, secs de couleur 105 800 -8,8 7,2 10,4 13,9 22,7 32,3
Seigle d'automne 42 300 0,5 -2,0 15,0 14,8 34,6 24,8
Soya 1 890 000 -7,3 2,7 11,2 12,0 17,3 30,1
Graines de tournesol 60 000 -6,4 4,0 13,9 14,0 31,6 27,9
Haricots, secs blancs 30 100 -13,2 3,0 17,0 16,8 35,1 32,0
Blé dur 1,7 -14,4 38,0 27,0 110,0 47,0
Blé roux de printemps de l'Ouest canadien 2 590 000 -12,6 -6,3 12,6 9,7 28,1 27,2
Blé, autre de printemps 20 900 -20,3 -2,8 25,6 15,8 68,4 31,1
Blé roux de printemps Canada Prairie et blé blanc de printemps Canada Prairie 51 000 -6,1 -9,0 18,4 15,3 42,0 33,6
Blé d'hiver restant 41 000 -1,9 2,5 6,1 7,2 10,2 19,8
... n'ayant pas lieu de figurer
Tableau 2 : Comparaison des différences relatives avec les estimations de rendement de l'assurance-récolte pour les estimations de rendement en milieu de saison de l'enquête de septembre et du modèle, de 2010 à 2018Note de bas de page 2 Note de bas de page 3
    Différence relative moyenne Différence relative absolue moyenne Différence relative absolue maximale
Crop Superficie ensemencée en 2018 (acres) Enquête de septembre (%) Valeurs modélisées (%) Enquête de septembre (%) Valeurs modélisées (%) Enquête de septembre (%) Valeurs modélisées (%)
Orge 324 000 0,2 -3,3 6,5 11,1 16,0 22,1
Sarrasin 5 400 ... -5,7 ... 18,5 ... 35,9
Graines de l'alpiste des Canaries ... -1,7 ... 17,3 ... 59,2
Canola (colza) 3 416 000 -11,4 -3,3 11,4 10,3 16,3 22,0
Maïs-grain 421 000 -15,3 2,4 15,3 11,5 28,6 32,1
Pois, secs 85 000 0,9 -1,2 5,9 12,6 17,1 26,3
Fèveroles ... 1,1 ... 9,9 ... 31,7
Graines de lin 37 500 -2,0 3,4 5,9 11,7 9,6 32,8
Chanvre 11 300 ... -7,4 ... 11,6 ... 34,2
Lentilles 2 000 ... 72,9 ... 89,4 ... 164,5
Graines de moutarde 4 900 ... 51,3 ... 59,7 ... 127,7
Avoine 484 900 -7,5 0,7 7,6 8,3 12,8 14,8
Haricots, secs de couleur 105 800 ... 4,9 ... 8,5 ... 22,5
Seigle d'automne 42 300 1,9 -2,3 11,7 17,4 20,3 27,0
Soya 1 890 000 -8,4 0,6 8,4 11,9 19,3 24,7
Graines de tournesol 60 000 ... 1,0 ... 22,1 ... 41,1
Haricots, secs blancs 30 100 ... -4,9 ... 11,3 ... 33,0
Blé dur ... -15,8 ... 25,7 ... 47,0
Blé roux de printemps de l'Ouest canadien 2 590 000 -9,3 -8,3 9,3 8,6 17,1 25,2
Blé, autre de printemps 20 900 -9,3 -3,8 9,3 13,7 17,1 32,5
Blé roux de printemps Canada Prairie et blé blanc de printemps Canada Prairie 51 000 -9,3 -4,2 9,3 11,3 17,1 30,9
Blé d'hiver restant 41 000 -0,9 1,6 2,9 9,7 5,9 23,9
... n'ayant pas lieu de figurer

Dans l'ensemble, le modèle est très comparable aux résultats des enquêtes de juillet et de septembre, plus particulièrement en ce qui concerne les cultures plus courantes au Manitoba comme le canola, le blé de printemps et le soya. Les différences relatives moyennes et les différences relatives absolues moyennes du modèle sont, en général, de meilleure qualité que celles de l'enquête.

La valeur de la différence relative en soi montre la différence en pourcentage entre les valeurs du modèle et les valeurs de l'assurance-récolte. En moyenne, les différences relatives sont bonnes dans de nombreux cas, mais il est important de noter qu'une bonne moyenne peut consister en une grande valeur positive et de façon similaire, en une grande valeur négative. Les valeurs absolues indiquent qu'il peut exister des différences importantes entre les deux estimations à tout moment donné. Le maximum indique que ces valeurs peuvent parfois être grandes.

6. Indicateur de la qualité des données—coefficient de variation

Étant donné que les valeurs de rendement à l'échelon de la parcelle sont des estimations issues d'un modèle, elles peuvent comporter des erreurs. Un indicateur qui peut être utilisé pour mesurer le degré d'erreur possible, et par conséquent, le degré d'incertitude des estimations, est le coefficient de variation (CV). En ce qui concerne le modèle de rendement, la variabilité est mesurée en fonction de l'erreur type des valeurs prédites individuelles (c.-à-d., l'erreur dans la prévision à l'échelon de la parcelle). Veuillez noter que les CV du modèle sont calculés différemment de ceux d'une enquête et ils ne sont pas directement comparables. Les CV du modèle peuvent être considérés comme une estimation conservatrice de la variabilité réelle—une borne supérieure. En fait, les CV réels pourraient être inférieurs. Le tableau 3 présente les CV moyens pour chacune des cultures à partir des tests de 2010 à 2018.

Tableau 3 : Coefficients de variation moyens estimés à partir du modèle pour différentes cultures, de 2010 à 2018
Culture Coefficient de variation moyen de l'estimation en début de saison (%) Coefficient de variation moyen de l'estimation en milieu de saison (%)
Orge 20,0 21,0
Sarrasin 61,5 59,6
Graines de l'alpiste des Canaries 33,2 33,3
Canola (colza) 19,4 20,0
Maïs-grain 14,3 14,6
Pois, secs 26,0 26,1
Fèveroles 35,3 31,3
Graines de lin 25,5 25,5
Chanvre 44,5 46,4
Lentilles 19,0 24,0
Graines de moutarde 59,6 48,5
Avoine 20,9 20,3
Haricots, secs de couleur 24,1 24,4
Seigle d'automne 27,9 27,5
Soya 18,5 18,7
Graines de tournesol 26,0 27,4
Haricots, secs blancs 21,9 23,0
Blé dur 33,3 33,4
Blé roux de printemps de l'Ouest canadien 17,8 18,1
Blé, autre de printemps 18,9 19,0
Blé roux de printemps Canada Prairie et blé blanc de printemps Canada Prairie 27,1 25,8
Blé d'hiver restant 17,4 17,6
Veuillez noter que les CV ne tiennent pas compte des variabilités liées au facteur d'ajustement pour les plus petites parcelles.

7. Critères de diffusion

Un ensemble de règles ont été établies afin de déterminer les rendements modélisés qui sont de qualité suffisante pour être diffusés. Ces règles sont fondées sur le succès du modèle linéaire multivarié robuste et le CV en résultant qui est calculé pour chaque estimation modélisée. Elles sont appliquées à chaque culture et sont légèrement différentes, selon que le modèle a été construit à l'échelon provincial ou de la région écologique.

Premièrement, il est possible qu'une estimation ne soit pas générée par le modèle. Cette situation est plus susceptible de se produire avec les cultures rares. Elle pourrait se produire en raison du fait qu'il y a moins de 50 parcelles de terres dans la base de données historiques avec lesquelles construire le modèle, ou parce qu'aucune solution mathématique ne peut convenir au modèle.

Deuxièmement, si le CV de l'estimation provinciale du modèle est supérieur à 35 %, l'estimation n'est pas diffusée.

Finalement, il y a une règle supplémentaire pour les cultures qui sont modélisées à l'échelon de la région écologique. L'estimation provinciale pour une culture ne sera pas diffusée si la superficie totale ensemencée dans les régions écologiques qui ne respectent pas les conditions précédentes dépasse 10 % de la superficie ensemencée provinciale pour la culture. Dans de telles situations, le modèle peut être exécuté de nouveau à l'échelon provincial pour obtenir une estimation provinciale.

Annexe A : Niveau géographique auquel les modèles de rendement des cultures ont été construits

Le tableau suivant indique le niveau géographique auquel les modèles de rendement des cultures ont été construits. En général, les cultures moins courantes ont été modélisées à l'échelon provincial, tandis que les cultures plus courantes ont été modélisées à l'échelon de la région écologique.
Culture Niveau géographique de modélisation
Orge Région écologique
Sarrasin Provincial
Graines de l'alpiste des Canaries Provincial
Canola (colza) Région écologique
Maïs-grain Région écologique
Pois, secs Provincial
Fèveroles Provincial
Graines de lin Région écologique
Chanvre Provincial
Lentilles Provincial
Graines de moutarde Provincial
Avoine Région écologique
Haricots, secs de couleur Région écologique
Seigle d'automne Provincial
Soya Région écologique
Graines de tournesol Provincial
Haricots, secs blancs Région écologique
Blé dur Provincial
Blé roux de printemps de l'Ouest canadien Région écologique
Blé, autre de printemps Région écologique
Blé roux de printemps Canada Prairie et blé blanc de printemps Canada Prairie Provincial
Blé d'hiver restant Région écologique

Annexe B : Pourcentage de superficies de culture non assurées par une assurance-récolte

Le tableau suivant présente les estimations, par culture, du pourcentage de terres cultivées qui ne sont pas assurées. Aucun ajustement n'est apporté aux estimations modélisées pour ces cultures non assurées. Il est présumé que leur rendement est similaire à celui des champs assurés. Les pourcentages ont été estimés en comparant la superficie de terres assurées selon la culture telle que déclarée dans les fichiers de la MASC de 2016 à 2018 à la superficie de cultures estimée dans la Série de rapports sur les grandes cultures de Statistique Canada.
Culture Pourcentage estimé de superficie de cultures non assurées (%)Note de bas de page 4
Orge 13,4
Sarrasin 10,2
Graines de l'alpiste des Canaries
Canola (colza) 3,1
Maïs-grain 8,5
Pois, secs 1,8
Fèveroles 9,0
Graines de lin 13,8
Chanvre
Lentilles 15,8
Graines de moutarde
Avoine 14,8
Haricots, secs de couleur 8,8
Seigle d'automne 9,5
Soya 1,3
Graines de tournesol 10,0
Haricots, secs blancs 8,8
Blé dur
Blé roux de printemps de l'Ouest canadien 6,0
Blé, autre de printemps 6,0
Blé roux de printemps Canada Prairie et blé blanc de printemps Canada Prairie 6,0
Blé d'hiver restant 15,4

Annexe C : Ratio des rendements entre les petites et grandes parcelles de terres assurées

Le tableau suivant présente les estimations du ratio du rendement des petits champs (moins de 145 acres d'une culture unique à l'intérieur d'une parcelle de terre) à celui des grands champs (au moins 145 acres d'une culture unique à l'intérieur d'une parcelle de terre). Une valeur de moins de 1 indique que les plus petits champs ont un rendement inférieur à celui des grands champs.
Ces valeurs ont été calculées en utilisant les renseignements sur 10 ans de la MASC, et le ratio représente la moyenne du ratio annuel sur les 10 ans. La variance de l'estimation est également fournie à titre indicatif de la stabilité de ce ratio avec le temps.
Culture Ratio estimé du rendement des petits champs aux grands champs Variance
Orge 0,88 0,0007
Sarrasin 1,04 0,0430
Graines de l'alpiste des Canaries 0,94 0,0189
Canola (colza) 0,96 0,0003
Maïs-grain 0,99 0,0007
Pois, secs 0,90 0,0021
Fèveroles 0,92 0,0403
Graines de lin 0,94 0,0042
Chanvre 0,98 0,0147
Lentilles 1,13 0,5358
Graines de moutarde 1,35 0,5556
Avoine 0,83 0,0025
Haricots, secs de couleur 1,04 0,0035
Seigle d'automne 0,92 0,0013
Soya 0,97 0,0003
Graines de tournesol 0,95 0,0022
Haricots, secs blancs 1,00 0,0045
Blé dur 1,01 0,0916
Blé roux de printemps de l'Ouest canadien 0,92 0,0003
Blé, autre de printemps 0,95 0,0053
Blé roux de printemps Canada Prairie et blé blanc de printemps Canada Prairie 1,05 0,0295
Blé d'hiver restant 0,93 0,0007
Date de modification :