Estimations modélisées des principales grandes cultures
Information détaillée pour 31 juillet 2023
Statut :
Active
Fréquence :
Annuelle
Numéro d'enregistrement :
5225
Les estimations modélisées des cultures fournissent, à l'échelle provinciale et nationale, des estimations sur la production et le rendement pour les principales grandes cultures au Canada. Le modèle utilise des données obtenues par imagerie satellitaire à faible résolution, des estimations historiques des grandes cultures et des renseignements agroclimatiques.
Date de la parution - 29 août 2023
Aperçu
Depuis 2012-2013, Statistique Canada collabore avec Agriculture et Agroalimentaire Canada (AAC) et Environnement Canada (EC) à la mise au point d'un modèle qui permettrait d'obtenir des estimations sur le rendement des principales cultures au Canada. Statistique Canada y a vu une occasion de rendre disponibles de nouveaux estimés sur les grandes cultures par ces estimations de rendement modélisées, et de réduire le fardeau de réponse pour les producteurs de cultures.
Les estimations modélisées du rendement des cultures sont produites aux niveaux provincial et national pour fins de diffusion.
Elles fourniront des renseignements sur le rendement et la production pour le mois d'août, à une date antérieure à celle de l'Enquête sur les fermes de septembre, sans alourdir le fardeau de réponse des producteurs de cultures.
Ces estimations fournissent des renseignements importants sur la sécurité alimentaire mondiale, les marchés de produits de culture et la planification du transport des cultures de la ferme vers les marchés.
Les organismes gouvernementaux fédéraux et provinciaux, les agences de commercialisation des grains, les sociétés d'assurance-récolte, les chercheurs et les producteurs sont les utilisateurs types des estimations sur le rendement et la production.
Sujets
- Agriculture et alimentation (anciennement Agriculture)
- Cultures et horticulture
Sources de données et méthodologie
Population cible
La population cible est l'ensemble du secteur agricole du Québec, de l'Ontario, du Manitoba, de la Saskatchewan et de l'Alberta.
Élaboration de l'instrument
Cette méthodologie ne s'applique pas.
Échantillonnage
Les données étant recueillies pour toutes les unités de la population cible, par conséquent, aucun échantillonnage n'est effectué.
Sources des données
Les données sont tirées de fichiers administratifs et sont dérivées de diverses enquêtes de Statistique Canada et/ou d'autres sources.
Trois sources de données sont utilisées comme variables d'entrée pour les modèles de culture; soit : 1) l'indice de végétation par différence normalisée (IVDN), dont les données sont obtenues par imagerie satellitaire à faible résolution, 2) les données d'enquête sur le rendement et 3) les indices agroclimatiques.
Les données hebdomadaires de l'IVDN sont un produit du Programme d'évaluation de l'état des cultures (PEEC) de Statistique Canada. L'IVDN est un indice normalisé de la santé de la végétation et permet de comparer directement les conditions changeantes de la végétation à l'intérieur d'une série chronologique. L'indice IVDN moyen pour une région agricole de recensement (RAR) donnée est calculé en faisant une moyenne de tous les pixels de cette région. Après avoir calculé les valeurs de l'IVDN moyennes, on les importe en tant que l'une des bases de données de variables d'entrée dans les modèles de culture sous forme de moyennes mobiles de trois semaines, de la 18e à la 35e semaine du calendrier julien (de mai à août). Pour de plus amples renseignements au sujet des données de l'IVDN, suivez le lien vers la page de la BMDI dans la section Documentation du présent document.
La Série de rapports sur les grandes cultures recueille des renseignements sur les céréales et autres grandes cultures entreposées à la ferme (enquêtes de mars, de juin, et de décembre), les superficies ensemencées (enquêtes de mars, juin, et novembre), les superficies récoltées, et les anticipations de rendement et de production des récoltes (enquête de novembre). Les estimations obtenues sont fondées sur des enquêtes par échantillon effectuées à quatre moments de l'année, principalement par interviews téléphoniques auprès d'exploitants agricoles. Les rendements prévus des cultures par les données modélisées de juillet de l'année en cours et les rendements historiques obtenus dans l'Enquête sur les fermes de juillet sont utilisés comme variables d'entrée pour le modèle. Les estimations historiques du rendement des cultures issues de l'enquête de novembre sont utilisées comme variable dépendante dans le modèle. L'estimation modélisée de la production est calculée en multipliant la valeur de la superficie récoltée tirée des données modélisées de juillet par l'estimation modélisée du rendement des cultures du mois d'août. Pour de plus amples renseignements au sujet de la Série de rapports sur les grandes cultures, suivez le lien vers la page de la BMDI dans la section Documentation du présent document.
L'information sur l'agroclimat mesurée pendant la saison de végétation est la troisième source de données utilisée pour la modélisation du rendement des cultures. Les données sur la température et les précipitations quotidiennes enregistrées dans les stations et fournies par Environnement et Changement climatique Canada et d'autres institutions partenaires sont utilisées pour générer des variables climatiques explicatives. Au total, approximativement 478 stations climatiques réparties sur l'ensemble des terres en culture du Canada sont choisies pour représenter le climat de 69 RAR et 19 DR en Saskatchewan. Le contrôle de la qualité et l'ajout des données manquantes sont effectués par AAC.
Les séries quotidiennes de température de l'air et des précipitations sont intégrées dans un modèle adaptatif du bilan hydrique des sols par AAC afin de générer des indices agroclimatiques qui seront utilisés dans le modèle de rendement. Les données du modèle adaptatif du bilan hydrique des sols sont générées chaque jour et utilisées comme prédicteurs du rendement potentiel.
Les valeurs moyennes des indices à toutes les stations sur les terres en culture d'une RAR donnée sont utilisées pour représenter l'agroclimat moyen de cette RAR. Si une RAR n'a pas suffisamment de données d'entrée sur le climat, les données des stations de RAR avoisinantes sont utilisées.
Afin de constituer un ensemble de prédicteurs du rendement éventuel des cultures qui soit facile à gérer, AAC a agrégé les indices agroclimatiques quotidiens qui sont inclus dans la méthodologie de modélisation (Newlands et al. 2014 - http://journal.frontiersin.org/article/10.3389/fenvs.2014.00017/full; Chipanshi et al. 2015 - http://dx.doi.org/10.1016/j.agrformet.2015.03.007).
Détection des erreurs
Après que les estimations modélisées sont générées, elles sont comparées aux estimations de rendement de juillet, même si l'on s'attend à ce qu'il y ait des différences entre les deux ensembles d'estimations. Les experts en la matière examinent également les résultats pour repérer toutes les estimations qui semblent douteuses. Des sources externes d'estimations du rendement des cultures sont également utilisées pour déceler les erreurs possibles.
Imputation
Cette méthodologie ne s'applique pas à ce programme statistique.
Estimation
Les estimations modélisées du rendement des cultures sont calculées à l'aide d'un robuste modèle de régression linéaire (au moyen de la méthode MM dans SAS) qui utilise des données allant de 1987 jusqu'à nos jours. Les estimations historiques de l'enquête sur les grandes cultures de novembre pour le rendement des cultures sont utilisées comme variable dépendante. Les variables indépendantes proviennent de l'ensemble de données de l'IVDN, des estimations historiques de l'enquête sur les grandes cultures de juillet pour le rendement des cultures et des données agroclimatiques historiques. Au plus cinq variables indépendantes peuvent être incluses dans le modèle. Elles sont choisies au moyen de la méthode LASSO (Least Absolute Shrinkage and Selection Operator) pour la sélection des variables dans SAS.
Les estimations du rendement des cultures sont modélisées par RAR et sont agrégées par province et pour tout le pays aux fins de diffusion. L'agrégation est effectuée en utilisant la superficie ensemencée tirée de l'Enquête sur les fermes de juin de la Série de rapports sur les grandes cultures afin de pondérer la contribution de chaque RAR par rapport au niveau d'agrégation respectif. Certaines cultures moins abondantes dans une province sont modélisées directement au niveau provincial.
Évaluation de la qualité
Au cours de l'étape d'élaboration du modèle, la qualité du modèle a été mise à l'essai en effectuant une prévision des valeurs pour les estimations historiques du rendement des cultures de l'enquête de novembre et en comparant ces valeurs aux valeurs réelles aux niveaux provincial et national. En fonction de ces observations, le modèle optimal a été choisi. Des essais diagnostics ont également été exécutés sur ce modèle afin de confirmer que ses données d'entrée sont conformes aux propriétés exigées par le modèle.
Un certain nombre d'exigences sont définies et doivent être satisfaites avant que les estimations du modèle puissent être publiées. Si l'on a moins de douze années d'estimations du rendement des Enquêtes sur les fermes de juillet ou novembre, ou s'il manque les estimations du rendement de l'Enquête sur les fermes de juillet ou de juin pour l'année en cours dans un RAR, une estimation du rendement ne sera pas produite pour cette RAR. En ce qui concerne le niveau provincial, la superficie totale supprimée au niveau de la RAR est calculée et si elle représente plus de 10 % de la superficie totale de cette culture dans la province, elle est également supprimée au niveau provincial. De même, si plus de 10 % de la superficie totale au niveau national est supprimée, une estimation du rendement ne sera pas produite pour cette culture au niveau national.
De plus, si le coefficient de variation (CV) calculé pour une estimation du rendement dans une province est supérieur à 35 %, une estimation du rendement ne sera pas publiée pour cette province.
Avant leur publication, les estimations modélisées du rendement des cultures pour l'année en cours sont comparées à celles de l'enquête sur les grandes cultures de juillet et des experts en la matière examinent les résultats afin de repérer des estimations qui pourraient sembler douteuses. Des sources externes d'estimations sur le rendement des cultures sont également utilisées pour cerner les résultats douteux.
Contrôle de la divulgation
La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.
Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite au moyen du Système généralisé de contrôle de la divulgation (G-Confid) de Statistique Canada. G-Confid est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.
Révisions et désaisonnalisation
Ce type de méthodologie ne s'applique pas à ce programme statistique.
Exactitude des données
Des coefficients de variation sont produits par le modèle. Toute estimation modélisée ayant un coefficient de plus de 10 % ne sera pas publiée. Ce seuil est différent de celui qui est utilisé pour les estimations fondées sur les enquêtes pour le rendement des cultures, car la méthode de calcul n'est pas la même.
Documentation
- Modélisation intégrée du rendement des cultures au moyen de la télédétection, de données agroclimatiques et de données d'enquête
- Programme d'évaluation de l'état des cultures (PEEC)
- Série de rapports sur les grandes cultures
- Date de modification :