La spectrométrie proche infrarouge, découverte récente, est utilisée dans le cadre de nombreuses applications pour son caractère non destructif, rapide et peu coûteux en entretien.
Du spectre à la mesure de richesse
Depuis 2017, de nombreux échantillons ont été mesurés par l’ITB avec le spectromètre SCIO. Des prélèvements de betteraves sont réalisés à différentes dates et sur plusieurs variétés soumises à des régimes azotés contrastés. Pour chaque betterave, une mesure est réalisée au niveau du collet, et la richesse de référence est mesurée au laboratoire du Griffon. Une première analyse permet d’évaluer la qualité des mesures indépendamment de l’effet année. Pour cela, à chaque année de mesure, les données sont séparées entre un jeu de données de calibration et un jeu de données de validation. Un modèle Partial Least Squares (PLS) permettant de relier le spectre à la richesse est paramétré à partir des données de calibration. Le choix du meilleur modèle est déterminé par l’erreur quadratique moyenne de la validation croisée (RMSECV) qui doit être la plus faible possible. Ce modèle est ensuite utilisé pour prédire les données du jeu de validation (figure 1). Afin d’évaluer la qualité de prédiction du modèle, différents critères sont calculés (tableau 1) : l’erreur standard de prédiction (SEP), le coefficient de détermination (R²), la différence moyenne entre les valeurs prédites et de référence (biais). Les données mesurées en 2020 ont une gamme de richesse plus large que celles des autres années, qui peut expliquer la valeur plus élevée de SEP malgré une valeur de R² proche de 0,7.
De la mesure à la prédiction de richesse
L’objectif de ce travail est de mettre au point un modèle permettant de prédire les richesses des betteraves de l’année en cours avec un modèle calibré par les mesures des années précédentes. Or, les conditions de culture étant différentes chaque année, il est difficile de paramétrer le modèle correctement. C’est pourquoi, une méthode de transfert de modèles est mise en place. Elle consiste en l’ajout d’une partie des données de l’année à prédire dans le jeu de calibration. Le modèle PLS ainsi calibré est ensuite utilisé pour prédire le reste des données de l’année. Afin de voir l’évolution de la précision de prédiction en fonction du nombre de données de calibration, cette approche est testée pour prédire les données de 2020 (figure 2) à partir des données de 2019 (modèle 1), de 2018-2019 (modèle 2) et de 2017-2018-2019 (modèle 3). Les mêmes critères d’évaluation que précédemment sont calculés : SEP, R² et biais (tableau 2). En 2020, avec trois années de mesure de calibration, l’erreur de prédiction a diminué de 0,1 point de richesse. Ces résultats montrent que la précision augmente avec le nombre de données servant à la calibration. L’ITB va continuer à enrichir la base de données chaque année afin de disposer d’un modèle robuste, capable de prendre en compte toutes les variabilités interannuelles.
Ce travail a bénéficié d’une aide de l’État gérée par l’Agence Nationale de la Recherche au titre du programme « Investissements d’avenir » portant la référence ANR-11-BTBR-0007.
Les données mesurées par le SCIO permettent de prédire la richesse des betteraves au cours de leur croissance.
Une méthode de transfert de modèle doit être mise en place pour prédire la richesse de l’année en cours.
La robustesse du modèle est améliorée par l’augmentation du nombre de données.
En 2020, la fiabilité de prédiction a augmenté de 0,1 point de richesse avec trois années de mesures de calibration