Ces dernières années, les algorithmes de ML ont gagné en reconnaissance dans la modélisation écologique, y compris la prédiction du carbone organique du sol (SOC). Cependant, leur application avec des ensembles de données plus petits, typiques des recherches à long terme sur le sol, reste à évaluer en profondeur, surtout par rapport aux modèles traditionnels basés sur des processus. Une étude en Autriche a comparé des algorithmes de ML comme Random Forest et Support Vector Machines à des modèles basés sur des processus comme RothC et ICBM, utilisant des données de cinq sites expérimentaux de longue durée. Les résultats ont révélé que les algorithmes de ML fonctionnent mieux avec de grands ensembles de données, mais leur précision diminue avec des ensembles de formation plus petits ou des méthodes de validation plus rigoureuses, comme leave-one-site-out. Les modèles basés sur des processus, bien que nécessitant une calibration minutieuse, offrent une meilleure compréhension des mécanismes biophysiques et biochimiques sous-jacents aux dynamiques du SOC. L’étude recommande ainsi de combiner les algorithmes de ML avec des modèles basés sur des processus pour tirer parti de leurs forces respectives.

Pour maintenir et augmenter les niveaux de SOC, essentiels pour la fertilité et la résilience des sols face au changement climatique, il est crucial d’avoir des systèmes de surveillance fiables et des modèles prédictifs efficaces. Alors que les ML brillent avec de grands ensembles de données, les modèles basés sur des processus apportent des aperçus précieux des mécanismes du sol. Cette approche combinée pourrait permettre des prédictions plus précises et adaptables, essentielles pour une gestion efficace des sols et la conservation environnementale à travers le monde.

En résumé, l’étude a utilisé des données de cinq expériences de terrain à long terme en Autriche, couvrant diverses pratiques de gestion visant l’accumulation de SOC. Les échantillons de sol ont été prélevés de 0 à 25 cm, et les données climatiques quotidiennes ont été obtenues à partir de jeux de données de haute qualité. Les modèles SOC basés sur des processus comme RothC, AMG.v2, ICBM, et C-TOOL ont été employés aux côtés des algorithmes de ML (Random Forest, SVM, régression par processus gaussien).

Par ailleurs, une recherche explorant les perceptions des scientifiques du sol indonésiens sur ChatGPT a révélé une confiance de plus de 80%, ChatGPT-4.0 étant préféré pour sa précision. Cependant, l’exactitude perçue des réponses reste à 55%, soulignant des possibilités d’amélioration futures. De manière concomitante, des modèles ML non linéaires, surtout combinés avec des modèles basés sur des processus comme Random Forest, montrent des promesses pour prédire les dynamiques du SOC en particulier dans les ensembles de données d’études agricoles à long terme. L’intégration du ML avec la connaissance experte pourrait améliorer la précision des prévisions SOC, soulignant l’importance de la supervision humaine et du raffinement des modèles.