Intégration des Bases de Données et Extraction de Ressources Minières par NLP et Modèles de Langage
Aicha Zouhair  1  
1 : CIRAD
Cirad, UMR TETIS, Université de Montpellier, Montpellier France

Le secteur minier joue un rôle important dans les changements d'usage des terres et peut menacer les zones agricoles, notamment dans les pays en développement. Alors que les acquisitions de terres à grande échelle pour l'agriculture sont relativement bien documentées, celles liées aux activités minières restent peu accessibles. Ce projet a pour objectif d'extraire automatiquement des informations pertinentes (comme le pays, la localisation ou l'usage) à partir de contrats miniers grâce à des techniques de text mining. Une première méthode s'appuie sur GROBID pour structurer les documents, et une seconde, en cours de développement, combine GROBID avec des modèles de langage (LLM). Les premiers résultats montrent des F1-scores prometteurs pour certaines entités, mais aussi des difficultés liées aux classes sous-représentées. L'objectif final est d'améliorer l'accessibilité des données pour un meilleur suivi des acquisitions minières.


Loading... Loading...