illustration
AIKO

Actualité - 29 juin 2026

AIKO : quand l’intelligence artificielle s’appuie sur les infrastructures documentaires

Un projet au service de l'exploration de la littérature scientifique

Comment explorer efficacement les millions de publications scientifiques produites chaque année ? Comment aider les chercheurs à identifier plus rapidement les informations pertinentes ou à relier des connaissances dispersées au sein de vastes corpus documentaires ?

C’est l’objectif d’AIKO (AI for scientists: publication KnOwledge), un projet piloté par Inria (Institut national de recherche en informatique et en automatique) et le Cirad (Centre de coopération internationale en recherche agronomique pour le développement), dans le cadre du programme France 2030.

Doté de 3 millions d’euros sur cinq ans, AIKO vise à développer de nouveaux outils d’intelligence artificielle pour faciliter l’exploration et l’analyse de la littérature scientifique. Le projet réunit des équipes de recherche spécialisées en intelligence artificielle et en traitement automatique des langues, ainsi que plusieurs infrastructures de recherche dédiées à l’information scientifique.

AIKO vise à développer de nouveaux outils d’intelligence artificielle pour faciliter l’exploration et l’analyse de vastes corpus de publications scientifiques.

Des outils d’IA pour mieux explorer les connaissances scientifiques

Les publications scientifiques ne se résument pas à des contenus textuels. Elles comprennent également des illustrations, des tableaux, des références bibliographiques, des jeux de données ou encore des logiciels, autant d’éléments qui participent à la production et à la diffusion des connaissances scientifiques.

L’ambition d’AIKO est de développer des méthodes capables d’exploiter cette richesse documentaire afin d’accompagner les chercheurs dans leurs travaux.

Le projet s’articule autour de quatre grands défis scientifiques :

  • identifier automatiquement les informations présentes dans les publications ;
  • analyser leur contenu afin de faire apparaître des concepts, des relations ou des tendances ;
  • faciliter l’accès aux connaissances grâce à de nouveaux outils d’exploration de la littérature scientifique ;
  • mieux articuler les différents types de contenus (textes, images, tableaux ou données) grâce à des approches multimodales.

Ces développements doivent permettre de proposer de nouveaux services destinés aux communautés scientifiques et d’améliorer l’exploration de corpus de publications toujours plus volumineux.

L’efficacité de ces outils dépend toutefois de la qualité des données sur lesquelles ils s’appuient. C’est précisément sur ce point que les infrastructures documentaires jouent un rôle déterminant.

Des corpus de qualité, une condition essentielle

Comme tout système d’intelligence artificielle, les outils développés dans AIKO doivent être entraînés, testés et évalués à partir de données fiables.

La qualité des corpus documentaires, de leurs métadonnées et de leur documentation constitue donc un enjeu majeur du projet. Des données bien structurées permettent non seulement de développer des modèles plus performants, mais aussi d’évaluer leurs résultats dans des conditions représentatives des usages de la recherche.

Le projet prévoit de constituer un corpus de référence, composé de publications scientifiques enrichies de métadonnées, qui servira au développement et à l’évaluation des différents outils d’intelligence artificielle.

Le rôle des infrastructures documentaires

Le projet s’appuie étroitement sur les infrastructures de recherche en information scientifique, qui mettent à disposition les corpus, les métadonnées et les ressources documentaires nécessaires au développement des outils.

Il prévoit que les outils les plus matures puissent, à terme, être déployés au sein des infrastructures partenaires afin d’être mis à disposition des communautés scientifiques.

Cette articulation entre recherche en intelligence artificielle et infrastructures documentaires illustre l’importance de disposer de collections scientifiques de qualité, correctement décrites et facilement réutilisables pour développer de nouveaux services au bénéfice de la recherche.

Une dynamique en résonance avec les missions de CollEx-Persée

Les objectifs poursuivis par AIKO font écho à plusieurs enjeux au cœur des missions de CollEx-Persée : améliorer l’accès aux collections scientifiques, favoriser leur enrichissement documentaire, renforcer leur découvrabilité et développer de nouveaux usages autour des corpus numériques.

AIKO rappelle ainsi que les infrastructures documentaires ne jouent pas seulement un rôle de conservation ou de diffusion des connaissances. Elles constituent également des ressources essentielles pour accompagner le développement de nouveaux outils d’exploration et d’analyse de la littérature scientifique.

Une actualité ou un événement à partager avec nous ?

Proposez vos actualités et événements afin qu'ils soient publiés sur le site du CollEx-Persée