Gallica / BnF — La Bibliothèque nationale de France partenaire data des IA
Avec la Bibliothèque nationale de France : rendre Gallica exploitable par l'IA — accès MCP aux collections, corpus extraits par IA, et services agentiques pour les clients B2B de la BnF.
Aperçu
Les bibliothèques nationales détiennent des siècles de savoir numérisé que les systèmes d’IA ignorent — ou moissonnent mal. Gallica, la bibliothèque numérique de la Bibliothèque nationale de France, donne accès à des millions de documents numérisés — presse ancienne, livres, cartes, manuscrits, images — dont rien n’a été conçu pour les agents IA.
Avec la BnF, Alien Intelligence construit trois choses :
- Un accès MCP aux collections — recherche au catalogue et en texte intégral, lecture par document et par page, imagerie IIIF, exposés aux agents IA comme une interface d’outils typée.
- Des corpus extraits par IA — transformer les collections numérisées brutes en corpus utiles et bien décrits (la presse française historique est le premier terrain).
- Des services agentiques pour les clients B2B de la BnF — mettre ces corpus et ces outils au service des institutions et entreprises clientes de la bibliothèque.
Mon rôle
Je pilote le partenariat pour Alien Intelligence : le travail avec les équipes de la BnF, l’interface d’outils côté agents au-dessus des API de Gallica, et les premières extractions de corpus.
Où en est le projet
Une première couche d’accès pour agents est opérationnelle et le travail de corpus est lancé. Un article complet suivra avec l’ouverture des services aux clients de la BnF. Les mêmes principes guident les travaux OpenAIRE MCP et LDS.