Mettre de l’Intelligence Artificielle dans les moteurs de recherche de l’entreprise en évitant les fuites de données : c’est ce à quoi s’attache France Labs. Piloté par Cédric Ulmer, l’un des ardents défenseurs de l’Open source au sein de Telecom Valley, la société a lancé un projet baptisé “Neural Datafari” qui a récemment été lauréat de NGI Search, dans l’un de ses cinq appels à projets lancés depuis le début de l'année. (Photo DR : mieux chercher l'aiguille dans la botte de foin de la data).
Avec cinq partenaires européens, NGI Search a ainsi fourni cinq appels ouverts jusqu’à l’été 2024. Ils sont dédiés aux chercheurs universitaires, aux Deep Tech ou aux scale-ups et PMEs de haute technologie qui sont ancrées dans l’open source. A la clé, jusqu'à 150.000 € accordés à chaque projet, avec le soutien d'une équipe dédiée, d'un conseil consultatif et de 10 services à valeur ajoutée. L’objectif est d’aider les bénéficiaires à adopter et à développer l'innovation numérique dans le domaine de la recherche et de la découverte de données et généralement de ressources sur Internet.
France Labs, à travers Datafari Enterprise Search, suit cette direction. La startup travaille activement à l’intégration native des dernières technologies d’IA utiles pour ses clients, à savoir la recherche vectorielle et la génération de réponse par LLM. “Pour accompagner ces travaux, et parce qu’ils seront intégralement disponibles gratuitement et libres de droits dans la version Communautaire de Datafari, le consortium européen NGI Search a retenu notre projet Neural Datafari comme lauréat de son 4ème appel à projets”, explique Cédric Ulmer.
Réalisé en commun avec la société anglaise Sease, ce projet de 12 mois permettra à Datafari de proposer à ses utilisateurs d’interagir avec ses documents, via des requêtes en langage naturel ou en demandant des réponses générées par l’IA. “Nous avons notamment rajouté le RAG (la génération augmentée de récupération) à notre technologie. C’est un processus qui consiste à optimiser le résultat d'un grand modèle de langage. Elle fait appel à une base de connaissances fiable externe aux sources de données utilisées pour l'entraîner avant de générer une réponse. L’objectif est de proposer à une entreprise un chatbot avec qui il est possible de dialoguer en langage naturel sans risque de divulguer des informations confidentielles."
Des travaux que France Labs présentera début décembre au salon Open Source Experience les 4 et 5 décembre à Paris au Palais des Congrès.