Translations:FACTS About Building Retrieval Augmented Generation-based Chatbots/25/fr
Enrichissement des métadonnées, Fragmentation, Reformulation des requêtes, Réordonnancement des requêtes: Nous avons constaté que les étapes d'enrichissement des métadonnées, de fragmentation, de reformulation des requêtes et de réordonnancement des requêtes du pipeline RAG ont le plus d'impact sur la qualité des réponses du chatbot. La qualité de la génération de réponses par les LLM dépend fortement de la pertinence de la récupération. La pertinence de la récupération dépend, à son tour, fortement de l'enrichissement des métadonnées des documents, de la fragmentation et de la reformulation des requêtes. Nous avons mis en œuvre des capacités d'auto-ML basées sur la recherche en grille pour trouver les bonnes configurations de tailles de jetons de fragments, expérimenté avec diverses variations de prompts et exploré différentes stratégies de réordonnancement des fragments pour trouver les paramètres optimaux pour chacun. Bien que nous ayons réalisé des améliorations significatives en termes de pertinence de récupération et de qualité et précision des réponses, nous pensons qu'il nous reste encore du travail à faire pour optimiser l'ensemble du pipeline.