Translations:FACTS About Building Retrieval Augmented Generation-based Chatbots/4/zh

    From Marovi AI

    企業聊天機器人,由生成式人工智慧驅動,正在迅速成為該技術在行業中最受關注的初始應用,旨在提高員工生產力。檢索增強生成(RAG)、大型語言模型(LLM)、Langchain/Llamaindex類型的LLM編排框架是構建生成式AI聊天機器人的關鍵技術組件。然而,構建成功的企業聊天機器人並不容易。它們需要對RAG管道進行精細的工程設計。這包括微調語義嵌入和LLM,從向量資料庫中提取相關文檔,重述查詢,重新排序結果,設計有效的提示,遵循文檔訪問控制,提供簡明的響應,包含相關參考,保護個人信息,並構建代理來協調所有這些活動。在本文中,我們基於在NVIDIA構建三個聊天機器人的第一手經驗,提出了一個構建有效RAG聊天機器人的框架:用於IT和HR福利、公司財務收益和一般企業內容的聊天機器人。我們的貢獻有三方面。首先,我們介紹了我們的FACTS框架,用於構建企業級RAG聊天機器人,以解決上述挑戰。FACTS助記符指的是RAG聊天機器人必須正確處理的五個維度——即內容新鮮度(F)、架構(A)、LLM的成本經濟性(C)、測試(T)和安全性(S)。其次,我們提出了RAG管道的十五個控制點以及在每個階段優化聊天機器人性能的技術。最後,我們展示了來自企業數據的實證結果,關於大型LLM與小型LLM之間的準確性-延遲權衡。據我們所知,這是第一篇提供全面視角的論文,涵蓋了構建安全企業級聊天機器人的因素及解決方案。