Translations:FACTS About Building Retrieval Augmented Generation-based Chatbots/68/zh
ChipNemo(10)提供了使用領域適應語言模型來提高RAG在特定領域問題上的表現的證據。他們對e5-small-unsupervised模型進行了微調,使用了3,000個領域特定的自動生成樣本。我們嘗試在Scout Bot中微調e5-large嵌入模型。我們的結果沒有顯示出顯著的改進。目前,我們正在收集高質量的人類注釋數據以重複實驗。這可能是我們未來工作中值得探索的重要方向。Setty et. al.(15)提出了另一種有趣的技術,即使用假設文檔嵌入(HYDE)技術來提高RAG性能。HyDE在響應查詢時使用LLM生成理論文檔,然後對原始問題和假設答案進行相似性搜索。這是一種有前途的方法,但可能會使架構變得複雜。