Translations:FACTS About Building Retrieval Augmented Generation-based Chatbots/22/pt: Difference between revisions

    From Marovi AI
    (Importing a new version from external source)
     
    (No difference)

    Latest revision as of 07:30, 20 February 2025

    Information about message (contribute)
    This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
    Message definition (FACTS About Building Retrieval Augmented Generation-based Chatbots)
    Retrieval Augmented Generation (RAG) is a process where relevant information is retrieved from vector databases through semantic matching and then fed to LLMs for response generation. In a RAG pipeline, vector databases and LLMs collaboratively ensure the delivery of up-to-date enterprise knowledge. However, RAG pipelines have many control points, each of which when not tuned well can lead to lower accuracy, hallucinations, and irrelevant responses by Chatbots. Additionally, document access control permissions complicate the search and retrieval process, requiring careful management to ensure data security and relevance. Furthermore, multi-modal content necessitates the use of multi-modal retrievers to handle structured, unstructured, and semi-structured data, including presentations, diagrams, videos, and meeting recordings. Addressing these challenges is critical for maintaining the accuracy and reliability of enterprise chatbots. Inspired by ([[#bib.bib3|3]]), we identify fifteen control points of RAG from our case studies visualized in Figure [[#S2.F1|1]]. Each control point is labeled with a number. In the remainder of this section, we present our insights and learnings for addressing RAG control points.

    A Geração Aumentada por Recuperação (RAG) é um processo onde informações relevantes são recuperadas de bancos de dados vetoriais através de correspondência semântica e, em seguida, alimentadas para LLMs para geração de respostas. Em um pipeline RAG, bancos de dados vetoriais e LLMs colaboram para garantir a entrega de conhecimento empresarial atualizado. No entanto, pipelines RAG possuem muitos pontos de controle, cada um dos quais, quando não ajustado adequadamente, pode levar a menor precisão, alucinações e respostas irrelevantes por Chatbots. Além disso, permissões de controle de acesso a documentos complicam o processo de busca e recuperação, exigindo uma gestão cuidadosa para garantir a segurança e relevância dos dados. Ademais, o conteúdo multimodal exige o uso de recuperadores multimodais para lidar com dados estruturados, não estruturados e semi-estruturados, incluindo apresentações, diagramas, vídeos e gravações de reuniões. Abordar esses desafios é crítico para manter a precisão e confiabilidade dos chatbots empresariais. Inspirados por (3), identificamos quinze pontos de controle de RAG a partir de nossos estudos de caso visualizados na Figura 1. Cada ponto de controle é rotulado com um número. No restante desta seção, apresentamos nossas percepções e aprendizados para abordar os pontos de controle de RAG.