Translations:FACTS About Building Retrieval Augmented Generation-based Chatbots/22/ko: Difference between revisions

    From Marovi AI
    (Importing a new version from external source)
     
    (No difference)

    Latest revision as of 07:19, 20 February 2025

    Information about message (contribute)
    This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
    Message definition (FACTS About Building Retrieval Augmented Generation-based Chatbots)
    Retrieval Augmented Generation (RAG) is a process where relevant information is retrieved from vector databases through semantic matching and then fed to LLMs for response generation. In a RAG pipeline, vector databases and LLMs collaboratively ensure the delivery of up-to-date enterprise knowledge. However, RAG pipelines have many control points, each of which when not tuned well can lead to lower accuracy, hallucinations, and irrelevant responses by Chatbots. Additionally, document access control permissions complicate the search and retrieval process, requiring careful management to ensure data security and relevance. Furthermore, multi-modal content necessitates the use of multi-modal retrievers to handle structured, unstructured, and semi-structured data, including presentations, diagrams, videos, and meeting recordings. Addressing these challenges is critical for maintaining the accuracy and reliability of enterprise chatbots. Inspired by ([[#bib.bib3|3]]), we identify fifteen control points of RAG from our case studies visualized in Figure [[#S2.F1|1]]. Each control point is labeled with a number. In the remainder of this section, we present our insights and learnings for addressing RAG control points.

    정보 검색 증강 생성(RAG)은 의미적 매칭을 통해 벡터 데이터베이스에서 관련 정보를 검색한 후 LLM에 전달하여 응답을 생성하는 과정입니다. RAG 파이프라인에서는 벡터 데이터베이스와 LLM이 협력하여 최신 기업 지식을 제공합니다. 그러나 RAG 파이프라인에는 여러 제어 지점이 있으며, 각 지점이 잘 조정되지 않으면 챗봇의 정확도가 떨어지고 환각이나 관련 없는 응답이 발생할 수 있습니다. 또한, 문서 접근 권한 제어는 검색 및 검색 과정을 복잡하게 하여 데이터 보안과 관련성을 보장하기 위해 신중한 관리가 필요합니다. 더 나아가, 다중 모드 콘텐츠는 프레젠테이션, 다이어그램, 비디오, 회의 녹음 등 구조화된, 비구조화된, 반구조화된 데이터를 처리하기 위해 다중 모드 검색기를 필요로 합니다. 이러한 과제를 해결하는 것은 기업 챗봇의 정확성과 신뢰성을 유지하는 데 중요합니다. (3)에서 영감을 받아, 우리는 사례 연구에서 시각화된 그림 1에 RAG의 15개 제어 지점을 식별했습니다. 각 제어 지점은 번호로 표시되어 있습니다. 이 섹션의 나머지 부분에서는 RAG 제어 지점을 해결하기 위한 우리의 통찰력과 학습 내용을 제시합니다.