All translations

Enter a message name below to show all available translations.

Message

Found 8 translations.

NameCurrent message text
 h German (de)Retrieval Augmented Generation (RAG) ist ein Prozess, bei dem relevante Informationen durch semantisches Matching aus Vektordatenbanken abgerufen und dann an LLMs zur Antwortgenerierung weitergeleitet werden. In einer RAG-Pipeline arbeiten Vektordatenbanken und LLMs zusammen, um die Bereitstellung aktueller Unternehmenskenntnisse sicherzustellen. Allerdings haben RAG-Pipelines viele Kontrollpunkte, von denen jeder, wenn er nicht gut abgestimmt ist, zu geringerer Genauigkeit, Halluzinationen und irrelevanten Antworten von Chatbots führen kann. Darüber hinaus erschweren Zugriffsberechtigungen für Dokumente den Such- und Abrufprozess, was eine sorgfältige Verwaltung erfordert, um Datensicherheit und Relevanz zu gewährleisten. Außerdem erfordert multimodaler Inhalt den Einsatz multimodaler Retriever, um strukturierte, unstrukturierte und halbstrukturierte Daten, einschließlich Präsentationen, Diagrammen, Videos und Besprechungsaufzeichnungen, zu verarbeiten. Die Bewältigung dieser Herausforderungen ist entscheidend für die Aufrechterhaltung der Genauigkeit und Zuverlässigkeit von Unternehmens-Chatbots. Inspiriert von ([[#bib.bib3|3]]) identifizieren wir fünfzehn Kontrollpunkte von RAG aus unseren Fallstudien, die in Abbildung [[#S2.F1|1]] visualisiert sind. Jeder Kontrollpunkt ist mit einer Nummer gekennzeichnet. Im weiteren Verlauf dieses Abschnitts präsentieren wir unsere Erkenntnisse und Erfahrungen zur Bewältigung der RAG-Kontrollpunkte.
 h English (en)Retrieval Augmented Generation (RAG) is a process where relevant information is retrieved from vector databases through semantic matching and then fed to LLMs for response generation. In a RAG pipeline, vector databases and LLMs collaboratively ensure the delivery of up-to-date enterprise knowledge. However, RAG pipelines have many control points, each of which when not tuned well can lead to lower accuracy, hallucinations, and irrelevant responses by Chatbots. Additionally, document access control permissions complicate the search and retrieval process, requiring careful management to ensure data security and relevance. Furthermore, multi-modal content necessitates the use of multi-modal retrievers to handle structured, unstructured, and semi-structured data, including presentations, diagrams, videos, and meeting recordings. Addressing these challenges is critical for maintaining the accuracy and reliability of enterprise chatbots. Inspired by ([[#bib.bib3|3]]), we identify fifteen control points of RAG from our case studies visualized in Figure [[#S2.F1|1]]. Each control point is labeled with a number. In the remainder of this section, we present our insights and learnings for addressing RAG control points.
 h Spanish (es)La Generación Aumentada por Recuperación (RAG) es un proceso en el que se recupera información relevante de bases de datos vectoriales mediante coincidencias semánticas y luego se alimenta a los LLMs para la generación de respuestas. En una canalización RAG, las bases de datos vectoriales y los LLMs colaboran para asegurar la entrega de conocimiento empresarial actualizado. Sin embargo, las canalizaciones RAG tienen muchos puntos de control, cada uno de los cuales, si no está bien ajustado, puede llevar a una menor precisión, alucinaciones y respuestas irrelevantes por parte de los chatbots. Además, los permisos de control de acceso a documentos complican el proceso de búsqueda y recuperación, requiriendo una gestión cuidadosa para asegurar la seguridad y relevancia de los datos. Además, el contenido multimodal requiere el uso de recuperadores multimodales para manejar datos estructurados, no estructurados y semiestructurados, incluyendo presentaciones, diagramas, videos y grabaciones de reuniones. Abordar estos desafíos es crítico para mantener la precisión y fiabilidad de los chatbots empresariales. Inspirados por ([[#bib.bib3|3]]), identificamos quince puntos de control de RAG a partir de nuestros estudios de caso visualizados en la Figura [[#S2.F1|1]]. Cada punto de control está etiquetado con un número. En el resto de esta sección, presentamos nuestras ideas y aprendizajes para abordar los puntos de control de RAG.
 h French (fr)La génération augmentée par récupération (RAG) est un processus où des informations pertinentes sont extraites de bases de données vectorielles par correspondance sémantique, puis transmises aux LLM pour la génération de réponses. Dans un pipeline RAG, les bases de données vectorielles et les LLM collaborent pour garantir la livraison de connaissances d'entreprise à jour. Cependant, les pipelines RAG comportent de nombreux points de contrôle, chacun d'eux pouvant, s'il n'est pas bien ajusté, entraîner une baisse de précision, des hallucinations et des réponses non pertinentes par les chatbots. De plus, les autorisations de contrôle d'accès aux documents compliquent le processus de recherche et de récupération, nécessitant une gestion minutieuse pour assurer la sécurité et la pertinence des données. En outre, le contenu multimodal nécessite l'utilisation de récupérateurs multimodaux pour gérer les données structurées, non structurées et semi-structurées, y compris les présentations, les diagrammes, les vidéos et les enregistrements de réunions. Relever ces défis est crucial pour maintenir la précision et la fiabilité des chatbots d'entreprise. Inspirés par ([[#bib.bib3|3]]), nous identifions quinze points de contrôle de RAG à partir de nos études de cas visualisées dans la Figure [[#S2.F1|1]]. Chaque point de contrôle est étiqueté avec un numéro. Dans la suite de cette section, nous présentons nos idées et nos apprentissages pour aborder les points de contrôle RAG.
 h Japanese (ja)検索強化生成(RAG)は、セマンティックマッチングを通じてベクターデータベースから関連情報を取得し、それをLLMに供給して応答を生成するプロセスです。RAGパイプラインでは、ベクターデータベースとLLMが協力して最新の企業知識を提供します。しかし、RAGパイプラインには多くの制御ポイントがあり、それぞれが適切に調整されていないと、チャットボットによる精度の低下、幻覚、無関係な応答を引き起こす可能性があります。さらに、文書のアクセス制御権限は検索と取得のプロセスを複雑にし、データのセキュリティと関連性を確保するための慎重な管理が必要です。また、マルチモーダルコンテンツは、プレゼンテーション、図、ビデオ、会議の録音など、構造化、非構造化、半構造化データを処理するためにマルチモーダルリトリーバーの使用を必要とします。これらの課題に対処することは、企業のチャットボットの精度と信頼性を維持するために重要です。([[#bib.bib3|3]])に触発され、我々はケーススタディからRAGの15の制御ポイントを特定し、図[[#S2.F1|1]]に視覚化しました。各制御ポイントには番号が付けられています。このセクションの残りでは、RAG制御ポイントに対処するための洞察と学びを紹介します。
 h Korean (ko)정보 검색 증강 생성(RAG)은 의미적 매칭을 통해 벡터 데이터베이스에서 관련 정보를 검색한 후 LLM에 전달하여 응답을 생성하는 과정입니다. RAG 파이프라인에서는 벡터 데이터베이스와 LLM이 협력하여 최신 기업 지식을 제공합니다. 그러나 RAG 파이프라인에는 여러 제어 지점이 있으며, 각 지점이 잘 조정되지 않으면 챗봇의 정확도가 떨어지고 환각이나 관련 없는 응답이 발생할 수 있습니다. 또한, 문서 접근 권한 제어는 검색 및 검색 과정을 복잡하게 하여 데이터 보안과 관련성을 보장하기 위해 신중한 관리가 필요합니다. 더 나아가, 다중 모드 콘텐츠는 프레젠테이션, 다이어그램, 비디오, 회의 녹음 등 구조화된, 비구조화된, 반구조화된 데이터를 처리하기 위해 다중 모드 검색기를 필요로 합니다. 이러한 과제를 해결하는 것은 기업 챗봇의 정확성과 신뢰성을 유지하는 데 중요합니다. ([[#bib.bib3|3]])에서 영감을 받아, 우리는 사례 연구에서 시각화된 그림 [[#S2.F1|1]]에 RAG의 15개 제어 지점을 식별했습니다. 각 제어 지점은 번호로 표시되어 있습니다. 이 섹션의 나머지 부분에서는 RAG 제어 지점을 해결하기 위한 우리의 통찰력과 학습 내용을 제시합니다.
 h Portuguese (pt)A Geração Aumentada por Recuperação (RAG) é um processo onde informações relevantes são recuperadas de bancos de dados vetoriais através de correspondência semântica e, em seguida, alimentadas para LLMs para geração de respostas. Em um pipeline RAG, bancos de dados vetoriais e LLMs colaboram para garantir a entrega de conhecimento empresarial atualizado. No entanto, pipelines RAG possuem muitos pontos de controle, cada um dos quais, quando não ajustado adequadamente, pode levar a menor precisão, alucinações e respostas irrelevantes por Chatbots. Além disso, permissões de controle de acesso a documentos complicam o processo de busca e recuperação, exigindo uma gestão cuidadosa para garantir a segurança e relevância dos dados. Ademais, o conteúdo multimodal exige o uso de recuperadores multimodais para lidar com dados estruturados, não estruturados e semi-estruturados, incluindo apresentações, diagramas, vídeos e gravações de reuniões. Abordar esses desafios é crítico para manter a precisão e confiabilidade dos chatbots empresariais. Inspirados por ([[#bib.bib3|3]]), identificamos quinze pontos de controle de RAG a partir de nossos estudos de caso visualizados na Figura [[#S2.F1|1]]. Cada ponto de controle é rotulado com um número. No restante desta seção, apresentamos nossas percepções e aprendizados para abordar os pontos de controle de RAG.
 h Chinese (zh)检索增强生成(RAG)是一种通过语义匹配从向量数据库中检索相关信息,然后将其提供给大型语言模型(LLM)以生成响应的过程。在RAG管道中,向量数据库和LLM协作确保提供最新的企业知识。然而,RAG管道有许多控制点,如果调校不当,可能导致聊天机器人准确性下降、幻觉和不相关的响应。此外,文档访问控制权限使搜索和检索过程复杂化,需要仔细管理以确保数据安全性和相关性。此外,多模态内容需要使用多模态检索器来处理结构化、非结构化和半结构化数据,包括演示文稿、图表、视频和会议记录。解决这些挑战对于保持企业聊天机器人的准确性和可靠性至关重要。受([[#bib.bib3|3]])的启发,我们从案例研究中识别出RAG的十五个控制点,如图[[#S2.F1|1]]所示。每个控制点都标有一个编号。在本节的其余部分,我们将介绍我们在解决RAG控制点方面的见解和经验。