Translations:FACTS About Building Retrieval Augmented Generation-based Chatbots/31/pt

    From Marovi AI
    Revision as of 07:30, 20 February 2025 by Felipefelixarias (talk | contribs) (Importing a new version from external source)
    (diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

    Manipulação de dados multimodais: Os dados empresariais são multimodais. Lidar com dados estruturados, não estruturados e multimodais é crucial para um pipeline RAG versátil. A partir da nossa experiência, se a estrutura do documento for consistente e conhecida previamente (como aquelas encontradas em bancos de dados EDGAR para dados de registros da SEC no domínio de resultados financeiros que o Scout bot estava lidando), implementar a divisão em nível de seção, usando os títulos das seções e subtítulos e incorporando-os no contexto dos fragmentos melhora a relevância da recuperação. Também encontramos soluções como Unstructured.io, que se especializam em extrair e estruturar conteúdo de PDFs, úteis na análise e fragmentação de documentos não estruturados com contexto.