Inteligência ArtificialArquitetura

RAG em empresas: quando faz sentido (e quando não)

Em 2024, praticamente toda apresentação comercial de inteligência artificial para empresas brasileiras terminou com o mesmo slide: “vamos montar um RAG com sua base de conhecimento”. Em 2025, boa parte desses projetos está travada em POC eterno ou já foi silenciosamente desligada.

O problema não é o RAG. A arquitetura funciona. O problema é que ela foi vendida como resposta universal quando é, na prática, resposta para um tipo bem específico de problema.

O que RAG resolve de verdade

Retrieval-Augmented Generation faz uma coisa bem feita: dar a um modelo de linguagem contexto atualizado e específico do domínio da empresa, sem precisar re-treinar o modelo.

Casos onde isso é útil:

  • Base de documentos regulatórios — contratos, normas técnicas, manuais de compliance. O modelo responde “o que diz a norma X sobre Y” citando o trecho exato.
  • Suporte interno a times grandes — documentação espalhada entre wiki, Confluence, Google Drive e e-mails antigos. O RAG agrega e responde.
  • Atendimento a clientes em domínio estável — FAQs dinâmicas, políticas de produto, manuais técnicos.

Em todos esses casos, o usuário faz uma pergunta, e a resposta existe — textualmente — em algum documento que a empresa já possui.

Onde RAG trava

Quando a resposta exige combinar múltiplos documentos de forma não-trivial. “Qual cliente teve maior crescimento em receita considerando o mix de produtos contratados nos últimos 3 trimestres?” — isso não é recuperação, é análise. RAG não resolve.

Quando o dado é estruturado. Se a informação está em tabelas de banco de dados, forçar um fluxo RAG é ineficiente e impreciso. Um agente que escreve SQL resolve melhor.

Quando a base muda o tempo todo. Sistemas transacionais com atualizações por segundo exigem arquitetura diferente — ou um pipeline de re-indexação caríssimo que inviabiliza o projeto.

Quando a pergunta exige raciocínio profundo entre fontes. Aí o caminho é um sistema agentic, com ferramentas e múltiplos passos — não um RAG tradicional.

O custo real de um RAG em produção

Quem vende RAG como “só plugar na sua base” omite a parte cara:

  • Re-indexação contínua dos documentos (embeddings não são de graça)
  • Vector store em produção (Pinecone, Weaviate ou self-hosted — todos têm custo operacional)
  • Chamadas de LLM a cada pergunta (e em alto volume, isso vira linha significativa no orçamento)
  • Re-ranking para melhorar a qualidade dos resultados recuperados
  • Avaliação contínua da qualidade das respostas — sem isso, o sistema degrada silenciosamente

Um RAG corporativo sério custa, em geral, entre R$ 8 mil e R$ 40 mil por mês em infraestrutura e LLM, sem contar o desenvolvimento inicial. Se esse custo for maior que o custo do problema que ele resolve, o projeto não tem ROI — e esse é um dos erros mais comuns em projetos de IA.

Antes de contratar um projeto de RAG

Três perguntas que valem mais que qualquer slide técnico:

  1. Qual é exatamente a pergunta que o usuário final quer responder? Se a resposta envolve cálculos, agregações ou raciocínio entre fontes, RAG não é a ferramenta.
  2. Quem vai manter a base atualizada? Sem dono claro da curadoria, a qualidade cai em seis meses.
  3. Qual é a métrica de sucesso em número, não em “ficou bacana”? Tempo médio de resposta a consultas internas, volume de tickets de suporte evitados, tempo gasto buscando informação no Drive — escolha uma e meça antes e depois.

RAG funciona. Só não é o martelo que resolve todo prego.


Este artigo foi escrito pela equipe técnica da Allogic Tecnologia. Para conversar sobre projetos de IA sob medida, agende uma conversa de 15 minutos.