RAG trata busca como infraestrutura. Em ambientes sensíveis a compliance, resultados de busca são evidência. E evidência tem requisitos além de relevância.
O que muda quando resultado é evidência
Retrieval comum otimiza relevância. Retrieval probatório também exige atribuição, estabilidade e completude. Cada chunk precisa apontar para documento, versão e registro de acesso. A mesma consulta contra o mesmo corpus deve produzir resultado estável ou explicável. O sistema também deve demonstrar que pesquisou o corpus autorizado completo.
Em sistemas financeiros e jurídicos, não recuperar um documento relevante é uma falha diferente de retornar um item pouco preciso. "O modelo não sabia" não é aceitável se o documento estava disponível.
pgvector e ParadeDB
pgvector mantém busca vetorial dentro do Postgres. Em compliance, a vantagem é arquitetural: transações, permissões e logs ficam no mesmo banco. ParadeDB adiciona BM25 ao Postgres, permitindo retrieval híbrido sem um cluster Elasticsearch separado.
Busca híbrida importa porque documentos regulatórios misturam semântica com termos exatos: números de cláusulas, identificadores e definições legais.
Esquema mínimo
Um chunk atribuível precisa de chunk_id, source_document_id, versão do documento, índice do chunk, texto original, embedding, ingestion_run_id e timestamp. Cada consulta deve registrar query_id, embedding, top_k, chunks retornados, scores e contexto do chamador.
Essa estrutura responde à pergunta de auditoria: quais documentos foram usados nesta decisão, de qual versão do corpus e por quem?
Latência e auditabilidade
Índices aproximados trocam precisão por velocidade. Em compliance, essa troca precisa ser uma decisão explícita. Sempre que a escala permitir, busca exata deve ser o padrão; ANN deve ser documentado como escolha consciente.