RAG 把搜索当作基础设施。在合规敏感环境中,检索结果是证据,而不仅是建议。证据的要求不止相关性。
当结果成为证据时发生什么变化
普通检索优化相关性。证据型检索还需要可归因、稳定性和完整性。每个 chunk 都必须指向原始文档、版本和访问记录。同一查询在同一语料上应产生稳定或可解释的结果。
在金融和法律系统中,未能找回相关文档是一类独立故障。如果文档在语料中,"模型不知道" 不是可接受解释。
pgvector 与 ParadeDB
pgvector 将向量搜索保留在 Postgres 内。对合规场景来说,优势是架构性的:事务、权限和日志都在同一数据库中。ParadeDB 在 Postgres 中加入 BM25,使混合检索不必依赖单独的 Elasticsearch。
混合搜索很重要,因为监管文档同时包含语义相似性和精确术语:条款编号、标识符和定义。
最小模式
可归因 chunk 需要 chunk_id、source_document_id、文档版本、chunk 序号、原文、embedding、ingestion_run_id 和时间戳。每次查询都应记录 query_id、embedding、top_k、返回 chunks、分数和调用方上下文。
这样才能回答审计问题:本次决策用了哪些文档、来自哪个语料版本、由谁请求。
延迟与可审计性
近似索引用精度换速度。在合规场景中,这必须是显式决策。只要规模允许,精确搜索应作为默认选择。