Il RAG tratta la ricerca come infrastruttura. In ambienti sensibili alla compliance, i risultati di ricerca sono prove. E una prova ha requisiti oltre la rilevanza.
Cosa cambia quando il risultato è una prova
Il retrieval comune ottimizza la rilevanza. Il retrieval probatorio richiede anche attribuzione, stabilità e completezza. Ogni chunk deve puntare a documento, versione e record di accesso. La stessa query sullo stesso corpus deve produrre risultati stabili o spiegabili.
Nei sistemi finanziari e legali, non recuperare un documento rilevante è un errore distinto da una bassa precisione. "Il modello non lo sapeva" non è accettabile se il documento era disponibile.
pgvector e ParadeDB
pgvector mantiene la ricerca vettoriale dentro Postgres. Per la compliance, il vantaggio è architetturale: transazioni, permessi e log restano nello stesso database. ParadeDB aggiunge BM25 a Postgres, abilitando retrieval ibrido senza Elasticsearch separato.
La ricerca ibrida conta perché i documenti regolatori combinano semantica e termini esatti: clausole, identificatori e definizioni.
Schema minimo
Un chunk attribuibile richiede chunk_id, source_document_id, versione, indice, testo originale, embedding, ingestion_run_id e timestamp. Ogni query deve registrare query_id, embedding, top_k, chunk restituiti, score e contesto del chiamante.
Questo risponde alla domanda di audit: quali documenti sono stati usati, da quale versione del corpus e da chi?
Latenza e auditabilità
Gli indici approssimati scambiano precisione con velocità. In compliance questa scelta deve essere esplicita. Quando la scala lo permette, la ricerca esatta dovrebbe rimanere lo standard.