← Voltar a RAG — Arquitetura de Ingestion e Retrieval

⏮️ Versioning e Reprocessamento

RAG — Arquitetura de Ingestion e Retrieval

Apresentação

6. Versioning e Reprocessamento


Estratégia de Versioning

Documentos

ConceitoRecomendação
logical_idIdentificador estável
versionNúmero incrementado por alteração
active_versionQual versão está ativa

SQL

Tipo de tabelaRecomendação
Entidades importantesSCD Type 2 (valid_from, valid_to)
Operacionais simplesupdated_at

Graph

ConceitoRecomendação
Nós e edgesvalid_from, valid_to
Alternativais_active

Índices

Também versionar:

  • chunking_version
  • embedding_version
  • retrieval_view_version

Estratégia de Reprocessamento

Full Rebuild

Usar quando:

  • Mudaste schema radicalmente
  • Mudaste embedding model
  • Mudaste chunking logic
  • Mudaste canonical schema

Partial Rebuild

Usar quando:

  • Mudou só um documento
  • Mudaram só algumas rows
  • Mudaram só algumas relações

Regra Prática

Preferir incremental sempre que possível, mas com possibilidade de full rebuild controlado.


Decisão: Full vs Partial

Mudança detectada
       |
       v
+------+------+
| Qual tipo?  |
+------+------+
       |
       +-- Schema/model/config → Full rebuild
       |
       +-- Um documento → Partial (doc pipeline)
       |
       +-- Linhas SQL → Partial (upsert/SCD)
       |
       +-- Edges → Partial (graph pipeline)

Controlo de Versões nos Índices

VersãoUso
embedding_versionNão misturar modelos na mesma coleção
chunking_versionRe-chunk obriga re-embed
index_versionNova estratégia de indexação

Quando mudar embedding model:

  1. Criar nova coleção ou embedding_version
  2. Re-embed total ou progressivo
  3. Manter traço de qual versão cada chunk usa

Zona de prática

Sem perguntas. Clica em Editar para adicionar.