← Voltar a RAG — Arquitetura de Ingestion e Retrieval
⏮️ Versioning e Reprocessamento
RAG — Arquitetura de Ingestion e RetrievalApresentação
6. Versioning e Reprocessamento
Estratégia de Versioning
Documentos
| Conceito | Recomendação |
|---|---|
logical_id | Identificador estável |
version | Número incrementado por alteração |
active_version | Qual versão está ativa |
SQL
| Tipo de tabela | Recomendação |
|---|---|
| Entidades importantes | SCD Type 2 (valid_from, valid_to) |
| Operacionais simples | updated_at |
Graph
| Conceito | Recomendação |
|---|---|
| Nós e edges | valid_from, valid_to |
| Alternativa | is_active |
Índices
Também versionar:
chunking_versionembedding_versionretrieval_view_version
Estratégia de Reprocessamento
Full Rebuild
Usar quando:
- Mudaste schema radicalmente
- Mudaste embedding model
- Mudaste chunking logic
- Mudaste canonical schema
Partial Rebuild
Usar quando:
- Mudou só um documento
- Mudaram só algumas rows
- Mudaram só algumas relações
Regra Prática
Preferir incremental sempre que possível, mas com possibilidade de full rebuild controlado.
Decisão: Full vs Partial
Mudança detectada
|
v
+------+------+
| Qual tipo? |
+------+------+
|
+-- Schema/model/config → Full rebuild
|
+-- Um documento → Partial (doc pipeline)
|
+-- Linhas SQL → Partial (upsert/SCD)
|
+-- Edges → Partial (graph pipeline)
Controlo de Versões nos Índices
| Versão | Uso |
|---|---|
embedding_version | Não misturar modelos na mesma coleção |
chunking_version | Re-chunk obriga re-embed |
index_version | Nova estratégia de indexação |
Quando mudar embedding model:
- Criar nova coleção ou
embedding_version - Re-embed total ou progressivo
- Manter traço de qual versão cada chunk usa
Zona de prática
Sem perguntas. Clica em Editar para adicionar.