← Voltar a RAG — Arquitetura de Ingestion e Retrieval

📋 Cenários de Alteração

RAG — Arquitetura de Ingestion e Retrieval

Apresentação

4. Cenários de Alteração ao Longo do Tempo


Cenário 1 — Ficheiro Markdown alterado

Exemplo: security_policy.md

PassoAção
1Loader lê
2Change detector vê hash diferente
3Normalizer cria nova versão
4Doc pipeline faz diff por secções/chunks
5Só chunks alterados são reprocessados
6Metadata atualizada
7Índice ativo passa para nova versão

Impactos: vector index parcial, manifest atualizado, queries freshness-aware usam só última versão.


Cenário 2 — PDF substituído por nova versão

Exemplo: expense_policy_v2.pdf

PassoAção
1Extrair texto
2Fingerprint do texto + metadata
3Nova versão lógica do mesmo documento
4Re-chunking
5Diff aproximado se possível
6Marcar anterior como antiga, não apagar

Nota: PDF é mais complexo — layout pode mudar sem mudar semântica. Usar hash do texto normalizado, não do binário bruto.


Cenário 3 — YAML muda e afeta vários produtos

Exemplo: policies.yaml

PassoAção
1Change detector marca mudança
2Re-gerar artefactos derivados: docs, SQL seeds, graph relations
3Dependency tracker identifica ativos impactados

Importante: Uma mudança na source of truth pode afetar vários backends ao mesmo tempo.


Cenário 4 — Nova linha numa tabela SQL

Exemplo: Novo incidente

PassoAção
1Ingest incremental via updated_at ou watermark
2Normalizar para StructuredRecord
3Inserir
4Atualizar materializações
5Opcional: gerar/atualizar documento derivado (postmortems)

Cenário 5 — Update numa linha SQL

Exemplo: Budget mudou

PassoAção
1Identificar pelo business key
2Escolher: upsert ou SCD2
3Atualizar dependências
4Invalidar caches e métricas associadas

Cenário 6 — Relação do grafo muda

Exemplo: TEAM_OWNS_SERVICE

PassoAção
1Fechar edge antiga
2Abrir edge nova
3Atualizar projection ativa
4Registar mudança para audit trail

Cenário 7 — Documento apagado

PassoAção
1Não apagar logo
2Marcar como retired / inactive
3Remover de índices ativos
4Manter versão histórica

Cenário 8 — Mudou o chunking strategy

Não é mudança de dados, mas afeta retrieval.

PassoAção
1Criar nova index_version
2Reprocessar documentos da vista ativa
3Manter traço de qual embedding model / chunk policy foi usada

Cenário 9 — Mudou o embedding model

PassoAção
1Não misturar embeddings diferentes na mesma coleção sem controlo
2Criar nova coleção ou nova embedding_version
3Re-embed total ou progressivo

Matriz Resumo

CenárioFonteTipoPipelineEstratégia
1MDDocDocumentVersion + chunk diff
2PDFDocDocumentVersion + re-chunk
3YAMLMistoTodosDependency-driven rebuild
4SQLStructuredSQLInsert
5SQLStructuredSQLUpsert / SCD2
6GraphGraphGraphEdge versioning
7QualquerQualquerQualquerSoft delete
8ConfigN/ADocumentFull reindex
9ConfigN/ADocumentNova embedding version

Zona de prática

Sem perguntas. Clica em Editar para adicionar.