← Voltar a RAG — Arquitetura de Ingestion e Retrieval

📈 Observability

RAG — Arquitetura de Ingestion e Retrieval

Apresentação

8. Validação e Observability da Ingestion


Métricas

CategoriaMétricas
Throughputassets lidos, novos, atualizados, removidos
Qualidadefalhas, retries
Performancetempo por pipeline, tempo por loader
Eficiênciachunks reusados, chunks re-embedados
SQLrows inseridas, rows atualizadas
Graphedges criadas, edges fechadas

Exemplo de métricas por run

ingestion_run_123:
  documents_read: 15
  documents_new: 2
  documents_updated: 3
  documents_unchanged: 10
  chunks_reused: 45
  chunks_reembedded: 12
  sql_rows_inserted: 5
  sql_rows_updated: 2
  graph_edges_created: 3
  graph_edges_closed: 1
  duration_seconds: 23.4
  failed_assets: []

Logs Úteis

CampoUso
ingestion_run_idCorrelacionar eventos
source_idQual fonte
change_typenew, updated, deleted
impacted_assetsO que foi afetado
errorsStack traces
retriesTentativas de retry

Exemplo de log

{
  "timestamp": "2026-03-23T10:00:00Z",
  "ingestion_run_id": "run_123",
  "event": "document_updated",
  "source_id": "docs/security_policy.md",
  "change_type": "content_changed",
  "impacted_assets": ["chunkset_security_policy_v3"],
  "chunks_reused": 8,
  "chunks_reembedded": 4
}

Alertas

CondiçãoAção
Documento falhou parseAlert + retry com backoff
Schema drift inesperadoAlert + pause ingest opcional
Relação refere entidade inexistenteAlert + skip ou fail
Reindex incompletoAlert + retry ou manual
Incompatibilidade de checksum após escritaAlerta + verificação de consistência

Dashboard Sugerido

  1. Runs: sucesso/falha, duração
  2. Throughput: assets por tipo, por hora
  3. Change rate: novos vs atualizados vs unchanged
  4. Failures: por fonte, por tipo de erro
  5. Reindex triggers: o que está pendente
  6. Registry health: assets stale, dependências quebradas

Zona de prática

Sem perguntas. Clica em Editar para adicionar.