← Voltar a RAG — Arquitetura de Ingestion e Retrieval

🔄 Estratégia de Fallback

RAG — Arquitetura de Ingestion e Retrieval

Apresentação

6. Estratégia de Fallback

O sistema não pensa só em routing inicial; pensa em escalonamento quando a confiança é baixa.


Princípio

Tentar primeiro o caminho válido mais barato
  → medir confiança
  → se confiança baixa, escalar
  → se ainda baixa, esclarecer ou falhar graciosamente

Fluxo de Escalonamento

simple_rag
  → confiança de retrieval baixa?
  → enriched_rag
  → ainda baixa?
  → multi_backend_agent
  → ainda baixa?
  → pedir pergunta de esclarecimento

Sinais de Confiança Baixa

SinalAção sugerida
Poucos documentos relevantesEscalar para enriched ou multi-backend
Scores fracos no rerankerEscalar ou clarificar
Pouca cobertura de evidênciaEscalar para enriched (multi-query)
Resposta sem citações suficientesRe-gerar ou escalar
Conflito entre fontesEscalar para multi-backend ou clarificar
Falha da toolRetry ou fallback para enriched
Answer confidence muito baixaEscalar ou clarificar

Thresholds (Configuráveis)

confidence:
  high: 0.8
  medium: 0.6
  low: 0.4

fallback:
  simple_rag_min_confidence: 0.5
  enriched_rag_min_confidence: 0.4
  escalate_to_clarify_threshold: 0.3

Lógica de Decisão

  1. Executar estratégia escolhida
  2. Calcular confidence pós-execução (baseado em retrieval score, cobertura de citações, verificação da resposta)
  3. Se confidence < simple_rag_min_confidence e estratégia foi simple_rag → tentar enriched_rag
  4. Se confidence < enriched_rag_min_confidence e estratégia foi enriched_rag → tentar multi_backend_agent
  5. Se confidence < escalate_to_clarify_threshold → devolver pergunta de esclarecimento em vez de resposta

Logging de Fallback

Para cada fallback, registar:

  • Estratégia inicial
  • Estratégia após fallback
  • Razão (ex: "retrieval_confidence_below_threshold")
  • Confidence antes/depois
  • Latência adicional

Zona de prática

Sem perguntas. Clica em Editar para adicionar.