← Voltar a RAG — Arquitetura de Ingestion e Retrieval

🔄 Estratégia de Fallback

RAG — Arquitetura de Ingestion e Retrieval

Apresentação

6. Estratégia de Fallback

O sistema não pensa só em routing inicial; pensa em escalonamento quando a confiança é baixa.

Princípio

Tentar primeiro o caminho válido mais barato
  → medir confiança
  → se confiança baixa, escalar
  → se ainda baixa, esclarecer ou falhar graciosamente

Fluxo de Escalonamento

simple_rag
  → confiança de retrieval baixa?
  → enriched_rag
  → ainda baixa?
  → multi_backend_agent
  → ainda baixa?
  → pedir pergunta de esclarecimento

Sinais de Confiança Baixa

Sinal	Ação sugerida
Poucos documentos relevantes	Escalar para enriched ou multi-backend
Scores fracos no reranker	Escalar ou clarificar
Pouca cobertura de evidência	Escalar para enriched (multi-query)
Resposta sem citações suficientes	Re-gerar ou escalar
Conflito entre fontes	Escalar para multi-backend ou clarificar
Falha da tool	Retry ou fallback para enriched
Answer confidence muito baixa	Escalar ou clarificar

Thresholds (Configuráveis)

confidence:
  high: 0.8
  medium: 0.6
  low: 0.4

fallback:
  simple_rag_min_confidence: 0.5
  enriched_rag_min_confidence: 0.4
  escalate_to_clarify_threshold: 0.3

Lógica de Decisão

Executar estratégia escolhida
Calcular confidence pós-execução (baseado em retrieval score, cobertura de citações, verificação da resposta)
Se confidence < simple_rag_min_confidence e estratégia foi simple_rag → tentar enriched_rag
Se confidence < enriched_rag_min_confidence e estratégia foi enriched_rag → tentar multi_backend_agent
Se confidence < escalate_to_clarify_threshold → devolver pergunta de esclarecimento em vez de resposta

Logging de Fallback

Para cada fallback, registar:

Estratégia inicial
Estratégia após fallback
Razão (ex: "retrieval_confidence_below_threshold")
Confidence antes/depois
Latência adicional

Zona de prática

Sem perguntas. Clica em Editar para adicionar.