← Voltar a RAG — Arquitetura de Ingestion e Retrieval
🔄 Estratégia de Fallback
RAG — Arquitetura de Ingestion e RetrievalApresentação
6. Estratégia de Fallback
O sistema não pensa só em routing inicial; pensa em escalonamento quando a confiança é baixa.
Princípio
Tentar primeiro o caminho válido mais barato
→ medir confiança
→ se confiança baixa, escalar
→ se ainda baixa, esclarecer ou falhar graciosamente
Fluxo de Escalonamento
simple_rag
→ confiança de retrieval baixa?
→ enriched_rag
→ ainda baixa?
→ multi_backend_agent
→ ainda baixa?
→ pedir pergunta de esclarecimento
Sinais de Confiança Baixa
| Sinal | Ação sugerida |
|---|---|
| Poucos documentos relevantes | Escalar para enriched ou multi-backend |
| Scores fracos no reranker | Escalar ou clarificar |
| Pouca cobertura de evidência | Escalar para enriched (multi-query) |
| Resposta sem citações suficientes | Re-gerar ou escalar |
| Conflito entre fontes | Escalar para multi-backend ou clarificar |
| Falha da tool | Retry ou fallback para enriched |
| Answer confidence muito baixa | Escalar ou clarificar |
Thresholds (Configuráveis)
confidence:
high: 0.8
medium: 0.6
low: 0.4
fallback:
simple_rag_min_confidence: 0.5
enriched_rag_min_confidence: 0.4
escalate_to_clarify_threshold: 0.3
Lógica de Decisão
- Executar estratégia escolhida
- Calcular
confidencepós-execução (baseado em retrieval score, cobertura de citações, verificação da resposta) - Se
confidence < simple_rag_min_confidencee estratégia foisimple_rag→ tentarenriched_rag - Se
confidence < enriched_rag_min_confidencee estratégia foienriched_rag→ tentarmulti_backend_agent - Se
confidence < escalate_to_clarify_threshold→ devolver pergunta de esclarecimento em vez de resposta
Logging de Fallback
Para cada fallback, registar:
- Estratégia inicial
- Estratégia após fallback
- Razão (ex: "retrieval_confidence_below_threshold")
- Confidence antes/depois
- Latência adicional
Zona de prática
Sem perguntas. Clica em Editar para adicionar.