← Voltar a RAG — Arquitetura de Ingestion e Retrieval

📊 Métricas

RAG — Arquitetura de Ingestion e Retrieval

Apresentação

12. Métricas Recomendadas

Métricas de Negócio/Sistema

MétricaDescrição
p50/p95 latencyLatência por percentil
custo por consultaCusto médio por consulta
taxa de sucesso de respostas% de respostas consideradas corretas
taxa de escalonamento% de consultas que escalaram
taxa de fallback% de fallbacks acionados

Métricas de Retrieval

MétricaDescrição
taxa de acerto% de consultas com documentos relevantes
cobertura de citações% de afirmações com citações
densidade de evidênciaMédia de citações por resposta
diversidade de fontesNúmero de fontes distintas usadas
proxy de qualidade do rerankerCorrelação scores vs relevância humana

Métricas do Router

MétricaDescrição
% consultas no path certoPrecisão do routing
over-routing rate% enviadas para path mais complexo que necessário
under-routing rate% enviadas para path mais simples (levou a fallback)
custo adicional por routing incorretoImpacto em $

Métricas de Qualidade

MétricaDescrição
groundednessClaims suportados por evidência
consistência factualSem contradições
completude da respostaResposta completa à pergunta
feedback do utilizador (thumbs)Up/down explícito
taxa de consultas não resolvidas% sem resposta satisfatória

Zona de prática

Sem perguntas. Clica em Editar para adicionar.