← Voltar a RAG — Arquitetura de Ingestion e Retrieval
📊 Métricas
RAG — Arquitetura de Ingestion e RetrievalApresentação
12. Métricas Recomendadas
Métricas de Negócio/Sistema
| Métrica | Descrição |
|---|---|
| p50/p95 latency | Latência por percentil |
| custo por consulta | Custo médio por consulta |
| taxa de sucesso de respostas | % de respostas consideradas corretas |
| taxa de escalonamento | % de consultas que escalaram |
| taxa de fallback | % de fallbacks acionados |
Métricas de Retrieval
| Métrica | Descrição |
|---|---|
| taxa de acerto | % de consultas com documentos relevantes |
| cobertura de citações | % de afirmações com citações |
| densidade de evidência | Média de citações por resposta |
| diversidade de fontes | Número de fontes distintas usadas |
| proxy de qualidade do reranker | Correlação scores vs relevância humana |
Métricas do Router
| Métrica | Descrição |
|---|---|
| % consultas no path certo | Precisão do routing |
| over-routing rate | % enviadas para path mais complexo que necessário |
| under-routing rate | % enviadas para path mais simples (levou a fallback) |
| custo adicional por routing incorreto | Impacto em $ |
Métricas de Qualidade
| Métrica | Descrição |
|---|---|
| groundedness | Claims suportados por evidência |
| consistência factual | Sem contradições |
| completude da resposta | Resposta completa à pergunta |
| feedback do utilizador (thumbs) | Up/down explícito |
| taxa de consultas não resolvidas | % sem resposta satisfatória |
Zona de prática
Sem perguntas. Clica em Editar para adicionar.