📋 Visão Geral — RAG
RAG — Arquitetura de Ingestion e RetrievalApresentação
Arquitetura de Retrieval
Visão Geral
Esta documentação descreve a arquitetura de retrieval para sistemas RAG adaptativos:
- Retrieval responde: "Como é que encontro e componho a resposta?"
- Ingestion responde: "Como é que os dados entram, mudam, são versionados e ficam prontos para retrieval?" (ver pasta
../ingestion/)
Princípio Central
O retrieval encontra evidência em várias fontes (docs, SQL, graph) e compõe a resposta através de pipelines adaptativos que escolhem a melhor estratégia por consulta.
Benefícios
| Objetivo | Resultado |
|---|---|
| Eficiência | Consultas simples → path rápido (simple_rag) |
| Qualidade | Consultas complexas → enriched ou multi-backend |
| Flexibilidade | Uma fonte ou várias (docs + SQL + graph) |
| Explicabilidade | Routing auditável, citações por fonte |
Documentação
| Documento | Conteúdo |
|---|---|
| 01-ARCHITECTURE | Diagrama geral, blocos principais (Analyzer → Router → 4 pipelines) |
| 02-RETRIEVAL-CORE | Como encontro e componho — DocStore, chunking, embedding, indexação |
| 03-TOOLS-SOURCES | DocStore (Chroma), SQLTool, Neo4jTool — fontes e APIs |
| 04-PIPELINES | Retrieval detalhado por pipeline (simple, enriched, multi-backend) |
| 05-ROUTING-RULES | Critérios de routing, heurísticas, pseudocódigo |
| 06-FALLBACK-STRATEGY | Escalonamento quando confiança é baixa |
| 07-FRESHNESS-METADATA | Metadados, ligação ingestion→retrieval, freshness-aware |
| 08-CONTRACTS | QueryAnalysis, ExecutionResult, API schemas |
| 09-FUTURE-THEORY | Reranker, hybrid search, validação — teoria não implementada |
| 10-ADVANCED-RETRIEVAL-TECHNIQUES | HyDE, RRF, ColBERT, contextual compression, parent doc retrieval |
| 11-IMPLEMENTATION-PHASES | Fases 1–4, prioridades, entregáveis |
| 12-METRICS | Métricas de negócio, retrieval, router |
| 13-DATA-GUIDE | Dados NovaOps, setup, mapeamento estratégia↔fontes |
Ligação com Ingestion
A pasta ../ingestion/ documenta como os dados entram e ficam prontos para retrieval. Ver em especial:
- ingestion/07-RETRIEVAL — Metadados que a ingestion fornece ao retrieval
Resumo para Artigo
"O retrieval adaptativo separa a decisão (Query Analyzer + Router) da execução (4 pipelines). O Router escolhe uma estratégia por consulta: direct_answer quando não precisa de grounding; simple_rag para factual com docs; enriched_rag para comparações com multi-query retrieval; multi_backend_agent para perguntas que exigem docs + SQL + graph. Cada pipeline usa DocStore (Chroma + sentence-transformers), SQLTool (Postgres read-only) e Neo4jTool (Cypher read-only). O sistema compõe a resposta através de synthesis que combina contextos das fontes relevantes. A teoria inclui reranker, hybrid search, validação de groundedness e freshness-aware retrieval, parte ainda por implementar."
Zona de prática
Sem perguntas. Clica em Editar para adicionar.