← Voltar a RAG — Arquitetura de Ingestion e Retrieval

📋 Visão Geral — RAG

RAG — Arquitetura de Ingestion e Retrieval

Apresentação

Arquitetura de Retrieval

Visão Geral

Esta documentação descreve a arquitetura de retrieval para sistemas RAG adaptativos:

Retrieval responde: "Como é que encontro e componho a resposta?"
Ingestion responde: "Como é que os dados entram, mudam, são versionados e ficam prontos para retrieval?" (ver pasta ../ingestion/)

Princípio Central

O retrieval encontra evidência em várias fontes (docs, SQL, graph) e compõe a resposta através de pipelines adaptativos que escolhem a melhor estratégia por consulta.

Benefícios

Objetivo	Resultado
Eficiência	Consultas simples → path rápido (simple_rag)
Qualidade	Consultas complexas → enriched ou multi-backend
Flexibilidade	Uma fonte ou várias (docs + SQL + graph)
Explicabilidade	Routing auditável, citações por fonte

Documentação

Documento	Conteúdo
01-ARCHITECTURE	Diagrama geral, blocos principais (Analyzer → Router → 4 pipelines)
02-RETRIEVAL-CORE	Como encontro e componho — DocStore, chunking, embedding, indexação
03-TOOLS-SOURCES	DocStore (Chroma), SQLTool, Neo4jTool — fontes e APIs
04-PIPELINES	Retrieval detalhado por pipeline (simple, enriched, multi-backend)
05-ROUTING-RULES	Critérios de routing, heurísticas, pseudocódigo
06-FALLBACK-STRATEGY	Escalonamento quando confiança é baixa
07-FRESHNESS-METADATA	Metadados, ligação ingestion→retrieval, freshness-aware
08-CONTRACTS	QueryAnalysis, ExecutionResult, API schemas
09-FUTURE-THEORY	Reranker, hybrid search, validação — teoria não implementada
10-ADVANCED-RETRIEVAL-TECHNIQUES	HyDE, RRF, ColBERT, contextual compression, parent doc retrieval
11-IMPLEMENTATION-PHASES	Fases 1–4, prioridades, entregáveis
12-METRICS	Métricas de negócio, retrieval, router
13-DATA-GUIDE	Dados NovaOps, setup, mapeamento estratégia↔fontes

Ligação com Ingestion

A pasta ../ingestion/ documenta como os dados entram e ficam prontos para retrieval. Ver em especial:

ingestion/07-RETRIEVAL — Metadados que a ingestion fornece ao retrieval

Resumo para Artigo

"O retrieval adaptativo separa a decisão (Query Analyzer + Router) da execução (4 pipelines). O Router escolhe uma estratégia por consulta: direct_answer quando não precisa de grounding; simple_rag para factual com docs; enriched_rag para comparações com multi-query retrieval; multi_backend_agent para perguntas que exigem docs + SQL + graph. Cada pipeline usa DocStore (Chroma + sentence-transformers), SQLTool (Postgres read-only) e Neo4jTool (Cypher read-only). O sistema compõe a resposta através de synthesis que combina contextos das fontes relevantes. A teoria inclui reranker, hybrid search, validação de groundedness e freshness-aware retrieval, parte ainda por implementar."

Zona de prática

Sem perguntas. Clica em Editar para adicionar.