← Voltar a RAG — Arquitetura de Ingestion e Retrieval

📋 Visão Geral — RAG

RAG — Arquitetura de Ingestion e Retrieval

Apresentação

Arquitetura de Retrieval

Visão Geral

Esta documentação descreve a arquitetura de retrieval para sistemas RAG adaptativos:

  • Retrieval responde: "Como é que encontro e componho a resposta?"
  • Ingestion responde: "Como é que os dados entram, mudam, são versionados e ficam prontos para retrieval?" (ver pasta ../ingestion/)

Princípio Central

O retrieval encontra evidência em várias fontes (docs, SQL, graph) e compõe a resposta através de pipelines adaptativos que escolhem a melhor estratégia por consulta.

Benefícios

ObjetivoResultado
EficiênciaConsultas simples → path rápido (simple_rag)
QualidadeConsultas complexas → enriched ou multi-backend
FlexibilidadeUma fonte ou várias (docs + SQL + graph)
ExplicabilidadeRouting auditável, citações por fonte

Documentação

DocumentoConteúdo
01-ARCHITECTUREDiagrama geral, blocos principais (Analyzer → Router → 4 pipelines)
02-RETRIEVAL-COREComo encontro e componho — DocStore, chunking, embedding, indexação
03-TOOLS-SOURCESDocStore (Chroma), SQLTool, Neo4jTool — fontes e APIs
04-PIPELINESRetrieval detalhado por pipeline (simple, enriched, multi-backend)
05-ROUTING-RULESCritérios de routing, heurísticas, pseudocódigo
06-FALLBACK-STRATEGYEscalonamento quando confiança é baixa
07-FRESHNESS-METADATAMetadados, ligação ingestion→retrieval, freshness-aware
08-CONTRACTSQueryAnalysis, ExecutionResult, API schemas
09-FUTURE-THEORYReranker, hybrid search, validação — teoria não implementada
10-ADVANCED-RETRIEVAL-TECHNIQUESHyDE, RRF, ColBERT, contextual compression, parent doc retrieval
11-IMPLEMENTATION-PHASESFases 1–4, prioridades, entregáveis
12-METRICSMétricas de negócio, retrieval, router
13-DATA-GUIDEDados NovaOps, setup, mapeamento estratégia↔fontes

Ligação com Ingestion

A pasta ../ingestion/ documenta como os dados entram e ficam prontos para retrieval. Ver em especial:


Resumo para Artigo

"O retrieval adaptativo separa a decisão (Query Analyzer + Router) da execução (4 pipelines). O Router escolhe uma estratégia por consulta: direct_answer quando não precisa de grounding; simple_rag para factual com docs; enriched_rag para comparações com multi-query retrieval; multi_backend_agent para perguntas que exigem docs + SQL + graph. Cada pipeline usa DocStore (Chroma + sentence-transformers), SQLTool (Postgres read-only) e Neo4jTool (Cypher read-only). O sistema compõe a resposta através de synthesis que combina contextos das fontes relevantes. A teoria inclui reranker, hybrid search, validação de groundedness e freshness-aware retrieval, parte ainda por implementar."

Zona de prática

Sem perguntas. Clica em Editar para adicionar.