← Voltar a RAG — Arquitetura de Ingestion e Retrieval
📋 Fases de Implementação
RAG — Arquitetura de Ingestion e RetrievalApresentação
11. Fases de Implementação
Plano incremental para não construir demasiado cedo.
Fase 1 — Base Sólida
Objetivo: Sistema funcional, rápido e mensurável.
Entregáveis
- Query Analyzer simples (heurísticas + LLM leve)
- Router rule-based
-
direct_answerpipeline -
simple_ragpipeline (retrieve → rerank → generate) - Observabilidade básica (logs estruturados, latência, custo)
Pilha sugerida
- FastAPI
- Vector store (Chroma/FAISS/ Pinecone)
- Embedding model (OpenAI/sentence-transformers)
- LLM (OpenAI/Anthropic ou local)
Fase 2 — Enriched RAG
Objetivo: Melhorar queries intermédias sem ir logo para agentic.
Entregáveis
- Decomposição de consultas
- Multi-query retrieval
- Reranking melhor (Cohere/Cross-Encoder)
- Verificações de confiança
- Fallback simples_rag → enriched_rag
Técnicas
- HyDE (quando fizer sentido)
- Passage merging
- Verificação de cobertura de citações
Fase 3 — Multi-Backend
Objetivo: Resolver casos enterprise compostos.
Entregáveis
- SQL tool (conexão a DB dos dados sintéticos)
- Docs retriever (já existe)
- API/tool support
- LangGraph para multi_backend_agent
- Evidence normalization e synthesis
Fontes
- Docs: adaptive-rag/data/generated/docs
- SQL: adaptive-rag/data/generated/sql
- Relações: teams, projects, services (opcional graph)
Fase 4 — Router Inteligente
Objetivo: Decidir melhor e escalar menos vezes sem necessidade.
Entregáveis
- Classifier melhor (fine-tuned ou prompts calibrados)
- Datasets de routing para avaliação
- Métricas: over-routing, under-routing, custo adicional
- Ajuste iterativo das regras
Ordem de Prioridade
- Ingestão — carregar docs e SQL em vector store e schema DB
- Simple RAG — path mais usado
- Query Analyzer — decisão mínima viável
- Observabilidade — desde o início
- Enriched RAG — quando simple_rag não chegar
- Multi-backend — para casos compostos
- Router inteligente — refinamento contínuo
Zona de prática
Sem perguntas. Clica em Editar para adicionar.