← Voltar a RAG — Arquitetura de Ingestion e Retrieval

📋 Fases de Implementação

RAG — Arquitetura de Ingestion e Retrieval

Apresentação

11. Fases de Implementação

Plano incremental para não construir demasiado cedo.


Fase 1 — Base Sólida

Objetivo: Sistema funcional, rápido e mensurável.

Entregáveis

  • Query Analyzer simples (heurísticas + LLM leve)
  • Router rule-based
  • direct_answer pipeline
  • simple_rag pipeline (retrieve → rerank → generate)
  • Observabilidade básica (logs estruturados, latência, custo)

Pilha sugerida

  • FastAPI
  • Vector store (Chroma/FAISS/ Pinecone)
  • Embedding model (OpenAI/sentence-transformers)
  • LLM (OpenAI/Anthropic ou local)

Fase 2 — Enriched RAG

Objetivo: Melhorar queries intermédias sem ir logo para agentic.

Entregáveis

  • Decomposição de consultas
  • Multi-query retrieval
  • Reranking melhor (Cohere/Cross-Encoder)
  • Verificações de confiança
  • Fallback simples_rag → enriched_rag

Técnicas

  • HyDE (quando fizer sentido)
  • Passage merging
  • Verificação de cobertura de citações

Fase 3 — Multi-Backend

Objetivo: Resolver casos enterprise compostos.

Entregáveis

  • SQL tool (conexão a DB dos dados sintéticos)
  • Docs retriever (já existe)
  • API/tool support
  • LangGraph para multi_backend_agent
  • Evidence normalization e synthesis

Fontes

  • Docs: adaptive-rag/data/generated/docs
  • SQL: adaptive-rag/data/generated/sql
  • Relações: teams, projects, services (opcional graph)

Fase 4 — Router Inteligente

Objetivo: Decidir melhor e escalar menos vezes sem necessidade.

Entregáveis

  • Classifier melhor (fine-tuned ou prompts calibrados)
  • Datasets de routing para avaliação
  • Métricas: over-routing, under-routing, custo adicional
  • Ajuste iterativo das regras

Ordem de Prioridade

  1. Ingestão — carregar docs e SQL em vector store e schema DB
  2. Simple RAG — path mais usado
  3. Query Analyzer — decisão mínima viável
  4. Observabilidade — desde o início
  5. Enriched RAG — quando simple_rag não chegar
  6. Multi-backend — para casos compostos
  7. Router inteligente — refinamento contínuo

Zona de prática

Sem perguntas. Clica em Editar para adicionar.