← Voltar a AI Engineer — Nutrium

🗄️ Vector Databases

AI Engineer — Nutrium

Apresentação

🗄️ Vector Databases — Requisito explícito da vaga

Vaga: "Have specific experience with LLMs, RAG systems, and vector databases."


O que são e para que servem

Armazenam embeddings (vetores) e permitem similarity search — encontrar os vetores mais próximos de uma query. Essencial para RAG.


Conceitos fundamentais

  • Cosine similarity — Mede ângulo entre vetores. 1 = idênticos, 0 = ortogonais.
  • ANN (Approximate Nearest Neighbor) — Algoritmos para search aproximado em escala (HNSW, IVF)
  • Metadata filtering — Filtrar por tipo de doc, data, etc., além da similaridade

Ferramentas comuns

FerramentaTipoQuando usar
PineconeManagedProdução, escala, pouco ops
WeaviateOpen-source / ManagedFlexível, hybrid search
ChromaOpen-sourceProtótipos, dev
pgvectorPostgreSQL extensionJá tens Postgres, dados menores
QdrantOpen-sourcePerformance, filtros complexos
MilvusOpen-sourceEscala muito grande

Escolha para Nutrium

  • Dados sensíveis — Preferir self-hosted ou managed em UE (Pinecone tem regiões)
  • Volume — Milhares de docs de guidelines: pgvector ou Chroma podem chegar; milhões: Pinecone, Weaviate
  • Hybrid search — Weaviate, Elasticsearch + vector plugin

Perguntas que podem fazer

  • "Que vector DB usaste e porque?"
  • "Como fazes similarity search em escala?"
  • "Cosine vs dot product?" (ambos usados; normalização torna equivalentes)

Zona de prática

Sem perguntas. Clica em Editar para adicionar.