Apresentação
🗄️ Vector Databases — Requisito explícito da vaga
Vaga: "Have specific experience with LLMs, RAG systems, and vector databases."
O que são e para que servem
Armazenam embeddings (vetores) e permitem similarity search — encontrar os vetores mais próximos de uma query. Essencial para RAG.
Conceitos fundamentais
- Cosine similarity — Mede ângulo entre vetores. 1 = idênticos, 0 = ortogonais.
- ANN (Approximate Nearest Neighbor) — Algoritmos para search aproximado em escala (HNSW, IVF)
- Metadata filtering — Filtrar por tipo de doc, data, etc., além da similaridade
Ferramentas comuns
| Ferramenta | Tipo | Quando usar |
|---|---|---|
| Pinecone | Managed | Produção, escala, pouco ops |
| Weaviate | Open-source / Managed | Flexível, hybrid search |
| Chroma | Open-source | Protótipos, dev |
| pgvector | PostgreSQL extension | Já tens Postgres, dados menores |
| Qdrant | Open-source | Performance, filtros complexos |
| Milvus | Open-source | Escala muito grande |
Escolha para Nutrium
- Dados sensíveis — Preferir self-hosted ou managed em UE (Pinecone tem regiões)
- Volume — Milhares de docs de guidelines: pgvector ou Chroma podem chegar; milhões: Pinecone, Weaviate
- Hybrid search — Weaviate, Elasticsearch + vector plugin
Perguntas que podem fazer
- "Que vector DB usaste e porque?"
- "Como fazes similarity search em escala?"
- "Cosine vs dot product?" (ambos usados; normalização torna equivalentes)
Zona de prática
Sem perguntas. Clica em Editar para adicionar.