🗄️ Vector Databases

AI Engineer — Nutrium

Apresentação

Vaga: "Have specific experience with LLMs, RAG systems, and vector databases."

Armazenam embeddings (vetores) e permitem similarity search — encontrar os vetores mais próximos de uma query. Essencial para RAG.

Cosine similarity — Mede ângulo entre vetores. 1 = idênticos, 0 = ortogonais.
ANN (Approximate Nearest Neighbor) — Algoritmos para search aproximado em escala (HNSW, IVF)
Metadata filtering — Filtrar por tipo de doc, data, etc., além da similaridade

Ferramenta	Tipo	Quando usar
Pinecone	Managed	Produção, escala, pouco ops
Weaviate	Open-source / Managed	Flexível, hybrid search
Chroma	Open-source	Protótipos, dev
pgvector	PostgreSQL extension	Já tens Postgres, dados menores
Qdrant	Open-source	Performance, filtros complexos
Milvus	Open-source	Escala muito grande

Dados sensíveis — Preferir self-hosted ou managed em UE (Pinecone tem regiões)
Volume — Milhares de docs de guidelines: pgvector ou Chroma podem chegar; milhões: Pinecone, Weaviate
Hybrid search — Weaviate, Elasticsearch + vector plugin

Sem perguntas. Clica em Editar para adicionar.