Voyage AI: A Precisão por Trás do Vectora
Enquanto o Gemini 3 Flash fornece o raciocínio, a precisão da busca do Vectora depende do Voyage AI. Especificamente, usamos o Voyage 4 para embeddings e o Voyage Rerank 2.5 para garantir que apenas os trechos de código mais relevantes alcancem o LLM.
O Coração da Recuperação do Vectora: Voyage 4 & Rerank 2.5
Vectora utiliza o estado da arte em modelos de embedding e reranking para garantir que o contexto enviado ao modelo de linguagem seja o mais preciso possível, minimizando alucinações e otimizando custos.
Por que Voyage AI?
Testamos os principais modelos de embedding. Aqui está a realidade para a recuperação de código:
Comparação de Modelos de Embedding (Busca de Código)
| Aspecto | Voyage 4 | text-embedding-3-large | Cohere Embed-3 |
|---|---|---|---|
| Code Benchmarks | Top-1 | Top-3 | Top-2 |
| Dimensões | 1,536 | 3,072 | 1,024 |
| Tokens Máximos | 32K | 8K | 8K |
| Latência | <50ms | ~200ms | ~150ms |
| Custo por 1M tokens | $0.02 | $0.13 | $0.10 |
Por que Voyage Vence para Desenvolvedores
- Ajuste Específico para Código: O Voyage 4 é treinado especificamente em vastos repositórios de código-fonte (Python, TS, Go, Rust), compreendendo sintaxes complexas melhor do que modelos de uso geral.
- Eficiência: 1.536 dimensões fornecem o equilíbrio perfeito entre precisão de recuperação e custo de armazenamento.
- Janela Ampla: O suporte a 32K tokens permite que “pedaços” (chunks) ou arquivos muito maiores sejam processados sem perder o contexto.
- Integração com Reranking: O Voyage Rerank 2.5 trabalha perfeitamente com o Voyage 4, reduzindo o ruído e aumentando a “precisão em 1” (P@1).
Arquitetura: O Pipeline de Vetores
Vectora utiliza um pipeline de recuperação em duas etapas:
1. Busca Vetorial (Recuperação Grossa)
- Fragmentação (Chunking): Seu código é dividido em pedaços otimizados com reconhecimento de AST via Tree-sitter.
- Embedding: O Voyage 4 converte esses pedaços em vetores de alta dimensão.
- Indexação: Os vetores são armazenados em um índice Qdrant HNSW.
- Consulta: Quando você pesquisa, sua pergunta é convertida em embedding e o Qdrant encontra os 50-100 vizinhos mais próximos.
2. Reranking (Filtragem Fina)
A busca vetorial sozinha pode retornar pedaços que são semanticamente semelhantes, mas tecnicamente irrelevantes. O Voyage Rerank 2.5 reavalia os principais resultados:
- Correspondência Semântica: Este código realmente resolve o problema do usuário?
- Relevância Contextual: Este é o arquivo correto ou apenas um padrão de sintaxe semelhante?
- Resultado: Os 5 pedaços com maior pontuação são enviados ao Gemini.
Benefícios do Reranking
Sem um reranker, o LLM frequentemente fica “confuso” com códigos que parecem semelhantes, mas estão incorretos. O reranking proporciona:
- Maior Qualidade: Reduz alucinações ao fornecer apenas verdadeiros positivos.
- Menor Custo: Reduz os tokens enviados ao LLM filtrando informações irrelevantes.
- Melhor UX: As respostas parecem mais “conscientes” da estrutura específica do seu projeto.
Configuração
Para usar o Voyage AI, certifique-se de que seu vectora.config.yaml esteja configurado:
providers:
embedding:
name: "voyage"
model: "voyage-4"
api_key: "${VOYAGE_API_KEY}"
reranker:
name: "voyage"
model: "voyage-rerank-2.5"
api_key: "${VOYAGE_API_KEY}"Preços & Cotas
O Voyage AI é extremamente econômico:
| Modelo | Custo (por 1M tokens) |
|---|---|
| Voyage 4 | $0.02 |
| Voyage Rerank 2.5 | $2.00 |
A maioria dos projetos de pequeno a médio porte custa menos de $1/mês em taxas de API do Voyage no plano Free (BYOK).
External Linking
| Concept | Resource | Link |
|---|---|---|
| Voyage Embeddings | Voyage Embeddings Documentation | docs.voyageai.com/docs/embeddings |
| Voyage Reranker | Voyage Reranker API | docs.voyageai.com/docs/reranker |
| AST Parsing | Tree-sitter Official Documentation | tree-sitter.github.io/tree-sitter/ |
| Qdrant | Vector Database Documentation | qdrant.tech/documentation/ |
| Gemini API | Google AI Studio Documentation | ai.google.dev/docs |
| RAG | Retrieval-Augmented Generation for Knowledge-Intensive NLP | arxiv.org/abs/2005.11401 |
Parte do ecossistema Vectora · Open Source (MIT) · Contribuidores