Skip to content
Voyage AI: A Precisão por Trás do Vectora

Voyage AI: A Precisão por Trás do Vectora

PT | EN

Enquanto o Gemini 3 Flash fornece o raciocínio, a precisão da busca do Vectora depende do Voyage AI. Especificamente, usamos o Voyage 4 para embeddings e o Voyage Rerank 2.5 para garantir que apenas os trechos de código mais relevantes alcancem o LLM.

O Coração da Recuperação do Vectora: Voyage 4 & Rerank 2.5

Vectora utiliza o estado da arte em modelos de embedding e reranking para garantir que o contexto enviado ao modelo de linguagem seja o mais preciso possível, minimizando alucinações e otimizando custos.

Por que Voyage AI?

Testamos os principais modelos de embedding. Aqui está a realidade para a recuperação de código:

Comparação de Modelos de Embedding (Busca de Código)

AspectoVoyage 4text-embedding-3-largeCohere Embed-3
Code BenchmarksTop-1Top-3Top-2
Dimensões1,5363,0721,024
Tokens Máximos32K8K8K
Latência<50ms~200ms~150ms
Custo por 1M tokens$0.02$0.13$0.10

Por que Voyage Vence para Desenvolvedores

  1. Ajuste Específico para Código: O Voyage 4 é treinado especificamente em vastos repositórios de código-fonte (Python, TS, Go, Rust), compreendendo sintaxes complexas melhor do que modelos de uso geral.
  2. Eficiência: 1.536 dimensões fornecem o equilíbrio perfeito entre precisão de recuperação e custo de armazenamento.
  3. Janela Ampla: O suporte a 32K tokens permite que “pedaços” (chunks) ou arquivos muito maiores sejam processados sem perder o contexto.
  4. Integração com Reranking: O Voyage Rerank 2.5 trabalha perfeitamente com o Voyage 4, reduzindo o ruído e aumentando a “precisão em 1” (P@1).

Arquitetura: O Pipeline de Vetores

Vectora utiliza um pipeline de recuperação em duas etapas:

1. Busca Vetorial (Recuperação Grossa)

  1. Fragmentação (Chunking): Seu código é dividido em pedaços otimizados com reconhecimento de AST via Tree-sitter.
  2. Embedding: O Voyage 4 converte esses pedaços em vetores de alta dimensão.
  3. Indexação: Os vetores são armazenados em um índice Qdrant HNSW.
  4. Consulta: Quando você pesquisa, sua pergunta é convertida em embedding e o Qdrant encontra os 50-100 vizinhos mais próximos.

2. Reranking (Filtragem Fina)

A busca vetorial sozinha pode retornar pedaços que são semanticamente semelhantes, mas tecnicamente irrelevantes. O Voyage Rerank 2.5 reavalia os principais resultados:

  • Correspondência Semântica: Este código realmente resolve o problema do usuário?
  • Relevância Contextual: Este é o arquivo correto ou apenas um padrão de sintaxe semelhante?
  • Resultado: Os 5 pedaços com maior pontuação são enviados ao Gemini.

Benefícios do Reranking

Sem um reranker, o LLM frequentemente fica “confuso” com códigos que parecem semelhantes, mas estão incorretos. O reranking proporciona:

  • Maior Qualidade: Reduz alucinações ao fornecer apenas verdadeiros positivos.
  • Menor Custo: Reduz os tokens enviados ao LLM filtrando informações irrelevantes.
  • Melhor UX: As respostas parecem mais “conscientes” da estrutura específica do seu projeto.

Configuração

Para usar o Voyage AI, certifique-se de que seu vectora.config.yaml esteja configurado:

providers:
  embedding:
    name: "voyage"
    model: "voyage-4"
    api_key: "${VOYAGE_API_KEY}"

  reranker:
    name: "voyage"
    model: "voyage-rerank-2.5"
    api_key: "${VOYAGE_API_KEY}"

Preços & Cotas

O Voyage AI é extremamente econômico:

ModeloCusto (por 1M tokens)
Voyage 4$0.02
Voyage Rerank 2.5$2.00

A maioria dos projetos de pequeno a médio porte custa menos de $1/mês em taxas de API do Voyage no plano Free (BYOK).


External Linking

ConceptResourceLink
Voyage EmbeddingsVoyage Embeddings Documentationdocs.voyageai.com/docs/embeddings
Voyage RerankerVoyage Reranker APIdocs.voyageai.com/docs/reranker
AST ParsingTree-sitter Official Documentationtree-sitter.github.io/tree-sitter/
QdrantVector Database Documentationqdrant.tech/documentation/
Gemini APIGoogle AI Studio Documentationai.google.dev/docs
RAGRetrieval-Augmented Generation for Knowledge-Intensive NLParxiv.org/abs/2005.11401

Parte do ecossistema Vectora · Open Source (MIT) · Contribuidores