Skip to content

Core Concepts

PT | EN

Entenda os pilares tecnológicos que sustentam o Vectora e como ele resolve o problema do contexto fragmentado em codebases complexos.

Vectora não é um chatbot. É um Sub-Agent Tier 2 com contexto governado via MCP — projetado para ser chamado por agentes principais (Claude Code, Gemini CLI, VS Code) quando precisarem de recuperação precisa de contexto em repositórios de código.

Mapa Conceitual

    graph LR
    A[Query do Usuário] --> B[Context Engine]
    B --> C[Embeddings: Voyage 4]
    C --> D[Vector Search: MongoDB Atlas]
    D --> E[Reranker: Voyage 2.5]
    E --> F[Harness Runtime]
    F --> G[Resposta Governada]

    H[Trust Folder] -.-> F
    I[Guardian] -.-> F
    J[Namespaces] -.-> D
  

5 Pilares Essenciais

PilarO que é (nova definição)Por que importaLink
Context EnginePipeline de recuperação em 2 estágios: recall vetorial + precision via rerankingEncontra código por similaridade funcional, não por palavras-chave exatas→ Context Engine
EmbeddingsRepresentação vetorial de código treinada em repositórios reais (Voyage 4)Permite buscar “implementação de retry” mesmo sem a palavra “retry” no código→ Embeddings
RerankerCross-encoder que reordena resultados brutos da busca vetorialAumenta precision@5 de ~0.45 para ~0.89 — crítico para respostas úteis→ Reranker
Harness RuntimeSistema nervoso distribuído: orquestra observação, auto-correção e governança em tempo realTransforma o Gemini de “modelo que chama tools” para “agente que assiste, avalia e ajusta suas próprias ações”→ Harness Runtime
Trust FolderSandbox de filesystem com validação de paths, symlink detection e BYOKPrevine directory traversal, vazamento de secrets e acesso não autorizado a arquivos→ Trust Folder

Conceitos Técnicos Profundos

Busca & Recuperação (RAG para Código)

ConceitoDescriçãoQuando usar
Vector SearchBusca por similaridade de embeddings em MongoDB Atlas Vector SearchQuando precisa encontrar código semanticamente similar, não lexicalmente idêntico
Embeddings & ModelosVoyage 4: 1536 dimensões, treinado em código, 32K contextoPara gerar representações de chunks de código que preservam significado funcional
RerankerVoyage Rerank 2.5: cross-encoder que avalia pares (query, chunk)Para filtrar top-100 da busca vetorial para top-5 altamente relevantes
Reranker LocalBM25 + heurísticas para cenários sem VectorDB ou dados mutáveisPara prototipagem, dados efêmeros ou ambientes offline

Arquitetura & Runtime (O “Sistema Nervoso”)

ConceitoDescriçãoDiferencial
Harness RuntimePadrão distribuído: Context Pipeline + Streaming Execution + Recovery Ladder + State ThreadingNão é um módulo — é a inteligência que permeia prompt, tools, estado e configuração
Trust FolderIsolamento de filesystem com fs.realpath, blocklist compilada em Go, BYOKSegurança “shift-left”: validação antes da execução, não auditoria pós-fato
NamespacesIsolamento lógico multi-tenant: projetos, equipes, ambientesPermite ingestão de múltiplos repositórios sem poluição cruzada de contexto

Conceitos Avançados (Escalando o Agente)

ConceitoDescriçãoCaso de Uso
RAG (Retrieval-Augmented Generation)Padrão de enriquecimento de contexto: retrieve → rerank → inject → generatePara qualquer tarefa que exija conhecimento externo ao treinamento do modelo
Sub-AgentsCoordenação de agentes especializados com contexto isolado e handoff via MCPQuando uma tarefa complexa requer fases distintas (pesquisa → planejamento → execução)
State PersistenceMongoDB como backend unificado para contexto, memória de execução e audit trailPara sessões longas, recuperação de falhas e aprendizado contínuo

Fluxo Completo: Query → Resposta Governada

1. IDE/CLI faz query via MCP: "Como validar tokens JWT em middleware Go?"
2. Context Engine:
   - Parse da query com AST-aware chunking
   - Geração de embedding via Voyage 4 (fallback local se indisponível)
3. Vector Search (MongoDB Atlas):
   - Busca vetorial: top-100 chunks por similaridade de cosseno
   - Filtro por namespace, permissões RBAC, Trust Folder
4. Reranker (Voyage 2.5):
   - Cross-encoder reordena top-100 → top-5 por relevância semântica
   - Métrica precision@5 injetada no contexto do Gemini
5. Harness Runtime (Distribuído):
   - [Observação] Gemini "assiste" métricas: precision=0.89, confidence=0.94
   - [Auto-correção] Se precision < 0.65 → retry com query refinada
   - [Governança] Guardian valida: sem paths fora do Trust Folder, sem secrets
   - [State] Nova iteração constrói AgentState imutável com audit trail
6. Tool Executor:
   - Retorna chunks rerankeados + métricas + audit log ao modelo
   - Gemini sintetiza resposta com citações, links e advertências de contexto
7. Resposta ao Usuário:
   - Código exemplo com atribuição de arquivo
   - Link direto para docs: cafegame.dev/docs/vectora/auth/jwt
   - Opção: "Quer que eu analise como isso está implementado no SEU projeto?"

O Harness não é uma “fase” neste fluxo — ele está presente em cada seta, observando, validando e ajustando o comportamento do agente em tempo real.

Guias por Perfil

Para Iniciantes (Primeiros 30 Minutos)

  1. Context Engine — Entenda como o Vectora “enxerga” código
  2. Vector Search — A técnica por trás da busca semântica
  3. Trust Folder — Como configurar o sandbox de filesystem com segurança

Para Desenvolvedores (Integração e Uso Diário)

  1. Harness Runtime — Como o Vectora auto-avalia e auto-corrige
  2. Sub-Agents — Quando e como delegar tarefas complexas
  3. MCP Protocol — Conectando Vectora ao seu IDE/CLI favorito

Para Arquitetos (Escalabilidade e Governança)

  1. Namespaces — Isolamento multi-tenant e políticas de acesso
  2. State Persistence — MongoDB como backend unificado para contexto e audit
  3. Guardian — Blocklist imutável, validação de paths e BYOK em produção

Perguntas Frequentes Conceituais

Por que Vectora usa Voyage em vez de OpenAI embeddings?

Voyage 4 foi treinado especificamente em repositórios de código (GitHub, GitLab), resultando em embeddings que capturam padrões de arquitetura, convenções de linguagem e semântica de APIs — algo que modelos genéricos não fazem com a mesma precisão. → Embeddings

Harness Runtime é um módulo que eu importo?

Não. Harness é um padrão arquitetural distribuído — não uma pasta /harness no código. Ele emerge da interação entre: system prompt (meta-instruções), tool schemas (com observation hooks), state management (imutável + audit trail) e configuração (recovery ladder em YAML). → Harness Runtime

Posso usar Vectora sem MongoDB Atlas?

Sim, com limitações. O Reranker Local permite busca inteligente sem VectorDB, ideal para prototipagem ou dados mutáveis. Porém, para produção com >10k chunks, MongoDB Atlas Vector Search oferece escalabilidade, TTL automático e integração nativa com o pipeline de ingestão. → Reranker Local


Dúvidas sobre um conceito? GitHub Discussions · Reportar erro na docs

External Linking

ConceitoRecursoLinkPor que este link?
MongoDB Atlas Vector SearchDocumentação oficial de busca vetorialmongodb.com/docs/atlas/atlas-vector-searchReferência canônica para configuração de indexes vetoriais, métricas de distância e integração com pipelines de ingestão
Model Context Protocol (MCP)Especificação do protocolo de contexto para agentesmodelcontextprotocol.io/specificationPadrão aberto que Vectora implementa para interoperabilidade com Claude Code, Cursor, VS Code e outros hosts
Voyage AI EmbeddingsDocumentação técnica dos modelos de embeddingdocs.voyageai.com/docs/embeddingsDetalhes sobre dimensionalidade, treinamento em código, e melhores práticas para chunking de repositórios
RAG: Retrieval-Augmented GenerationArtigo seminal do padrão RAG (Lewis et al., 2020)arxiv.org/abs/2005.11401Fundamentação acadêmica do padrão que Vectora adapta para domínio de código
Agentic Design Patterns12 padrões de Harness extraídos do Claude Codegenerativeprogrammer.com/p/12-agentic-harness-patternsGuia prático de padrões reutilizáveis para orquestração distribuída de agentes

Parte do ecossistema Vectora · Open Source (MIT) · Contribuidores