Skip to content

Vectora

PT | EN

Visão Geral

Agentes de IA tradicionais operam em contextos fragmentados, gerando alucinações, desperdício de tokens e exposição acidental de segredos. O Vectora resolve isso não sendo “mais um chat”, mas sim um Sub-Agent Tier 2 projetado exclusivamente para engenharia de software: ele intercepta chamadas via Protocolo MCP, valida segurança em tempo real com o Guardian, orquestra recuperação multi-hop via Context Engine e entrega contexto estruturado ao seu agent principal (Claude Code, Gemini CLI, Cursor, etc.).


Fórmula Central: Agente Funcional = Modelo (Gemini 3 Flash) + [Harness Runtime](concepts/harness-runtime/) + Contexto Governado (Voyage 4 + MongoDB Atlas)


O Problema que Vectora Resolve

Falha em Agents GenéricosImpacto PráticoComo Vectora Mitiga
Contexto RasoBusca por “autenticação” retorna 50 arquivos irrelevantesReranker 2.5 filtra por relevância semântica real, não por similaridade cossena bruta
Sem Validação Pré-ExecuçãoTool calls perigosos rodam antes de serem auditadosHarness Runtime intercepta, valida schema Zod e aplica Guardian antes da execução
Falta de IsolamentoDados de projetos diferentes vazam entre sessõesNamespace Isolation via RBAC na aplicação + filtragem obrigatória no backend
Consumo ImprevisívelLLMs geram overfetch, gastam tokens em boilerplateContext Engine decide escopo, aplica compaction (head/tail) e injeta só o relevante
Segurança FrágilBlocklists dependem de prompts (jailbreakáveis)Hard-Coded Guardian é compilado no runtime, impossível de bypassar via prompt

A Solução: Arquitetura de Sub-Agent

Vectora é exposto exclusivamente via MCP. Não há CLI de chat, TUI ou interface de conversação direta. Ele opera silenciosamente como camada de governança e contexto:

    graph LR
    A[Agent Principal] -->|MCP Tool Call| B[Harness Runtime]
    B --> C{Guardian + Zod Validation}
    C -->| Aprovado| D[Context Engine]
    D --> E[Embed via Voyage 4]
    D --> F[Rerank via Voyage 2.5]
    E --> G[MongoDB Atlas Vector Search]
    F --> G
    G --> H[Composed Context + Metrics]
    H -->|MCP Response| A
  

Componentes Nucleares

MóduloResponsabilidadeDocumentação
Harness RuntimeOrquestra execução, valida schemas, intercepta tool calls, persiste estadoInfraestrutura que conecta o LLM ao mundo real, não um framework de testes
Context EngineDecide escopo (filesystem vs vector), aplica AST parsing, compaction multi-hopPipeline Embed → Search → Rerank → Compose → Validate
Provider RouterRoteia para stack curada, gerencia fallback BYOK, rastreia quotaSem camadas genéricas. SDKs oficiais, parsing estável
Tool ExecutorValida args via Zod, executa com retry exponencial, sanitiza outputBlocklist imutável aplicada antes de qualquer chamada

Stack Curada & Infraestrutura

Vectora não é provider-agnóstico. Operamos com modelos rigorosamente calibrados para garantir consistência de métricas, estabilidade de parsing e custos previsíveis:

CamadaTecnologiaPor que escolhemosDocs
LLM (Inferência)gemini-3-flashLatência <30ms, tool calling estável, custo 90% menor vs ProGemini 3
Embeddingsvoyage-4AST-aware, captura similaridade funcional (validateTokencheckJWT)Voyage 4
Rerankingvoyage-rerank-2.5Cross-encoder otimizado para código, latência <100ms, precisão +25% vs BM25Reranker
Vector DB + MetadataMongoDB AtlasBackend unificado (vetores + docs + estado + audit), escalável, sem ETLMongoDB Atlas
State PersistenceSessions + AGENTS.mdWorking memory entre chamadas MCP, continuidade de contexto longoState Persistence

> Sem suporte a fallbacks genéricos: Vectora não integra OpenAI, Anthropic, OpenRouter ou modelos locais. A calibração do Harness Runtime depende estritamente dessa stack. Para multi-provider, use tools MCP padrão do mercado.


Segurança, Governança & BYOK

A segurança no Vectora é implementada na camada de aplicação, não delegada ao banco de dados:

CamadaImplementaçãoDocumento
Guardian Hard-CodedBlocklist imutável (.env, .key, .pem, binários, lockfiles) executada antes de qualquer tool callGuardian
Trust FolderValidação de paths com fs.realpath + escopo por namespace/projetoTrust Folder
RBAC AplicativoRoles (reader, contributor, admin, auditor) validadas em runtimeRBAC
BYOK ObrigatórioGEMINI_API_KEY + VOYAGE_API_KEY são fornecidas pelo usuário em todos os planosPlano Free
Fallback AutomáticoQuota gerenciada esgota → roteia silenciosamente para BYOK sem interrupçãoPlano Pro

Planos & Política de Retenção

Vectora opera com modelo BYOK First, onde o backend (MongoDB Atlas) é gerenciado pela Kaffyn em todos os planos, mas as chaves de API são do usuário:

PlanoPreçoStorageAPI QuotaRetençãoDocs
Free$0/mês512MB totalBYOK puro30 dias inatividade = exclusão do índice vetorialFree
Pro~$20/mês10GB total500k tokens + 100k vetores/mês90 dias pós-cancelamentoPro
Team$5 base + $15/user/mês50GB totalPool compartilhado + fallback BYOK por user180 dias pós-cancelamentoTeam
EnterpriseCustomIlimitado (VPC/Dedicated)Sob contratoPolítica customOverview

> Regras de Retenção: Contas Free inativas por 30 dias têm o índice vetorial excluído automaticamente. Metadados são preservados por +90 dias para exportação via vectora export. Downgrades notificam redução de limites e concedem 7 dias para backup. Detalhes em Política de Retenção.


Fluxo de Operação (MCP-First)

  1. Detecção: Agent Principal identifica necessidade de contexto profundo e dispara context_search via MCP.
  2. Interceptação: Harness Runtime captura chamada, valida namespace e aplica Guardian.
  3. Decisão: Context Engine escolhe escopo (filesystem, vector ou híbrido) e aplica AST parsing.
  4. Embed + Rerank: Query é embedada via voyage-4, resultados brutos são refinados por voyage-rerank-2.5.
  5. Busca & Compaction: MongoDB Atlas retorna top-N com compaction (head/tail + pointers) para evitar context rot.
  6. Resposta Estruturada: Contexto validado + métricas são retornados ao agent principal, que gera a resposta final ao usuário.

Por Onde Começar?

CategoriaDocumentoDescrição
ConceitosSub-AgentsPor que Sub-Agent e não tools MCP passivas? Governança ativa vs funções estáticas
Harness RuntimeHarness RuntimeTool Execution, Context Engineering, State Management, Verification Hooks
Context & RAGContext EngineAST parsing, compaction, multi-hop reasoning, hybrid ranking
RerankingRerankerPipeline Embed → Search → Rerank → LLM, métricas de precisão
ModelosGemini 3 · Voyage 4Stack curada, fallback BYOK, schema de configuração, custos por query
BackendMongoDB AtlasVector Search, collections, state persistence, isolamento multi-tenant
SegurançaGuardian · RBACBlocklist hard-coded, Trust Folder, sanitização, roles por namespace
PlanosOverviewFree/Pro/Team, quota gerenciada, fallback automático, política de retenção
IntegraçõesClaude Code · Gemini CLIConfiguração MCP, extensões IDE, agents customizados
ReferênciaMCP Tools · Config YAMLSchema de tools, config.yaml validado por Zod, códigos de erro
ContribuiçãoGuidelinesTypeScript estrito, testes Harness primeiro, PRs, roadmap público

Frase para guardar:
“Vectora não responde ao usuário. Ele entrega contexto governado ao seu agent. Backend gerenciado, API sob sua chave, segurança na aplicação, dados sempre seus.”


Guia de Navegação


Parte do ecossistema Vectora · Open Source (MIT) · TypeScript