Skip to content

Vectora

PT | EN

Agentes de IA tradicionais operam em contextos fragmentados, gerando alucinações, desperdício de tokens e exposição acidental de segredos. O Vectora resolve isso não sendo “mais um chat”, mas sim um Sub-Agent Tier 2 projetado exclusivamente para engenharia de software: ele intercepta chamadas via Protocolo MCP, valida segurança em tempo real com o Guardian, orquestra recuperação multi-hop via Context Engine e entrega contexto estruturado ao seu agent principal (Claude Code, Gemini CLI, Cursor, etc.).

Fórmula Central:

Agente Funcional = Modelo (Gemini 3 Flash) + [Harness Runtime](/concepts/harness-runtime/) + Contexto Governado (Voyage 4 + MongoDB Atlas)

O Problema que Vectora Resolve

Falha em Agents GenéricosImpacto PráticoComo Vectora Mitiga
Contexto RasoBusca por “autenticação” retorna 50 arquivos irrelevantesReranker 2.5 filtra por relevância semântica real, não por similaridade cossena bruta
Sem Validação Pré-ExecuçãoTool calls perigosos rodam antes de serem auditadosHarness Runtime intercepta, valida via Struct Validation e aplica Guardian antes da execução
Falta de IsolamentoDados de projetos diferentes vazam entre sessõesNamespace Isolation via RBAC na aplicação + filtragem obrigatória no backend
Consumo ImprevisívelLLMs geram overfetch, gastam tokens em boilerplateContext Engine decide escopo, aplica compaction (head/tail) e injeta só o relevante
Segurança FrágilBlocklists dependem de prompts (jailbreakáveis)Hard-Coded Guardian é compilado no binário Go, impossível de bypassar via prompt

A Solução: Arquitetura de Sub-Agent

Vectora é exposto exclusivamente via MCP. Não há CLI de chat, TUI ou interface de conversação direta. Ele opera silenciosamente como camada de governança e contexto:

    graph LR
    A[Agent Principal] -->|MCP Tool Call| B[Harness Runtime]
    B --> C{Guardian + Native Validation}
    C -->| Aprovado| D[Context Engine]
    D --> E[Embed via Voyage 4]
    D --> F[Rerank via Voyage 2.5]
    E --> G[MongoDB Atlas Vector Search]
    F --> G
    G --> H[Composed Context + Metrics]
    H -->|MCP Response| A
  

Componentes Nucleares

MóduloResponsabilidadeDocumentação
Harness RuntimeOrquestra execução, valida schemas, intercepta tool calls, persiste estadoInfraestrutura que conecta o LLM ao mundo real, não um framework de testes
Context EngineDecide escopo (filesystem vs vector), aplica AST parsing, compaction multi-hopPipeline Embed → Search → Rerank → Compose → Validate
Provider RouterRoteia para stack curada, gerencia fallback BYOK, rastreia quotaSem camadas genéricas. SDKs oficiais, parsing estável
Tool ExecutorValida args via Strong Typing, executa com retry exponencial, sanitiza outputBlocklist imutável aplicada antes de qualquer chamada

Stack Curada & Infraestrutura

Vectora não é provider-agnóstico. Operamos com modelos rigorosamente calibrados para garantir consistência de métricas, estabilidade de parsing e custos previsíveis:

CamadaTecnologiaPor que escolhemosDocs
LLM (Inferência)gemini-3-flashLatência <30ms, tool calling estável, custo 90% menor vs ProGemini 3
Embeddingsvoyage-4AST-aware, captura similaridade funcional (validateTokencheckJWT)Voyage 4
Rerankingvoyage-rerank-2.5Cross-encoder otimizado para código, latência <100ms, precisão +25% vs BM25Reranker
Vector DB + MetadataMongoDB AtlasBackend unificado (vetores + docs + estado + audit), escalável, sem ETLMongoDB Atlas

Vectora Cloud Only:

O Vectora é uma solução 100% baseada em nuvem otimizada para a stack Gemini + Voyage. Não oferecemos suporte para modelos locais (Ollama, LlamaCpp, etc.) ou outros provedores genéricos para garantir a precisão do engine.

Segurança, Governança & BYOK

A segurança no Vectora é implementada na camada de aplicação, não delegada ao banco de dados:

CamadaImplementaçãoDocumento
Guardian Hard-CodedBlocklist imutável (.env, .key, .pem, binários, lockfiles) executada antes de qualquer tool callGuardian
Trust FolderValidação de paths com fs.realpath + escopo por namespace/projetoTrust Folder
RBAC AplicativoRoles (reader, contributor, admin, auditor) validadas em runtimeRBAC
BYOK ou ManagedChaves do usuário (Free) ou créditos inclusos (Plus)Plano Free
Managed (Plus)Quota gerenciada inclusa nos planos Pro e TeamPlano Pro

Planos & Política de Retenção

Vectora opera com modelo Digital Sovereignty First, oferecendo BYOK (Bring Your Own Key) para controle total ou Managed (Plus) para conveniência:

PlanoPreçoStorageAPI QuotaRetençãoDocs
Free$0/mês512MB totalBYOK puro30 dias inatividade = exclusão do índice vetorialFree
Pro$29/mês5GB totalUnlimited (Plus) ou BYOK90 dias pós-cancelamentoPro
TeamCustomCustomUnlimited (Plus) ou BYOKPolítica de ComplianceTeam
EnterpriseCustomIlimitado (VPC/Dedicated)Sob contratoPolítica customOverview

Regras de Retenção: Contas Free inativas por 30 dias têm o índice vetorial excluído automaticamente. Metadados são preservados por +90 dias para exportação via vectora export. Downgrades notificam redução de limites e concedem 7 dias para backup. Detalhes em Política de Retenção.

Fluxo de Operação (MCP-First)

  1. Detecção: Agent Principal identifica necessidade de contexto profundo e dispara context_search via MCP.
  2. Interceptação: Harness Runtime captura chamada, valida namespace e aplica Guardian.
  3. Decisão: Context Engine escolhe escopo (filesystem, vector ou híbrido) e aplica AST parsing.
  4. Embed + Rerank: Query é embedada via voyage-4, resultados brutos são refinados por voyage-rerank-2.5.
  5. Busca & Compaction: MongoDB Atlas retorna top-N com compaction (head/tail + pointers) para evitar context rot.
  6. Resposta Estruturada: Contexto validado + métricas são retornados ao agent principal, que gera a resposta final ao usuário.

Por Onde Começar?

CategoriaDocumentoDescrição
Início RápidoGetting Startedwinget install kaffyn.vectora, configuração via Systray, integração MCP
ConceitosSub-AgentsPor que Sub-Agent e não tools MCP passivas? Governança ativa vs funções estáticas
Harness RuntimeHarness RuntimeTool Execution, Context Engineering, State Management, Verification Hooks
Context & RAGContext EngineAST parsing, compaction, multi-hop reasoning, hybrid ranking
RerankingReranker · Reranker LocalVectorDB + cross-encoder ou late binding para dados mutáveis, trade-offs de custo
ModelosGemini 3 · Voyage 4Stack curada, fallback BYOK, schema de configuração, custos por query
BackendMongoDB AtlasVector Search, collections, state persistence, isolamento multi-tenant
SegurançaGuardian · RBACBlocklist hard-coded, Trust Folder, sanitização, roles por namespace
PlanosOverviewFree/Pro/Team, quota gerenciada, fallback automático, política de retenção
IntegraçõesMCP Protocol · VS Code · ChatGPT · Gemini APIMCP genérico, extensions, plugins, APIs
ReferênciaMCP Tools · Config YAMLSchema de tools, config.yaml validado negativamente, códigos de erro
ImplementaçãoEngineeringArquitetura em Golang, Migração de Core, CLI Engine, Systray UX
ContribuiçãoGuidelinesGolang estrito, testes de performance, PRs, roadmap público

Frase para guardar: “Vectora não responde ao usuário. Ele entrega contexto governado ao seu agent. Backend gerenciado, API sob sua chave, segurança na aplicação, dados sempre seus.”

Guia de Navegação

External Linking

ConceptResourceLink
MongoDB AtlasAtlas Vector Search Documentationwww.mongodb.com/docs/atlas/atlas-vector-search/
MCPModel Context Protocol Specificationmodelcontextprotocol.io/specification
MCP Go SDKGo SDK for MCP (mark3labs)github.com/mark3labs/mcp-go
Voyage EmbeddingsVoyage Embeddings Documentationdocs.voyageai.com/docs/embeddings
Voyage RerankerVoyage Reranker APIdocs.voyageai.com/docs/reranker
Gemini APIGoogle AI Studio Documentationai.google.dev/docs

Parte do ecossistema Vectora · Open Source (MIT) · Contribuidores