Vectora
Visão Geral
Agentes de IA tradicionais operam em contextos fragmentados, gerando alucinações, desperdício de tokens e exposição acidental de segredos. O Vectora resolve isso não sendo “mais um chat”, mas sim um Sub-Agent Tier 2 projetado exclusivamente para engenharia de software: ele intercepta chamadas via Protocolo MCP, valida segurança em tempo real com o Guardian, orquestra recuperação multi-hop via Context Engine e entrega contexto estruturado ao seu agent principal (Claude Code, Gemini CLI, Cursor, etc.).
Fórmula Central:
Agente Funcional = Modelo (Gemini 3 Flash) + [Harness Runtime](concepts/harness-runtime/) + Contexto Governado (Voyage 4 + MongoDB Atlas)
O Problema que Vectora Resolve
| Falha em Agents Genéricos | Impacto Prático | Como Vectora Mitiga |
|---|---|---|
| Contexto Raso | Busca por “autenticação” retorna 50 arquivos irrelevantes | Reranker 2.5 filtra por relevância semântica real, não por similaridade cossena bruta |
| Sem Validação Pré-Execução | Tool calls perigosos rodam antes de serem auditados | Harness Runtime intercepta, valida schema Zod e aplica Guardian antes da execução |
| Falta de Isolamento | Dados de projetos diferentes vazam entre sessões | Namespace Isolation via RBAC na aplicação + filtragem obrigatória no backend |
| Consumo Imprevisível | LLMs geram overfetch, gastam tokens em boilerplate | Context Engine decide escopo, aplica compaction (head/tail) e injeta só o relevante |
| Segurança Frágil | Blocklists dependem de prompts (jailbreakáveis) | Hard-Coded Guardian é compilado no runtime, impossível de bypassar via prompt |
A Solução: Arquitetura de Sub-Agent
Vectora é exposto exclusivamente via MCP. Não há CLI de chat, TUI ou interface de conversação direta. Ele opera silenciosamente como camada de governança e contexto:
graph LR
A[Agent Principal] -->|MCP Tool Call| B[Harness Runtime]
B --> C{Guardian + Zod Validation}
C -->| Aprovado| D[Context Engine]
D --> E[Embed via Voyage 4]
D --> F[Rerank via Voyage 2.5]
E --> G[MongoDB Atlas Vector Search]
F --> G
G --> H[Composed Context + Metrics]
H -->|MCP Response| A
Componentes Nucleares
| Módulo | Responsabilidade | Documentação |
|---|---|---|
| Harness Runtime | Orquestra execução, valida schemas, intercepta tool calls, persiste estado | Infraestrutura que conecta o LLM ao mundo real, não um framework de testes |
| Context Engine | Decide escopo (filesystem vs vector), aplica AST parsing, compaction multi-hop | Pipeline Embed → Search → Rerank → Compose → Validate |
| Provider Router | Roteia para stack curada, gerencia fallback BYOK, rastreia quota | Sem camadas genéricas. SDKs oficiais, parsing estável |
| Tool Executor | Valida args via Zod, executa com retry exponencial, sanitiza output | Blocklist imutável aplicada antes de qualquer chamada |
Stack Curada & Infraestrutura
Vectora não é provider-agnóstico. Operamos com modelos rigorosamente calibrados para garantir consistência de métricas, estabilidade de parsing e custos previsíveis:
| Camada | Tecnologia | Por que escolhemos | Docs |
|---|---|---|---|
| LLM (Inferência) | gemini-3-flash | Latência <30ms, tool calling estável, custo 90% menor vs Pro | Gemini 3 |
| Embeddings | voyage-4 | AST-aware, captura similaridade funcional (validateToken ≈ checkJWT) | Voyage 4 |
| Reranking | voyage-rerank-2.5 | Cross-encoder otimizado para código, latência <100ms, precisão +25% vs BM25 | Reranker |
| Vector DB + Metadata | MongoDB Atlas | Backend unificado (vetores + docs + estado + audit), escalável, sem ETL | MongoDB Atlas |
| State Persistence | Sessions + AGENTS.md | Working memory entre chamadas MCP, continuidade de contexto longo | State Persistence |
> Sem suporte a fallbacks genéricos: Vectora não integra OpenAI, Anthropic, OpenRouter ou modelos locais. A calibração do Harness Runtime depende estritamente dessa stack. Para multi-provider, use tools MCP padrão do mercado.
Segurança, Governança & BYOK
A segurança no Vectora é implementada na camada de aplicação, não delegada ao banco de dados:
| Camada | Implementação | Documento |
|---|---|---|
| Guardian Hard-Coded | Blocklist imutável (.env, .key, .pem, binários, lockfiles) executada antes de qualquer tool call | Guardian |
| Trust Folder | Validação de paths com fs.realpath + escopo por namespace/projeto | Trust Folder |
| RBAC Aplicativo | Roles (reader, contributor, admin, auditor) validadas em runtime | RBAC |
| BYOK Obrigatório | GEMINI_API_KEY + VOYAGE_API_KEY são fornecidas pelo usuário em todos os planos | Plano Free |
| Fallback Automático | Quota gerenciada esgota → roteia silenciosamente para BYOK sem interrupção | Plano Pro |
Planos & Política de Retenção
Vectora opera com modelo BYOK First, onde o backend (MongoDB Atlas) é gerenciado pela Kaffyn em todos os planos, mas as chaves de API são do usuário:
| Plano | Preço | Storage | API Quota | Retenção | Docs |
|---|---|---|---|---|---|
| Free | $0/mês | 512MB total | BYOK puro | 30 dias inatividade = exclusão do índice vetorial | Free |
| Pro | ~$20/mês | 10GB total | 500k tokens + 100k vetores/mês | 90 dias pós-cancelamento | Pro |
| Team | $5 base + $15/user/mês | 50GB total | Pool compartilhado + fallback BYOK por user | 180 dias pós-cancelamento | Team |
| Enterprise | Custom | Ilimitado (VPC/Dedicated) | Sob contrato | Política custom | Overview |
> Regras de Retenção: Contas Free inativas por 30 dias têm o índice vetorial excluído automaticamente. Metadados são preservados por +90 dias para exportação via vectora export. Downgrades notificam redução de limites e concedem 7 dias para backup. Detalhes em Política de Retenção.
Fluxo de Operação (MCP-First)
- Detecção: Agent Principal identifica necessidade de contexto profundo e dispara
context_searchvia MCP. - Interceptação: Harness Runtime captura chamada, valida namespace e aplica Guardian.
- Decisão: Context Engine escolhe escopo (filesystem, vector ou híbrido) e aplica AST parsing.
- Embed + Rerank: Query é embedada via
voyage-4, resultados brutos são refinados porvoyage-rerank-2.5. - Busca & Compaction: MongoDB Atlas retorna top-N com compaction (head/tail + pointers) para evitar context rot.
- Resposta Estruturada: Contexto validado + métricas são retornados ao agent principal, que gera a resposta final ao usuário.
Por Onde Começar?
| Categoria | Documento | Descrição |
|---|---|---|
| Conceitos | Sub-Agents | Por que Sub-Agent e não tools MCP passivas? Governança ativa vs funções estáticas |
| Harness Runtime | Harness Runtime | Tool Execution, Context Engineering, State Management, Verification Hooks |
| Context & RAG | Context Engine | AST parsing, compaction, multi-hop reasoning, hybrid ranking |
| Reranking | Reranker | Pipeline Embed → Search → Rerank → LLM, métricas de precisão |
| Modelos | Gemini 3 · Voyage 4 | Stack curada, fallback BYOK, schema de configuração, custos por query |
| Backend | MongoDB Atlas | Vector Search, collections, state persistence, isolamento multi-tenant |
| Segurança | Guardian · RBAC | Blocklist hard-coded, Trust Folder, sanitização, roles por namespace |
| Planos | Overview | Free/Pro/Team, quota gerenciada, fallback automático, política de retenção |
| Integrações | Claude Code · Gemini CLI | Configuração MCP, extensões IDE, agents customizados |
| Referência | MCP Tools · Config YAML | Schema de tools, config.yaml validado por Zod, códigos de erro |
| Contribuição | Guidelines | TypeScript estrito, testes Harness primeiro, PRs, roadmap público |
Frase para guardar:
“Vectora não responde ao usuário. Ele entrega contexto governado ao seu agent. Backend gerenciado, API sob sua chave, segurança na aplicação, dados sempre seus.”
Guia de Navegação
- Início Rápido — Instalação, configuração BYOK e integração MCP.
- Conceitos Nucleares — Entenda Sub-Agents, Context Engine e Reranking.
- Segurança & Governança — Detalhes sobre o Guardian, Trust Folder e RBAC.
- Autenticação — Fluxos de SSO, Identidade Unificada e API Keys.
- Modelos & Providers — Stack curada com Gemini 3 e Voyage AI.
- Backend & Persistência — MongoDB Atlas, Sessões e State Persistence.
- Integrações — Como usar com Claude Code, Gemini CLI e Cursor.
- Planos & Preços — Comparativo de recursos e política de retenção.
- Referência Técnica — Schema de ferramentas MCP e Config YAML.
- Contribuição — Guidelines, padrões de código e roadmap.
- Perguntas Frequentes — Solução de problemas e dúvidas comuns.
- Protocolos — Especificações do Protocolo MCP no Vectora.
Parte do ecossistema Vectora · Open Source (MIT) · TypeScript