Respan
Respan é uma plataforma de engenharia de LLM para equipes que implementam produtos de modelos de linguagem e agentes em produção. Encaminhe solicitações através de um único gateway, capture cada chamada como um traço, execute avaliações com tráfego ao vivo e gerencie prompts a partir de um painel compartilhado. Foi criada para equipes de engenharia e produto que necessitam de um lugar para depurar, medir e melhorar recursos de IA após o lançamento.
O produto surgiu da Keywords AI, que começou como uma API de roteamento LLM na Universidade de Illinois, antes de expandir para uma observabilidade completa. Respan agora unifica roteamento de gateway, rastreamento, avaliações e gerenciamento de prompts em torno de um modelo de dados de span único, de modo que os registros de produção alimentam diretamente a pontuação de qualidade e a iteração.
Equipes de plataforma, engenheiros de IA e startups que executam agentes em larga escala utilizam Respan para monitorar custos e latência, identificar regressões e lançar alterações em prompts ou modelos sem redeploy do código da aplicação. Clientes citados no site incluem Retell AI, Lovable, Gumloop e Mem0.
Encaminhe chamadas no estilo OpenAI para mais de 500 modelos através de um único gateway
Fallback automático e tentativas de nova conexão quando um modelo apresenta erro ou limitações de taxa
Cada chamada ao gateway se torna uma árvore de rastreamento com latência em cada segmento
Componha avaliadores com juízes LLM, verificações de código e revisão humana
Defina avisos suaves ou limites rígidos de gasto por chave API com alertas no Slack
O plano gratuito inclui a plataforma completa com 100 mil logs e não requer cartão de crédito.
Gateway suporta mais de 500 modelos com fallback, tentativas, cache e limites de gastos em um só lugar.
Combina tracing, evals, gerenciamento de prompts e roteamento gateway em dados de span compartilhados.
Opções de conformidade com SOC 2, GDPR, ISO 27001 e HIPAA estão documentadas no site.
O plano Team inclui apenas cinco assentos para membros antes de cobrar por membro adicional.
A retenção de logs no nível gratuito é de sete dias, em comparação com 30 dias no Team.
O Gateway adiciona aproximadamente 50 a 150ms de latência ao rotear através do Respan em vez de chamadas diretas ao provedor.
O Respan oferece um plano gratuito?
Sim. O Respan oferece um plano gratuito com a plataforma completa, 100 mil logs, 1 mil scores, 5 conjuntos de dados, 2 avaliadores e 5 prompts. Não é necessário cartão de crédito para se inscrever.
Quais modelos o Respan suporta?
O Respan direciona requisições para mais de 500 modelos através de seu gateway de IA. Você pode enviar chamadas no estilo OpenAI pelo Respan ou manter o SDK nativo de cada provedor em um endpoint passthrough, enquanto todas as requisições são registradas.
Quais integrações o Respan suporta?
O Respan integra-se com frameworks e ferramentas incluindo LangChain, LlamaIndex, Vercel AI SDK, OpenAI SDK, Mastra, Mem0, PostHog e LiteLLM. Os SDKs de Python e JavaScript estão documentados em respan.ai/docs.
O Respan está em conformidade com HIPAA?
O Respan afirma ser compatível com HIPAA e oferece um Business Associate Agreement para organizações de saúde nos planos Enterprise. Um complemento de conformidade HIPAA está listado a por mês na página de preços.
Qual era o nome anterior do Respan?
O Respan era anteriormente conhecido como Keywords AI. A empresa mudou sua marca para Respan em fevereiro de 2026, expandindo-se do roteamento de LLM para uma plataforma completa de observabilidade e avaliação.

