
Última actualización 06-28-2026
Categoría:
Reviews:
Join thousands of AI enthusiasts in the World of AI!
Patronus AI
Patronus AI es un laboratorio de investigación y una empresa de productos enfocados en evaluar, monitorear y simular sistemas de IA para que los equipos puedan implementar aplicaciones y agentes de LLM con mayor confianza. Su plataforma central cubre experimentos, registros, comparaciones y trazas, mientras que programas de investigación como Digital World Models buscan simular flujos de trabajo digitales realistas para el entrenamiento de agentes a largo plazo.
La compañía ha publicado trabajos de evaluación ampliamente citados, incluyendo Lynx para la detección de alucinaciones, Glider como juez de modelos de lenguaje pequeños, y referencias como FinanceBench. Percival, su copiloto de evaluación, analiza las trazas de los agentes para identificar modos de fallo y sugerir optimizaciones en errores de razonamiento y planificación.
Patronus AI está diseñado para ingenieros de ML, equipos de plataformas e investigadores que necesitan pruebas estructuradas antes y después de la producción. Los casos de uso abarcan controles de calidad RAG, supervisión de agentes, pruebas de conjuntos de datos adversariales y monitoreo continuo de productos LLM en vivo.
Lynx supera a GPT-4 en benchmarks publicados de detección de alucinaciones
El copiloto Percival señala más de 20 modos de fallo en trazas de agentes
El juez Glider 3B evalúa rúbricas personalizadas con resaltado de fragmentos
Ejecuta experimentos, registros, trazas y comparaciones paralelas en un solo lugar
Conjuntos de datos adversariales listos para usar como FinanceBench y EnterprisePII
Detecta 15 modos de error de agentes con resúmenes automáticos de trazas
Modelos digitales del mundo simulan flujos de trabajo de software realistas para entrenamiento
El nivel para desarrolladores comienza gratis con $10 en créditos para API y no requiere tarjeta de crédito.
Publica sus propios modelos de evaluación y benchmarks, incluyendo Lynx, Glider y FinanceBench.
Cubre todo el ciclo de vida de evaluación desde experimentos sin conexión hasta registros y trazas en producción.
El nivel de desarrollador limita Experimentos, Registros y Seguimientos a las últimas dos semanas.
La tarificación Enterprise y las opciones avanzadas de seguridad requieren agendar una llamada con ventas.
El alcance del producto abarca múltiples ofertas, lo que puede tomar tiempo para mapear a su flujo de trabajo.
¿Patronus AI tiene un plan gratuito?
Sí. Patronus AI ofrece un nivel para desarrolladores que puedes comenzar desde app.patronus.ai sin necesidad de tarjeta de crédito. Incluye $10 en créditos de API gratuitos para evaluadores, dos proyectos y acceso a Experimentos, Registros y Rastros de las últimas dos semanas.
¿Qué es Percival de Patronus AI?
Percival es el copiloto de evaluación de Patronus AI para sistemas agentivos. Analiza los rastros del agente, detecta más de 20 modos de falla y sugiere optimizaciones para errores de razonamiento y planificación. También hay un asistente de chat disponible para interactuar con Percival dentro de la plataforma.
¿Qué es Lynx en Patronus AI?
Lynx es el modelo de detección de alucinaciones de Patronus AI para sistemas RAG. La empresa informa que Lynx (70B) logró la mayor precisión en tareas publicadas de alucinaciones, superando a modelos como GPT-4. Lynx está disponible en versiones de 8B y 70B.
¿Qué conjuntos de datos proporciona Patronus AI?
Patronus AI mantiene conjuntos de pruebas adversariales listos para casos de uso específicos, incluyendo FinanceBench con 10,000 pares de preguntas y respuestas financieras, SimpleSafetyTests para riesgos de seguridad en LLM, y EnterprisePII para detectar información sensible empresarial en textos corporativos.
¿Cómo funciona la tarificación de la API de Patronus AI?
Patronus AI cobra tarifas de API basadas en uso en el nivel para desarrolladores: $10 por cada 1,000 llamadas pequeñas al evaluador, $20 por cada 1,000 llamadas grandes al evaluador, y $10 por cada 1,000 explicaciones de evaluación. Las cuentas nuevas para desarrolladores comienzan con $10 en créditos gratuitos.
¿Patronus AI ofrece opciones de despliegue para empresas?
Sí. El plan Enterprise de Patronus AI incluye acceso ilimitado a la plataforma, despliegue on-premise o en VPC dedicada, retención de datos personalizada, SSO, límites de tasa API mayores, descuentos por volumen y ajuste fino personalizado de modelos de evaluación. La tarificación requiere agendar una llamada con ventas.
