Ultravox

Ultravox

Ultravox es la plataforma de inteligencia artificial de voz en tiempo real de Fixie.ai para desarrolladores que necesitan agentes que hablen, escuchen y respondan en conversaciones en vivo. Está dirigida a equipos que construyen bots telefónicos, asistentes de voz integrados en aplicaciones y otras interfaces de voz donde la latencia o una entrega robótica arruina la experiencia. El producto se ubica detrás de varios agentes de voz de alto perfil, con APIs y SDKs diseñados para implementación en producción más que solo para demostraciones.

La mayoría de las pilas de voz transcriben el habla a texto antes de que un LLM pueda razonar, lo cual añade latencia y elimina tono, cadencia y tono de la señal. Ultravox adopta una ruta nativa de voz: su propio modelo lee el audio directamente, y la empresa opera infraestructura de inferencia dedicada en lugar de encadenar pools de LLM externos.

La plataforma ofrece APIs REST, kits de desarrollo para web y móvil, hooks de telefonía integrados y herramientas para corpora RAG y clones de voz personalizados. La versión 0.7 de Ultravox lidera en los benchmarks Big Bench Audio, y el equipo publica modelos de peso abierto en Hugging Face junto con investigaciones sobre la toma de turnos mediante UltraVAD.

Ingenieros de IA de voz, fundadores de SaaS y equipos de automatización de soporte utilizan Ultravox cuando necesitan respuestas en menos de un segundo y una interacción natural de ida y vuelta por teléfono o audio del navegador, no solo chatbots de texto.

Funciones principales:
  1. El modelo nativo de voz omite la transcripción para que el tono y la cadencia se mantengan en el bucle

  2. Ultravox v0.7 alcanza un 91.8% en Big Bench Audio, 97% con razonamiento activado

  3. La propia pila de inferencia mantiene la latencia baja sin esperar a grupos externos de LLM

  4. APIs REST más SDKs para web y móvil, con integraciones para los principales proveedores de telefonía

  5. UltraVAD v0.1 predice los finales de turno en lugar de interrumpir al usuario a mitad de pensamiento

  6. Modelos de peso abierto en Hugging Face bajo la organización fixie-ai

Pros:
  1. El diseño nativo de voz evita la latencia de STT y mantiene el tono y la cadencia en la conversación.

  2. Pago por Uso incluye 30 minutos gratis al mes sin necesidad de suscripción.

  3. Los modelos de peso abierto en Hugging Face ofrecen a los equipos visibilidad sobre la pila subyacente de voz.

  4. El nivel Pro elimina los límites estrictos de concurrencia para cargas de trabajo de voz en producción.

Cons:
  1. Pay as You Go limita a cinco llamadas simultáneas.

  2. Los precios empresariales y los límites avanzados requieren contactar con ventas.

  3. El modelo dedicado de generación de voz aún aparece como próximamente en el sitio.

Preguntas frecuentes:

¿Ultravox es gratis para usar?

Sí. Ultravox ofrece un plan Pay as You Go a $0 al mes con 30 minutos de llamadas gratuitas, uso ilimitado del playground y sin precios dinámicos. El uso que exceda los minutos gratuitos se cobra a $0.05 por minuto, incluyendo TTS.

¿Cuánto cuesta Ultravox por minuto?

Ultravox cobra $0.05 por minuto en los planes Pay as You Go y Pro, con TTS incluido. Las llamadas SIP añaden $0.005 por minuto en Pay as You Go o $0.0048 por minuto en Pro. El uso de tokens Thread cuesta $2 por millón de tokens de entrada no almacenados en caché y $15 por millón de tokens de salida.

¿Cuál es el enfoque de Ultravox nativo para el habla?

Ultravox procesa audio con un modelo nativo para el habla en lugar de convertir primero el habla a texto. Este diseño reduce la latencia antes de que comience la inferencia y preserva señales paralógicas como tono, cadencia y entonación, que la transcripción típicamente elimina.

¿Ultravox soporta integraciones de telefonía?

Sí. Ultravox incluye integraciones incorporadas con los principales proveedores de telefonía y precios SIP en sus planes. El nivel Pro añade un programador de llamadas salientes para campañas de voz programadas.

¿Qué modelos ofrece Ultravox?

Ultravox v0.7 es el modelo de voz principal, con un puntaje de 91.8% en Big Bench Audio sin razonamiento y 97% con pensamiento habilitado. UltraVAD v0.1 gestiona el endpointing dinámico y la toma de turnos. Las versiones de pesos abiertos están en Hugging Face en huggingface.co/fixie-ai.

¿Cuántas llamadas concurrentes puedo realizar en Ultravox?

Pay as You Go en Ultravox limita las llamadas concurrentes a cinco. El plan Pro de $100 al mes elimina los límites estrictos de concurrencia, y los planes Enterprise ofrecen concurrencia personalizable con opciones prioritarias de SLA.

Categoría:

Tarificación:

Freemium

Etiquetas:

Voice AI
Speech Models
Real-time AI
Developer APIs
Telephony

Tecnología utilizada:

Ant Design
Framer Sites
Google Tag Manager
Fathom
Google Fonts
Font Awesome
GitHub

Reseñas:

Give your opinion on Ultravox :-

Overall rating

Join thousands of AI enthusiasts in the World of AI!

Mejor Gratis Ultravox Alternativas (y Pagadas)

By Rishit