Ultravox
Ultravox é a plataforma de voz AI em tempo real da Fixie.ai para desenvolvedores que precisam de agentes que falem, escutem e respondam em conversas ao vivo. Ela é direcionada a equipes que constroem bots de telefone, assistentes de voz em aplicativos e outras interfaces de fala onde atraso ou entrega robótica prejudicam a experiência. O produto fica por trás de vários agentes de voz de destaque, com APIs e SDKs destinados à implantação em produção, e não apenas para demonstrações.
A maioria das pilhas de voz transcreve a fala em texto antes que um LLM possa raciocinar, o que aumenta a latência e remove tom, cadência e pitch do sinal. Ultravox adota uma abordagem nativa de fala: seu próprio modelo lê o áudio diretamente, e a empresa roda infraestrutura de inferência dedicada em vez de encadear pools externos de LLM.
A plataforma oferece APIs REST, kits de desenvolvimento para web e mobile, hooks integrados de telefonia e ferramentas para corpora RAG e clones de voz personalizados. Ultravox v0.7 lidera nos benchmarks Big Bench Audio, e a equipe publica modelos de peso aberto no Hugging Face, junto com pesquisas sobre turn-taking via UltraVAD.
Engenheiros de Voice AI, fundadores de SaaS e equipes de automação de suporte usam Ultravox quando precisam de respostas em subsegundos e de uma troca natural via telefone ou áudio de navegador, não apenas bots de texto ao estilo chat.
O modelo nativo de fala ignora a transcrição para que o tom e a cadência permaneçam naturais
Ultravox v0.7 alcança 91,8% no Big Bench Audio, 97% com raciocínio ativado
Pilhas de inferência próprias mantêm a latência baixa sem depender de pools externos de LLM
APIs REST e SDKs para web e mobile, com integrações em grandes provedores de telefonia
UltraVAD v0.1 prevê o fim das falas em vez de interromper o usuário no meio do pensamento
Modelos de código aberto no Hugging Face sob a organização fixie-ai
O design nativo para fala evita latência de STT e mantém o tom e a cadência na conversa.
O Pay as You Go inclui 30 minutos grátis por mês sem necessidade de assinatura.
Modelos open-weight no Hugging Face dão às equipes visibilidade sobre a pilha de voz subjacente.
O nível Pro remove limites rígidos de concorrência para cargas de trabalho de voz em produção.
Pague Conforme o Uso limita você a cinco chamadas simultâneas.
Os preços empresariais e limites avançados exigem contato com o setor de vendas.
O modelo dedicado de geração de fala ainda está marcado como em breve no site.
O Ultravox é gratuito para usar?
Sim. O Ultravox oferece um plano Pay as You Go por $0 por mês com 30 minutos de chamadas gratuitas, uso ilimitado do playground e sem tarifas dinâmicas. O uso além dos minutos gratuitos é cobrado a $0,05 por minuto, incluindo TTS.
Quanto custa o Ultravox por minuto?
O Ultravox cobra $0,05 por minuto nos planos Pay as You Go e Pro, com TTS incluído. Chamadas SIP adicionam $0,005 por minuto no Pay as You Go ou $0,0048 por minuto no Pro. O uso de tokens Thread é de $2 por milhão de tokens de entrada não armazenados em cache e $15 por milhão de tokens de saída.
O que é a abordagem speech-native do Ultravox?
O Ultravox processa áudio com um modelo speech-native em vez de converter a fala em texto primeiro. Esse design reduz a latência antes do início da inferência e preserva sinais paralinguísticos como tom, cadência e entonação que a transcrição normalmente perde.
O Ultravox suporta integrações com telefonia?
Sim. O Ultravox inclui integrações embutidas com os principais provedores de telefonia e preços de SIP nos seus planos. O nível Pro adiciona um agendador de chamadas de saída para campanhas de voz agendadas.
Quais modelos o Ultravox oferece?
O Ultravox v0.7 é o modelo principal de fala, alcançando 91,8% no Big Bench Audio sem raciocínio e 97% com raciocínio ativado. O UltraVAD v0.1 lida com endpoint dinâmico e troca de turnos. As versões com pesos abertos estão disponíveis no Hugging Face em huggingface.co/fixie-ai.
Quantas chamadas simultâneas posso realizar no Ultravox?
O plano Pay as You Go no Ultravox limita chamadas simultâneas a cinco. O plano Pro de $100 por mês remove limites rígidos de simultaneidade, e os planos Enterprise oferecem simultaneidade personalizável com opções prioritárias de SLA.

