
Dernière mise à jour 06-27-2026
Catégorie:
Reviews:
Join thousands of AI enthusiasts in the World of AI!
Ultravox
Ultravox est la plateforme d'IA vocale en temps réel de Fixie.ai destinée aux développeurs qui ont besoin d'agents capables de parler, écouter et répondre lors de conversations en direct. Elle cible les équipes construisant des bots téléphoniques, des assistants vocaux intégrés à des applications, et autres interfaces vocales où le lag ou une livraison robotique ruinent l'expérience. Le produit fonctionne en arrière-plan de plusieurs agents vocaux de grande envergure, avec des API et des SDK conçus pour le déploiement en production plutôt que pour des démonstrations uniquement.
La plupart des stacks vocaux transcrivent la parole en texte avant qu'un LLM ne puisse raisonner, ce qui augmente la latence et dénature le ton, la cadence et la tonalité du signal. Ultravox adopte une approche native à la parole : son propre modèle lit directement l'audio, et la société gère une infrastructure d'inférence dédiée plutôt que d'utiliser des pools de LLM externes.
La plateforme propose des API REST, des kits de développement pour le web et le mobile, des hooks téléphoniques intégrés, ainsi que des outils pour les corpus RAG et la création de clones vocaux personnalisés. Ultravox v0.7 domine les benchmarks Big Bench Audio, et l'équipe publie des modèles open-weight sur Hugging Face en parallèle de recherches sur la prise de tours via UltraVAD.
Les ingénieurs en IA vocale, les fondateurs de SaaS et les équipes d'automatisation du support utilisent Ultravox lorsqu'ils ont besoin de réponses en moins d'une seconde et d'un échange naturel en retour sur l'audio téléphonique ou browser, pas seulement pour des bots textuels en mode chat.
Le modèle natif de parole saute la transcription pour que le ton et le rythme restent intacts
Ultravox v0.7 atteint 91,8 % sur Big Bench Audio, 97 % avec le raisonnement activé
La pile d'inférence propriétaire maintient une faible latence sans attendre les pools externes de LLM
APIs REST plus SDK pour le web et mobile, avec intégrations majeures de fournisseurs de téléphonie
UltraVAD v0.1 prédit les fins de tours au lieu d'interrompre les utilisateurs en plein milieu de leur pensée
Modèles à poids ouverts sur Hugging Face sous l'organisation fixie-ai
La conception native pour la parole évite la latence STT et conserve le ton et le rythme dans la conversation.
Le modèle Pay as You Go inclut 30 minutes gratuites par mois sans abonnement requis.
Les modèles open-weight sur Hugging Face offrent aux équipes une visibilité sur la pile vocale sous-jacente.
Le niveau Pro supprime les limites strictes de concurrence pour les charges de travail vocales en production.
Le paiement à l'utilisation limite à cinq appels simultanés.
Les tarifs entreprise et les limites avancées nécessitent de contacter le service commercial.
Le modèle dédié de génération vocale est toujours indiqué comme prochainement disponible sur le site.
Ultravox est-il gratuit à utiliser ?
Oui. Ultravox propose un plan Pay as You Go à 0 $ par mois avec 30 minutes d'appels gratuits, une utilisation illimitée du playground, et pas de tarification en période de forte demande. L'utilisation au-delà des minutes gratuites est facturée à 0,05 $ par minute, TTS inclus.
Combien coûte Ultravox par minute ?
Ultravox facture 0,05 $ par minute sur les plans Pay as You Go et Pro, avec le TTS inclus. Les appels SIP ajoutent 0,005 $ par minute sur Pay as You Go ou 0,0048 $ par minute sur Pro. L'utilisation de tokens Thread coûte 2 $ par million de tokens d'entrée non mis en cache et 15 $ par million de tokens de sortie.
Quelle est l'approche speech-native d'Ultravox ?
Ultravox traite l'audio avec un modèle speech-native au lieu de convertir d'abord la parole en texte. Cette conception réduit la latence avant le début de l'inférence et préserve les signaux paralinguistiques tels que le ton, la cadence et la hauteur que la transcription supprime généralement.
Ultravox supporte-t-il les intégrations téléphoniques ?
Oui. Ultravox intègre nativement les principaux fournisseurs de téléphonie et inclut la tarification SIP dans ses plans. Le niveau Pro ajoute un planificateur d'appels sortants pour les campagnes vocales programmées.
Quels modèles Ultravox propose-t-il ?
Ultravox v0.7 est le modèle vocal principal, atteignant 91,8 % sur Big Bench Audio sans raisonnement et 97 % avec le mode pensée activé. UltraVAD v0.1 gère la détection dynamique de la fin et la prise de parole. Les versions open-weight sont disponibles sur Hugging Face à huggingface.co/fixie-ai.
Combien d'appels simultanés puis-je lancer sur Ultravox ?
Le plan Pay as You Go d'Ultravox limite les appels simultanés à cinq. Le plan Pro à 100 $ par mois supprime ces limites strictes de simultanéité, et les plans Enterprise offrent une simultanéité personnalisable avec des options de SLA prioritaires.
