Invoice Mama

Invoicing that brings you faster payments! 💸

Dernière mise à jour 06-29-2026

Catégorie:

Text to Speech (TTS)

Reviews:

Join thousands of AI enthusiasts in the World of AI!

Unreal Speech

Unreal Speech est une API de synthèse vocale prête à la production, construite sur le moteur TTS open source Kokoro. Elle offre aux développeurs et aux entreprises une synthèse vocale naturelle à une fraction du coût d'ElevenLabs, Amazon Polly, Google Cloud et Microsoft Azure. L'API diffuse l'audio en environ 300 millisecondes et prend en charge les travaux longue durée jusqu'à 10 heures par requête.

Kokoro fonctionne avec un modèle décodage seul de 82 millions de paramètres qui combine des idées de StyleTTS 2 et iSTFTNet. Vous disposez de 48 voix réparties sur huit langues, dont l'anglais américain et britannique, le mandarin, l'hindi, l'espagnol, le portugais, le japonais, le français et l'italien. Les horodatages par mot permettent aux applications de mettre en surbrillance le texte en synchronisation avec la lecture, ce qui améliore l'accessibilité, les interfaces de style karaoké, et les lecteurs interactifs.

L'API REST expose quatre points de terminaison : /stream pour une synthèse en moins d'une seconde jusqu'à 1 000 caractères, /speech pour jusqu'à 3 000 caractères avec des URL d'horodatage, /synthesisTasks pour des travaux asynchrones jusqu'à 500 000 caractères, et une route websocket /streamWithTimestamps pour audio en direct avec synchronisation des mots. Des SDK sont disponibles pour Python, Node.js et React Native, avec un code exemple sur la page d'accueil.

Kokoro TTS Studio sur unrealspeech.com propose une démo gratuite dans le navigateur pour tester les voix avant de s'inscrire. Les plans payants suppriment les exigences d'attribution pour l'audio commercial. Les clients entreprises sur la plateforme traitent des milliards de caractères chaque mois avec une disponibilité de 99,9 %.

Fonctionnalités principales:

Diffuse jusqu'à 1 000 caractères en environ 300 ms via /stream
Les tâches de synthèse asynchrone gèrent jusqu'à 500 000 caractères par requête
Les horodatages par mot synchronisent la mise en surbrillance du texte avec la sortie audio
48 voix dans huit langues avec contrôle de la vitesse et de la hauteur
Le websocket /streamWithTimestamps fournit un audio en direct ainsi que des données de synchronisation
Les SDK Python, Node.js et React Native sont fournis avec des exemples de code
Une seule tâche de synthèse peut produire jusqu'à 10 heures d'audio

Pros:

Les tarifs publiés sont environ 11 fois moins chers que ceux d'ElevenLabs pour des niveaux comparables
Quatre points de terminaison API couvrent la diffusion en continu en temps réel et les tâches longues de synthèse asynchrone
Les horodatages par mot permettent la mise en surbrillance synchronisée et les fonctionnalités d'accessibilité
Le forfait gratuit inclut 250 000 caractères avec un accès complet aux voix et aux langues
Le moteur TTS Kokoro est open source et peut également être auto-hébergé localement

Cons:

La clonage vocal n'est pas encore disponible sur l'API hébergée
Le plan gratuit nécessite d'attribuer Unreal Speech dans l'audio commercial publié
La démo du navigateur Studio limite l'entrée à 500 caractères par génération

FAQ:

Quelles langues et voix Unreal Speech prend-il en charge ?

Unreal Speech propose 48 voix dans huit langues : anglais américain, anglais britannique, mandarin, hindi, espagnol, portugais, japonais, français et italien. Vous pouvez choisir les voix, ajuster la vitesse et la hauteur, et sélectionner des formats de sortie tels que MP3 et PCM.

Unreal Speech propose-t-il un plan gratuit ?

Oui. Unreal Speech comprend un niveau gratuit avec 250 000 caractères par mois, soit environ six heures d'audio. Vous avez accès à toutes les voix et langues. L'audio créé avec le plan gratuit et utilisé commercialement doit inclure un lien vers unrealspeech.com dans la description.

À quelle vitesse Unreal Speech peut-il générer de l'audio ?

Unreal Speech diffuse l'audio en environ 300 millisecondes via le point de terminaison /stream pour jusqu'à 1 000 caractères. Les tâches plus longues via /speech ou /synthesisTasks prennent environ une seconde par 700 à 800 caractères selon le point de terminaison.

Unreal Speech prend-il en charge le clonage vocal ?

Unreal Speech ne propose pas encore de clonage vocal personnalisé sur l'API. L'équipe indique que le clonage vocal est en cours de développement. Le modèle open source Kokoro peut être affiné localement pour des voix personnalisées en dehors de l'API hébergée.

Que se passe-t-il si je dépasse ma limite mensuelle de caractères ?

Unreal Speech facture les dépassements quotidiennement au tarif de votre plan : Basic à 16 $ par million de caractères, Plus à 12 $, Pro à 10 $, et Enterprise à 8 $. Les caractères non utilisés sur les plans payants sont reportés au cycle de facturation suivant. Les caractères du plan gratuit sont remis à zéro le premier jour de chaque mois.

Puis-je utiliser commercialement l'audio généré par Unreal Speech ?

Oui. Unreal Speech autorise l'utilisation commerciale de l'audio généré. Les utilisateurs du plan gratuit doivent mentionner Unreal Speech avec un lien vers unrealspeech.com dans les contenus publiés. Les abonnés payants n'ont pas besoin d'attribution.

Quels points de terminaison API Unreal Speech propose-t-il ?

Unreal Speech propose /stream pour un audio instantané jusqu’à 1 000 caractères, /speech pour jusqu’à 3 000 caractères avec URLs horodatées, /synthesisTasks pour des tâches asynchrones jusqu’à 500 000 caractères, et /streamWithTimestamps via websocket pour un audio en temps réel avec minutage au niveau des mots.

Catégorie:

Text to Speech (TTS)

Tarification:

Freemium

Tags:

text-to-speech

voice API

developer tools

speech synthesis

multilingual

real-time

open-source

audio streaming

accessibility

Technologie utilisée:

Kokoro TTS

Chakra UI

Ant Design

jQuery

Amazon Web Services

Google Cloud

Google Analytics

Google Tag Manager

Hotjar

Mixpanel

Intercom

Google Fonts

Python

Ruby

GitHub

Emotion

Styled Components

Commentaires:

Join thousands of AI enthusiasts in the World of AI!

Meilleur Gratuit Unreal Speech Alternatives (et Payées)

ElevenLabs

ElevenLabs est une plateforme vocale et audio pour transformer du texte en discours naturel, transcrire de l'audio, générer de la musique et déployer des ...

Text to Speech (TTS)

Freemium

ElevenLabs vs Unreal Speech

ttsMP3

ttsMP3.com offre un moyen simple de convertir du texte en parole naturelle dans plus de 28 langues, dont l'anglais américain et de nombreux accents. Il pr...

Text to Speech (TTS)

Freemium

ttsMP3 vs Unreal Speech

SpeechGen

SpeechGen est une plateforme de synthèse vocale alimentée par l'IA qui crée des voix-off réalistes rapidement et à moindre coût. Elle supporte plus de 1 0...

Text to Speech (TTS)

Paid

SpeechGen vs Unreal Speech

ReadSpeaker

ReadSpeaker propose une large gamme de solutions de synthèse vocale (TTS) qui convertissent le contenu écrit en parole naturelle. Avec plus de 200 voix IA...

Text to Speech (TTS)

Paid

ReadSpeaker vs Unreal Speech

FakeYou

FakeYou est une plateforme d'IA polyvalente qui transforme du texte en parole en utilisant une vaste bibliothèque de voix, comprenant de nombreux personna...

Text to Speech (TTS)

Paid

FakeYou vs Unreal Speech

Luvvoice

Luvvoice est un outil gratuit de synthèse vocale en ligne qui convertit du texte en une voix naturelle avec plus de 200 voix dans plus de 70 langues. Il p...

Text to Speech (TTS)

Freemium

Luvvoice vs Unreal Speech

Deep Voice 3

Deep Voice 3 est un système de synthèse vocale open source qui utilise un réseau de neurones entièrement convolutionnel pour transformer du texte en parol...

Text to Speech (TTS)

Freemium

Deep Voice 3 vs Unreal Speech

Speechify

Speechify transforme le texte écrit en audio naturel, aidant les utilisateurs à écouter des livres, des articles, des PDF et des pages web sur différents ...

Text to Speech (TTS)

Freemium

Speechify vs Unreal Speech

SpeechGen.io

SpeechGen.io offre un service de synthèse vocale réaliste qui convertit n'importe quel texte en voix off d'apparence naturelle. Il prend en charge plus de...

Text to Speech (TTS)

Paid

SpeechGen.io vs Unreal Speech

Pickles

Pickles AI propose une API révolutionnaire de synthèse vocale (TTS) conçue pour fournir une parole d'IA réaliste et de haute qualité avec émotion, tout en...

Text to Speech (TTS)

Freemium

Pickles vs Unreal Speech

ElevenLabs

Text to Speech (TTS)

Freemium

ElevenLabs est une plateforme vocale et audio pour transformer du texte en discours naturel, transcrire de l'audio, générer de la musique et déployer des ...

ElevenLabs vs Unreal Speech

ttsMP3

Text to Speech (TTS)

Freemium

ttsMP3.com offre un moyen simple de convertir du texte en parole naturelle dans plus de 28 langues, dont l'anglais américain et de nombreux accents. Il pr...

ttsMP3 vs Unreal Speech

SpeechGen

Text to Speech (TTS)

Paid

SpeechGen est une plateforme de synthèse vocale alimentée par l'IA qui crée des voix-off réalistes rapidement et à moindre coût. Elle supporte plus de 1 0...

SpeechGen vs Unreal Speech

ReadSpeaker

Text to Speech (TTS)

Paid

ReadSpeaker propose une large gamme de solutions de synthèse vocale (TTS) qui convertissent le contenu écrit en parole naturelle. Avec plus de 200 voix IA...

ReadSpeaker vs Unreal Speech

FakeYou

Text to Speech (TTS)

Paid

FakeYou est une plateforme d'IA polyvalente qui transforme du texte en parole en utilisant une vaste bibliothèque de voix, comprenant de nombreux personna...

FakeYou vs Unreal Speech

Luvvoice

Text to Speech (TTS)

Freemium

Luvvoice est un outil gratuit de synthèse vocale en ligne qui convertit du texte en une voix naturelle avec plus de 200 voix dans plus de 70 langues. Il p...

Luvvoice vs Unreal Speech

Deep Voice 3

Text to Speech (TTS)

Freemium

Deep Voice 3 est un système de synthèse vocale open source qui utilise un réseau de neurones entièrement convolutionnel pour transformer du texte en parol...

Deep Voice 3 vs Unreal Speech

Speechify

Text to Speech (TTS)

Freemium

Speechify transforme le texte écrit en audio naturel, aidant les utilisateurs à écouter des livres, des articles, des PDF et des pages web sur différents ...

Speechify vs Unreal Speech

SpeechGen.io

Text to Speech (TTS)

Paid

SpeechGen.io offre un service de synthèse vocale réaliste qui convertit n'importe quel texte en voix off d'apparence naturelle. Il prend en charge plus de...

SpeechGen.io vs Unreal Speech

Pickles

Text to Speech (TTS)

Freemium

Pickles AI propose une API révolutionnaire de synthèse vocale (TTS) conçue pour fournir une parole d'IA réaliste et de haute qualité avec émotion, tout en...

Pickles vs Unreal Speech