Invoice Mama

Invoicing that brings you faster payments! 💸

Última atualização 06-29-2026

Categoria:

Text to Speech (TTS)

Reviews:

Join thousands of AI enthusiasts in the World of AI!

Unreal Speech

Unreal Speech é uma API de texto-para-fala pronta para produção, construída sobre o motor Kokoro TTS de código aberto. Ela oferece a desenvolvedores e empresas uma síntese de fala natural por uma fração do custo da ElevenLabs, Amazon Polly, Google Cloud e Microsoft Azure. A API transmite áudio em aproximadamente 300 milissegundos e suporta trabalhos de longa duração de até 10 horas por solicitação.

Kokoro funciona com um modelo decodificador de 82 milhões de parâmetros, que combina ideias do StyleTTS 2 e iSTFTNet. Você tem acesso a 48 vozes em oito idiomas, incluindo inglês dos EUA e do Reino Unido, mandarim, hindi, espanhol, português, japonês, francês e italiano. Timestamps por palavra permitem que aplicativos destaquem o texto sincronizado com a reprodução, o que é útil para acessibilidade, interfaces no estilo karaokê e leitores interativos.

A API REST expõe quatro endpoints: /stream para síntese subsegundo de até 1.000 caracteres, /speech para até 3.000 caracteres com URLs de timestamp, /synthesisTasks para trabalhos assíncronos de até 500.000 caracteres, e uma rota websocket /streamWithTimestamps para áudio ao vivo com temporização de palavras. SDKs são disponibilizados para Python, Node.js e React Native, com códigos de exemplo na página inicial.

O Kokoro TTS Studio em unrealspeech.com oferece uma demonstração gratuita no navegador para testar vozes antes de se inscrever. Planos pagos eliminam os requisitos de atribuição para uso comercial de áudio. Clientes corporativos na plataforma processam bilhões de caracteres mensalmente com 99,9% de uptime.

Recursos Principais:

Transmite até 1.000 caracteres em cerca de 300ms via /stream
Tarefas de síntese assíncrona lidam com até 500.000 caracteres por requisição
Carimbos de tempo por palavra sincronizam a realce de texto com a saída de áudio
48 vozes em oito idiomas com controles de velocidade e tom
Websocket /streamWithTimestamps oferece áudio ao vivo mais dados de sincronização
SDKs para Python, Node.js e React Native vêm com exemplos de código
Trabalhos de síntese únicos podem produzir até 10 horas de áudio

Pros:

Os preços publicados são cerca de 11 vezes mais baratos que os da ElevenLabs em níveis comparáveis
Quatro endpoints de API abrangem streaming em tempo real e trabalhos longos de síntese assíncrona
Timestamps por palavra suportam destaque sincronizado e recursos de acessibilidade
O nível gratuito inclui 250.000 caracteres com acesso completo a vozes e idiomas
O motor Kokoro TTS é open source e também pode ser hospedado localmente

Cons:

A clonagem de voz ainda não está disponível na API hospedada
O plano gratuito requer atribuição da Unreal Speech em áudio comercial publicado
A demonstração no navegador do Studio limita a entrada a 500 caracteres por geração

Perguntas frequentes:

Quais idiomas e vozes o Unreal Speech suporta?

O Unreal Speech oferece 48 vozes em oito idiomas: inglês dos EUA, inglês do Reino Unido, mandarim, hindi, espanhol, português, japonês, francês e italiano. Você pode escolher vozes, ajustar velocidade e tom, e selecionar formatos de saída incluindo MP3 e PCM.

O Unreal Speech possui um plano gratuito?

Sim. O Unreal Speech inclui um nível gratuito com 250.000 caracteres por mês, aproximadamente seis horas de áudio. Você tem acesso a todas as vozes e idiomas. Áudios produzidos no plano gratuito usados comercialmente devem incluir um link para unrealspeech.com na descrição.

Quão rápido o Unreal Speech pode gerar áudio?

O Unreal Speech transmite áudio em cerca de 300 milissegundos pelo endpoint /stream para até 1.000 caracteres. Trabalhos mais longos via /speech ou /synthesisTasks levam aproximadamente um segundo para cada 700 a 800 caracteres, dependendo do endpoint.

O Unreal Speech suporta clonagem de voz?

O Unreal Speech ainda não oferece clonagem de voz personalizada na API. A equipe informa que a clonagem de voz está em desenvolvimento. O modelo open-source Kokoro pode ser ajustado localmente para vozes personalizadas fora da API hospedada.

O que acontece se eu exceder meu limite mensal de caracteres?

O Unreal Speech cobra o uso excedente diariamente à taxa do seu plano: Basic a 16 dólares por 1 milhão de caracteres, Plus a 12 dólares, Pro a 10 dólares e Enterprise a 8 dólares. Caracteres não usados em planos pagos são acumulados para o próximo ciclo de faturamento. Caracteres do plano gratuito são reiniciados no primeiro dia de cada mês.

Posso usar o áudio do Unreal Speech comercialmente?

Sim. O Unreal Speech permite o uso comercial do áudio gerado. Usuários do plano gratuito devem atribuir o Unreal Speech com um link para unrealspeech.com no conteúdo publicado. Assinantes pagos não precisam fazer atribuição.

Quais endpoints de API o Unreal Speech fornece?

O Unreal Speech oferece os endpoints /stream para áudio instantâneo de até 1.000 caracteres, /speech para até 3.000 caracteres com URLs de marcação temporal, /synthesisTasks para trabalhos assíncronos de até 500.000 caracteres, e /streamWithTimestamps via websocket para áudio em tempo real com temporização ao nível de palavra.

Categoria:

Text to Speech (TTS)

Preços:

Freemium

Tags:

text-to-speech

voice API

developer tools

speech synthesis

multilingual

real-time

open-source

audio streaming

accessibility

Tecnologia utilizada:

Kokoro TTS

Chakra UI

Ant Design

jQuery

Amazon Web Services

Google Cloud

Google Analytics

Google Tag Manager

Hotjar

Mixpanel

Intercom

Google Fonts

Python

Ruby

GitHub

Emotion

Styled Components

Avaliações:

Join thousands of AI enthusiasts in the World of AI!

Melhor Gratuito Unreal Speech Alternativas (e Pagas)

ElevenLabs

ElevenLabs é uma plataforma de voz e áudio para transformar texto em fala realista, transcrever áudios, gerar música e implantar agentes de voz conversaci...

Text to Speech (TTS)

Freemium

ElevenLabs vs Unreal Speech

Text to Speech Online

Text to Speech Online é uma ferramenta gratuita de navegador que converte texto escrito em fala realista com mais de 100 vozes de IA. Os usuários escolhem...

Text to Speech (TTS)

Free

Text to Speech Online vs Unreal Speech

TexttoSpeech.im: Convert Text to Speech Free Online

TexttoSpeech.im é um gerador de texto para fala baseado em navegador que transforma texto escrito em áudio para download. Cole até alguns milhares de cara...

Text to Speech (TTS)

Freemium

TexttoSpeech.im: Convert Text to Speech Free Online vs Unreal Speech

Speechelo - AI text to speech voices

O Speechelo é um aplicativo de conversão de texto em fala na nuvem, criado para pessoas que precisam de locuções para vídeos sem contratar um dublador ou ...

Text to Speech (TTS)

Paid

Speechelo - AI text to speech voices vs Unreal Speech

TTSMaker

TTSMaker é uma ferramenta gratuita de conversão de texto em fala online que transforma textos escritos em arquivos de áudio para download. Ela suporta mai...

Text to Speech (TTS)

Freemium

TTSMaker vs Unreal Speech

BoodleBox

BoodleBox é uma área de trabalho colaborativa de IA para educação, equipes corporativas e indivíduos. Ela reúne mais de 38 modelos líderes (ChatGPT, Claud...

Text to Speech (TTS)

Freemium

BoodleBox vs Unreal Speech

Voice to Text

Text to Voice (texttovoice.online) é uma plataforma de conversão de texto em fala baseada no navegador que transforma textos escritos em narrações em MP3 ...

Text to Speech (TTS)

Freemium

Voice to Text vs Unreal Speech

Clearly Reader

O Clearly Reader é uma extensão de modo leitura para navegador que remove anúncios e distrações dos artigos, permitindo que você se concentre no conteúdo....

Text to Speech (TTS)

Freemium

Clearly Reader vs Unreal Speech

Clipboard TTS

Clipboard TTS é uma ferramenta de leitura para desktop que monitora sua área de transferência e lê o texto copiado em voz alta. Em vez de colar o texto em...

Text to Speech (TTS)

Paid

Clipboard TTS vs Unreal Speech

Pickles

Pickles AI oferece uma API inovadora de conversão de texto em fala (TTS) projetada para fornecer fala de IA realista e de alta qualidade com emoção, ao me...

Text to Speech (TTS)

Freemium

Pickles vs Unreal Speech

ElevenLabs

Text to Speech (TTS)

Freemium

ElevenLabs é uma plataforma de voz e áudio para transformar texto em fala realista, transcrever áudios, gerar música e implantar agentes de voz conversaci...

ElevenLabs vs Unreal Speech

Text to Speech Online

Text to Speech (TTS)

Free

Text to Speech Online é uma ferramenta gratuita de navegador que converte texto escrito em fala realista com mais de 100 vozes de IA. Os usuários escolhem...

Text to Speech Online vs Unreal Speech

TexttoSpeech.im: Convert Text to Speech Free Online

Text to Speech (TTS)

Freemium

TexttoSpeech.im é um gerador de texto para fala baseado em navegador que transforma texto escrito em áudio para download. Cole até alguns milhares de cara...

TexttoSpeech.im: Convert Text to Speech Free Online vs Unreal Speech

Speechelo - AI text to speech voices

Text to Speech (TTS)

Paid

O Speechelo é um aplicativo de conversão de texto em fala na nuvem, criado para pessoas que precisam de locuções para vídeos sem contratar um dublador ou ...

Speechelo - AI text to speech voices vs Unreal Speech

TTSMaker

Text to Speech (TTS)

Freemium

TTSMaker é uma ferramenta gratuita de conversão de texto em fala online que transforma textos escritos em arquivos de áudio para download. Ela suporta mai...

TTSMaker vs Unreal Speech

BoodleBox

Text to Speech (TTS)

Freemium

BoodleBox é uma área de trabalho colaborativa de IA para educação, equipes corporativas e indivíduos. Ela reúne mais de 38 modelos líderes (ChatGPT, Claud...

BoodleBox vs Unreal Speech

Voice to Text

Text to Speech (TTS)

Freemium

Text to Voice (texttovoice.online) é uma plataforma de conversão de texto em fala baseada no navegador que transforma textos escritos em narrações em MP3 ...

Voice to Text vs Unreal Speech

Clearly Reader

Text to Speech (TTS)

Freemium

O Clearly Reader é uma extensão de modo leitura para navegador que remove anúncios e distrações dos artigos, permitindo que você se concentre no conteúdo....

Clearly Reader vs Unreal Speech

Clipboard TTS

Text to Speech (TTS)

Paid

Clipboard TTS é uma ferramenta de leitura para desktop que monitora sua área de transferência e lê o texto copiado em voz alta. Em vez de colar o texto em...

Clipboard TTS vs Unreal Speech

Pickles

Text to Speech (TTS)

Freemium

Pickles AI oferece uma API inovadora de conversão de texto em fala (TTS) projetada para fornecer fala de IA realista e de alta qualidade com emoção, ao me...

Pickles vs Unreal Speech