Invoice Mama

Invoicing that brings you faster payments! 💸

最后更新 06-29-2026

分类:

Text to Speech (TTS)

Reviews:

Join thousands of AI enthusiasts in the World of AI!

Unreal Speech

Unreal Speech是一款基于开源Kokoro TTS引擎的生产就绪文本转语音API。它为开发者和企业提供自然的语音合成，成本仅为ElevenLabs、Amazon Polly、Google Cloud和Microsoft Azure的一小部分。该API的音频流传输时间约为300毫秒，支持每次请求长达10小时的长格式任务。

Kokoro运行在一个拥有8200万个参数的解码器模型上，该模型融合了StyleTTS 2和iSTFTNet的思想。您可以选择来自八种语言的48种声音，包括美式和英式英语、普通话、印地语、西班牙语、葡萄牙语、日语、法语和意大利语。每个单词的时间戳功能使应用能够与播放同步高亮显示文本，有助于无障碍、卡拉OK式界面和互动阅读体验。

REST API提供四个端点：/stream用于不到一秒的合成，支持最多1000字符；/speech支持最多3000字符并提供时间戳URL；/synthesisTasks用于异步作业，支持最多50万字符；以及用于实时音频和单词计时的websocket /streamWithTimestamps路由。开发者SDK包括Python、Node.js和React Native，主页提供示例代码。

unrealspeech.com上的Kokoro TTS Studio提供免费浏览器演示，便于在注册前试用语音。付费计划将取消商业音频的归属要求。平台的企业客户每月处理数十亿字符，保证99.9%的稳定性。

主要功能:

通过 /stream 以约 300 毫秒的速度流式传输最多 1,000 个字符
异步合成任务每次请求处理最多 500,000 个字符
逐词时间戳同步文本高亮与音频输出
覆盖八种语言的 48 个声音，具备速度和音调控制
Websocket /streamWithTimestamps 提供实时音频及时间数据
Python、Node.js 和 React Native SDK 搭配示例代码提供
单个合成任务最多可生成 10 小时音频

Pros:

公开定价比 ElevenLabs 在相同比例下便宜大约 11 倍
四个 API 端点涵盖实时流媒体和长时间异步合成任务
每字时间戳支持同步高亮和无障碍功能
免费套餐包含 250,000 个字符，享有完整的语音和语言访问权限
Kokoro TTS 引擎是开源的，也可以本地自托管

Cons:

语音克隆功能尚未在托管API上提供
免费套餐要求在发布的商业音频中标注Unreal Speech
Studio浏览器演示每次生成的输入限制为500个字符

常见问题:

Unreal Speech支持哪些语言和声音？

Unreal Speech提供8种语言共48种声音：美式英语、英式英语、普通话、印地语、西班牙语、葡萄牙语、日语、法语和意大利语。您可以选择不同的声音，调整语速和音调，并选择包括MP3和PCM在内的输出格式。

Unreal Speech有免费套餐吗？

有的。Unreal Speech提供每月25万个字符的免费额度，约合6小时音频。您可以使用所有声音和语言。免费套餐的商业用途音频必须在描述中包含链接至unrealspeech.com。

Unreal Speech生成音频的速度有多快？

Unreal Speech通过/stream端点约300毫秒即可流式传输多达1,000字符的音频。通过/speech或/synthesisTasks处理较长任务时，速度大约为每700到800个字符约1秒，具体取决于端点。

Unreal Speech支持语音克隆吗？

Unreal Speech的API暂不支持定制语音克隆。团队表示语音克隆功能正在开发中。开源的Kokoro模型可以在本地微调，用于API托管之外的定制语音。

如果我超过了每月字符限制，会怎样？

Unreal Speech会按您所选套餐的费率每日计费超额使用：Basic套餐每百万字符16美元，Plus套餐12美元，Pro套餐10美元，Enterprise套餐8美元。付费套餐中未使用的字符可以结转到下一个计费周期。免费套餐的字符额度会在每月初重置。

我可以将Unreal Speech生成的音频用于商业用途吗？

可以。Unreal Speech允许将生成的音频用于商业用途。免费套餐用户必须在发布内容中注明并附上指向unrealspeech.com的链接。付费用户则无需注明来源。

Unreal Speech提供哪些API端点？

Unreal Speech提供/stream端点用于即时音频生成，支持最多1,000字符；/speech端点支持最多3,000字符并带有时间戳URL；/synthesisTasks端点支持异步任务，最多50万个字符；以及通过websocket的/streamWithTimestamps端点，支持带单词级时间标记的实时音频流。

分类:

Text to Speech (TTS)

定价:

免费试用和收费混合

使用的技术:

Kokoro TTS

Chakra UI

Ant Design

jQuery

Amazon Web Services

Google Cloud

Google Analytics

Google Tag Manager

Hotjar

Mixpanel

Intercom

Google Fonts

Python

Ruby

GitHub

Emotion

Styled Components

Join thousands of AI enthusiasts in the World of AI!

最佳免费 Unreal Speech 替代方案（和付费）

ElevenLabs

ElevenLabs 是一个语音和音频平台，旨在将文本转化为逼真的语音、转录音频、生成音乐，以及部署对话式语音代理。它为创作者、开发者和企业团队提供一个集中平台，用于制作旁白、配音、音效以及面对客户的电话或聊天体验，无需每次项目都使用录音棚或聘请配音人才。该公司自主开发了语音、转录和音乐模型，而不是依赖...

Text to Speech (TTS)

Freemium

ElevenLabs vs Unreal Speech

Text to Speech Online

Text to Speech Online 是一个免费的浏览器工具，可以将书面文本转换为逼真的语音，拥有超过 100 种 AI 语音。用户可以选择语言、性别和语音风格，调整速度和音调，然后预览或生成音频，支持下载为 MP3 或 WAV 文件。界面支持多种语言、语音搜索、文件导入、字幕输出和生成后自动播放...

Text to Speech (TTS)

Free

Text to Speech Online vs Unreal Speech

TexttoSpeech.im: Convert Text to Speech Free Online

TexttoSpeech.im 是一个基于浏览器的文本转语音生成器，可以将书面文本转化为可下载的音频文件。只需粘贴最多几千个字符，选择一种语言和语音，即可生成一个可以在浏览器中试听或保存的 MP3 文件。其主要吸引力在于丰富的语音目录：大约包含 148 种选择，包括美国、英国、澳大利亚、印度及其他地区的...

Text to Speech (TTS)

Freemium

TexttoSpeech.im: Convert Text to Speech Free Online vs Unreal Speech

Speechelo - AI text to speech voices

Speechelo是一款云端文本转语音应用，专为需要视频配音但又不想聘请配音演员或自己录制的用户打造。你只需粘贴剧本，选择一个配音，然后下载一个可以直接放入你的视频编辑器的音频文件。它与电话系统的TTS不同之处在于专注于视频旁白。其引擎会加入语调变化，让你选择正常、愉快或严肃的表达方式，还支持呼吸声和较...

Text to Speech (TTS)

Paid

Speechelo - AI text to speech voices vs Unreal Speech

TTSMaker

TTSMaker是一个免费的在线文本转语音工具，可以将书面文本转换为可下载的音频文件。它支持100多种语言和600多个人工智能语音，让创作者无需雇佣配音演员或自己录制，就能生成配音。该工具在你的浏览器中运行。只需粘贴文本，选择一种语言和语音，调整速度、音量和音调，然后导出为MP3、OGG、AAC、OPU...

Text to Speech (TTS)

Freemium

TTSMaker vs Unreal Speech

BoodleBox

BoodleBox 是一个面向教育、企业团队和个人的协作式人工智能工作空间。它将 38 款以上领先模型（如 ChatGPT、Claude、Gemini、Perplexity 等）整合在一个共享环境中，允许多人可以并肩使用AI。用户可以将文档上传到知识库，构建基于机构或团队专业知识的定制机器人，并在不同模...

Text to Speech (TTS)

Freemium

BoodleBox vs Unreal Speech

Voice to Text

Text to Voice (texttovoice.online) 是一个基于浏览器的文本转语音平台，可以将书面文本转换成可下载的 MP3 配音。你只需输入或粘贴文本，选择语言和语音，调整速度和情感，然后播放或下载结果。无需在桌面安装软件；它可以在 Mac、Windows 和移动设备的浏览器中运行。核...

Text to Speech (TTS)

Freemium

Voice to Text vs Unreal Speech

Clearly Reader

Clearly Reader 是一款浏览器阅读模式插件，能够去除文章中的广告和杂乱元素，让你专注于文本内容。一键点击（或按 Alt+R）即可将嘈杂的网页变成干净的阅读布局，支持可调节字体、主题和行间距。该产品在基本的可读性基础上加入了AI辅助阅读工具。扫描模式（Alt+S）可以生成文章的快速摘要、提纲和...

Text to Speech (TTS)

Freemium

Clearly Reader vs Unreal Speech

Clipboard TTS

剪贴板TTS是一款桌面阅读辅助工具，可以监控你的剪贴板并大声朗读复制的文本。你无需将文本粘贴到另一个应用程序中，只需在电脑上复制任何内容，它就会以你选择的声音将其读出。该工具面向希望免手操作即可阅读文章、学习资料和文档的用户。该软件考虑到了阅读障碍和阅读疲劳，提供单词和句子高亮、彩色背景覆盖、OpenD...

Text to Speech (TTS)

Paid

Clipboard TTS vs Unreal Speech

Pickles

Pickles AI 提供了突破性的文本转语音 (TTS) API，旨在提供高质量、逼真的带有情感的 AI 语音，同时比竞争对手更具成本效益。它拥有约 500 毫秒的延迟优化性能，确保快速响应，非常适合扩展应用程序。 Pickles 的 TTS 服务脱颖而出，不仅因为比 ElevenLabs 等竞争对手...

Text to Speech (TTS)

Freemium

Pickles vs Unreal Speech