Invoice Mama

Invoicing that brings you faster payments! 💸

最后更新 07-02-2026

分类:

Audio Generation

Reviews:

Join thousands of AI enthusiasts in the World of AI!

ChatTTS

ChatTTS 是一个为对话而构建的开源文本到语音模型。2Noise 团队在超过 10 万小时的中文和英文语音数据上进行了训练，因此它在双向对话中听起来自然流畅，而不仅仅是预设的旁白。

其区别在于在细节层面进行韵律控制。该模型可以加入笑声、暂停和插入语，并能在一次会话中处理多个发声者。这使它非常适合用于大型语言模型助手、对话音频以及对话密集的多媒体内容。

开发者可以通过 pip 安装或克隆 GitHub 仓库。在 Hugging Face 上的开源版本是一个基于 4 万小时数据的基础模型，遵循 AGPLv3+ 协议。团队将其定位为研究和对话用途，若有路线图方面的问题，可以通过 [email protected] 联系。

主要功能:

将笑声、停顿和插话整合到合成语音中
通过一次推理调用运行多说话人对话
在超过100,000小时的中英文音频上训练
音频输出流式传输，实现实时播放
通过 pip 安装或从 Hugging Face 获取权重

Pros:

开源项目，拥有庞大的GitHub社区和2Noise的积极开发。
细粒度韵律控制，包括笑声、停顿和插话。
支持流式推理、批处理以及多说话人对话。
可在PyPI和Hugging Face上获得，便于本地快速配置。

Cons:

仅限学术和研究用途，禁止用于商业项目。
仅支持英语和中文，且尚未宣布支持其他语言。
需要本地Python环境；建议使用GPU硬件以加快生成速度。
官方2noise.com网站内容简洁，大部分文档托管于GitHub。

常见问题:

ChatTTS 是免费使用的吗？

是的。ChatTTS 是基于 AGPLv3+ 开源协议的开源软件。您可以通过 pip 安装，或者从 GitHub 克隆仓库，完全免费。

ChatTTS 支持哪些语言？

ChatTTS 支持英语和中文。其主模型是在超过 10 万小时的这两种语言音频数据上训练的。

ChatTTS 能用于商业项目吗？

不能。ChatTTS 仅供学术和研究用途。Hugging Face 的模型卡和项目文档明确限制了其商业和法律用途。

如何安装 ChatTTS？

对于稳定的 PyPI 版本，运行 pip install ChatTTS；想要最新版可运行 pip install git+https://github.com/2noise/ChatTTS。模型权重托管在 Hugging Face 的 2Noise/ChatTTS。

我在哪里可以下载 ChatTTS 模型权重？

开源的 40,000 小时基础模型托管在 Hugging Face，地址是 huggingface.co/2Noise/ChatTTS。您也可以克隆 GitHub 仓库，并通过 ChatTTS Python 包加载模型。

ChatTTS 输出的音频采样率是多少？

ChatTTS 输出的音频采样率为 24,000 Hz。生成的波形可以使用 torchaudio 保存，或直接在 Python 笔记本中播放。

分类:

Audio Generation

定价:

免费

使用的技术:

GitHub

Python

Hugging Face

Join thousands of AI enthusiasts in the World of AI!

最佳免费 ChatTTS 替代方案（和付费）

Play.ht

具有600+ AI声音的AI语音生成器。通过AI在线上生成逼真的文本以语音为语音。将文本转换为音频，并以MP3和WAV文件下载。

Audio Generation

Paid

Murf AI

AI语音生成器使用20种语言。 120+逼真的文字到语音声音，以创建完美的AI配音。立即轻松地从文字到声音。

Audio Generation

Freemium

SpeechEasy

**用Speecheasy™体验高质量的合成声音：** SpeechAsy™利用AI和机器学习的力量提供了一种无缝且直接的解决方案，以将文本转换为音频。借助我们的平台，您可以生成工作室级的合成声音，这些声音不仅容易理解，而且令人愉悦地听 - 无论您是在旅途中，在家还是在办公室里。我们的技术旨在通过提供高质量...

Audio Generation

Freemium

MusicLM

Google介绍了Musiclm，该模型是从文本说明中产生高保真音乐的模型，例如“以扭曲的吉他即兴演奏为后盾的镇定小提琴旋律”。 Musiclm将有条件的音乐生成过程作为层次结构序列建模任务，并以24 kHz的形式生成音乐，该音乐在几分钟内保持一致。

Audio Generation

Free

Pomo.rhythm

通过pomo.rhythm提高您的生产力，其中Pomodoro技术的力量符合音乐的能力影响。 Pomo.Rhythm为那些寻求重点与动力和动力和动力和动力融合的人精心制作，为您的工作会议引入了无缝的，有节奏的背景。通过将您的任务分为高效，定时的间隔，并伴随着专门为将您留在区域的音乐，Pomo.Rhythm提...

Audio Generation

Freemium

Ermine.ai

通过Ermine.ai从您的设备上体验无缝的音频转录，隐私符合便利。 Ermine.ai专门研究本地音频录制和转录，利用客户端处理来确保您的数据永远不会离开设备。通过初始设置，涉及下载轻巧的转录模型（〜50MB），请准备好快速，高效且安全的转录。我们的直观平台是用户友好的 - 只需单击即可开始转录，您还可以...

Audio Generation

Freemium

Endel

Endel是一种个性化的AI工具，可提供音景自定义，以帮助个人专注，放松和睡眠。该工具得到了神经科学的支持，确保它为心理健康创造了完美的氛围。通过使用Endel，用户可以体验到增加集中度，减轻压力和深度睡眠的好处。 Endel凭借其专利技术，创造了自适应音景，这些音景对各种投入（例如一天中的时间，天气，心率...

Audio Generation

Freemium

SpeechGPT

Speechgpt是您所有语音生成需求的未来派解决方案。语音策略利用尖端的AI，专门创建了现实和自然的音频内容。无论您是想制作配音，播客还是任何形式的音频媒体，Speechgpt都可以对语音生成过程提供无缝而直观的控制。该网站的布局旨在易于使用，并在几下单击几下可访问的所有功能。详细的文档指导用户完成每...

Audio Generation

Freemium

Amadeus Code

欢迎来到Amadeus Code Inc.的官方公司站点。进入专用中心，创造力符合技术。发现有关我们创新公司的全面信息，包括我们的最新新闻和更新。我们的网站是那些寻求就业机会，渴望了解我们的投资者关系的人的门户网站，或者希望对我们的公司结构进行深入了解。通过Musictga-Hr，Evoke Music...

Audio Generation

Freemium

Now&Zen

与 Now&Zen 一起踏上独特的冥想之旅，定制冥想旨在与您的个人正念目标无缝衔接。 Now&Zen 提供了一个直观的平台，让您可以打造自己的冥想体验，定制每个细节以满足您的喜好。从选择完美的声音到设定正确的意图，Now&Zen 可以轻松创建与您当前需求产生共鸣的引导冥想。通过持续时间、语音、风格和背景...

Audio Generation

Freemium

Play.ht

Audio Generation

Paid

具有600+ AI声音的AI语音生成器。通过AI在线上生成逼真的文本以语音为语音。将文本转换为音频，并以MP3和WAV文件下载。

Murf AI

Audio Generation

Freemium

AI语音生成器使用20种语言。 120+逼真的文字到语音声音，以创建完美的AI配音。立即轻松地从文字到声音。

Invoice Mama

分类:

Reviews:

Join thousands of AI enthusiasts in the World of AI!

ChatTTS

ChatTTS 是免费使用的吗？

ChatTTS 支持哪些语言？

ChatTTS 能用于商业项目吗？

如何安装 ChatTTS？

我在哪里可以下载 ChatTTS 模型权重？

ChatTTS 输出的音频采样率是多少？

分类:

定价:

标签:

使用的技术:

评论:

Join thousands of AI enthusiasts in the World of AI!

最佳免费 ChatTTS 替代方案（和付费）

Play.ht

Murf AI

SpeechEasy

MusicLM

Pomo.rhythm

Ermine.ai

Endel

SpeechGPT

Amadeus Code

Now&Zen

Play.ht

Murf AI

SpeechEasy

MusicLM

Pomo.rhythm

Ermine.ai

Endel

SpeechGPT

Amadeus Code

Now&Zen