VALL-E
Vall-E开发了一种上下文感知的学习功能,可以通过简单地将无形的扬声器记录3秒钟作为语音提示来综合高质量的个性化语音。实验结果表明,在语音自然性和说话者的相似性方面,VALL-E的表现显着优于最先进的零击中TTS系统。此外,我们发现Vall-E可以保留综合过程中声音提示的演讲者的情绪和声学提示的声学环境。
定价:
免费
标签:
AI Music
AI Speech
AI Voice
Communication with AI
创建者:
使用的技术:
VALL
Vall-E开发了一种上下文感知的学习功能,可以通过简单地将无形的扬声器记录3秒钟作为语音提示来综合高质量的个性化语音。实验结果表明,在语音自然性和说话者的相似性方面,VALL-E的表现显着优于最先进的零击中TTS系统。此外,我们发现Vall-E可以保留综合过程中声音提示的演讲者的情绪和声学提示的声学环境。