在Meta AI公司精心研发下,有一款全新的文本引导型音频生成工具问世了。该工具通过应用自动回归变换器语言模型,能够将书面描述轻易地转换成引人入胜的音频。它名叫AudioGen,专为文本到声音的生成而设计。只需一个简单的文本提示,它就能生成长达5秒的、与文本内容相匹配的音频。
AudioGen的特性非常显著,包括对环境声音的精确生成。在模拟现实录音条件与复杂场景的背景下,AudioGen都能生动地呈现。例如,它能够模拟风中的口哨声、逼真的警报声、鸟鸣声、火车道口的信号声以及打字机的敲击声等。这些细致入微的声音效果,让AudioGen成为了音频领域的一大创新突破。
发表评论