语音克隆

Marco-Voice 是由阿里巴巴国际数字商务团队开源的一款多功能语音合成系统,作为新一代文本到语音(TTS)技术的代表,Marco-Voice通过创新的说话者-情感解耦机制,成功将语音克...
2025-08-14
新闻资讯
549

MegaTTS3是由字节跳动(Bytedance)开发并开源的一个高质量语音合成(TTS)模型,基于PyTorch实现。该项目旨在通过创新的Diffusion Transformer架构和WaveVAE声码器,提供轻量...
2025-04-04
新闻资讯
766