微软ai工具Text To Speech Avatar:可制作虚拟 3D 数字人

IT之家 2023-11-16 15:24:26新闻资讯
342

11 月 16 日消息,微软在 Ignite 大会中,为 Azure AI Speech 推出了一项名为“Azure AI Speech text to speech (TTS) avatar”的 AI 工具,号称可以生成人类逼真虚拟化身(数字人),目前这款工具已经开放给大众预览试用。

Text To Speech Avatar.jpg

微软表示,用户使用 Azure AI Speech text to speech (TTS) avatar,可以建立基于“输入文字说出内容”的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的“互动式聊天机器人”,可用于企业的营销、业务或客户服务等场景。

据悉,这项 Azure AI Speech text to speech (TTS) avatar 主要包含三个模块,分别是文字分析器、TTS 声音合成器及 TTS 虚拟化身合成器:

文字分析器会先分析用户输入的文字内容,产生音素序列(phoneme sequence)。接着 TTS 声音合成器中的 TTS 语音模型会预测用户输入文字的声学特征,再合成声音。最后,由神经网络声音合成模型 Avatar,根据上述声学特征预测人物的唇形影像,最终形成虚拟化身影像。

微软解释,传统虚拟化身制作费时耗工,需要建立专用拍摄环境、而拍摄剪辑后期过程也相当花成本。而当下运用微软最新的 Azure AI Speech text to speech (TTS) avatar 服务,在初次建立模型后,用户只要输入文字就可以制作各种产品介绍、互动视频等。配合微软 Azure OpenAI Service 及神经网络 TTS 功能,还能呈现更自然的互动体验。

Text To Speech Avatar2.jpg

Text To Speech Avatar5.jpg

IT之家发现,微软举例声称,用户可利用 Azure AI Speech TTS avatar 批量制作各种视频内容,例如企业文化影片、产品介绍或 CEO 在大会上的数字分身。也可以制作虚拟直播数字人、聊天机器人、业务机器人、或线上教学的 AI 老师等。

Text To Speech Avatar3.jpg

微软表示,Azure AI Speech text to speech (TTS) avatar 目前已经向 Azure 订阅用户推出,支持各种语言,用户可以从预设的虚拟化身选项中挑选想要的角色,也可以自行定制虚拟化身。

Text To Speech Avatar4.jpg

如果用户想要自行定制虚拟化身,则需要上传一批人物视频片段,Azure平台就会在线上处理这些视频,从而生成虚拟化身。角色本身与音源分开,用户可以选择官方提供的默认音源,也可以自行上传训练音源。

ai工具
THE END
zhanid
勇气也许不能所向披靡,但胆怯根本无济于事

相关推荐

国内中文字体商用授权情况一览(微软雅黑、思源黑体等)
在数字化内容创作与商业传播中,中文字体的选择已从单纯的美学需求演变为法律合规与商业安全的双重考量。本文站长工具网聚焦微软雅黑、思源黑体等主流中文字体,结合方正字库...
2025-09-12 站长之家
546

数字人软件有哪些?6款免费的AI数字人生成软件推荐评测
在人工智能技术飞速发展的当下,数字人软件正以“零门槛、低成本、高效率”的特性,重塑内容创作、营销推广、教育培训等领域的生产模式。本文ZHANID工具网将结合功能特点、操...
2025-09-11 电脑知识
867

AiPy:让您用自然语言指挥AI自动写Python代码的开源工具
AiPyApp(简称AiPy)是一款将大型语言模型(LLM)与Python生态深度融合的开源工具,旨在通过自然语言交互实现任务的自动化执行。其核心理念是“需求解析→代码生成→自动执行...
2025-09-02 新闻资讯
685

VibeVoice:微软开源的一款文本到语音(TTS)生成模型
VibeVoice 是微软研究院开源的一款革命性音频生成模型,其1.5B版本在语音合成领域实现了多项重大技术突破,被业界誉为"语音界的Sora"。作为基于人工智能的文本转语音(TTS)系统...
2025-08-26 新闻资讯
923

AI Sheets:Hugging Face开源的一款创新型零代码数据处理工具
一、AI Sheets是什么AI Sheets 是Hugging Face团队开源的一款创新型零代码数据处理工具,它将大型语言模型(LLM)的强大功能直接引入用户熟悉的电子表格界面,彻底改变了开发者...
2025-08-13 新闻资讯
514

Wassette:微软开源的一款专为AI Agent设计的安全工具
Wassette 是微软开源的一款专为AI Agent设计的安全工具扩展运行时,基于Rust语言和WebAssembly(Wasm)技术构建。其核心目标是解决AI Agent在动态加载外部工具时的安全性问题...
2025-08-08 新闻资讯
515