网站导航

新闻资讯 编程技术 电脑知识 站长之家 自媒体

微软ai工具Text To Speech Avatar：可制作虚拟 3D 数字人

IT之家 2023-11-16 15:24:26新闻资讯

342

11 月 16 日消息，微软在 Ignite 大会中，为 Azure AI Speech 推出了一项名为“Azure AI Speech text to speech (TTS) avatar”的 AI 工具，号称可以生成人类逼真虚拟化身(数字人)，目前这款工具已经开放给大众预览试用。

微软表示，用户使用 Azure AI Speech text to speech (TTS) avatar，可以建立基于“输入文字说出内容”的虚拟化身，并结合现实人物照片训练，建立以真实人物为基础的“互动式聊天机器人”，可用于企业的营销、业务或客户服务等场景。

据悉，这项 Azure AI Speech text to speech (TTS) avatar 主要包含三个模块，分别是文字分析器、TTS 声音合成器及 TTS 虚拟化身合成器：

文字分析器会先分析用户输入的文字内容，产生音素序列(phoneme sequence)。接着 TTS 声音合成器中的 TTS 语音模型会预测用户输入文字的声学特征，再合成声音。最后，由神经网络声音合成模型 Avatar，根据上述声学特征预测人物的唇形影像，最终形成虚拟化身影像。

微软解释，传统虚拟化身制作费时耗工，需要建立专用拍摄环境、而拍摄剪辑后期过程也相当花成本。而当下运用微软最新的 Azure AI Speech text to speech (TTS) avatar 服务，在初次建立模型后，用户只要输入文字就可以制作各种产品介绍、互动视频等。配合微软 Azure OpenAI Service 及神经网络 TTS 功能，还能呈现更自然的互动体验。

IT之家发现，微软举例声称，用户可利用 Azure AI Speech TTS avatar 批量制作各种视频内容，例如企业文化影片、产品介绍或 CEO 在大会上的数字分身。也可以制作虚拟直播数字人、聊天机器人、业务机器人、或线上教学的 AI 老师等。

微软表示，Azure AI Speech text to speech (TTS) avatar 目前已经向 Azure 订阅用户推出，支持各种语言，用户可以从预设的虚拟化身选项中挑选想要的角色，也可以自行定制虚拟化身。

如果用户想要自行定制虚拟化身，则需要上传一批人物视频片段，Azure平台就会在线上处理这些视频，从而生成虚拟化身。角色本身与音源分开，用户可以选择官方提供的默认音源，也可以自行上传训练音源。

本文来源于#IT之家，由@zhanid 整理发布。如若内容造成侵权/违法违规/事实不符，请联系本站客服处理!

该文章观点仅代表作者本人，不代表本站立场。本站不承担相关法律责任。

如若转载，请注明出处：https://www.zhanid.com/news/51.html

THE END

zhanid

勇气也许不能所向披靡,但胆怯根本无济于事

相关推荐

国内中文字体商用授权情况一览（微软雅黑、思源黑体等）

国内中文字体商用授权情况一览（微软雅黑、思源黑体等）

在数字化内容创作与商业传播中，中文字体的选择已从单纯的美学需求演变为法律合规与商业安全的双重考量。本文站长工具网聚焦微软雅黑、思源黑体等主流中文字体，结合方正字库...

2025-09-12 站长之家

546

数字人软件有哪些？6款免费的AI数字人生成软件推荐评测

数字人软件有哪些？6款免费的AI数字人生成软件推荐评测

在人工智能技术飞速发展的当下，数字人软件正以“零门槛、低成本、高效率”的特性，重塑内容创作、营销推广、教育培训等领域的生产模式。本文ZHANID工具网将结合功能特点、操...

2025-09-11 电脑知识

867

AiPy：让您用自然语言指挥AI自动写Python代码的开源工具

AiPy：让您用自然语言指挥AI自动写Python代码的开源工具

AiPyApp（简称AiPy）是一款将大型语言模型（LLM）与Python生态深度融合的开源工具，旨在通过自然语言交互实现任务的自动化执行。其核心理念是“需求解析→代码生成→自动执行...

2025-09-02 新闻资讯

685

VibeVoice：微软开源的一款文本到语音(TTS)生成模型

VibeVoice：微软开源的一款文本到语音(TTS)生成模型

VibeVoice 是微软研究院开源的一款革命性音频生成模型，其1.5B版本在语音合成领域实现了多项重大技术突破，被业界誉为"语音界的Sora"。作为基于人工智能的文本转语音(TTS)系统...

2025-08-26 新闻资讯

923

AI Sheets：Hugging Face开源的一款创新型零代码数据处理工具

AI Sheets：Hugging Face开源的一款创新型零代码数据处理工具

一、AI Sheets是什么AI Sheets 是Hugging Face团队开源的一款创新型零代码数据处理工具，它将大型语言模型(LLM)的强大功能直接引入用户熟悉的电子表格界面，彻底改变了开发者...

2025-08-13 新闻资讯

514

Wassette：微软开源的一款专为AI Agent设计的安全工具

Wassette：微软开源的一款专为AI Agent设计的安全工具

Wassette 是微软开源的一款专为AI Agent设计的安全工具扩展运行时，基于Rust语言和WebAssembly（Wasm）技术构建。其核心目标是解决AI Agent在动态加载外部工具时的安全性问题...

2025-08-08 新闻资讯

515

推荐工具

热门网站

热门文章

1 ed2k下载工具有哪些：8款广受好评的ed2k下载工具推荐 2 打开浏览器显示空白页about:blank怎么办？ 3 下划线“_”怎么打？电脑中下划线符号输入方法详解 4 Windows11系统中获取帮助的9种方法详解 5 网页打不开提示“CONNECTION_RESET”的原因及解决方法 6 Word顶端有一条横线怎样删除？删除Word顶部横线的几种方法

图文资讯

图片压缩软件有哪些？5款免费好用的图片压缩软件推荐

软件下载

Cursor
下载
Cursor 是一款创新的AI代码编辑器...
Maye Lite
下载
Maye Lite是一个专注于文件快速...
微信开发者工具
下载
微信开发者工具是一款专门针对于...
图吧工具箱
下载
图吧工具箱是电脑系统和硬件维护...
ShareX
下载
ShareX是一款免费的开源程序，不...
HeyGem
下载
Heygem 是一款专为Windows系统设...