微软ai工具Text To Speech Avatar:可制作虚拟 3D 数字人

IT之家 2023-11-16 15:24:26新闻资讯
190

11 月 16 日消息,微软在 Ignite 大会中,为 Azure AI Speech 推出了一项名为“Azure AI Speech text to speech (TTS) avatar”的 AI 工具,号称可以生成人类逼真虚拟化身(数字人),目前这款工具已经开放给大众预览试用。

Text To Speech Avatar.jpg

微软表示,用户使用 Azure AI Speech text to speech (TTS) avatar,可以建立基于“输入文字说出内容”的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的“互动式聊天机器人”,可用于企业的营销、业务或客户服务等场景。

据悉,这项 Azure AI Speech text to speech (TTS) avatar 主要包含三个模块,分别是文字分析器、TTS 声音合成器及 TTS 虚拟化身合成器:

文字分析器会先分析用户输入的文字内容,产生音素序列(phoneme sequence)。接着 TTS 声音合成器中的 TTS 语音模型会预测用户输入文字的声学特征,再合成声音。最后,由神经网络声音合成模型 Avatar,根据上述声学特征预测人物的唇形影像,最终形成虚拟化身影像。

微软解释,传统虚拟化身制作费时耗工,需要建立专用拍摄环境、而拍摄剪辑后期过程也相当花成本。而当下运用微软最新的 Azure AI Speech text to speech (TTS) avatar 服务,在初次建立模型后,用户只要输入文字就可以制作各种产品介绍、互动视频等。配合微软 Azure OpenAI Service 及神经网络 TTS 功能,还能呈现更自然的互动体验。

Text To Speech Avatar2.jpg

Text To Speech Avatar5.jpg

IT之家发现,微软举例声称,用户可利用 Azure AI Speech TTS avatar 批量制作各种视频内容,例如企业文化影片、产品介绍或 CEO 在大会上的数字分身。也可以制作虚拟直播数字人、聊天机器人、业务机器人、或线上教学的 AI 老师等。

Text To Speech Avatar3.jpg

微软表示,Azure AI Speech text to speech (TTS) avatar 目前已经向 Azure 订阅用户推出,支持各种语言,用户可以从预设的虚拟化身选项中挑选想要的角色,也可以自行定制虚拟化身。

Text To Speech Avatar4.jpg

如果用户想要自行定制虚拟化身,则需要上传一批人物视频片段,Azure平台就会在线上处理这些视频,从而生成虚拟化身。角色本身与音源分开,用户可以选择官方提供的默认音源,也可以自行上传训练音源。

ai工具
THE END
zhanid
勇气也许不能所向披靡,但胆怯根本无济于事

相关推荐

为什么你的AI工具总出废稿?这3个指令模板快收藏!
“AI生成的内容总是偏离需求”“文案像机器人写的,毫无感染力”“修改次数比自己写还多”……你是否也遇到过类似问题?AI工具并非“废稿制造机”,问题可能出在你的指令上。...
2025-05-10 自媒体
220

微软推出低端平板电脑以推广AI工具 Surface Laptop与Surface Pro瞄准AI应用场景
微软正式推出两款定位中端入门的Surface设备,包括13英寸的Surface Laptop和12英寸的Surface Pro二合一平板电脑,起售价分别为899美元和799美元。这两款产品以“普及AI工具”...
2025-05-07 新闻资讯
239

抖音AI克隆人爆火!用数字分身发视频算违规吗?
2025年,AI克隆人技术迎来爆发式增长。从明星虚拟分身直播带货,到普通人用数字形象分享生活,抖音等短视频平台正被AI生成内容(AIGC)席卷。然而,当“数字分身”逐渐模糊真...
2025-05-01 自媒体
286

Open Avatar Chat:阿里开源的轻量化多模态实时数字人对话系统
Open Avatar Chat是一个由阿里巴巴开源的轻量化多模态实时数字人对话系统。它旨在通过先进的人工智能技术,实现数字人与用户之间的自然、流畅交互。该项目整合了语音识别、自...
2025-04-27 新闻资讯
354

Win11玩老游戏闪退?这个兼容模式微软藏得太深!
不少玩家遇到了一个棘手的问题:老游戏在Win11上频繁闪退。这背后的原因究竟是什么?微软是否真的隐藏了某些兼容模式来解决这一问题?本文ZHANID工具网将为您深入剖析Win11玩...
2025-04-27 电脑知识
346

UFO²:微软发布的面向Windows桌面的创新性多Agent操作系统
UFO²是微软发布的一款面向Windows桌面的创新性多Agent操作系统。它旨在通过多模态大语言模型(LLM)驱动的Computer-Using Agent(CUA),实现复杂桌面工作流程的自动化,从而...
2025-04-24 新闻资讯
298