微软推文本转真人视频工具Deepfakes Creator

站长之家 2023-11-17 14:49:16新闻资讯
421

微软推出了一款名为Deepfakes Creator的工具,被称为Azure AI Speech的文本到语音化身。这个工具可以通过文本输入生成逼真的会说话的真人视频。用户只需要上传想要化身模仿的人的照片,并写一个剧本,工具就能创建出逼真的人物化身视频,模拟人物说话。不仅如此,这个工具还支持多种语言,并能进行实时问答互动。此外,Deepfakes Creator还提供了个性化语音功能,用户只需提供一分钟的语音样本,就能快速复制用户的声音,用于定制语音助手和内容配音。

Deepfakes Creator.png

项目地址:https://github.com/Azure/gen-cv/tree/main/avatar/video

为了确保合法和伦理的使用,Deepfakes Creator禁止使用预录制语音,并要求用户明确同意使用并通过注册使用特定的用例。另外,为了辨认AI合成语音,工具会在个人语音中自动添加水印,并要求用户同意Microsoft使用水印检测服务。

Deepfakes Creator还可以简化传统视频制作流程,适用于制作培训视频、产品介绍等各种内容。同时,它还可以用于构建对话代理、虚拟助手、聊天机器人等,提供自然的交互式对话。工具的内容生成工作流程包括文本分析、TTS音频合成和TTS化身视频合成,生成与声音同步的嘴唇动画。

除了提供即用型的预构建化身,Deepfakes Creator还提供可定制化的化身选项。用户可以通过上传的视频录像进行训练,定制出符合自己需求的化身。

为了方便用户使用,Azure AI Speech Studio提供了UI工具和API访问支持。Deepfakes Creator可以广泛应用于创建各类吸引人的视频和交互式应用,提高沟通和信息传达的效率。

工具
THE END
zhanid
勇气也许不能所向披靡,但胆怯根本无济于事

相关推荐

国内中文字体商用授权情况一览(微软雅黑、思源黑体等)
在数字化内容创作与商业传播中,中文字体的选择已从单纯的美学需求演变为法律合规与商业安全的双重考量。本文站长工具网聚焦微软雅黑、思源黑体等主流中文字体,结合方正字库...
2025-09-12 站长之家
546

VibeVoice:微软开源的一款文本到语音(TTS)生成模型
VibeVoice 是微软研究院开源的一款革命性音频生成模型,其1.5B版本在语音合成领域实现了多项重大技术突破,被业界誉为"语音界的Sora"。作为基于人工智能的文本转语音(TTS)系统...
2025-08-26 新闻资讯
923

Wassette:微软开源的一款专为AI Agent设计的安全工具
Wassette 是微软开源的一款专为AI Agent设计的安全工具扩展运行时,基于Rust语言和WebAssembly(Wasm)技术构建。其核心目标是解决AI Agent在动态加载外部工具时的安全性问题...
2025-08-08 新闻资讯
515

Next-Frame Diffusion:微软与北大联合开发的开源自回归视频生成框架
Next-Frame Diffusion(NFD)是由微软研究院与北京大学联合开发的开源自回归视频生成框架,作为当前最具突破性的实时交互式视频生成技术之一,其核心创新在于通过块状因果注意...
2025-06-14 新闻资讯
548

Magentic-UI:微软开源的一款人机协作网页自动化工具
Magentic-UI是微软研究院于2025年5月在Build开发者大会上正式开源的一款革命性人机协作网页自动化工具。作为基于Magentic-One系统和AutoGen框架开发的创新项目,它重新定义了...
2025-06-07 新闻资讯
625

微软推出低端平板电脑以推广AI工具 Surface Laptop与Surface Pro瞄准AI应用场景
微软正式推出两款定位中端入门的Surface设备,包括13英寸的Surface Laptop和12英寸的Surface Pro二合一平板电脑,起售价分别为899美元和799美元。这两款产品以“普及AI工具”...
2025-05-07 新闻资讯
525