阿里AI模型EMO免费上线通义APP 一张照片即可开口唱歌说话

站长之家 2024-04-26 20:08:00新闻资讯
597

阿里云宣布,EMO模型成功在通义APP中上线,并且完全开放给所有用户免费使用。

如今,在通义千问APP内,用户只需简单三步操作:选择模版、上传照片、生成视频,即可轻松实现照片中人物演戏唱歌的神奇效果。

通义APP首批上线了多达80个EMO模板,涵盖了热门歌曲、网络热梗等多种内容。用户可以选择预置的音频来生成视频,但目前暂不支持用户自定义音频。

阿里AI模型EMO.png

EMO模型是通义实验室精心研发的AI模型,其背后的肖像说话技术正是当前AIGC领域的热门话题。与传统的Talking Head技术相比,EMO模型采用了创新的弱控制设计,无需对人脸、人头或身体部分进行繁琐的3D建模,即可轻松驱动肖像开口说话。这不仅大大降低了视频生成的成本,还显著提升了视频的质量。

EMO模型具备强大的学习能力,能够编码人类表达情绪的能力。它能够将音频内容与人物的表情、嘴型精准匹配,甚至能将音频的语气特征和情绪色彩细腻地反映到人物的微表情上,使得生成的视频更加生动逼真。

自2月底通义实验室公布相关论文以来,EMO模型便受到了广泛关注,成为继Sora之后最受瞩目的AI模型之一。未来,EMO技术有望在数字人、数字教育、影视制作、虚拟陪伴、电商直播等众多领域发挥巨大潜力。

通义APP一直致力于为用户提供前沿模型的免费体验。除了EMO模型外,通义APP还推出了众多现象级应用,如“全民舞王”、“兵马俑跳科目三”、“金毛跳舞”等,这些应用背后的模型也均出自通义实验室。此外,通义APP还不断推出实用功能,如超长文档解析、AI编码助手、AI会议助手等,为用户提供全方位的超级AI助手服务。

体验地址https://www.zhanid.com/daohang/tongyiqianwen.html

通义千问 AI
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Kotaemon:一款基于RAG技术的开源文档问答神器
Kotaemon是一个基于RAG(Retrieval-Augmented Generation)技术的开源工具,它允许用户通过聊天的方式与自己的文档进行交互,从而快速获取所需信息。RAG技术结合了检索(Retriev...
2025-09-09 新闻资讯
719

Java中“java.lang.OutOfMemoryError”错误的解决方法
在Java程序运行过程中,java.lang.OutOfMemoryError是开发者最常遭遇的严重错误之一。该错误表明程序申请的内存超出了Java虚拟机(JVM)的可用内存限制,导致系统无法继续分配...
2025-09-04 编程技术
654

HunyuanVideo-Foley:腾讯混元团队开源的一款端到端视频音效生成模型
HunyuanVideo-Foley 是腾讯混元团队研发并开源的一款端到端视频音效生成模型,其核心使命是通过人工智能技术,为无声视频自动生成高质量、高同步的音效与背景音乐,打造真正意...
2025-08-29 新闻资讯
907

Seed-OSS:原生512K长上下文与可控推理的开源大语言模型
一、Seed-OSS是什么?Seed-OSS是字节跳动Seed团队开源的大语言模型系列,标志着字节跳动首次进军开源大模型赛道。这一系列模型以其360亿参数的规模、原生512K超长上下文支持...
2025-08-22 新闻资讯
890

Qwen-Image-Edit:阿里巴巴通义千问推出的开源图像编辑模型
Qwen-Image-Edit 是阿里巴巴通义千问团队推出的开源图像编辑模型,基于20B参数规模的Qwen-Image基础模型进一步训练而成。作为多模态扩散Transformer(MMDiT)架构的代表性应用...
2025-08-21 新闻资讯
787

memory.dmp是什么文件?memory.dmp文件查看方法详解
memory.dmp是Windows操作系统在遭遇严重系统错误(如蓝屏死机)时自动生成的内存转储文件,其本质是系统崩溃瞬间的物理内存与虚拟内存的完整快照。当操作系统检测到不可恢复的...
2025-08-18 电脑知识
850