阿里ReplaceAnything框架火了:照片中万物皆可AI替换

站长之家 2024-01-15 14:56:23新闻资讯
241

在近期,人工智能图像处理技术(AIGC技术)备受瞩目,其在图像编辑、生成等领域展现出强大的能力。然而,一个备受挑战的问题是在生成新内容的同时,严格保持指定对象的身份不变。正是为了解决这一难题,ReplaceAnything框架应运而生。

由阿里巴巴集团智能计算研究院团队成员提出了ReplaceAnything框架。这一框架具有极高的灵活性,可广泛应用于人物替换、服装替换、背景替换等多个场景。简单的说,现在只需框住你需要保留的区域,就能把想保留的区域放大任何其它场景中。

其中,引人注目的是在服装替换中,框架能够严格保留掩模区域,实现了内容替换的高质量和高度自定义。

如下图,选中目标物体,如衣服,书包,就能无缝穿在另外一个人身上:

ReplaceAnything.png

再如下图,选中物体,就能把他们放到任何场景中:

ReplaceAnything2.png

比如选中霉霉的脸,就能让她穿上中国旗袍,结果发饰、服装、背景等各种细节全都替换掉了。

ReplaceAnything3.png

这一技术的推出标志着内容替换领域的一项重大进展,为多个行业提供了强大的工具和解决方案。ReplaceAnything框架的引入,将有望推动人工智能在图像处理领域的应用进一步发展,为用户提供更丰富、更个性化的体验。不仅如此,其在多个场景的应用也将为各行各业带来更多的可能性和创新。

目前已经可以免费体验,只要上传图片,点击要保留的对象,输入Prompt或者参考图像,等待生成结果即可。在选择对象时,只需要滑动一下,然后它就会自动识别你要保留的对象。

ReplaceAnything4.png

项目huggingface网址:https://huggingface.co/spaces/modelscope/ReplaceAnything

项目github网址:https://aigcdesigngroup.github.io/replace-anything/

ai
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Agent Zero:开源动态学习与多智能体协作的AI框架
Agent Zero是一个革命性的开源AI代理框架,不同于传统的预编程AI工具,Agent Zero被设计为一个"个人化、有机(organic)的智能体框架",其核心理念是与用户共同成长和学习。这个...
2025-07-08 新闻资讯
233

MirrorMe:阿里通义推出的实时、高保真、可控的音频驱动肖像动画框架
MirrorMe 是由阿里通义实验室开发的一款实时、高保真、可控的音频驱动肖像动画框架,该项目旨在解决当前音频驱动肖像动画领域存在的高延迟、时间一致性差、身份保持困难和控制...
2025-07-03 新闻资讯
272

BlenderFusion:谷歌DeepMind开发的2D图像转换为可编辑3D场景框架
BlenderFusion 是由谷歌DeepMind团队开发的一项革命性技术,它能够将普通的2D照片转换成完全可编辑的3D场景。它能够精确控制图片中每个物体的位置、角度、大小,改变颜色材质...
2025-07-03 新闻资讯
262

XVerse:字节跳动开源的多主体可控文生图框架
XVerse 是字节跳动AI实验室开源的一款创新性多主体可控文本到图像生成框架,旨在解决传统扩散变换器(DiTs)在多主题生成场景中面临的身份混淆和属性纠缠问题。该项目基于先进的...
2025-07-02 新闻资讯
299

VLN-R1:基于第一人称连续导航的具身智能框架
VLN-R1是由香港大学与上海AI Lab联合提出的视觉语言导航(Vision-Language Navigation, VLN)开源框架,其核心目标是实现智能体通过自然语言指令在复杂环境中完成连续动作的自...
2025-06-30 新闻资讯
264

DRA-Ctrl:基于深度学习的开源跨模态图片编辑框架
DRA-Ctrl(Dimension-Reduction Attack)是一个创新的跨模态图片编辑框架,通过整合视频模型中的视觉、时间、空间和因果等多维度高维特征表示,实现对图片主体的状态预测与精...
2025-06-27 新闻资讯
294