AI图片编辑神器(Anydoor):开启图片编辑的任意门 图片主体随意移动

站长之家 2023-12-21 15:36:07新闻资讯
350

随着数字时代图像编辑的飞速发展,来自香港大学、阿里巴巴和蚂蚁集团的新成果AnyDoor为图片编辑开辟了一扇全新的时代之门。

这是一项基于扩散技术的创新,具有将目标物体以和谐的方式传送到用户指定位置的神奇能力。与传统模型需要为每个物体调整参数不同,AnyDoor只需进行一次训练,就能在推断阶段轻松适应多样化的物体-场景组合。

这种具有挑战性的零障碍设置要求对某个对象进行充分的特征描述。为此,在常用的身份特征基础上,补充了细节特征,这些特征经过精心设计,既能保持纹理细节,又能允许多样化的局部变化(如光照、方向、姿势等),使对象能够与不同环境和谐融合。

此外,研究人员还提出从视频数据集中借用知识,从中观察单个对象在时间轴上的各种形态,以增强模型的泛化能力和稳健性。大量实验证明,我们的方法在效果上优于现有替代方案,并在虚拟试穿和物体移动等实际应用中展现出巨大潜力。

AnyDoor能实现的效果包括

1. 物体移动: AnyDoor可应用于高级任务,如物体移动,轻松实现场景中物体的位置变换。

比如把这张图里桌面上的位置任意变化:

1.png

2. 物体交换: AnyDoor可扩展为进行物体交换,为图像增添更多创意和趣味。

如下图,可以将图中两辆车的位置对调:

2.png

3. 多主体合成: 由于AnyDoor对于将物体放置在给定场景特定位置具有高度可控性,因此轻松扩展为多主体合成,创造更加丰富的画面。

比如把下图中所有的宠物狗都放到同一个草地上:

3.png

4. 虚拟试穿: AnyDoor可作为虚拟试穿的简单但强大基线。无需复杂的人体解析,能够保留不同衣物的颜色、图案和纹理。试穿衣服也能玩成贴画游戏版本,图中人物换上想要的衣服

4.png

这项技术创新为图像编辑领域带来了新的可能性,将在图像合成、效果图像渲染、海报制作、虚拟试穿等多个应用场景中发挥实际作用。

项目网址:https://damo-vilab.github.io/AnyDoor-Page/

论文网址:https://arxiv.org/pdf/2307.09481.pdf

ai工具
THE END
战地网
频繁记录吧,生活的本意是开心

相关推荐

AiPy:让您用自然语言指挥AI自动写Python代码的开源工具
AiPyApp(简称AiPy)是一款将大型语言模型(LLM)与Python生态深度融合的开源工具,旨在通过自然语言交互实现任务的自动化执行。其核心理念是“需求解析→代码生成→自动执行...
2025-09-02 新闻资讯
869

AI Sheets:Hugging Face开源的一款创新型零代码数据处理工具
一、AI Sheets是什么AI Sheets 是Hugging Face团队开源的一款创新型零代码数据处理工具,它将大型语言模型(LLM)的强大功能直接引入用户熟悉的电子表格界面,彻底改变了开发者...
2025-08-13 新闻资讯
560

设计师必备的5款AI软件,你居然还没用过?
人工智能技术的飞速发展,为设计师带来了前所未见的高效工具。本文将为你推荐5款必备的AI设计软件,它们不仅能大幅提升工作效率,还能激发无限创意可能。无论你是平面、UI还是...
2025-06-10 电脑知识
1175

为什么你的AI工具总出废稿?这3个指令模板快收藏!
“AI生成的内容总是偏离需求”“文案像机器人写的,毫无感染力”“修改次数比自己写还多”……你是否也遇到过类似问题?AI工具并非“废稿制造机”,问题可能出在你的指令上。...
2025-05-10 自媒体
706

微软推出低端平板电脑以推广AI工具 Surface Laptop与Surface Pro瞄准AI应用场景
微软正式推出两款定位中端入门的Surface设备,包括13英寸的Surface Laptop和12英寸的Surface Pro二合一平板电脑,起售价分别为899美元和799美元。这两款产品以“普及AI工具”...
2025-05-07 新闻资讯
584

站长必备AI工具箱:从内容生成到数据分析的全套解决方案
在数字化浪潮的推动下,网站运营面临着前所未有的挑战与机遇。站长们不仅需要关注网站的内容质量、用户体验,还需紧跟技术前沿,利用先进工具提升工作效率与网站竞争力。本文...
2025-04-15 站长之家
662