AI图片编辑神器(Anydoor):开启图片编辑的任意门 图片主体随意移动

站长之家 2023-12-21 15:36:07新闻资讯
196

随着数字时代图像编辑的飞速发展,来自香港大学、阿里巴巴和蚂蚁集团的新成果AnyDoor为图片编辑开辟了一扇全新的时代之门。

这是一项基于扩散技术的创新,具有将目标物体以和谐的方式传送到用户指定位置的神奇能力。与传统模型需要为每个物体调整参数不同,AnyDoor只需进行一次训练,就能在推断阶段轻松适应多样化的物体-场景组合。

这种具有挑战性的零障碍设置要求对某个对象进行充分的特征描述。为此,在常用的身份特征基础上,补充了细节特征,这些特征经过精心设计,既能保持纹理细节,又能允许多样化的局部变化(如光照、方向、姿势等),使对象能够与不同环境和谐融合。

此外,研究人员还提出从视频数据集中借用知识,从中观察单个对象在时间轴上的各种形态,以增强模型的泛化能力和稳健性。大量实验证明,我们的方法在效果上优于现有替代方案,并在虚拟试穿和物体移动等实际应用中展现出巨大潜力。

AnyDoor能实现的效果包括

1. 物体移动: AnyDoor可应用于高级任务,如物体移动,轻松实现场景中物体的位置变换。

比如把这张图里桌面上的位置任意变化:

1.png

2. 物体交换: AnyDoor可扩展为进行物体交换,为图像增添更多创意和趣味。

如下图,可以将图中两辆车的位置对调:

2.png

3. 多主体合成: 由于AnyDoor对于将物体放置在给定场景特定位置具有高度可控性,因此轻松扩展为多主体合成,创造更加丰富的画面。

比如把下图中所有的宠物狗都放到同一个草地上:

3.png

4. 虚拟试穿: AnyDoor可作为虚拟试穿的简单但强大基线。无需复杂的人体解析,能够保留不同衣物的颜色、图案和纹理。试穿衣服也能玩成贴画游戏版本,图中人物换上想要的衣服

4.png

这项技术创新为图像编辑领域带来了新的可能性,将在图像合成、效果图像渲染、海报制作、虚拟试穿等多个应用场景中发挥实际作用。

项目网址:https://damo-vilab.github.io/AnyDoor-Page/

论文网址:https://arxiv.org/pdf/2307.09481.pdf

ai工具
THE END
战地网
频繁记录吧,生活的本意是开心

相关推荐

为什么你的AI工具总出废稿?这3个指令模板快收藏!
“AI生成的内容总是偏离需求”“文案像机器人写的,毫无感染力”“修改次数比自己写还多”……你是否也遇到过类似问题?AI工具并非“废稿制造机”,问题可能出在你的指令上。...
2025-05-10 自媒体
253

微软推出低端平板电脑以推广AI工具 Surface Laptop与Surface Pro瞄准AI应用场景
微软正式推出两款定位中端入门的Surface设备,包括13英寸的Surface Laptop和12英寸的Surface Pro二合一平板电脑,起售价分别为899美元和799美元。这两款产品以“普及AI工具”...
2025-05-07 新闻资讯
265

站长必备AI工具箱:从内容生成到数据分析的全套解决方案
在数字化浪潮的推动下,网站运营面临着前所未有的挑战与机遇。站长们不仅需要关注网站的内容质量、用户体验,还需紧跟技术前沿,利用先进工具提升工作效率与网站竞争力。本文...
2025-04-15 站长之家
329

自媒体写作使用AI工具会被限流吗?
在自媒体领域,内容创作是核心。随着人工智能(AI)技术的飞速发展,越来越多的自媒体人开始使用AI工具辅助写作,以提高创作效率和质量。然而,关于自媒体写作使用AI工具是否...
2025-03-28 自媒体
285

自媒体人AI工具墙推荐:从脚本到剪辑的全链神器
自媒体人正面临前所未有的挑战:如何在信息洪流中持续产出高质量内容?如何压缩制作周期却保持创意水准?答案藏在AI技术的进化中。从脚本创作到智能剪辑,从素材生成到数据分...
2025-03-19 自媒体
445

Repomix:让你的代码仓库变身AI友好格式的神奇工具🚀
你是否曾经遇到过这样的情况:手头有一个庞大的代码仓库,想要将其提交给AI助手(比如ChatGPT、DeepSeek等)进行代码审查、重构建议,或者生成文档和测试用例?但又担心AI无法...
2025-03-19 新闻资讯
351