AI图片编辑神器(Anydoor):开启图片编辑的任意门 图片主体随意移动

站长之家 2023-12-21 15:36:07新闻资讯
26

随着数字时代图像编辑的飞速发展,来自香港大学、阿里巴巴和蚂蚁集团的新成果AnyDoor为图片编辑开辟了一扇全新的时代之门。

这是一项基于扩散技术的创新,具有将目标物体以和谐的方式传送到用户指定位置的神奇能力。与传统模型需要为每个物体调整参数不同,AnyDoor只需进行一次训练,就能在推断阶段轻松适应多样化的物体-场景组合。

这种具有挑战性的零障碍设置要求对某个对象进行充分的特征描述。为此,在常用的身份特征基础上,补充了细节特征,这些特征经过精心设计,既能保持纹理细节,又能允许多样化的局部变化(如光照、方向、姿势等),使对象能够与不同环境和谐融合。

此外,研究人员还提出从视频数据集中借用知识,从中观察单个对象在时间轴上的各种形态,以增强模型的泛化能力和稳健性。大量实验证明,我们的方法在效果上优于现有替代方案,并在虚拟试穿和物体移动等实际应用中展现出巨大潜力。

AnyDoor能实现的效果包括

1. 物体移动: AnyDoor可应用于高级任务,如物体移动,轻松实现场景中物体的位置变换。

比如把这张图里桌面上的位置任意变化:

1.png

2. 物体交换: AnyDoor可扩展为进行物体交换,为图像增添更多创意和趣味。

如下图,可以将图中两辆车的位置对调:

2.png

3. 多主体合成: 由于AnyDoor对于将物体放置在给定场景特定位置具有高度可控性,因此轻松扩展为多主体合成,创造更加丰富的画面。

比如把下图中所有的宠物狗都放到同一个草地上:

3.png

4. 虚拟试穿: AnyDoor可作为虚拟试穿的简单但强大基线。无需复杂的人体解析,能够保留不同衣物的颜色、图案和纹理。试穿衣服也能玩成贴画游戏版本,图中人物换上想要的衣服

4.png

这项技术创新为图像编辑领域带来了新的可能性,将在图像合成、效果图像渲染、海报制作、虚拟试穿等多个应用场景中发挥实际作用。

项目网址:https://damo-vilab.github.io/AnyDoor-Page/

论文网址:https://arxiv.org/pdf/2307.09481.pdf

ai工具
THE END
战地网
频繁记录吧,生活的本意是开心

相关推荐

Pic Copilot推出AI虚拟试衣工具,革新服饰电商视觉营销
在电商视觉营销领域,阿里国际旗下的Pic Copilot近日推出了一款创新的AI虚拟试衣工具,旨在帮助服饰商家大幅降低商品展示的拍摄成本。这一突破性工具的亮相,预示着服饰电商行...
2024-05-15 新闻资讯
52

微信发布桌面效率AI工具小微助手 支持类ChatGPT在线聊天问答功能
​微信最近发布了一款名为“小微助手”的桌面AI效率工具,旨在通过自然语言处理技术,提升用户在电脑上的工作效率。这款工具不仅支持Windows和Mac操作系统,还具备以下特点:搜...
2024-04-25 新闻资讯
33

Google Maps 引入 AI 工具:概述餐厅 / 景点特色、增强本地人推荐内容等
3 月 28 日消息,谷歌公司近日发布新闻稿,宣布为 Google Maps 应用引入 3 项改进,让你的夏日旅行更轻松。Google Maps 本次更新最值得关注的改进在于借助 Google AI,可以基...
2024-03-28 新闻资讯
23

OptimizerAI:可为AI视频自动配音 还将支持立体声
OptimizerAI是一款专门为视频自动生成音效的AI工具,可以通过文字提示创造出适用于各种场景的声音和音效。用户可以利用这个平台生成适用于多种应用场景的声音效果。
2024-03-11 新闻资讯
48

免费AI背景移除工具iFoto算法升级,发丝都能扣得干净
iFoto这款AI 背景移除工具可以快速消除产品图片中不需要的背景,轻松将在线背景消除器集成到工作流程中 。基于 AI 技术,iFoto 的在线背景移除工具保证了准确性和细致的细节保...
2024-03-08 新闻资讯
28

Design2Code:Ai设计图自动生成前端代码的工具
近年来,生成 AI 在多模态理解和代码生成方面取得了显著进展,为前端开发带来了全新的范式。研究人员开展了对视觉设计转换为代码实现任务(称为Design2Code)的系统研究。 D...
2024-03-07 新闻资讯
67