阿里巴巴推AI画图框架(SCEdit):可显著减少训练参数

站长之家 2023-12-27 11:24:30新闻资讯
223

阿里巴巴的新项目SCEdit是一个AI画图框架,可以显著减少训练参数、内存使用率和计算开销。在训练阶段,它减少了52%的内存消耗,仅利用ControlNet所需参数的7.9%,并实现内存使用量减少30%。

SCEdit.png

项目地址:https://scedit.github.io/

该项目的简介指出,图像扩散模型已被用于各种任务,如文本到图像生成和可控图像合成。最近的研究引入了微调方法,对原始模型进行细微调整,在基础生成式扩散模型的特定适应性方面取得了有希望的结果。

SCEdit2.png

SCEdit并不是修改扩散模型的主干部分,而是深入研究U-Net中跳跃连接的作用,并揭示出在编码器和解码器之间聚合远程信息的分层特征对图像生成内容和质量产生重大影响。

基于这一观察,SCEdit提出了一个高效的生成式调整框架,它使用轻量级调节模块SC-Tuner来集成和编辑Skip Connection。此外,所提出的框架允许通过注入不同条件与可控SC-Tuner简化并统一多条件输入网络设计以实现可控图像合成任务。由于其轻量级调节器使得反向传播仅传递给解码器块,SCEdit显著减少了训练参数、内存使用率和计算开销。

在文本到图像生成和可控图像合成任务上进行了大量实验,结果表明SCEdit在效率和性能方面具有优势。同时,该项目也宣布了开源,尽管还没有提供具体的代码,但已经有开发者表示愿意帮助实现。

ai画图
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

WebAgent:阿里巴巴开源的自主搜索AI智能体
WebAgent 是阿里巴巴NLP团队开源的一款自主搜索AI智能体,基于Apache 2.0许可证发布。该项目包含两大核心模块:WebDancer(端到端智能体训练框架)和WebWalker(Web遍历的LLM...
2025-06-03 新闻资讯
336

QwenLong-L1:阿里巴巴通义千问团队开源的首个基于强化学习训练的长上下文推理大模型框架
QwenLong-L1 是由阿里巴巴通义千问团队(Qwen-Doc团队)开发并开源的首个基于强化学习(RL)训练的长上下文大型推理模型(LRM)框架,旨在解决当前大型语言模型在长文本推理任务中面...
2025-05-28 新闻资讯
321

AnyText:阿里巴巴开源的多语言视觉文本生成与编辑模型
AnyText 是一种基于扩散模型的多语言视觉文本生成与编辑框架,由阿里巴巴集团智能计算研究所的研究团队开发。它旨在解决当前文本到图像生成模型在文本区域模糊、不可读或错误...
2025-04-01 新闻资讯
376

TaoAvatar:阿里巴巴推出的高保真轻量级全身谈话虚拟形象生成技术
TaoAvatar是阿里巴巴推出的一种基于3D高斯溅射(3DGS)的高保真、轻量级全身谈话虚拟形象生成技术。它能够从多视角序列中生成具有拓扑一致性的逼真3D全身虚拟形象,这些虚拟形象...
2025-03-25 新闻资讯
349

阿里巴巴推出AI旗舰应用“新夸克” 全面升级为“AI超级框”
3月13日,阿里巴巴正式推出其AI旗舰应用——新夸克。这款全新升级的夸克基于阿里通义领先的推理及多模态大模型,打造了一个无边界的“AI超级框”,为用户带来全新的AI体验。
2025-03-13 新闻资讯
381

阿里巴巴1688接入DeepSeek:所有商家可免费使用AI工具
2月10日,阿里巴巴旗下知名B2B电子商务平台1688在京举行了一场盛大的招商活动,并在会上宣布了一项重大决定:所有面向商家的AI产品将全部免费开放使用。这一举措标志着1688在...
2025-02-10 新闻资讯
475