阿里推开源版“妙鸭”FaceChain 1张图片百种定制

站长之家 2024-01-10 17:03:29新闻资讯
274

FaceChain-FACT是阿里推出的一项人工智能生成个性化肖像的技术,通过Deformable Neural Radiance Fields技术从普通视频中创造自由视点的肖像。使用FaceChainAI照片生成模型,不需要提供多张照片训练LoRA(妙鸭相机的原理),仅需一张用户照片即可生成高度定制的肖像,支持百余种定制模版,生成速度更是快过商业应用100倍,达到秒级。

FaceChain-FACT.png

项目地址:https://facechain-fact.github.io/

其技术方法包括图像预处理、基于Transformer的面部特征提取器、稳定扩散等,支持多种LoRA模型,实现多样化肖像风格。这一技术的应用前景广泛,尤其在人工智能生成内容领域具有巨大潜力。

在技术方法方面,FaceChain-FACT通过一系列图像预处理步骤获取训练数据集,利用Transformer-based的面部特征提取器提取面部特征,使用稳定扩散将面部条件传递给FACT-Adapter,结合文本嵌入生成高质量肖像图像。该技术还支持ControlNet和LoRA插件,具有强大的插拔性。

总体而言,FaceChain-FACT的提出填补了现有技术的空白,为个性化肖像生成提供了一种更加高效和简便的解决方案,同时在生成速度和定制化程度方面实现了显著的进步。这对于人工智能生成内容的发展具有积极的推动作用。

开源
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Genkit:Google Firebase团队开发的统一全栈AI应用开发框架
Genkit 是由Google Firebase团队开发并投入生产的开源统一全栈AI应用开发框架,旨在为开发者提供一套完整的工具链和标准化接口,用于构建、测试和部署全栈AI驱动的应用程序。
2025-07-11 新闻资讯
242

SmolLM:Hugging Face推出的轻量高效多语言长上下文推理模型
SmolLM 是Hugging Face推出的"小而精"语言模型系列,其名称"Smol"源于"Small"的变体,直指其"以小搏大"的核心设计哲学。该项目始于SmolLM2的发布,最初定位为资源受限设备(如...
2025-07-11 新闻资讯
244

DiffuCoder:苹果公司与香港大学联合研发的并行化代码生成模型
DiffuCoder是苹果公司与香港大学联合研发的一款革命性代码生成模型,它突破了传统自回归语言模型(如GPT系列)必须按顺序生成代码的限制,采用掩码扩散模型(Masked Diffusio...
2025-07-10 新闻资讯
257

OmniSVG:全球首个端到端多模态可缩放矢量图形(SVG)生成模型
OmniSVG 是由复旦大学与阶跃星辰(StepFun)联合研发的全球首个端到端多模态可缩放矢量图形(SVG)生成模型,代表了当前AI生成矢量图形领域的最前沿技术突破。作为一项开源项目,...
2025-07-10 新闻资讯
250

HumanOmniV2:阿里巴巴通义实验室开源的多模态大语言模型
HumanOmniV2是阿里巴巴集团旗下通义实验室(Tongyi Lab)开源的多模态大语言模型,代表了当前人工智能领域在多模态推理与复杂意图理解方面的最前沿技术成果。作为HumanOmni系...
2025-07-10 新闻资讯
265

MetaStone-S1:融合深度推理与过程评分的反射生成模型
MetaStone-S1 是北京元石科技推出的反射生成式大模型,其核心创新在于提出了"反思型生成范式"(reflective generative paradigm),通过统一框架实现了推理生成与过程评估的协同...
2025-07-09 新闻资讯
281