EmbodiedGen：面向具身智能的交互式3D世界生成引擎

原创 2025-06-26 10:53:30新闻资讯

547

一、EmbodiedGen是什么？

EmbodiedGen是由地平线机器人（Horizon Robotics）联合GigaAI、3D-Robotics、上海交通大学、南开大学等多家顶尖机构推出的开源生成式3D世界引擎，专为具身智能（Embodied AI）研发设计。该项目通过生成物理真实、可交互的3D环境，解决了机器人训练中的核心痛点：传统虚拟环境创建依赖人工3D建模，成本高昂且缺乏物理真实感，导致机器人从仿真到现实的迁移效率低下。

EmbodiedGen的核心创新在于将生成式AI与物理引擎深度融合，仅需单张图片或文字描述，即可自动生成具备真实物理属性（如重量、摩擦系数、尺寸）的3D物体与场景，支持静态物体、关节物体（如可开关的抽屉）及多样化背景（厨房、办公室等）。其生成的资产采用统一机器人描述格式（URDF），可直接导入主流仿真平台（如OpenAI Gym、Isaac Lab、MuJoCo、SAPIEN），实现从生成到仿真的无缝闭环。

二、功能特色

1. 多模态3D生成能力

图像→3D（Image-to-3D）：上传物体照片，自动重建带物理属性的3D模型，并补全不可见部分（如桌子背面）。
文本→3D（Text-to-3D）：输入自然语言描述（如“带把手的陶瓷杯”），生成可操作物体，支持风格化编辑（如替换颜色、添加图案）。
场景生成：根据“现代客厅”等描述，创建布局合理的完整场景，支持动态调整物体位置。

2. 物理引擎无缝兼容

所有生成的资产默认输出为URDF格式，无需额外转换即可直接用于物理仿真。例如，生成的微波炉模型会包含真实的门铰链扭矩参数，使机器人训练更贴近现实。

3. 自动化质量检测系统

通过三重AI质检确保生成资产可用性：

美学检查员（AestheticChecker）：评估纹理细节丰富度，过滤“塑料感”模型；
分割检查员（ImageSegChecker）：结合GPT-4o优化前景提取，确保主体清晰；
几何检查员（MeshGeoChecker）：验证结构合理性（如椅子是否稳定）。

4. 关节物体与动态交互

支持生成带活动部件的物体（如门铰链、抽屉滑轨），为机器人操作技能训练提供关键环境。例如，生成的可开关微波炉模型可用于训练机械臂执行“加热食物”任务。

5. 纹理优化与风格编辑

采用多视角RGB回投影技术消除传统3D生成的“塑料感”：

移除光照效果，统一各视角亮度；
对每个视角独立做4倍超分辨率（提升至2K）；
基于视角置信度加权融合，优先保留垂直视角细节。

三、技术细节

1. 物理属性恢复

通过GPT-4o/Qwen构建“物理专家代理”，从单张图像推断真实尺寸与物理参数：

尺度恢复：结合上下文区分物体类别（如玩具老虎 vs. 真实老虎），估算摩擦系数与质量；
水密性（Watertight）几何：确保模型完全闭合，满足碰撞检测需求。

2. 生成流程优化

文字→3D两阶段设计：

用Kolors模型将文本生成高质量图片；
输入统一图片→3D服务生成资产，比端到端方案（如Trellis-text-xlarge）可控性更强。

物理约束验证：自动检测物体尺寸合理性（如避免生成巨型的咖啡杯）。

3. 核心算法创新

RoboSplatter模块：引入3D高斯溅射（3DGS）技术，在提升视觉真实感的同时降低计算开销；
纹理反投影优化：通过几何感知的纹理合成解决多视角不一致问题。

四、应用场景

1. 机器人仿真训练

为工业机器人提供低成本、高拟真度的训练环境。例如生成带精密铰链的储物柜，训练机械臂开门/放置物品的技能。

2. 医疗模拟与康复

生成手术台3D场景，供达芬奇手术系统进行0.1毫米级精度的虚拟操作训练；或创建个性化康复环境，适配患者行动能力。

3. 自动驾驶仿真

动态生成极端天气道路、复杂交通场景，替代实车路测的高风险环节。

4. 教育与文旅

教师输入“宋代书房”，一键生成历史场景教具；博物馆快速构建文物互动展厅。

5. 工业4.0柔性生产

结合协作机器人（如库卡LBR iiwa），生成定制化生产线布局，实时验证设备协作逻辑。

五、官方资源链接

项目主页：https://horizonrobotics.github.io/robot_lab/embodied_gen/index.html
GitHub代码：https://github.com/HorizonRobotics/EmbodiedGen
论文地址：https://arxiv.org/abs/2506.10600
模型地址：https://huggingface.co/collections/HorizonRobotics/embodiedgen-684c3ec6cfd908bb1d6069bf