视觉推理框架


Pixel Reasoner:基于好奇心驱动强化学习的像素空间视觉推理框架
Pixel Reasoner是由TIGER AI Lab开发的开源视觉推理框架,其革命性在于首次将"像素空间操作"(如放大、框选、对比)与多模态大模型结合,实现了人类级别的细粒度视觉理解能力...
2025-05-27 新闻资讯
525