VLM

MiMo-VL是小米公司LLM-Core团队开源的多模态视觉语言模型(VLM),作为MiMo-7B系列的重要扩展,该模型以仅7B参数的紧凑规模,在40多项多模态任务评测中超越Qwen2.5-VL-72B等10倍...
2025-06-04
新闻资讯
631

DeepEyes是由小红书与西安交通大学联合研发的开源多模态视觉语言模型(VLM),旨在赋予AI“边看图边思考”的能力,即通过动态调用视觉工具(如图像局部放大)在推理过程中主动...
2025-06-04
新闻资讯
554