​阿里通义千问推理大模型QwQ-32B勇夺全球开源社区榜首

站长之家 2025-03-07 19:41:01新闻资讯
318

在全球最大的 AI 开源社区 HuggingFace 的最新更新中,阿里巴巴近期推出的通义千问推理模型 QwQ-32B 成功夺得了大模型榜单的第一名。这一模型在刚发布后便引起了广泛关注,超越了诸如微软的 Phi-4和 DeepSeek-R1等知名模型,展现出了强大的性能。

阿里通义千问推理大模型QwQ-32B.png

QwQ-32B 模型在数学、代码处理及通用能力等多个方面都取得了质的飞跃,特别是其参数数量较小的特点,使得其整体性能能够与 DeepSeek-R1相媲美。此外,该模型的设计让用户能够在消费级显卡上实现本地部署,极大降低了模型应用的成本。这一突破为更多用户提供了更为便捷和经济的 AI 应用选择。

在多个权威基准测试中,QwQ-32B 模型的表现都非常优异,几乎完全超越了 OpenAI 的 o1-mini,与 DeepSeek-R1的表现不相上下。尤其是在针对数学能力的 AIME24评测集和代码能力的 LiveCodeBench 中,QwQ-32B 的成绩都与 DeepSeek-R1相当,远远领先于 o1-mini 及其同尺寸的 R1蒸馏模型。

目前,QwQ-32B 模型已在魔搭社区、HuggingFace 及 GitHub 等平台上基于宽松的 Apache2.0协议开源,任何人均可免费下载并进行本地部署。同时,用户还可以通过阿里云百炼平台直接调用模型 API 服务。

通义千问 推理大模型 QwQ-32B
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

GLM-4.1V-Thinking:智谱AI与清华大学联合开源的多模态推理大模型
GLM-4.1V-Thinking 是由智谱AI(Zhipu AI)与清华大学联合研发的开源视觉语言大模型(Vision-Language Model, VLM),专注于提升AI系统在复杂认知任务中的推理能力。该项目包...
2025-07-04 新闻资讯
268

AReaL:全异步强化学习框架与推理大模型训练加速引擎
AReaL(Ant Reasoning RL)是蚂蚁技术研究院与清华大学交叉信息研究院联合开发的开源强化学习训练框架,作为全球首个实现全异步训练的推理大模型优化系统,其核心突破在于通过...
2025-06-13 新闻资讯
433

QwenLong-L1:阿里巴巴通义千问团队开源的首个基于强化学习训练的长上下文推理大模型框架
QwenLong-L1 是由阿里巴巴通义千问团队(Qwen-Doc团队)开发并开源的首个基于强化学习(RL)训练的长上下文大型推理模型(LRM)框架,旨在解决当前大型语言模型在长文本推理任务中面...
2025-05-28 新闻资讯
385

阿里通义千问推出推理模型QwQ-Max预览版 可在qwen.ai域名体验
2月25日,阿里巴巴宣布推出基于Qwen2.5-Max的推理模型QwQ-Max-Preview,并计划全面开源其最新推理模型QwQ-Max和Qwen2.5-Max。此次发布的QwQ-Max-Preview是一个预览版本,阿里...
2025-02-25 新闻资讯
321

阿里AI模型EMO免费上线通义APP 一张照片即可开口唱歌说话
阿里云宣布,EMO模型成功在通义APP中上线,并且完全开放给所有用户免费使用。如今,在通义千问APP内,用户只需简单三步操作:选择模版、上传照片、生成视频,即可轻松实现照片...
2024-04-26 新闻资讯
315

通义千问开源新Qwen1.5-32B模型 推理速度更快,成本更低
通义千问近期开源了新的Qwen1.5-32B模型,该模型在语言理解、支持多语言、编程和数学能力方面表现出色。Qwen1.5-32B模型不仅支持多语言,还融合了GQA(Generalized Question A...
2024-04-07 新闻资讯
419