ai模型


HunyuanVideo-Foley:腾讯混元团队开源的一款端到端视频音效生成模型
HunyuanVideo-Foley 是腾讯混元团队研发并开源的一款端到端视频音效生成模型,其核心使命是通过人工智能技术,为无声视频自动生成高质量、高同步的音效与背景音乐,打造真正意...
2025-08-29 新闻资讯
778

Seed-OSS:原生512K长上下文与可控推理的开源大语言模型
一、Seed-OSS是什么?Seed-OSS是字节跳动Seed团队开源的大语言模型系列,标志着字节跳动首次进军开源大模型赛道。这一系列模型以其360亿参数的规模、原生512K超长上下文支持...
2025-08-22 新闻资讯
775

RynnEC:阿里达摩院开源的一款专为具身智能设计的世界理解模型
RynnEC是阿里巴巴达摩院开源的一款专为具身智能设计的世界理解模型,属于多模态大语言模型(MLLM)范畴。其核心目标是赋予AI系统对物理世界的深度理解能力,使机器人或智能体...
2025-08-13 新闻资讯
671

RynnVLA-001:基于视频生成与人体轨迹预训练的视觉-语言-动作模型
RynnVLA-001是阿里巴巴达摩院自主研发并开源的视觉-语言-动作(Vision-Language-Action, VLA)模型,专为具身智能(Embodied AI)场景设计。该项目通过大规模第一人称视角视频...
2025-08-13 新闻资讯
725

GPT-OSS:OpenAI开源的高效稀疏激活大语言模型
GPT-OSS(Open-Source Series)是OpenAI发布的两款开源大型语言模型系列,包括GPT-OSS-120B和GPT-OSS-20B两个版本。这是OpenAI自2019年发布GPT-2以来,时隔6年首次回归开源阵...
2025-08-07 新闻资讯
724

Qwen-Image:阿里巴巴通义千问开源的首个图像生成基础模型
Qwen-Image 是阿里巴巴通义千问团队开源的首个图像生成基础模型,属于Qwen系列的重要成员。作为一个200亿参数的多模态扩散变换器(MMDiT)模型,它在复杂文本渲染和精确图像编...
2025-08-06 新闻资讯
678

ARC-Hunyuan-Video-7B:腾讯开源的多模态短视频理解与生成模型
ARC-Hunyuan-Video-7B 是腾讯ARC实验室于2025年7月开源的多模态大模型,专注于现实世界短视频的结构化理解与生成。该模型以端到端方式融合视觉、音频和文本信号,具备多粒度时...
2025-08-01 新闻资讯
662

Skywork UniPic:昆仑万维开源的一款多模态统一预训练模型
Skywork UniPic 是昆仑万维开源的一款多模态统一预训练模型,它采用自回归范式,在单一模型中实现了图像理解、文本到图像生成和图像编辑三大核心能力的深度融合。与传统的多模...
2025-07-31 新闻资讯
550

Orthus:基于自回归Transformer的无损图文交错生成与理解模型
Orthus是由快手与上海交通大学联合研发的一款统一多模态生成理解模型,基于自回归Transformer架构,能够高效处理图文交错数据的生成与理解任务。Orthus的核心创新在于解决了现...
2025-07-30 新闻资讯
655

Voxtral:Mistral AI推出的首款开源语音理解模型
Voxtral 是Mistral AI开发的开源语音理解模型系列,被定位为"首个能在真实业务场景中落地的'可用语音智能'开源模型"。它从根本上解决了开发者在语音处理领域长期面...
2025-07-17 新闻资讯
437

RoboBrain2.0:北京智源研究院联合北京大学团队开源的具身视觉语言基础模型
RoboBrain2.0是由北京智源研究院联合北京大学团队开发的全球最强开源具身视觉语言基础模型,代表了当前具身智能领域的最前沿技术成果。作为第二代具身大脑大模型,它旨在统一...
2025-07-15 新闻资讯
564

SmolLM:Hugging Face推出的轻量高效多语言长上下文推理模型
SmolLM 是Hugging Face推出的"小而精"语言模型系列,其名称"Smol"源于"Small"的变体,直指其"以小搏大"的核心设计哲学。该项目始于SmolLM2的发布,最初定位为资源受限设备(如...
2025-07-11 新闻资讯
645

DiffuCoder:苹果公司与香港大学联合研发的并行化代码生成模型
DiffuCoder是苹果公司与香港大学联合研发的一款革命性代码生成模型,它突破了传统自回归语言模型(如GPT系列)必须按顺序生成代码的限制,采用掩码扩散模型(Masked Diffusio...
2025-07-10 新闻资讯
608

OmniSVG:全球首个端到端多模态可缩放矢量图形(SVG)生成模型
OmniSVG 是由复旦大学与阶跃星辰(StepFun)联合研发的全球首个端到端多模态可缩放矢量图形(SVG)生成模型,代表了当前AI生成矢量图形领域的最前沿技术突破。作为一项开源项目,...
2025-07-10 新闻资讯
704

MetaStone-S1:融合深度推理与过程评分的反射生成模型
MetaStone-S1 是北京元石科技推出的反射生成式大模型,其核心创新在于提出了"反思型生成范式"(reflective generative paradigm),通过统一框架实现了推理生成与过程评估的协同...
2025-07-09 新闻资讯
675