ai大模型
Baichuan-M2是百川智能开源的医疗增强大模型,标志着中国在医疗人工智能领域实现从"追赶者"到"引领者"的关键跨越。作为一款专为医疗场景设计的轻量化大模型,Baichuan-M2以32...
2025-08-12
新闻资讯
821
MiDashengLM 是小米集团旗下"MiLM Plus"团队于2025年8月4日正式发布并全量开源的声音理解大模型,该模型以Xiaomi Dasheng音频编码器为核心,结合Qwen2.5-Omni-7B Thinker自回...
2025-08-05
新闻资讯
957
HYPIR(High-Performance Image Restoration)是由中国科学院深圳先进技术研究院董超研究员团队开发的图像复原大模型,该项目通过创新的技术路线,解决了传统图像复原领域长期...
2025-07-31
新闻资讯
1562
Intern-S1是上海人工智能实验室(Shanghai AI Laboratory)发布的一款先进的开源多模态科学大模型,属于"书生"大模型家族的最新成员。作为首个融合专业科学能力的开源通用模型...
2025-07-29
新闻资讯
1009
Kimi-K2 是月之暗面科技(MoonshotAI)推出的新一代基础大模型,属于该公司Kimi系列模型的最新迭代版本。项目包含两个主要开源版本:Kimi-K2-Base(基础预训练模型)和Kimi-K2-In...
2025-07-15
新闻资讯
1152
HumanOmniV2是阿里巴巴集团旗下通义实验室(Tongyi Lab)开源的多模态大语言模型,代表了当前人工智能领域在多模态推理与复杂意图理解方面的最前沿技术成果。作为HumanOmni系...
2025-07-10
新闻资讯
854
GLM-4.1V-Thinking 是由智谱AI(Zhipu AI)与清华大学联合研发的开源视觉语言大模型(Vision-Language Model, VLM),专注于提升AI系统在复杂认知任务中的推理能力。该项目包...
2025-07-04
新闻资讯
811
Kwai Keye-VL是快手公司自主研发并开源的一款多模态大语言模型,代表了当前视频理解与复杂推理领域的最前沿技术成果。作为基于Qwen3-8B语言模型构建的多模态系统,Kwai Keye-...
2025-06-27
新闻资讯
948
Stream-Omni是一款先进的大型语言-视觉-语音模型(LMM),旨在实现同时多模态交互,支持文本、视觉(图像/视频)和语音模态的灵活组合输入与输出。作为GPT-4o类多模态模型的创...
2025-06-22
新闻资讯
746
MindOmni是腾讯ARC Lab联合清华大学、香港中文大学和香港大学推出的统一多模态大语言模型,旨在突破传统文本到图像系统在处理多模态输入和复杂推理任务时的局限性。作为当前最...
2025-06-22
新闻资讯
729
SongGeneration是腾讯AI Lab开源的文本到音乐生成大模型,作为当前最具突破性的AI音乐创作工具之一,其核心创新在于融合LLM(大语言模型)与DiT(扩散变换器)架构,首次实现...
2025-06-21
新闻资讯
1027
QwenLong-L1 是由阿里巴巴通义千问团队(Qwen-Doc团队)开发并开源的首个基于强化学习(RL)训练的长上下文大型推理模型(LRM)框架,旨在解决当前大型语言模型在长文本推理任务中面...
2025-05-28
新闻资讯
835
Step1X-Edit是由阶跃星辰团队研发的开源图像编辑大模型,其技术架构由70亿参数的多模态大型语言模型(MLLM)与120亿参数的扩散图像Transformer(DiT)构成。这一设计实现了自...
2025-04-28
新闻资讯
1024
CosyVoice是阿里通义实验室研发的一款功能强大的语音合成(Text-To-Speech, TTS)大模型。作为阿里巴巴集团在AI语音技术领域的一项重要成果,CosyVoice不仅整合了多种实用功能,...
2025-02-22
新闻资讯
1260
DeepSeek 的横空出世让更多的人打开了对AI大模型的认知,但是同时也带来了更多甜蜜的烦恼,AI大模型究竟该如何解锁其正确的使用姿势?如何向AI大模型提问才能得到我想要的回答...
2025-02-19
编程技术
2486













