网站导航

在线工具 网址大全 网站源码

ai大模型

BaiChuan-M2：百川智能推出的开源医疗增强大模型

Baichuan-M2是百川智能开源的医疗增强大模型，标志着中国在医疗人工智能领域实现从"追赶者"到"引领者"的关键跨越。作为一款专为医疗场景设计的轻量化大模型，Baichuan-M2以32...

2025-08-12 新闻资讯

940

MiDashengLM：小米开源的跨场景声音理解大模型

MiDashengLM 是小米集团旗下"MiLM Plus"团队于2025年8月4日正式发布并全量开源的声音理解大模型，该模型以Xiaomi Dasheng音频编码器为核心，结合Qwen2.5-Omni-7B Thinker自回...

2025-08-05 新闻资讯

1088

HYPIR：1.7秒实现8K超清图像复原的开源大模型

HYPIR（High-Performance Image Restoration）是由中国科学院深圳先进技术研究院董超研究员团队开发的图像复原大模型，该项目通过创新的技术路线，解决了传统图像复原领域长期...

2025-07-31 新闻资讯

1743

Intern-S1：上海人工智能实验室开源的多模态科学大模型

Intern-S1是上海人工智能实验室（Shanghai AI Laboratory）发布的一款先进的开源多模态科学大模型，属于"书生"大模型家族的最新成员。作为首个融合专业科学能力的开源通用模型...

2025-07-29 新闻资讯

1139

Kimi-K2：月之暗面(MoonshotAI)推出的新一代基础大模型

Kimi-K2 是月之暗面科技(MoonshotAI)推出的新一代基础大模型，属于该公司Kimi系列模型的最新迭代版本。项目包含两个主要开源版本：Kimi-K2-Base(基础预训练模型)和Kimi-K2-In...

2025-07-15 新闻资讯

1279

HumanOmniV2：阿里巴巴通义实验室开源的多模态大语言模型

HumanOmniV2是阿里巴巴集团旗下通义实验室（Tongyi Lab）开源的多模态大语言模型，代表了当前人工智能领域在多模态推理与复杂意图理解方面的最前沿技术成果。作为HumanOmni系...

2025-07-10 新闻资讯

985

GLM-4.1V-Thinking：智谱AI与清华大学联合开源的多模态推理大模型

GLM-4.1V-Thinking 是由智谱AI（Zhipu AI）与清华大学联合研发的开源视觉语言大模型（Vision-Language Model, VLM），专注于提升AI系统在复杂认知任务中的推理能力。该项目包...

2025-07-04 新闻资讯

919

Kwai Keye-VL：快手技术团队开源的多模态大语言模型

Kwai Keye-VL是快手公司自主研发并开源的一款多模态大语言模型，代表了当前视频理解与复杂推理领域的最前沿技术成果。作为基于Qwen3-8B语言模型构建的多模态系统，Kwai Keye-...

2025-06-27 新闻资讯

1086

Stream-Omni：支持语言-视觉-语音实时交互的统一多模态大模型

Stream-Omni是一款先进的大型语言-视觉-语音模型（LMM），旨在实现同时多模态交互，支持文本、视觉（图像/视频）和语音模态的灵活组合输入与输出。作为GPT-4o类多模态模型的创...

2025-06-22 新闻资讯

862

MindOmni：腾讯ARC Lab开源的推理增强型多模态生成大模型

MindOmni是腾讯ARC Lab联合清华大学、香港中文大学和香港大学推出的统一多模态大语言模型，旨在突破传统文本到图像系统在处理多模态输入和复杂推理任务时的局限性。作为当前最...

2025-06-22 新闻资讯

842

SongGeneration：腾讯AI Lab开源的文本到音乐生成大模型

SongGeneration是腾讯AI Lab开源的文本到音乐生成大模型，作为当前最具突破性的AI音乐创作工具之一，其核心创新在于融合LLM（大语言模型）与DiT（扩散变换器）架构，首次实现...

2025-06-21 新闻资讯

1133

QwenLong-L1：阿里巴巴通义千问团队开源的首个基于强化学习训练的长上下文推理大模型框架

QwenLong-L1 是由阿里巴巴通义千问团队(Qwen-Doc团队)开发并开源的首个基于强化学习(RL)训练的长上下文大型推理模型(LRM)框架，旨在解决当前大型语言模型在长文本推理任务中面...

2025-05-28 新闻资讯

920

Step1X-Edit：阶跃星辰开源的AI图像编辑大模型

Step1X-Edit是由阶跃星辰团队研发的开源图像编辑大模型，其技术架构由70亿参数的多模态大型语言模型（MLLM）与120亿参数的扩散图像Transformer（DiT）构成。这一设计实现了自...

2025-04-28 新闻资讯

1139

CosyVoice：阿里通义实验室开源的AI语音合成(TTS)大模型

CosyVoice是阿里通义实验室研发的一款功能强大的语音合成(Text-To-Speech, TTS)大模型。作为阿里巴巴集团在AI语音技术领域的一项重要成果，CosyVoice不仅整合了多种实用功能，...

2025-02-22 新闻资讯

1364

全面掌握AI大模型：DeepSeek 高级提示词技巧使用详解

DeepSeek 的横空出世让更多的人打开了对AI大模型的认知，但是同时也带来了更多甜蜜的烦恼，AI大模型究竟该如何解锁其正确的使用姿势？如何向AI大模型提问才能得到我想要的回答...

2025-02-19 编程技术

2634

图文资讯

图片压缩软件有哪些？5款免费好用的图片压缩软件推荐

软件下载

Cursor
下载
Cursor 是一款创新的AI代码编辑器...
Maye Lite
下载
Maye Lite是一个专注于文件快速...
微信开发者工具
下载
微信开发者工具是一款专门针对于...
图吧工具箱
下载
图吧工具箱是电脑系统和硬件维护...
ShareX
下载
ShareX是一款免费的开源程序，不...
HeyGem
下载
Heygem 是一款专为Windows系统设...