大语言模型
一、Seed-OSS是什么?Seed-OSS是字节跳动Seed团队开源的大语言模型系列,标志着字节跳动首次进军开源大模型赛道。这一系列模型以其360亿参数的规模、原生512K超长上下文支持...
2025-08-22
新闻资讯
946
Klear-Reasoner 是由快手Klear团队开发的一款专注于复杂推理任务的开源大语言模型,基于Qwen3-8B-Base架构构建,在数学推导和代码生成等需要长链逻辑推理的领域展现出卓越性能...
2025-08-20
新闻资讯
945
GPT-OSS(Open-Source Series)是OpenAI发布的两款开源大型语言模型系列,包括GPT-OSS-120B和GPT-OSS-20B两个版本。这是OpenAI自2019年发布GPT-2以来,时隔6年首次回归开源阵...
2025-08-07
新闻资讯
878
XBai-o4 是由国内AI厂商"问小白"推出的第四代开源大语言模型,其核心创新在于引入了独创的"反思型生成范式"(Reflective Generative Form)架构,通过深度融合Long-CoT强化学习...
2025-08-05
新闻资讯
998
Kwai Keye-VL是快手公司自主研发并开源的一款多模态大语言模型,代表了当前视频理解与复杂推理领域的最前沿技术成果。作为基于Qwen3-8B语言模型构建的多模态系统,Kwai Keye-...
2025-06-27
新闻资讯
948
MiniCPM是由清华大学自然语言处理实验室与面壁智能联合开发的端侧大语言模型系列,定位为“小钢炮”模型,以极低参数量(0.5B-8B)实现接近百亿级模型的性能。项目核心目标是...
2025-06-09
新闻资讯
893
Ming-Lite-Omni是蚂蚁集团百灵大模型团队(InclusionAI)开源的一款原生全模态多模态大语言模型(MLLM),基于MoE(Mixture of Experts)架构设计,总参数18B,激活参数3B。作为蚂蚁...
2025-05-30
新闻资讯
679
PocketFlow是由The-Pocket团队开发的开源极简大型语言模型(LLM)框架,其核心代码仅用100行Python实现,却完整支持多智能体协作、工作流编排和检索增强生成(RAG)等复杂功能...
2025-05-26
新闻资讯
629
R1-Omni是阿里通义团队研发并开源的全模态大语言模型,它采用了强化学习中的RLVR(Reinforcement Learning with Verifiable Reward)训练范式,并结合了GRPO(Generative Rel...
2025-03-12
新闻资讯
636
Ollama是一个专为Python开发者设计的库,它提供了简洁而强大的API接口,使得调用本地大语言模型变得前所未有的轻松。无论是进行文本生成、问题回答,还是构建复杂的AI应用,O...
2025-02-16
编程技术
880
Sonus-1是Sonus AI推出的一系列高性能大语言模型。该系列模型包括三个版本:Sonus-1 Mini、Sonus-1 Air和Sonus-1 Pro。这些模型旨在满足不同应用场景和性能需求,从快速响应的...
2025-01-07
新闻资讯
722
随着人工智能技术的不断发展,生成式语言模型在各个领域的应用日益广泛。然而,这些模型在从训练到实际应用的过程中面临着诸多挑战。其中,如何在推理阶段使模型达到最佳表现...
2025-01-03
新闻资讯
547
Claude是Anthropic公司基于Transformer架构开发的大规模语言模型。它通过大量的文本数据进行训练,能够执行各种自然语言处理任务,包括文本生成、问答、翻译、摘要等。Claude...
2024-08-15
新闻资讯
964
LM Studio是一款革命性的桌面应用程序,旨在让用户在自己的计算机上本地运行、管理和部署大型语言模型(LLMs)。它提供了一个直观且强大的平台,使得研究人员、开发者以及普通...
2025-02-11
电脑软件
453













