斯坦福团队大模型Octopus v2火了:手机就能运行 准确性超越GPT-4

站长之家 2024-04-07 16:01:31新闻资讯
196

近日,斯坦福大学研究人员发布的 Octopus v2模型引起了开发者社区的极大关注,其20亿参数的模型一夜下载量超过2k。

Octopus v2.png

这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行,并在准确性和延迟方面表现超越了 GPT-4,同时将上下文长度减少了95%。Octopus v2还比 Llama7B + RAG 方案快了整整36倍,展示了端侧 AI 智能体的崛起。

Octopus v2的设计独特之处在于其函数性 token 策略,使其能够实现与 GPT-4相当的性能水平,同时大幅提高推理速度,超越基于 RAG 的方法,对边缘计算设备特别有利。模型在生成单独的、嵌套的和并行的函数调用时表现优异。为了训练该模型,研究团队采用了高质量数据集,并使用 Google Gemma-2B 作为预训练模型框架。训练过程中采用了完整模型训练和 LoRA 模型训练两种方法,展现了 Octopus v2在推理速度和准确性方面的优异表现。

在基准测试中,Octopus v2表现出卓越的推理速度,比 Llama7B + RAG 解决方案快36倍,在准确率上也超越了其他方案。这种效率和性能的提升归功于 Octopus v2的函数性 token 设计,使其成为端侧设备上极具竞争力的 AI 智能体。设备端 AI 智能体时代即将到来,Octopus v2的发布为这一趋势注入了新的活力。

论文:https://arxiv.org/abs/2404.01744

产品入口:https://huggingface.co/NexaAIDev/Octopus-v2

ai
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Insert Anything:基于上下文感知扩散变换器的图像插入解决方案
Insert Anything是由浙江大学、哈佛大学与南洋理工大学联合开发的开源图像编辑框架,专注于通过上下文感知扩散变换器(Diffusion Transformer, DiT)实现图像内容的精准插入。...
2025-05-09 新闻资讯
231

ACE-Step:ACE Studio 和 StepFun开源的音乐生成基础模型
ACE-Step 是一个革命性的开源音乐生成基础模型,旨在通过其全面的架构设计克服现有方法的局限性,并在音乐生成领域实现最先进的性能。该项目由 ACE Studio 和 StepFun 共同领...
2025-05-07 新闻资讯
259

国内AI大模型有哪些?12家主流模型技术特点与行业应用深度盘点
中国AI大模型产业正以“百模大战”之势加速迭代,从通用基座到垂直领域,从文本生成到多模态交互,技术突破与商业落地齐头并进。本文深度解析国内12大主流AI大模型,揭示其技...
2025-04-28 电脑知识
687

本地部署大模型必知:llama、ollama与llama.cpp的区别详解
在本地部署大型语言模型(LLM)时,Llama、Ollama和Llama.cpp是三个高频出现的关键词。三者看似关联紧密,但定位与功能差异显著。本文ZHANID工具网将从技术架构、应用场景、性...
2025-04-28 编程技术
366

Step1X-Edit:阶跃星辰开源的AI图像编辑大模型
Step1X-Edit是由阶跃星辰团队研发的开源图像编辑大模型,其技术架构由70亿参数的多模态大型语言模型(MLLM)与120亿参数的扩散图像Transformer(DiT)构成。这一设计实现了自...
2025-04-28 新闻资讯
280

LiveCC:字节跳动与新加坡国立大学联合开源的实时视频解说大模型
LiveCC是一个开源的实时视频解说大模型,由字节跳动与新加坡国立大学合作推出。该项目基于Qwen2-VL-7B模型开发,通过大规模流式语音文本学习,实现了视频内容的实时理解与解说...
2025-04-27 新闻资讯
261