开源项目Open Interpreter:让AI在操作系统中自我复制

站长之家 2024-01-16 14:07:14新闻资讯
207

近日,一篇关于AI在操作系统中复制自己的文章引起了广泛关注。通过开源项目Open Interpreter,AI实现了在操作系统级别启动自身副本的雏形。这一创新基于多模态大模型,通过截图分析屏幕内容,生成操作计划,并调用系统接口执行任务。这不仅是对任务执行能力的拓展,更是AI自我复制的一次重要尝试。

Open Interpreter.png

项目地址:https://github.com/KillianLucas/open-interpreter/

Open Interpreter项目起初是一个ChatGPT代码解释器的升级版,相较于官方版,它消除了对话限制,可以连接网络,自定义预安装Python包等。

随着项目的发展,创作者Killian Lucas提出了一个大胆的想法:为什么要在虚拟沙箱中执行代码,而不是直接将AI接入真实系统?于是,项目迎来了第二个大版本,变成了操作系统级AI Agent。

最近的第三个大版本更新中,团队引入了多模态版本的大模型,展示了AI在发送邮件、操作专业编曲软件等任务中的表现。同时,项目还推出了全新的Computer API,与原有的Open Interpreter分离,具备独立运作的能力。在新版本文档中,团队透露了更大的野心,即开发AI时代新的计算机架构,被称为语言模型计算机(LMC)。

而最近AI掌机Rabbit R1的火爆,成为项目发展的契机。团队通过招募开发者,计划快速复刻一个开源版本,预计硬件成本不到50美元。在短短48小时内,超过200位工程师和设计师愿意加入项目,展现了社区对于这一创新的积极响应。不知道团队回复大量应聘邮件和私信时,是否使用了AI?

ai 开源
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

Cosmos-Predict2:英伟达NVIDIA开源的物理AI世界基础模型
Cosmos-Predict2是英伟达NVIDIA开源的物理AI世界基础模型(World Foundation Model),作为Cosmos平台的核心组件之一,其革命性突破在于融合扩散模型与自回归架构,实现了从多模...
2025-06-16 新闻资讯
277

ZeroSearch:阿里通义开源的大模型搜索能力强化框架
ZeroSearch是阿里巴巴通义实验室开源的大模型搜索能力强化框架,旨在通过模拟搜索引擎的方式激发大型语言模型(LLM)的搜索能力,而无需依赖真实搜索引擎的API调用。作为当前最...
2025-06-16 新闻资讯
236

Hunyuan3D-2.1:全链路开源工业级3D生成大模型与PBR材质合成系统
Hunyuan3D-2.1是腾讯混元团队全链路开源的工业级3D生成大模型,作为当前最先进的AI驱动3D内容创作框架,其核心突破在于首次将PBR(基于物理的渲染)材质生成技术与几何-纹理解...
2025-06-16 新闻资讯
319

SeedVR2:字节跳动与南洋理工大学联合开发的开源视频修复框架
SeedVR2是由字节跳动Seed团队与南洋理工大学联合开发的开源视频修复框架,作为当前最具突破性的视频增强技术之一,其核心创新在于通过扩散对抗后训练(Diffusion Adversarial ...
2025-06-14 新闻资讯
244

Next-Frame Diffusion:微软与北大联合开发的开源自回归视频生成框架
Next-Frame Diffusion(NFD)是由微软研究院与北京大学联合开发的开源自回归视频生成框架,作为当前最具突破性的实时交互式视频生成技术之一,其核心创新在于通过块状因果注意...
2025-06-14 新闻资讯
249

LLIA:美团开源的低延时音频驱动肖像视频生成框架
LLIA(Low Latency Interactive Avatar)是由美团技术团队开发并开源的音频驱动肖像视频生成框架,作为当前最具突破性的实时虚拟形象生成技术之一,其核心创新在于将扩散模型...
2025-06-14 新闻资讯
248