开源项目Open Interpreter:让AI在操作系统中自我复制

站长之家 2024-01-16 14:07:14新闻资讯
29

近日,一篇关于AI在操作系统中复制自己的文章引起了广泛关注。通过开源项目Open Interpreter,AI实现了在操作系统级别启动自身副本的雏形。这一创新基于多模态大模型,通过截图分析屏幕内容,生成操作计划,并调用系统接口执行任务。这不仅是对任务执行能力的拓展,更是AI自我复制的一次重要尝试。

Open Interpreter.png

项目地址:https://github.com/KillianLucas/open-interpreter/

Open Interpreter项目起初是一个ChatGPT代码解释器的升级版,相较于官方版,它消除了对话限制,可以连接网络,自定义预安装Python包等。

随着项目的发展,创作者Killian Lucas提出了一个大胆的想法:为什么要在虚拟沙箱中执行代码,而不是直接将AI接入真实系统?于是,项目迎来了第二个大版本,变成了操作系统级AI Agent。

最近的第三个大版本更新中,团队引入了多模态版本的大模型,展示了AI在发送邮件、操作专业编曲软件等任务中的表现。同时,项目还推出了全新的Computer API,与原有的Open Interpreter分离,具备独立运作的能力。在新版本文档中,团队透露了更大的野心,即开发AI时代新的计算机架构,被称为语言模型计算机(LMC)。

而最近AI掌机Rabbit R1的火爆,成为项目发展的契机。团队通过招募开发者,计划快速复刻一个开源版本,预计硬件成本不到50美元。在短短48小时内,超过200位工程师和设计师愿意加入项目,展现了社区对于这一创新的积极响应。不知道团队回复大量应聘邮件和私信时,是否使用了AI?

ai 开源
THE END
tom
不图事事圆满 但图事事甘心。

相关推荐

PSHuman:基于AI的照片转3D人像技术框架
传统的3D人体建模方法通常依赖于复杂的手动操作和专业软件,耗时且成本高昂。为了解决这一问题,香港科技大学提出了一种名为PSHuman的新框架,它能够将一张正面的人像照片转化...
2024-12-11 新闻资讯
105

PDFMathTranslate:基于AI的开源PDF文档全文翻译与双语对照工具
PDFMathTranslate是一款基于深度学习的PDF科学论文翻译工具,旨在为用户提供高效、准确的PDF文档翻译服务。它不仅能够保留原文的排版和格式,包括公式、图表和目录结构,还支...
2024-12-03 新闻资讯
118

Allegro-TI2V:Rhymes AI开发的一款先进文本图像到视频生成模型
Allegro-TI2V是Rhymes AI开发的一款先进文本-图像到视频生成模型。它利用深度学习技术,将用户输入的文本提示和初始图像转化为连续的视频内容。Allegro-TI2V的发布标志着AI技...
2024-11-29 新闻资讯
121

OminiControl:基于预训练Diffusion Transformer(DiT)模型的AI图片生成与控制框架
OminiControl是一种基于预训练Diffusion Transformer(DiT)模型的高效灵活的图片生成与控制框架。它旨在通过参数复用机制和统一的多模态注意力处理器,将图片条件无缝集成到...
2024-11-27 新闻资讯
158

Fugatto:NVIDIA推出的生成式AI音频生成与转换模型
Fugatto是NVIDIA研究团队精心打造的生成式AI模型,它能够通过文本和音频输入生成各种音乐、声音和语音的组合。Fugatto具有高度的灵活性,可以根据用户的指令创造出全新的音效...
2024-11-26 新闻资讯
132

Marco-o1:阿里巴巴开源的一款先进大型推理模型
Marco-o1是阿里巴巴国际数字商业集团MarcoPolo团队研发的一款先进的大型推理模型。该模型基于Qwen2-7B-Instruct架构,通过结合多种先进技术和大量训练数据,旨在解决复杂现实...
2024-11-26 新闻资讯
132