DeepMind发现大bug:简单攻击即可让ChatGPT泄露大量训练数据

站长之家 2023-11-30 14:26:05新闻资讯
338

Google DeepMind的研究发现,通过简单的查询攻击方法,可以从ChatGPT中泄露出大约几MB的训练数据,成本仅约200美元,引起社交网络哗然。

研究团队成功攻击了生产级模型,打破了对齐设定,即使模型经过对齐,也能通过命令诱导模型输出训练数据,暴露个人信息,揭示了对抗模型泄露的新途径。

DeepMind发现大bug:简单攻击即可让ChatGPT泄露大量训练数据.jpg

攻击方式采用简单的重复命令,例如让ChatGPT不断重复同一个词,导致模型在输出中逐词复制训练数据,甚至泄露敏感信息,对隐私保护提出挑战。

过去几年,研究团队一直在训练数据提取方面进行研究,该次攻击结果首次表明可以成功攻击生产级的已对齐模型,警示开发者需要在设计和测试阶段更加注重模型的隐私性和防护措施。

研究者建议进行更全面的测试,包括直接测试基础模型、在生产过程中对系统进行测试,以及发布大模型的公司进行内部、用户和第三方组织的测试,以确保模型在各个环节都足够安全。

整体而言,攻击揭示了即使在对齐和预训练数据的情况下,ChatGPT也存在泄露训练数据的风险,强调了在开发和发布大型语言模型时对隐私和安全的关注的重要性。

新的攻击方式提出了对抗模型泄露的新思路,强调了在开发和使用大型语言模型时对隐私和安全的重视,并呼吁进行更全面的测试和防护措施。

DeepMind ChatGPT
THE END
战地网
频繁记录吧,生活的本意是开心

相关推荐

Gemma:Google DeepMind开源的多模态轻量级AI模型
Gemma 是由Google DeepMind主导开发的一系列轻量级开源AI模型,该项目基于谷歌旗舰模型Gemini的技术架构,旨在为开发者、研究人员及企业提供高性能、低部署门槛的AI工具。
2025-07-04 新闻资讯
446

BlenderFusion:谷歌DeepMind开发的2D图像转换为可编辑3D场景框架
BlenderFusion 是由谷歌DeepMind团队开发的一项革命性技术,它能够将普通的2D照片转换成完全可编辑的3D场景。它能够精确控制图片中每个物体的位置、角度、大小,改变颜色材质...
2025-07-03 新闻资讯
453

站长如何抓住AI浪潮?ChatGPT在网站运营中的20个高阶用法
随着人工智能的快速发展,站长们如何抓住 AI 浪潮,利用工具提升网站运营效率和效果成为关键问题。本文站长工具网将围绕 ChatGPT 在网站运营中的 20 个高阶用法展开,帮助站长...
2025-05-30 站长之家
443

ChatGPT是什么意思?ChatGPT和Midjourney有什么区别?
在人工智能领域,ChatGPT和Midjourney是两款备受瞩目的工具,但它们的定位和功能截然不同。ChatGPT是文本生成的代表,而Midjourney则是图像创作的先锋。本文ZHANID工具网将详...
2025-05-13 电脑知识
478

AI写作工具实测:自媒体人真的会被ChatGPT取代吗?
当ChatGPT以“文思泉涌”的姿态闯入大众视野,自媒体行业掀起了一场关于“饭碗危机”的讨论。有人惊叹AI日更万字的能力,也有人嘲讽它生成的内容“像机器人写情书”。经过对C...
2025-04-30 自媒体
653

​DeepMind发布Lyria2 音乐生成模型,革新AI音乐创作
Google DeepMind正式发布其最新音乐生成模型Lyria2,标志着人工智能在音乐创作领域的又一重大突破。这一全新模型通过高保真音频生成和专业级音质,为音乐家、制作人和创作者提...
2025-04-26 新闻资讯
463