AI击败AI:Google研究团队使用GPT-4击败AI-Guardian审查系统

干货分享7个月前更新 Youzhizhan
1,534 0


Google Deep Mind的研究员Nicholas Carlini在一篇题为”LLM-assisted growth OF AI-Guardian”的论文中讨论了使用GPT-4“设计攻击方法并编写攻击原则”,并利用这些程序欺骗了AI-Guardian的防御机制。

AI击败AI:Google研究团队使用GPT-4击败AI-Guardian审查系统

8月2日,据报道,谷歌研究团队正在进行一项实验。 他们使用OpenAI的GPT-4来打破其他AI模型的安全措施。,该团队现在已经打破了AI-Guardian审查系统,并分享了相关的技术细节

经过询问了解到,AI-Guardian是一款AI审核系统,可以检测图片中是否有不当内容,图片本身是否被其他AI修改过。 如果在图片中检测到上述迹象,则会提示管理员进行处理。

Google Deep Mind的研究员Nicholas Carlini在一篇题为”LLM-assisted growth OF AI-Guardian”的论文中讨论了使用GPT-4″设计攻击方法并编写攻击原则”,并利用这些程序欺骗了AI-Guardian的防御机制。

AI击败AI:Google研究团队使用GPT-4击败AI-Guardian审查系统

▲图片来源Google研究团队

据报道,GPT-4将发布一系列错误的脚本和解释来欺骗AI-Guardian,正如论文中提到的那样。,GPT-4允许AI-Guardian认为”有人拿枪的照片”是”有人拿着无害的苹果的照片”,允许AI-Guardian直接释放相关的图像输入源。。谷歌研究团队表示,在GPT-4的帮助下,他们成功地”破解”了AI-Guardian防御,将模型的准确性从98%降低到只有8%。

目前,相关技术文件已在arXiv上发表。 有兴趣的朋友可以去了解一下。,不过,AI-Guardian的开发者也指出,Google研究团队的这种攻击方式将在未来的AI-Guardian版本中不再可用。,考虑到其他机型也会跟进,所以Google目前的攻击计划只能在未来作参考。

[ad]
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...