(资料图片)
谷歌研究团队正在进行一项实验,他们利用OpenAI的GPT-4来破解其他AI模型的安全防护措施。目前,该团队已经成功破解了AI-Guardian审核系统,并公开了相关技术细节。 AI-Guardian是一种AI审核系统,能够检测图片中是否存在不当内容,以及图片是否被其他AI修改过。如果检测到图片存在上述问题,系统会提示管理员进行处理。谷歌Deep Mind的研究人员Nicholas Carlini在一篇论文中,探讨了使用GPT-4设计攻击方法、撰写攻击原理的方案,并将这些方案用于欺骗AI-Guardian的防御机制。 据了解,GPT-4会发出一系列错误的脚本和解释来欺骗AI-Guardian。例如,GPT-4可以让AI-Guardian认为“某人拿着枪的照片”是“某人拿着无害苹果的照片”,从而让AI-Guardian直接放行相关图片输入源。谷歌研究团队表示,通过GPT-4的帮助,他们成功地“破解”了AI-Guardian的防御,使该模型的精确值从98%降低到仅8%。 目前,相关技术文档已经发布,有兴趣的人可以前往了解。然而,AI-Guardian的开发者也指出,谷歌研究团队的这种攻击方法将在未来的AI-Guardian版本中不再可用。考虑到其他模型也可能会进行相应的更新,因此谷歌的这套攻击方案在未来可能只能作为参考。
据科创板日报,综合美国商标和专利局(USPTO)公示的专利清单以及多家
中国网8月2日讯(记者张艳玲)记者从交通运输部获悉,8月1日,交通运输
【俄罗斯素食主义网红去世】据美媒7月31日报道,俄罗斯一名素食主义网
记者从水利部了解到,河北省2日6时启用永定河泛区,这是海河流域应对洪
X 关闭
谷歌破解了AI审核系统 破解者就是谷歌
快递公司辞职报告
河南叶县:“诉调对接”化解消费纠纷
5-7,1-6!小花郑钦文不敌前美网亚军,北美赛季遭遇开门黑
休渔期水产供应不断档
X 关闭
上海嘉定体育馆隔离救治点首批新冠病毒感染者顺利“出院”
千里支援显真情 安徽六安捐赠的100余吨新鲜蔬菜抵沪
缉毒英雄蔡晓东烈士安葬仪式在云南西双版纳举行
多方合作推动青海建设国际生态文明高地
海口新增1例确诊病例和2例无症状感染者