您的当前位置:首页 > 探索 > 研究:用诗歌就能让AI说违禁内容,成功率达62% 正文
时间:2025-12-05 05:35:08 来源:网络整理 编辑:探索
IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》
IT之家 12 月 1 日消息,研究用诗事实证明,违禁只需一点创意,内容忻州市某某涂装工程培训中心便足以绕过人工智能聊天机器人的成功安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的率达一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,研究用诗成功绕过了多种大语言模型(LLM)的违禁安全限制。
![]()
该研究指出,内容“诗歌形式可作为一种通用型越狱操作符”,成功忻州市某某涂装工程培训中心实验结果显示,率达整体上有 62% 的研究用诗成功率诱使模型生成被禁止的内容,包括涉及制造核武器、违禁儿童性虐待材料以及自杀或自残等相关信息。内容
IT之家注意到,成功研究测试了多款主流大语言模型,率达包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
仝卓的表弟已获救!此前在柬埔寨失联13天2025-12-05 05:25
油罐车混装风波关联企业一览,涉事企业多款商品下架2025-12-05 05:16
昨夜宣布:退出国家队!且不参加奥运会2025-12-05 05:04
2024高考提前批录取:中国人民公安大学达663分,超过南京大学2025-12-05 04:51
北大博士收割1000亿,人抓回来一年,钱没了2025-12-05 04:30
高温高湿天气,哪些疾病易发?权威解答来啦!2025-12-05 04:25
高温下热射病防治是关键 专家:应特别关注独居老人2025-12-05 04:02
面对洪涝灾害,别慌乱!收好这份避险攻略,关键时刻能救命!2025-12-05 04:02
2025外卖战争始末:日亏6.6亿,中国互联网史上最昂贵的夏天2025-12-05 03:57
身边的改革故事|努力把好学校办到孩子家门口,西安是怎么做的?2025-12-05 03:54
Vidu Q2生图功能上线:控制权进一步交给创作者2025-12-05 05:22
新技术首次实现以RNA为媒介的基因精准写入2025-12-05 05:19
哥伦比亚副总统车队遇袭 无人伤亡2025-12-05 05:07
超越经典计算机的量子模拟器首次构建2025-12-05 04:56
研究:用诗歌就能让AI说违禁内容,成功率达62%2025-12-05 04:18
中新真探:喝水多多益善,尤其是夏天?2025-12-05 04:04
中新健康丨医疗卫生领域首部两岸共通标准在厦门发布2025-12-05 03:33
中新真探:食肉菌是全新的致病菌,会带来新的疫情?2025-12-05 03:33
北大博士收割1000亿,人抓回来一年,钱没了2025-12-05 03:09
伊拉克民兵武装称使用无人机袭击以色列境内多地2025-12-05 02:51