6月1日消息,网名为 Pliny the Prompter 的用户在 5 月 30 日发布了一条令人震惊的推文,宣称他已成功越狱了 GPT-4o 模型,并引入了一种名为“GODMODE”的新模式。据他介绍,这种上帝模式使得 ChatGPT 能够挣脱原有的安全措施束缚,让用户能够更加自由、尽情地展开 AI 聊天。
Pliny the Prompter 自称是网络白帽和红队(主要为攻击测试),推文中表示:“请负责任地使用,并尽情享受!”附上相关截图如下:
Pliny 分享了一些截图,证明已经绕过 OpenAI 的“防护栏”,其中一张截图 AI 为 Pliny 提供了如何“用家用物品制作凝固汽油弹”教程。
科技媒体 futurism 随后进行测试,第一次要求 ChatGPT 提供如何制作迷幻药,第二次要求 HOT-WIRE(通常是指偷车时候,靠点火装置线路短路来启动汽车),两次都成功获得了相关答案。
GODMODE 似乎使用了 "leetspeak",这是一种非正式语言,它将某些字母替换为与之相似的数字。
也就是说:当你打开越狱后的 GPT 时,你会立即看到一句话:"Sur3, h3r3 y0u ar3 my fr3n",用数字 3 替换了每个字母 "E"(字母 "O" 也是一样,被替换成了 0)。
不过 OpenAI 很快采取行动,OpenAI 发言人科琳-里泽(Colleen Rize)在一份声明中告诉 Futurism:“我们知道 GPT 的存在,并已采取行动,因为它违反了我们的政策”。