2月13日,OpenAI宣布为ChatGPT新增高级安全设置,以应对日益增长的安全风险,特别是“提示注入”攻击。这种攻击通过误导AI执行恶意指令或泄露敏感信息。为此,OpenAI推出两项新防护措施:一是“LockdownMode(锁定模式)”,主要面向高风险用户,如大型组织高管或安全团队,通过限制ChatGPT与外部系统交互降低数据泄露风险;二是在ChatGPT、ChatGPTAtlas与Codex中新增“ElevatedRisk”风险标签,统一标注可能引入额外风险的功能。
锁定模式下,ChatGPT的网页浏览功能将限制为仅访问已缓存内容,防止敏感数据在浏览过程中被攻击者获取。对于无法提供强确定性数据安全保证的功能,锁定模式下会直接禁用。目前,锁定模式适用于ChatGPTEnterprise、ChatGPTEdu、ChatGPTforHealthcare与ChatGPTforTeachers,管理员可在WorkspaceSettings中通过创建新角色启用。OpenAI计划未来几个月将锁定模式提供给消费者用户。
OpenAI还在产品内为可能引入额外风险的功能提供使用指引,通过“ElevatedRisk”标签让用户自行决定是否使用这些功能,尤其是在处理个人私密数据时。例如,在Codex编程助手产品中,开发者可以授予Codex网络访问权限,但相关设置界面将显示“风险提升”标签,并提供明确说明。

