OpenAI 為旗下產品推出「鎖定模式」(Lockdown Mode),透過限制可連線至網際網路或外部服務的功能,協助保護敏感資料、防範「提示注入」(prompt injection)攻擊。
提示注入攻擊是一種以 AI 為中心的新型攻擊行為,有時甚至可被視為徹頭徹尾的駭客攻擊。攻擊者將惡意指令丟入提示詞或在 AI Agent 所讀取的內容中,不只竊取資料,甚至可能掌控使用者的一舉一動。
鎖定模式設計用意,是限制可能將敏感資料傳輸至攻擊者的對外網路請求,防止發生提示注入攻擊的最後資料外流階段。然而鎖定模式並不會阻止提示注入指令出現在 ChatGPT 所處理的內容中,舉例來說,提示注入指令仍有可能出現在已快取的網頁內容或上傳的檔案中,進而影響回應的行為或準確性,但不會將資料外流出去。
當啟用鎖定模式時,OpenAI 產品的以下功能將被停用:
- 即時網頁瀏覽。
- 圖片支援,也就是 ChatGPT 回應中不會顯示圖片;但使用者依然可以上傳圖片、生成圖片。
- 深度研究(Deep Research)。
- 以 Agent 身分運作。
- 與 Canvas 程式碼產生器進行串接。
- 檔案下載。
「鎖定模式並非設計給所有人使用,它是為需要處理敏感資料、希望針對與提示注入相關的資料外流風險有更嚴密防護的個人和組織所設計」,OpenAI 說明。
鎖定模式是一種被刻意簡化的使用體驗,當使用 ChatGPT 在內的 OpenAI 產品時,自己進行的操作敏感程度高到可能因提示注入攻擊受到重大傷害,可藉鎖定模式進入某種避難空間,而不是偵測到危險才觸發的保護方式。
那麼,該如何啟用鎖定模式呢?使用者可在 ChatGPT 的【設定】→【安全性】→ 在進階安全性啟用【鎖定模式】即可。
AI 聊天機器人目前仍在蓬勃發展階段,想像律師將訴訟客戶的敏感資料輸入 ChatGPT 加以處理、或者業務人員希望透過 ChatGPT 分析商務資料等等,使用過程總有不安。OpenAI 為 ChatGPT 推出這麼一項防止資料外流、防範提示注入攻擊等使用模式,相信是必要的。
(首圖來源:Unsplash)






