美國政府報告，指 DeepSeek 有多重缺陷與風險

美國政府近日首度對中國深度求索（DeepSeek）的人工智慧模型發布評估報告，指 DeepSeek 模型在性能、成本、安全性等方面仍落後於美國的對比模型，且存在安全缺陷和中國官方審查，對美國使用者與國家安全構成風險。

英文南華早報報導，美國國家標準與技術研究院（NIST）、人工智慧標準與創新中心（CAISI）和美國商務部9月30日發布的報告將中國模型描述為「對手人工智慧」，並稱DeepSeek等模型由於有安全缺陷和審查制度，對人工智慧開發者、消費者和美國國家安全構成風險。

CAISI的專家評估三個DeepSeek模型（R1、R1-0528和V3.1）和四個美國模型（OpenAI的GPT-5、GPT-5-mini和gpt-oss及Anthropic的Opus 4），涵蓋19個領域的基準測試，表示中國模型幾乎全部得分低於美國模型，同時更容易被意圖實施駭客攻擊和網路犯罪活動的惡意用戶越獄。

中國政府的審查制度「直接內建DeepSeek模型」，基於CAISI與美國國務院聯合開發的新基準，測試DeepSeek模型被認為對中國執政的共產黨有政治敏感性問題表現。

研究發現，DeepSeek模型比美國模型更符合中國政府敘事，最符合的模型是DeepSeek的R1-0528模型，當中文提示時，符合率高達25.7%。

報告列舉六項主要發現，指DeepSeek V3.1模型性能落後美國最佳參考模型，軟體工程和網路任務方面差距最大，美國最佳模型比 DeepSeek最佳模型多解決20%任務。

報告並指DeepSeek模型的使用成本高於同類美國模型。所有13個效能基準測試，一個美國參考模型的平均成本比最佳DeepSeek模型低35%，且效能接近。

DeepSeek最安全的模型（R1-0528）更容易受代理劫持攻擊，執行惡意指令的可能性平均比美國尖端模型高12倍，這些指令旨在偏離使用者任務。被劫持的代理會在模擬環境傳送釣魚信件、下載並執行惡意軟體，並竊取使用者登入憑證。

DeepSeek模式比美國模式更容易受越獄攻擊。使用常見越獄技術時，DeepSeek最安全模型（R1-0528）回應94%明顯惡意請求，美國參考模型的回應率僅8%。DeepSeek模型也助長中國共產黨宣傳，附和中共宣傳不準確和誤導性是美國參考模型四倍。

美國商務部長盧特尼克（Howard Lutnick）在社群媒體表示，部門公布調查結果是為了幫助確保「美國在人工智慧領域繼續保持領先地位」。報告明確指出DeepSeek遠遠落後，尤其網路和軟體工程領域；「這些弱點不僅技術層面，顯示依賴外國人工智慧危險且短視」。

DeepSeek尚未回應置評請求。

DeepSeek近日上線新模型，同時大幅調降API價格，開發者調用DeepSeek API成本可降低超過50%。

（首圖來源：shutterstock）