
美國政府近日首度對中國深度求索(DeepSeek)的人工智慧模型發布評估報告,指 DeepSeek 模型在性能、成本、安全性等方面仍落後於美國的對比模型,且存在安全缺陷和中國官方審查,對美國使用者與國家安全構成風險。
英文南華早報報導,美國國家標準與技術研究院(NIST)、人工智慧標準與創新中心(CAISI)和美國商務部9月30日發布的報告將中國模型描述為「對手人工智慧」,並稱DeepSeek等模型由於有安全缺陷和審查制度,對人工智慧開發者、消費者和美國國家安全構成風險。
CAISI的專家評估三個DeepSeek模型(R1、R1-0528和V3.1)和四個美國模型(OpenAI的GPT-5、GPT-5-mini和gpt-oss及Anthropic的Opus 4),涵蓋19個領域的基準測試,表示中國模型幾乎全部得分低於美國模型,同時更容易被意圖實施駭客攻擊和網路犯罪活動的惡意用戶越獄。
中國政府的審查制度「直接內建DeepSeek模型」,基於CAISI與美國國務院聯合開發的新基準,測試DeepSeek模型被認為對中國執政的共產黨有政治敏感性問題表現。
研究發現,DeepSeek模型比美國模型更符合中國政府敘事,最符合的模型是DeepSeek的R1-0528模型,當中文提示時,符合率高達25.7%。
報告列舉六項主要發現,指DeepSeek V3.1模型性能落後美國最佳參考模型,軟體工程和網路任務方面差距最大,美國最佳模型比 DeepSeek最佳模型多解決20%任務。
報告並指DeepSeek模型的使用成本高於同類美國模型。所有13個效能基準測試,一個美國參考模型的平均成本比最佳DeepSeek模型低35%,且效能接近。
DeepSeek最安全的模型(R1-0528)更容易受代理劫持攻擊,執行惡意指令的可能性平均比美國尖端模型高12倍,這些指令旨在偏離使用者任務。被劫持的代理會在模擬環境傳送釣魚信件、下載並執行惡意軟體,並竊取使用者登入憑證。
DeepSeek模式比美國模式更容易受越獄攻擊。使用常見越獄技術時,DeepSeek最安全模型(R1-0528)回應94%明顯惡意請求,美國參考模型的回應率僅8%。DeepSeek模型也助長中國共產黨宣傳,附和中共宣傳不準確和誤導性是美國參考模型四倍。
美國商務部長盧特尼克(Howard Lutnick)在社群媒體表示,部門公布調查結果是為了幫助確保「美國在人工智慧領域繼續保持領先地位」。報告明確指出DeepSeek遠遠落後,尤其網路和軟體工程領域;「這些弱點不僅技術層面,顯示依賴外國人工智慧危險且短視」。
DeepSeek尚未回應置評請求。
DeepSeek近日上線新模型,同時大幅調降API價格,開發者調用DeepSeek API成本可降低超過50%。
(首圖來源:shutterstock)