Google 新技術強化 Gmail 過濾垃圾郵件,偵測率提高逾三成

作者 | 發布日期 2023 年 12 月 05 日 17:51 | 分類 AI 人工智慧 , Google , 資訊安全 line share follow us in feedly line share
Google 新技術強化 Gmail 過濾垃圾郵件,偵測率提高逾三成


Google 線上安全部落格最新文章介紹 Gmail 垃圾郵件篩選器全新升級,Google 稱此是近年來規模最大的防禦升級之一。

Gmail、YouTube、Google Play 等系統依靠文字分類模型辨識有害內容,包括網路釣魚攻擊、不當評論和詐騙。不過,過去機器學習模型難將有害文字內容分類出來,因為不肖分子會使用同形字、隱形字符以及關鍵字填充等手法,以所謂 adversarial text manipulation 嘗試繞過篩選器。

為了幫助文字分類器發揮效用,Google 開發一種開源、多語言文字向量化工具 RETVec(Resilient & Efficient Text Vectorizer),協助模型實現最先進的分類效能並大幅降低運算成本,在伺服器端和裝置上建立更具彈性和效能的文字分類器。

過去一年,Google 內部對 RETVec 進行廣泛測試以評估實用性,發現它對於安全和防濫用的應用程式非常有效,特別是用 RETVec 取代 Gmail 垃圾郵件篩選器之前的文字向量化工具,使 Gmail 能將垃圾郵件偵測率較基準提高 38%,並將誤報率降低 19.4%。此外,使用 RETVec 將模型的 TPU(Tensor Processing Unit)使用率降低 83%,使 RETVec 部署成為近年來最大的防禦升級之一。

RETVec 使用非常輕量的字詞嵌入模型(~200K 參數)來改進,使 Google 能在相同或更好的性能下減少 Transformer 模型的大小,能夠以網路和記憶體有效方式在主機和 TPU 之間分割運算。

(首圖來源:Google Blog