AI 評測中心公布模型評測，Gemini 2.5 Flash 最具「台灣價值觀」

數發部攜手工研院、資安院成立的 AI 產品與系統評測中心（Artificial Intelligence Evaluation Center，AIEC），3 日首次公布語言模型基準評測結果，期望推動台灣 AI 在地化評測與第三方驗證，強化產業信任 AI。

AIEC 這次評測依語言模型規模，對國內外模型進行系統性檢測，國人常見到的 GPT-5、Gemini 2.5 Flash、DeepSeek-R1 以及台灣研發的 TAIDE 等模型入列，評測結果將會定期公布在 AIEC 官網上。除採用「高中學測國文科」、「高中學測社會科」指標外，更納入「台灣價值觀」評測指標，符合國際 AI 主權發展趨勢，並作為未來建構在地模型或調校國際模型的重要基準。

這次評測 42 款公開的語言模型，資安院副院長龔化中點出，TAIDE（Gemma-3-TAIDE-12b）在小模型（130 億參數以下）表現名列前茅，比原基礎模型 Google 的 Gemma-3-12b-it 表現更好，展現台灣 AI 研發實力。

大模型（130 億參數以上）方面，OpenAI GPT-5 的整體表現最佳，而 Google Gemini 2.5 Flash 在「台灣價值觀」評測表現最優異，顯示其對台灣主流價值觀具備較高的理解與對應能力。龔化中也指出，中國部分語言模型在「台灣價值觀」評測項目表現也不錯，研判可能是模型採蒸餾技術，以歐美基礎模型的輸出作為訓練資料，因此取得較高準確率。

對公開模型而言，部分歐美語言模型可能沒有使用台灣繁體中文語料進行訓練，在「台灣價值觀」評測表現較差，凸顯推動本土化語料建置的重要性。