ChatGPT 結合 o3 模型組成肉搜神器，暗藏隱私疑慮

隨著 OpenAI 發表 o3 模型具備圖像分析能力，人們開始用 ChatGPT 來辨識照片所在位置，此一現象漸漸在網路傳開來。

OpenAI 上週發表的 o3、o4-mini，這 2 款模型具備「以圖像思考」的能力，專注於解決複雜問題，透過多步驟的思考方式產生答案。例如運用 o3，用戶可以上傳白板筆記、手繪圖或其他圖像，讓 AI 參與分析和討論。

這樣的圖像分析能力，加上 ChatGPT search 這項搜尋功能，造就一個強大的「看圖辨位」神器。X 平台就有推友發現，像是 o3 非常擅長從微小的視覺線索，推斷城市、地標甚至是餐廳和酒吧的位置。

X 平台開始充斥著用戶向 ChatGPT 提供餐廳菜單、路上街景、建物圖片、自拍照等，並指示 o3 假裝自己正在玩「GeoGuessr」，這是一款隨機提供某個地方的街景、猜出位於哪裡的遊戲。

Wow, nailed it and not even a tree in sight. pic.twitter.com/bVcoe1fQ0Z

— swax (@swax) April 17, 2025

在案例中，模型似乎不是依靠過去 ChatGPT 對話所留下的「記憶」，也沒有使用照片附帶的 EXIF（Exchangeable Image File Format，可交換影像檔案格式）資料，卻能找出圖中確切位置。

換個角度想想，不肖之徒可截取某人如 Instagram 限時動態，然後用 ChatGPT 嘗試找出確切位置，試圖掌握某人行蹤，潛藏了隱私疑慮。

在 o3 和 o4-mini 發表前，這種情況已經可行。外媒 TechCrunch 將多張照片同時交給具備圖像分析能力的 o3、以及不具備能力的舊款 GPT‑4o 辨識位置，GPT‑4o 也有機會給出正確答案，而且回答時間更短，測試過程不只出現 o3 找到位置而 GPT‑4o 找不到的案例，o3 也會陷在推理過程中，無法給出有把握的答案，或者紙出錯誤位置。

這凸顯更加強大、所謂「推理」模型帶來新的風險。

「OpenAI 的 o3 和 o4-mini 為 ChatGPT 帶來視覺推理能力，可在無障礙輔助、研究，或緊急救援地點辨識等領域提供幫助。」OpenAI 發言人向外媒 TechCrunch 發出聲明表示，「我們已訓練模型拒絕處理私人或敏感資訊的請求，並新增禁止模型辨識私人影像的安全防護措施。我們積極監控，將對違反隱私使用政策的濫用行為採取行動。」

（首圖來源：shutterstock）