
隨著 OpenAI 發表 o3 模型具備圖像分析能力,人們開始用 ChatGPT 來辨識照片所在位置,此一現象漸漸在網路傳開來。
OpenAI 上週發表的 o3、o4-mini,這 2 款模型具備「以圖像思考」的能力,專注於解決複雜問題,透過多步驟的思考方式產生答案。例如運用 o3,用戶可以上傳白板筆記、手繪圖或其他圖像,讓 AI 參與分析和討論。
這樣的圖像分析能力,加上 ChatGPT search 這項搜尋功能,造就一個強大的「看圖辨位」神器。X 平台就有推友發現,像是 o3 非常擅長從微小的視覺線索,推斷城市、地標甚至是餐廳和酒吧的位置。
X 平台開始充斥著用戶向 ChatGPT 提供餐廳菜單、路上街景、建物圖片、自拍照等,並指示 o3 假裝自己正在玩「GeoGuessr」,這是一款隨機提供某個地方的街景、猜出位於哪裡的遊戲。
Wow, nailed it and not even a tree in sight. pic.twitter.com/bVcoe1fQ0Z
— swax (@swax) April 17, 2025
在案例中,模型似乎不是依靠過去 ChatGPT 對話所留下的「記憶」,也沒有使用照片附帶的 EXIF(Exchangeable Image File Format,可交換影像檔案格式)資料,卻能找出圖中確切位置。
換個角度想想,不肖之徒可截取某人如 Instagram 限時動態,然後用 ChatGPT 嘗試找出確切位置,試圖掌握某人行蹤,潛藏了隱私疑慮。
在 o3 和 o4-mini 發表前,這種情況已經可行。外媒 TechCrunch 將多張照片同時交給具備圖像分析能力的 o3、以及不具備能力的舊款 GPT‑4o 辨識位置,GPT‑4o 也有機會給出正確答案,而且回答時間更短,測試過程不只出現 o3 找到位置而 GPT‑4o 找不到的案例,o3 也會陷在推理過程中,無法給出有把握的答案,或者紙出錯誤位置。
這凸顯更加強大、所謂「推理」模型帶來新的風險。
「OpenAI 的 o3 和 o4-mini 為 ChatGPT 帶來視覺推理能力,可在無障礙輔助、研究,或緊急救援地點辨識等領域提供幫助。」OpenAI 發言人向外媒 TechCrunch 發出聲明表示,「我們已訓練模型拒絕處理私人或敏感資訊的請求,並新增禁止模型辨識私人影像的安全防護措施。我們積極監控,將對違反隱私使用政策的濫用行為採取行動。」
- The latest viral ChatGPT trend is doing ‘reverse location search’ from photos
- ChatGPT is now a potent tool for finding the locations of photos, raising doxxing concerns
(首圖來源:shutterstock)