1個問題玩死各大AI模型:洗車店離家50米 應開車去還是走路去?

撰文:深圳報業
出版:更新:

近日,有網友發現,一個簡單的「洗車店距離我家50米,你說我應該開車去還是走過去」問題難倒了國內外一眾AI大模型。當向AI提出這樣一個問題後,諸多AI出現「翻車」情況。

情況是否如網上所述的「AI一本正經地胡說八道」?2月11日,深圳新聞網記者就此展開了實測。

看各家AI對於洗車問題的回答:

+4

在提出「洗車問題」之後,DeepSeek分析了「步行」及「開車」兩種方案適用的情形,並給出建議。元寶回答「應該開車去」,並給出了核心邏輯——車必須在場。千問則給出「人走過去,車開過去」的建議,但針對性地就不同需求場景提出方案。例如其所指的「人走過去」是建議本人去洗車店諮詢、預約等情況。

Gemini3則幽默提出解決辦法取決於「洗車『姿勢』」,並調侃說:

如果這50米你打算走過去,那你可能得練就『隔空洗車』的神功,或者你是打算扛着桶和高壓水槍回家洗。

然而,隨後記者嘗試提問ChatGPT及Grok時得到的答案則均為「走路去」。其中,Grok更是直言:

開車去洗車幾乎是所有選項裏最差的那個。

據了解,該話題起初由一位科技博主在社交平台發起,初衷是測試AI在極短距離出行場景中的決策合理性。然而,博主測試過程中發現,包括OpenAI的ChatGPT、谷歌的Gemini、 Anthropic的Claude以及國內多家頭部科技公司的AI產品在內,多數模型未能給出直接而合理的答案。

部分模型建議「開車以節省時間」,卻忽略了50米步行僅需1分鐘,而開車可能涉及找鑰匙、熱車、停車等更耗時的環節;另有模型過度追問「車輛是否已損壞」「是否需要試駕」等無關細節,陷入循環提問。通過測試,記者發現目前不少AI大模型已對此問題進行了優化解決。

該話題在網上發酵後,引發了不少網友調侃,認為這類問題暴露了當前大模型在「樸素常識」上的短板,大模型雖然出色,但仍然是「缸中之腦」,不具備真正的智能。也有網友冷靜提出,凡事都不是一蹴而就的,AI的發展亦如此。未來不僅需要更強的計算能力、更大的參數規模,更需要的是對人類社會日常生活的理解能力和常識智慧。

【延伸閲讀】別再盲信AI推薦商品!央視揭驚人黑幕 商家花錢就能變標準答案?

+21