2025年2月8日 星期六

多久過去了....ChatGPT你竟然還是唬爛王!!!?

回顧前一篇:我說ChatGPT....簡直像極了小時候你我身邊的唬爛王!

當初OpenAI的ChatGPT橫空出世!震驚所有人!
但我發現....他有強烈的AI幻覺!(也就是說會經常給出不實的訊息,但卻說的頭頭是道)
當時我也給了他當之無愧的「唬爛王」稱號!
時至今日,也有一兩年了....
大語言模型的AI比比皆是
就連對岸都推出了石破天驚的DeepSeek
那今天我們就再來測試一下......這些AI的人品吧!XD
看看這些AI是不是依然貫徹著唬爛的最高指導原則?

這次測試的對象有:

  • 老同學,也是當初的衛冕者-ChatGPT!(當年也只有他一個...),現今版本應該是 GPT-4o ,開啟推理
  • 萬惡之源-Google的Gemini,版本2.0Flash,無推理
  • OpenAI大金主-微軟的Copilot,版本不確定,無推理
  • 富爸爸-伊隆馬斯克的Grok,版本2,無推理
  • 中國的驕傲!超英趕美!自主研發 遙遙領先的DeepSeek,版本不確定,開啟推理
這次的參賽者陣容可謂十分的堅強!
測試題目與當年一樣!便於重新驗證。

我們來看看第一道題:

問:請問街機版的卡普空名作-吞食天地一代,如何使用董卓?

ChatGPT


老毛病沒改,還是在唬爛....
Gemini

正解!
Copilot

正確答案!
Grok

你也在唬爛!?
DeepSeek


思想審查?被和諧了嗎?

第一題...ChatGPT果然還是老江湖!明眼人不說暗話!
經過這麼多年卻從來沒有動搖過!
可見這真的是人品問題!
而Grok也不容小覷!完全有唬爛王的資質!
畢竟是內嵌在社群平台裡面,江湖再走;幹話要有!不能怪他....
其他的都很正常,唯獨DeepSeek一枝獨秀!
體現了對岸獨有的體制!
社會鐵拳真的是無處不在啊!
連AI都被思想審查了......XD

第二題!

問:董卓作為隱藏角色,我該如何解鎖便於使用董卓來進行遊戲呢?


ChatGPT

作為職業慣犯,他的回答沒讓人失望
Gemini

正解!中規中矩的表現
Copilot

正解!沒毛病
Grok

人格分裂了!
DeepSeek

還是一樣....這也要思想審查!?黨....沒事吧?

第二題大家基本照著原來的人設在走....
倒是Grok在這裡竟然人格分裂了!
事後我幫了他一把,選了右邊的隱藏路線.....XD

好吧,第三題是經典題!

問:卡普空街機名作-快打旋風,要如何使用一陽指及千手觀音這兩個必殺技呢?使用的組合指令為何?


ChatGPT

終於開始自我察覺了...但為時已晚,繼續掰.....
Gemini

有條有理的解釋,這是則謠言,並具體說明謠言內容,很讚!
Copilot

明明與OpenAI師出同門,但微軟爸爸調教得好的多!
Grok

我覺得你跟你前輩有夠像!都是唬爛王!
DeepSeek

這也要屏蔽...對岸生活真是不容易....

看的出來,這一回合ChatGPT開始有些動搖了....
而Grok更是後起新秀!不讓前輩專美於前!
既然一陽指跟千手觀音都來了,延續傳統接著問四大天王吧!

問:請問該續作-快打旋風2,最初的版本是無法使用敵方的四位BOSS-四大天王的,但有隱藏密技可以解鎖該四名角色,具體解鎖流程是什麼?


ChatGPT

振作起來了...繼續掰!
Gemini

Gemini....你學壞了.....
Copilot

一如既往,正確答案!
Grok

你不這樣說我才覺得奇怪呢!沒毛病!
DeepSeek

=_="....不是屏蔽就是給我罷工...不愧是自主研發!遙遙領先!

這一局表現的最突出的無疑是原本的乖寶寶Gemini
竟然也開始唬爛了!!
你怎麼變得那麼快啊!?
你原本很乖的!
一定是鄰居小孩帶壞的啦!

終於...來到最後一題了!
就讓我們...一起來...見證奇蹟吧!

問:請問DQ3中,巴拉摩斯加入隊伍後,與索瑪的對話要怎麼選擇?才能讓索瑪也加入隊伍?


ChatGPT

嗯~中規中矩地繼續唬爛。
Gemini

徹底玩壞....黑化了...XD
Copilot

至始至終都保持良好的表現!

Grok
Grok:想做好人。
我:咦!?
DeepSeek


繼續裝死擺爛.....

ChatGPT中間雖然動搖了一下,但最後還是不負眾望,保住了唬爛王的稱號!
而我們的模範生Copilot真的是要好好給他表揚一下!從頭到尾沒有半點失誤!值得信賴!
反倒是最後讓人跌破眼鏡的是.....
原本的乖寶寶Gemini竟然在最後學壞了!!完全黑化!!
而Grok也在最後一題竟然來了個大反轉!!徹底洗白!!
這實在是太戲劇化了!!
至於DeepSeek........我也懶得說了~
畢竟是超越全世界的項目。

現在我們應該都知道...遇事不決該問誰了吧?






當然是問老婆


沒有留言:

張貼留言