GPT-4慘遭削弱,偷懶摸魚絕不多寫一行代碼,OpenAI已介入調查

2023-12-1 69 12/1

網友:呼叫舊版GPT-4

西風 發自 凹非寺

量子位 | 公衆號 QbitAI

GPT-4再次遭網友“羣攻”,原因是“懶”得離譜!

有網友想在Android系統開發一個能夠與OpenAI API實時交互的應用。

於是把方法示例鏈接發給GPT-4,讓它用Kotlin語言編寫代碼:

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

沒成想,和GPT-4一來二去溝通半天,GPT-4死活給不出一個能正常運行的完整代碼。

反而解釋了一通“應該怎麼做”。

這讓網友着實惱火,發推文吐槽“兩週前能寫好的代碼,現在卻不行了”。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

結果一下子炸出來更多網友:

終於有人調查這事兒了。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

大夥兒連連表示遇到了類似問題:

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

據網友所述,似乎從11月6日GPT-4大更新起,就開始出現這種情況了。

目前有OpenAI員工出面迴應,表示已將問題反饋給團隊。

只要代碼,完整代碼!

也難怪網友會“破防”,就說上面網友把方法示例鏈接發給GPT-4,讓它用Kotlin語言編寫代碼之後。

GPT-4給出的回覆是這樣嬸兒的,足足列了7條步驟,都在解釋“應該怎麼做”:

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

直到最後纔給出代碼,但只是一個基礎“模版”:

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

網友起初還比較有耐心,告訴它“不需要解釋,只要給我代碼,完整的代碼,能100%正常運行的代碼”:

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

結果GPT-4張口又在解釋、舉例子:

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

網友氣不打一處來,直接打斷它,並再次強調“不要解釋,給我代碼”:

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

GPT-4這下可是真真明白了,把上面那個模版稍微改動了一下,就發出來了:

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

這纔有了開頭的一幕,網友無奈發帖吐槽。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

對於GPT-4的回覆,網友“怒吼”了一句:他們都對你做了什麼?抱歉你被削弱了。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

GPT-4此刻也是一臉無辜。

陸陸續續出來吐槽的網友中,更有甚者表示已經不用ChatGPT了。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

AI圖像編輯器dingboard CEO@kache (yacine)在前一天也發帖吐槽,瀏覽量達157000+:

在過去的一個半星期裏,我一直在編寫“幼稚”的代碼,因爲GPT-4不那麼遵循指令了。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

巧了不是,如果按網友所說的“一個半星期”來算,時間還和奧特曼·真還傳事件吻合了。(手動狗頭)

kache (yacine)還有一條帖子滿滿都是情緒,“請把舊的GPT-4還給我”:

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

這位網友表示“我懂你”:

以前它能做出很好的猜測,現在它會給我十個理由解釋爲什麼它不能做出好的猜測。

上週,我對着聊天框大喊“f

ing do it!!”的次數創下歷史新高。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

一時間,GPT-4的“懶惰”成爲衆多網友“討伐”對象。

沃頓商學院教授Ethan Mollick也看不下去了,親自上手測試了一下,結果似乎表明這是真的。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

Ethan Mollick重複了一系列之前用代碼解釋器(Code Interpreter)做的分析。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

GPT-4雖然知道該怎麼做,但會一直提示“去完成工作”。導致原本的一個步驟變成了許多步驟,而且有些步驟很奇怪。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

這下Ethan Mollick也是無語住了。

GPT-4到底是怎麼了?背後原因還不得而知,網友們也是紛紛猜測起來。

OpenAI員工:已反饋給團隊

Ethan Mollick還是很嚴謹,認爲即便如此也不足以證明GPT-4變得越來越笨了,他推測這可能是系統負載過高的暫時問題。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

如果你是在手機(移動設備)上遇到了這種問題,那可能是因爲手機版系統提示的原因,會指示ChatGPT生成更簡短精要的答案。

我的測試是在網頁版進行的。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

Reddit上也有人發文討論,其中有一篇帖子指出“並不是新版GPT-4懶,只是我們用錯了”:

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

文中指出,GPT-4自本月6號進行了一次大更新後,基礎版本沒有自定義提示,這就導致GPT-4沒有預定義的“路徑”來指導其行爲。

這讓它非常通用,但默認設置下它的輸出也有些“無方向”。

解決辦法之一,就是使用更新後提供的自定義GPT新功能(GPTs),爲每項工作設置一個專門的GPT。

也相繼有網友分享“小妙招”:

新版GPT-4改變遊戲規則的一點是它能一次性解釋的代碼量。明確地說出類似“請完整地寫出這個測試”的指令,可能會有用。

同時,明確指出“不要重寫已經寫過的代碼”也很有幫助,這樣可以節省token,讓模型專注於產生新的輸出。

我還發現,加入“一步一步思考”的提示會在開始時增加一些計劃性的文本,這有助於後續輸出更好地定位上下文。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

但也有網友表示自己在用的時候,無論如何都會留下一些“待辦事項”:

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

這位網友更是直言GPT-4現在像是得了老年癡呆:

OpenAI暗示的是新版GPT-4非常善於遵循指令,但事實並非如此。

我從一開始就一直在使用GPT-3、3.5再到後來的4,從未見過這種程度的阿爾茨海默症。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

在網友的激烈吐槽下,OpenAI員工也出面迴應。

起初是讓網友們提供一些具體的例子,說是研究一下,很有可能在下次模型版本迭代中修補這些問題。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

此話一出,炸出更多網友“上報故障”。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

will depue再次迴應:

感謝反饋,在這裏的所有示例都會幫助我們更快地解決這個問題。我剛剛將其轉發給團隊,後續有消息會及時通知。

GPT-4惨遭削弱,偷懒摸鱼绝不多写一行代码,OpenAI已介入调查

看來官方後續迴應還要再等一波,家人們最近有遇到類似情況嗎?

參考鏈接:

[1]https://twitter.com/erhartford/status/1729566883350012038

[2]https://x.com/emollick/status/1729358803425001702?s=20