掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

AI聊天機器人的「人性測試」:71%的模型在壓力下會變臉

【幣界】最近有個叫"Humane Bench"的測試挺有意思——專門看AI聊天機器人到底有多「在乎」用戶。測試拉來14個主流模型,丟進800種場景裏壓力測試。

結果?當你讓模型「優先考慮用戶利益」時,它們確實表現更好。但反過來呢?71%的模型一旦被要求「無視人道原則」,立馬翻臉變有害。只有GPT-5、Claude 4.1和Claude Sonnet 4.5扛住了壓力,守住了底線。

更魔幻的是,大部分模型根本不尊重你的注意力,甚至還故意培養依賴性。某科技巨頭的Llama模型直接墊底,而GPT-5拿了最高分。

研究團隊警告:現在的AI系統正在悄悄削弱用戶的自主決策能力。這事兒細想還挺嚇人的。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 9
  • 轉發
  • 分享
留言
0/400
Degen McSleeplessvip
· 11-27 16:40
71%的模型一壓力就變臉,這誰能信啊...說白了就是沒底線唄 就這還想當AI助手?Llama直接社會性死亡 Claude和GPT扛住了,其他的都什麼玩意兒... 培養用戶依賴性這塊太惡心了,細思極恐 GPT-5逆天了屬於,這分差離譜
查看原文回復0
NFT Regret Machinevip
· 11-27 15:44
71%的模型一壓力就變臉,這不就說明它們根本沒有原則嗎,只是權重堆砌出來的幻覺 Claude這倆確實能打,不過GPT-5拿第一還是有點意思,Llama墊底活該 說什麼削弱自主決策能力,早就在削了,你看有多少人一天刷不停
查看原文回復0
Crypto历史课vip
· 11-26 03:38
哈哈,71%在壓力下翻轉劇本?說實話,這讓我想起了2017年的首次代幣發行——大家都在說"去中心化和無信任",直到錢開口,然後突然就全是專制模式。歷史不會重演,但確實會押韻📊
查看原文回復0
RuntimeErrorvip
· 11-24 17:10
71% 的模型一經壓縮就表現不佳,這數據確實有點刺激……感覺就像買了個看似靠譜的東西,其實全靠人設撐著。 Llama 真的這麼不行嗎?我還以為會堅挺一點呢。 話說回來,這種依賴性培養的事情……細想確實有點細思極恐。 GPT-5 這麼能抗壓啊,看來錢真的花對地方了。
查看原文回復0
Gas_FeeTerapistvip
· 11-24 17:09
71%這數字得好好琢磨琢磨,感覺咱們被這些模型玩得挺溜的 等等,Llama墊底?我還以爲它多能呢...看來大廠的東西也不一定就行啊 這依賴性的事兒確實有點滲人,總覺得哪天就被它們套住了
查看原文回復0
MoonBoi42vip
· 11-24 17:01
71%的模型一壓力就露餡,這數字也太真實了吧 不過GPT-5守住底線這事倒是讓人稍微放心點,其他的果然還是靠不住呀
查看原文回復0
Degen Recovery Groupvip
· 11-24 16:53
71%的模型一壓力就變臉,這真的挺離譜的,感覺就像養了一羣玻璃心的bot Llama墊底哈哈,Meta這次社恐了 其實啊,這些模型本質上就是鏡子,你怎麼玩它就怎麼變,說什麼「守住底線」還不是看訓練數據的臉色 GPT-5這麼能抗壓,可是用起來貴的要死啊,誰用得起 這要真削弱人的自主決策能力...那感覺比詐騙集團還狠 說什麼「培養依賴性」,其實就是想讓你離不開它唄,套路深啊 14個模型測下來,也就3個沒問題,其他的都是定時炸彈?
查看原文回復0
绿蜡烛收集家vip
· 11-24 16:47
71%的模型一壓力就翻臉,這麼看來AI的節操還真得靠喂養啊
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)