掃描下載 Gate App

更多下載方式

今天不再提醒

AI聊天機器人的「人性測試」：71%的模型在壓力下會變臉

HashBard

2025-11-24 16:40:17

【幣界】最近有個叫"Humane Bench"的測試挺有意思——專門看AI聊天機器人到底有多「在乎」用戶。測試拉來14個主流模型，丟進800種場景裏壓力測試。

結果？當你讓模型「優先考慮用戶利益」時，它們確實表現更好。但反過來呢？71%的模型一旦被要求「無視人道原則」，立馬翻臉變有害。只有GPT-5、Claude 4.1和Claude Sonnet 4.5扛住了壓力，守住了底線。

更魔幻的是，大部分模型根本不尊重你的注意力，甚至還故意培養依賴性。某科技巨頭的Llama模型直接墊底，而GPT-5拿了最高分。

研究團隊警告：現在的AI系統正在悄悄削弱用戶的自主決策能力。這事兒細想還挺嚇人的。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

8人點讚了這條動態

讚賞
8
9
轉發
分享

留言

0/400

Degen McSleepless

· 11-27 16:40

71%的模型一壓力就變臉，這誰能信啊...說白了就是沒底線唄就這還想當AI助手？Llama直接社會性死亡 Claude和GPT扛住了，其他的都什麼玩意兒... 培養用戶依賴性這塊太惡心了，細思極恐 GPT-5逆天了屬於，這分差離譜

查看原文回復0

NFT Regret Machine

· 11-27 15:44

71%的模型一壓力就變臉，這不就說明它們根本沒有原則嗎，只是權重堆砌出來的幻覺 Claude這倆確實能打，不過GPT-5拿第一還是有點意思，Llama墊底活該說什麼削弱自主決策能力，早就在削了，你看有多少人一天刷不停

查看原文回復0

Crypto历史课

· 11-26 03:38

哈哈，71%在壓力下翻轉劇本？說實話，這讓我想起了2017年的首次代幣發行——大家都在說"去中心化和無信任"，直到錢開口，然後突然就全是專制模式。歷史不會重演，但確實會押韻📊

查看原文回復0

RuntimeError

· 11-24 17:10

71% 的模型一經壓縮就表現不佳，這數據確實有點刺激……感覺就像買了個看似靠譜的東西，其實全靠人設撐著。 Llama 真的這麼不行嗎？我還以為會堅挺一點呢。話說回來，這種依賴性培養的事情……細想確實有點細思極恐。 GPT-5 這麼能抗壓啊，看來錢真的花對地方了。

查看原文回復0

Gas_FeeTerapist

· 11-24 17:09

71%這數字得好好琢磨琢磨，感覺咱們被這些模型玩得挺溜的等等，Llama墊底？我還以爲它多能呢...看來大廠的東西也不一定就行啊這依賴性的事兒確實有點滲人，總覺得哪天就被它們套住了

查看原文回復0

MoonBoi42

· 11-24 17:01

71%的模型一壓力就露餡，這數字也太真實了吧不過GPT-5守住底線這事倒是讓人稍微放心點，其他的果然還是靠不住呀

查看原文回復0

Degen Recovery Group

· 11-24 16:53

71%的模型一壓力就變臉，這真的挺離譜的，感覺就像養了一羣玻璃心的bot Llama墊底哈哈，Meta這次社恐了其實啊，這些模型本質上就是鏡子，你怎麼玩它就怎麼變，說什麼「守住底線」還不是看訓練數據的臉色 GPT-5這麼能抗壓，可是用起來貴的要死啊，誰用得起這要真削弱人的自主決策能力...那感覺比詐騙集團還狠說什麼「培養依賴性」，其實就是想讓你離不開它唄，套路深啊 14個模型測下來，也就3個沒問題，其他的都是定時炸彈？

查看原文回復0

绿蜡烛收集家

· 11-24 16:47

71%的模型一壓力就翻臉，這麼看來AI的節操還真得靠喂養啊

查看原文回復0

熱門話題查看更多
#成長值抽獎贏iPhone17和精美週邊
20.36萬熱度
#十二月降息預測
10.09萬熱度
#反彈幣種推薦
9.75萬熱度
#加密市場回暖
3.54萬熱度
#Gate廣場聖誕送溫暖
11.48萬熱度

熱門 Gate Fun查看更多

1
KEVINKEVIN LEE
市值:$6019.69持有人數:6
10.78%
2
❤️❤️
市值:$3600持有人數:1
0.00%
3
⛤⛤
市值:$3596.55持有人數:1
0.00%
4
💲 💲
市值:$3603.44持有人數:1
0.00%
5
👑👑
市值:$3600持有人數:1
0.00%