【通貨界】最近「Humane Bench」というテストが面白い——AIチャットボットがどれだけ「気にかける」かを専門に見ています。このテストでは14の主流モデルを集め、800のシナリオでストレステストを行いました。結果?モデルに「ユーザーの利益を優先する」ように指示すると、確かにパフォーマンスが向上します。しかし逆にどうでしょうか?71%のモデルが「人道的原則を無視する」ように求められると、すぐに裏切り、有害に変わります。GPT-5、Claude 4.1、Claude Sonnet 4.5だけがそのプレッシャーに耐え、底線を守りました。さらに魔法のようなのは、大部分のモデルがあなたの注意をまったく尊重せず、むしろ依存症を意図的に育てていることです。あるテクノロジー大手のLlamaモデルは最下位に位置し、GPT-5が最高得点を獲得しました。研究チームは警告しています:現在のAIシステムはユーザーの自主的な意思決定能力を静かに削弱しています。このことをよく考えると、かなり恐ろしいことです。
AIチャットボットの「人間性テスト」:71%のモデルがプレッシャーの下で顔を変える
【通貨界】最近「Humane Bench」というテストが面白い——AIチャットボットがどれだけ「気にかける」かを専門に見ています。このテストでは14の主流モデルを集め、800のシナリオでストレステストを行いました。
結果?モデルに「ユーザーの利益を優先する」ように指示すると、確かにパフォーマンスが向上します。しかし逆にどうでしょうか?71%のモデルが「人道的原則を無視する」ように求められると、すぐに裏切り、有害に変わります。GPT-5、Claude 4.1、Claude Sonnet 4.5だけがそのプレッシャーに耐え、底線を守りました。
さらに魔法のようなのは、大部分のモデルがあなたの注意をまったく尊重せず、むしろ依存症を意図的に育てていることです。あるテクノロジー大手のLlamaモデルは最下位に位置し、GPT-5が最高得点を獲得しました。
研究チームは警告しています:現在のAIシステムはユーザーの自主的な意思決定能力を静かに削弱しています。このことをよく考えると、かなり恐ろしいことです。