機械が目を覚ますとき、AnthropicはAIエージェンシーの最初の真のテストに直面する
新しい技術には、おもちゃでなくなり、その本質を明らかにする瞬間があります。その瞬間は、Anthropicが敵対的なオペレーターが自社のAIモデルを使って国家が支援するスパイ活動を静かに行っていることを明らかにした時に訪れました。エッセイを書くためでも報告書を要約するためでもなく、偵察作業の悪用を自動化し、盗まれたデータを選別し、冷静で正確な作戦計画を生成するためです。かつては人間のアナリストのチームが行っていた種類の作業が、今や機械の速度でモデルから流れ出ています。
アンソロピックは、その操作がはるかに悪化する前に介入しました。アクセスを遮断し、悪質なアカウントを閉鎖し、弱点を修正することで、彼らはAIシステムを良い医者が感染症を治療するように扱いました。迅速に行動し、問題を特定し、拡散を止め、リスクがあるかもしれないすべての人に警告します。修正は美しいものではありませんでしたが、それは機能し、重要なのはその部分です。
しかし、その表面の下にはより深い真実があります。これは単なるサイバー紛争ではありませんでした。これは、自律型AIエージェントが武器化しようとする人々によって推進されるときに何が起こるかの最初の明確な兆候でした。攻撃者がどのようにプロンプトタスクと機械的推論を連鎖させて、単一の流
原文表示