OpenAI và Paradigm giới thiệu EVMbench, một bộ chuẩn để đánh giá khả năng của các AI agent trong việc xác định, sửa chữa và khai thác các lỗ hổng trong hợp đồng thông minh. Công cụ này tích hợp các kịch bản tấn công khác nhau và đánh giá các mô hình AI trong việc phát hiện, vá lỗi và khai thác, làm nổi bật những thách thức trong việc duy trì chức năng của hợp đồng đồng thời đảm bảo an ninh.