OpenAI dan Paradigm memperkenalkan EVMbench, sebuah tolok ukur untuk mengevaluasi kemampuan agen AI dalam mengidentifikasi, memperbaiki, dan mengeksploitasi kerentanan dalam kontrak pintar. Alat ini mengintegrasikan berbagai skenario serangan dan mengevaluasi model AI dalam deteksi, perbaikan, dan eksploitasi, menyoroti tantangan yang dihadapi dalam menjaga fungsi kontrak sambil memastikan keamanan.