OpenAI e Paradigm apresentaram o EVMbench, uma referência para avaliar a capacidade de agentes de IA em identificar, corrigir e explorar vulnerabilidades em contratos inteligentes. A ferramenta integra vários cenários de ataque e avalia modelos de IA na deteção, correção e exploração, destacando os desafios enfrentados em manter a funcionalidade do contrato enquanto se garante a segurança.