OpenAI y Paradigm presentaron EVMbench, una referencia para evaluar la capacidad de los agentes de IA para identificar, corregir y explotar vulnerabilidades en contratos inteligentes. La herramienta integra varios escenarios de ataque y evalúa los modelos de IA en detección, parcheo y explotación, destacando los desafíos enfrentados para mantener la funcionalidad del contrato mientras se garantiza la seguridad.