OpenAI et Paradigm ont présenté EVMbench, un benchmark pour évaluer la capacité des agents IA à identifier, corriger et exploiter les vulnérabilités dans les contrats intelligents. L'outil intègre divers scénarios d'attaque et évalue les modèles d'IA en détection, correction et exploitation, mettant en évidence les défis rencontrés pour maintenir la fonctionnalité du contrat tout en garantissant la sécurité.