Realizamos nuestras propias evaluaciones en todos los principales LLM internamente, específicamente para tareas en cadena.
Cuando se lanzó Sonnet 4.5, vimos mejoras de calidad inmediatas.
Por ejemplo, su capacidad para usar datos pasó del 80% al 85% en nuestra evaluación.
Entonces: hemos enviado Sonnet 4.5 a IA.
¡Disfruta!
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
Realizamos nuestras propias evaluaciones en todos los principales LLM internamente, específicamente para tareas en cadena.
Cuando se lanzó Sonnet 4.5, vimos mejoras de calidad inmediatas.
Por ejemplo, su capacidad para usar datos pasó del 80% al 85% en nuestra evaluación.
Entonces: hemos enviado Sonnet 4.5 a IA.
¡Disfruta!