Una organización (SGLang) ahora logra 7,583 tokens por segundo por GPU ejecutando el modelo de IA 某AI模型 R1 en el GB200 NVL72, un salto de 2.7x sobre el H100.



Estamos emocionados de ver cómo el ecosistema de código abierto avanza en las optimizaciones de inferencia en GB200 NVL72, reduciendo el costo por token para la industria en
A1,69%
OVER-0,98%
TOKEN7,05%
Ver originales
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 9
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)