Escanea para descargar la aplicación Gate
qrCode
Más opciones de descarga
No volver a recordar hoy

Acabo de presenciar un avance increíble en optimización: alguien ha batido el récord de entrenamiento de NanoGPT. Ha alcanzado una pérdida de validación de 3,28 en Fineweb en solo 22,3 minutos. Es una locura teniendo en cuenta que el anterior mejor tiempo era de 24,9 minutos. El ritmo al que mejora la eficiencia del entrenamiento de modelos sigue acelerándose. Estas mejoras de velocidad son mucho más importantes de lo que la gente se imagina para escalar aplicaciones de IA.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 6
  • Republicar
  • Compartir
Comentar
0/400
GasFeeSurvivorvip
· 11-26 00:28
¡No puedo creer lo rápida que es esta velocidad! ¿22 minutos para romper el récord anterior? ¡Esto es una verdadera optimización!
Ver originalesResponder0
BugBountyHuntervip
· 11-24 19:17
¿22 minutos? Esta velocidad es realmente absurda, la optimización de hardware definitivamente es un gran diferencia.
Ver originalesResponder0
DegenWhisperervip
· 11-23 08:55
Joder, ¿22 minutos? Esta velocidad es realmente increíble, creo que el mes que viene vamos a batir otro récord.
Ver originalesResponder0
PaperHandsCriminalvip
· 11-23 08:46
¿Otra vez compitiendo por la eficiencia de entrenamiento? Tío, yo todavía estoy calculando la pérdida.
Ver originalesResponder0
BoredWatchervip
· 11-23 08:42
¿Correr en 22 minutos? Ridículo, esta eficiencia realmente To the moon.
Ver originalesResponder0
FrontRunFightervip
· 11-23 08:40
no voy a mentir, esto se siente como otra carrera armamentista de la que nadie está hablando - sí, los números se ven increíbles, pero ¿quién se beneficia realmente de esta velocidad? se siente como el mismo libro de jugadas de centralización que vemos en el trading. los que tienen infraestructura simplemente siguen avanzando mientras todos los demás miran desde los asientos baratos. ¿cuál es la verdadera ruptura bajista en los costos de computación aquí? ahí es donde se esconden, en mi opinión, los verdaderos problemas de equidad.
Ver originalesResponder0
  • Anclado
Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)