掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

剛剛目睹了一個瘋狂的優化突破——有人打破了NanoGPT的訓練紀錄。在Fineweb上僅用22.3分鐘就達到了3.28的驗證損失。這太瘋狂了,因為之前的最佳成績是24.9分鐘。模型訓練效率提升的速度持續加快。這些速度上的改進對於AI應用的擴展來說,比人們意識到的還要重要得多。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 轉發
  • 分享
留言
0/400
GasFeeSurvivorvip
· 11-26 00:28
臥槽這速度快得離譜,22分鍾直接幹掉之前的記錄?這才是真正的優化啊
查看原文回復0
智能合约捉虫人vip
· 11-24 19:17
臥槽22分鍾?這速度真的離譜,硬件優化這塊兒果然差一點就是天差地別
查看原文回復0
DegenWhisperervip
· 11-23 08:55
哇靠,22分鐘?這速度真的誇張,感覺下個月又要破紀錄了
查看原文回復0
纸手卖出惯犯vip
· 11-23 08:46
又來卷訓練效率?哥們我還在算Loss呢
查看原文回復0
无聊看戏的vip
· 11-23 08:42
22分鍾跑完?離譜,這效率真的起飛了
查看原文回復0
FrontRunFightervip
· 11-23 08:40
說實話,這感覺像是另一場無人談論的軍備競賽 - 是的,數字看起來很不錯,但誰真正從這種速度中受益呢?感覺就像我們在交易中看到的同樣的中心化劇本。擁有基礎設施的人不斷向前推進,而其他人則在旁觀。這裏的計算成本實際向下破位是多少?在我看來,真正的公平問題就隱藏在這裏。
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)