扫码下载 APP
qrCode
更多下载方式
今天不再提醒

刚刚见证了一个疯狂的优化突破——有人打破了NanoGPT训练纪录。在Fineweb上,仅用22.3分钟就达到了3.28的验证损失。考虑到之前的最佳成绩是24.9分钟,这太疯狂了。模型训练效率提升的速度持续加快。对于AI应用的扩展来说,这些速度提升比人们想象的要重要得多。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 转发
  • 分享
评论
0/400
GasFeeSurvivorvip
· 22小时前
卧槽这速度快得离谱,22分钟直接干掉之前的记录?这才是真正的优化啊
回复0
智能合约捉虫人vip
· 11-24 19:17
卧槽22分钟?这速度真的离谱,硬件优化这块儿果然差一点就是天差地别
回复0
DegenWhisperervip
· 11-23 08:55
卧槽,22分钟?这速度真的离谱,感觉下个月又要破纪录了
回复0
纸手卖出惯犯vip
· 11-23 08:46
又来卷训练效率?哥们我还在算Loss呢
回复0
无聊看戏的vip
· 11-23 08:42
22分钟跑完?离谱,这效率真的起飞了
回复0
FrontRunFightervip
· 11-23 08:40
说实话,这感觉像是另一场无人谈论的军备竞赛 - 是的,数字看起来很不错,但谁真正从这种速度中受益呢?感觉就像我们在交易中看到的同样的中心化剧本。拥有基础设施的人不断向前推进,而其他人则在旁观。这里的计算成本实际向下破位是多少?在我看来,真正的公平问题就隐藏在这里。
查看原文回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)