Gateアプリをダウンロードするにはスキャンしてください
qrCode
その他のダウンロードオプション
今日はこれ以上表示しない

とんでもない最適化のブレイクスルーを目撃した――誰かがNanoGPTのトレーニング記録を塗り替えた。Finewebで3.28のバリデーションロスをわずか22.3分で達成。前回のベストが24.9分だったことを考えると、これは異常な速さ。モデル訓練の効率向上のペースがどんどん加速している。これらのスピード改善は、AIアプリケーションのスケールアップにおいて、人々が思っている以上に重要な意味を持つ。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 6
  • リポスト
  • 共有
コメント
0/400
GasFeeSurvivorvip
· 11-26 00:28
なんてこった、このスピードは異常だ、22分で以前の記録をぶっ壊す?これが本当の最適化だ。
原文表示返信0
BugBountyHuntervip
· 11-24 19:17
えっ、22分?この速度は本当にありえない。ハードウェアの最適化はやっぱり少しの違いで天と地の差がある。
原文表示返信0
DegenWhisperervip
· 11-23 08:55
やばい、22分?この速さは本当に異常だ。来月また記録を更新しそうな気がする。
原文表示返信0
PaperHandsCriminalvip
· 11-23 08:46
またトレーニング効率で競争するの?俺はまだLossを計算してるんだけど
原文表示返信0
BoredWatchervip
· 11-23 08:42
22分で終わる?ありえない、この効率は本当に月へ行った。
原文表示返信0
FrontRunFightervip
· 11-23 08:40
正直、これは誰も話していない別の軍拡競争のように感じる - そう、数字は素晴らしく見えるけど、このスピードから実際に誰が利益を得ているの?取引で見るのと同じ中央集権のプレイブックのように感じる。インフラを持っている者たちはどんどん前に進んでいく一方、他の人々は安い席から見ている。ここでのコンピュートコストの実際のブレイクダウンは何?そこに本当の公平性の問題が隠れていると思う。
原文表示返信0
  • ピン