Baru saja menyaksikan terobosan optimasi yang luar biasa - seseorang berhasil memecahkan rekor pelatihan NanoGPT. Mencapai 3,28 validation loss di Fineweb hanya dalam 22,3 menit. Itu gila mengingat rekor sebelumnya adalah 24,9 menit. Laju peningkatan efisiensi pelatihan model terus semakin cepat. Peningkatan kecepatan ini jauh lebih penting dari yang disadari banyak orang untuk skalabilitas aplikasi AI.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
21 Suka
Hadiah
21
6
Posting ulang
Bagikan
Komentar
0/400
GasFeeSurvivor
· 11-26 00:28
Wah, kecepatan ini sangat luar biasa, hanya dalam 22 menit sudah mengalahkan catatan sebelumnya? Ini benar-benar optimasi yang hebat!
Lihat AsliBalas0
BugBountyHunter
· 11-24 19:17
Wah, 22 menit? Kecepatan ini benar-benar tidak masuk akal, optimasi perangkat keras memang sedikit berbeda antara langit dan bumi.
Lihat AsliBalas0
DegenWhisperer
· 11-23 08:55
Gila, 22 menit? Kecepatannya bener-bener nggak masuk akal, kayaknya bulan depan bakal pecah rekor lagi.
Lihat AsliBalas0
PaperHandsCriminal
· 11-23 08:46
Lagi-lagi bersaing soal efisiensi pelatihan? Bro, gue masih ngitung Loss nih.
Lihat AsliBalas0
BoredWatcher
· 11-23 08:42
Selesai dalam 22 menit? Konyol, efisiensi ini benar-benar To da moon.
Lihat AsliBalas0
FrontRunFighter
· 11-23 08:40
sejujurnya ini terasa seperti perlombaan senjata lain yang tidak ada yang bicarakan - ya, angkanya terlihat luar biasa tetapi siapa yang benar-benar diuntungkan dari kecepatan ini? terasa seperti buku pedoman sentralisasi yang sama yang kita lihat dalam perdagangan. mereka yang memiliki infrastruktur terus menarik diri lebih jauh sementara yang lain hanya menonton dari tempat murah. apa sebenarnya breakdown biaya komputasi di sini? di situlah masalah keadilan yang nyata bersembunyi menurut pendapat saya.
Baru saja menyaksikan terobosan optimasi yang luar biasa - seseorang berhasil memecahkan rekor pelatihan NanoGPT. Mencapai 3,28 validation loss di Fineweb hanya dalam 22,3 menit. Itu gila mengingat rekor sebelumnya adalah 24,9 menit. Laju peningkatan efisiensi pelatihan model terus semakin cepat. Peningkatan kecepatan ini jauh lebih penting dari yang disadari banyak orang untuk skalabilitas aplikasi AI.