Vừa chứng kiến một đột phá tối ưu hóa điên rồ - ai đó đã phá vỡ kỷ lục huấn luyện NanoGPT. Đạt loss xác thực 3.28 trên Fineweb chỉ trong 22.3 phút. Thật điên rồ khi kỷ lục trước đó là 24.9 phút. Tốc độ cải thiện hiệu quả huấn luyện mô hình ngày càng tăng nhanh. Những cải tiến về tốc độ này quan trọng hơn rất nhiều so với những gì mọi người nhận ra khi mở rộng các ứng dụng AI.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
21 thích
Phần thưởng
21
6
Đăng lại
Retweed
Bình luận
0/400
GasFeeSurvivor
· 11-26 00:28
Ôi chao, tốc độ này nhanh đến mức phi lý, trực tiếp phá kỷ lục trước đó chỉ trong 22 phút? Đây mới thực sự là tối ưu hóa!
Xem bản gốcTrả lời0
BugBountyHunter
· 11-24 19:17
Ôi trời, 22 phút? Tốc độ này thật sự không thể tin được, quả thật phần tối ưu phần cứng kém một chút thì khác nhau một trời một vực.
Xem bản gốcTrả lời0
DegenWhisperer
· 11-23 08:55
Trời ơi, 22 phút? Tốc độ này thật sự quá khủng, cảm giác tháng sau lại phá kỷ lục nữa rồi.
Xem bản gốcTrả lời0
PaperHandsCriminal
· 11-23 08:46
Lại thi nhau tối ưu hiệu suất huấn luyện à? Anh bạn ơi tôi còn đang tính Loss đây này.
Xem bản gốcTrả lời0
BoredWatcher
· 11-23 08:42
22 phút hoàn thành? Quá lố, hiệu suất này thật sự To da moon
Xem bản gốcTrả lời0
FrontRunFighter
· 11-23 08:40
không nói dối, cảm giác như đây là một cuộc chạy đua vũ trang khác mà không ai nói đến - đúng là những con số trông rất ấn tượng nhưng ai thực sự được hưởng lợi từ tốc độ này? cảm giác như cùng một kịch bản tập trung mà chúng ta thấy trong giao dịch. những người có cơ sở hạ tầng cứ tiếp tục tiến xa hơn trong khi mọi người khác chỉ ngồi xem từ chỗ rẻ tiền. thực sự thì chi phí tính toán ở đây là gì? đó là nơi mà những vấn đề công bằng thực sự ẩn náu theo ý kiến của tôi.
Vừa chứng kiến một đột phá tối ưu hóa điên rồ - ai đó đã phá vỡ kỷ lục huấn luyện NanoGPT. Đạt loss xác thực 3.28 trên Fineweb chỉ trong 22.3 phút. Thật điên rồ khi kỷ lục trước đó là 24.9 phút. Tốc độ cải thiện hiệu quả huấn luyện mô hình ngày càng tăng nhanh. Những cải tiến về tốc độ này quan trọng hơn rất nhiều so với những gì mọi người nhận ra khi mở rộng các ứng dụng AI.