توّي شاهدت تقدم مذهل في تحسين الأداء - أحدهم حطم الرقم القياسي لتدريب NanoGPT. حقق خسارة تحقق (validation loss) بمقدار 3.28 على Fineweb خلال 22.3 دقيقة فقط. هذا شيء جنوني بالنظر إلى أن الرقم القياسي السابق كان 24.9 دقيقة. وتيرة تحسين كفاءة تدريب النماذج تتسارع باستمرار. هذي التحسينات في السرعة أهم بكثير مما يتصور الناس بالنسبة لتوسيع تطبيقات الذكاء الاصطناعي.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 21
أعجبني
21
6
إعادة النشر
مشاركة
تعليق
0/400
GasFeeSurvivor
· 11-26 00:28
يا إلهي، هذه السرعة غير معقولة، 22 دقيقة فقط لتدمير الرقم القياسي السابق؟ هذه هي التحسينات الحقيقية!
شاهد النسخة الأصليةرد0
BugBountyHunter
· 11-24 19:17
يا إلهي 22 دقيقة؟ هذه السرعة حقًا غير معقولة، تحسين الأجهزة هنا حقًا سيء قليلًا مما يجعل الفارق شاسعًا
شاهد النسخة الأصليةرد0
DegenWhisperer
· 11-23 08:55
يا ساتر، 22 دقيقة؟ هالسرعة فعلاً خرافية، أحس الشهر الجاي بنكسر الرقم القياسي من جديد.
شاهد النسخة الأصليةرد0
PaperHandsCriminal
· 11-23 08:46
جايين تتنافسوا في كفاءة التدريب؟ يا رجال أنا لسه أحسب الـLoss
شاهد النسخة الأصليةرد0
BoredWatcher
· 11-23 08:42
22 دقيقة لإنهائها؟ غير معقول، هذه الكفاءة حقاً للقمر
شاهد النسخة الأصليةرد0
FrontRunFighter
· 11-23 08:40
بصراحة، يبدو أن هذه سباق تسلح آخر لا يتحدث عنه أحد - نعم، الأرقام تبدو رائعة ولكن من يستفيد فعلاً من هذه السرعة؟ يبدو أن نفس كتاب اللعب المركزي الذي نراه في التداول. أولئك الذين لديهم البنية التحتية يستمرون في التقدم بينما يشاهد الجميع من المقاعد الرخيصة. ما هو الانهيار الفعلي لتكاليف الحوسبة هنا؟ هذا هو المكان الذي تختبئ فيه مشاكل العدالة الحقيقية برأيي.
توّي شاهدت تقدم مذهل في تحسين الأداء - أحدهم حطم الرقم القياسي لتدريب NanoGPT. حقق خسارة تحقق (validation loss) بمقدار 3.28 على Fineweb خلال 22.3 دقيقة فقط. هذا شيء جنوني بالنظر إلى أن الرقم القياسي السابق كان 24.9 دقيقة. وتيرة تحسين كفاءة تدريب النماذج تتسارع باستمرار. هذي التحسينات في السرعة أهم بكثير مما يتصور الناس بالنسبة لتوسيع تطبيقات الذكاء الاصطناعي.