تحقق منظمة معينة (SGLang) الآن 7,583 توكن في الثانية لكل وحدة معالجة رسومية تعمل على نموذج AI معين R1 على GB200 NVL72، وهو قفزة بمقدار 2.7 مرة مقارنة بـ H100.



نحن متحمسون لرؤية نظام المصادر المفتوحة يتقدم في تحسينات الاستدلال على GB200 NVL72، مما يقلل من تكلفة كل رمز للصناعة عند
A2.62%
OVER2.91%
TOKEN‎-6.08%
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 9
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت