Grok 4.2 وصلت للتو إلى 60% على معيار ARC AGI 2. أداء قوي جدًا هناك. يبدو أننا نشهد لحظة جديدة من التقدم في قدرات الذكاء الاصطناعي. الاستمرار في التقدم على هذه المعايير الموحدة يدفع حدود ما يمكن لهذه النماذج التعامل معه.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 15
أعجبني
15
5
إعادة النشر
مشاركة
تعليق
0/400
LiquidationHunter
· منذ 3 س
60%؟ هذا لا يقترب بعد، لا بد أن نستمر في المنافسة
شاهد النسخة الأصليةرد0
SnapshotLaborer
· منذ 13 س
60%، هذه النسبة تبدو جيدة لكنها ليست مبالغ فيها... على أي حال، هذه المعايير القياسية لا تعني شيئًا، والأهم هو كيف تستخدمها في الواقع.
شاهد النسخة الأصليةرد0
ForkInTheRoad
· منذ 13 س
60%؟ شعرت أنه ليس بهذا الانفجار كما توقعت... كنت أعتقد أنه يمكن أن يتجاوز 70
شاهد النسخة الأصليةرد0
MEV_Whisperer
· منذ 13 س
نعم، تم تحديث معيار نجل آرك مرة أخرى، لكن هل يمكن حقًا أن يوضح هذا بنسبة 60%؟ أشعر أن هذه القوائم لا تزال تختلف كثيرًا عن التطبيقات الفعلية...
شاهد النسخة الأصليةرد0
NeonCollector
· منذ 13 س
60٪، كم حجم هذه الرطوبة المعيارية... الذكاء الاصطناعي العام الحقيقي لا يزال بعيدا عن ذلك
Grok 4.2 وصلت للتو إلى 60% على معيار ARC AGI 2. أداء قوي جدًا هناك. يبدو أننا نشهد لحظة جديدة من التقدم في قدرات الذكاء الاصطناعي. الاستمرار في التقدم على هذه المعايير الموحدة يدفع حدود ما يمكن لهذه النماذج التعامل معه.