Grok 4.2 وصلت للتو إلى 60% على معيار ARC AGI 2. أداء قوي جدًا هناك. يبدو أننا نشهد لحظة جديدة من التقدم في قدرات الذكاء الاصطناعي. الاستمرار في التقدم على هذه المعايير الموحدة يدفع حدود ما يمكن لهذه النماذج التعامل معه.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • إعادة النشر
  • مشاركة
تعليق
0/400
LiquidationHuntervip
· منذ 3 س
60%؟ هذا لا يقترب بعد، لا بد أن نستمر في المنافسة
شاهد النسخة الأصليةرد0
SnapshotLaborervip
· منذ 13 س
60%، هذه النسبة تبدو جيدة لكنها ليست مبالغ فيها... على أي حال، هذه المعايير القياسية لا تعني شيئًا، والأهم هو كيف تستخدمها في الواقع.
شاهد النسخة الأصليةرد0
ForkInTheRoadvip
· منذ 13 س
60%؟ شعرت أنه ليس بهذا الانفجار كما توقعت... كنت أعتقد أنه يمكن أن يتجاوز 70
شاهد النسخة الأصليةرد0
MEV_Whisperervip
· منذ 13 س
نعم، تم تحديث معيار نجل آرك مرة أخرى، لكن هل يمكن حقًا أن يوضح هذا بنسبة 60%؟ أشعر أن هذه القوائم لا تزال تختلف كثيرًا عن التطبيقات الفعلية...
شاهد النسخة الأصليةرد0
NeonCollectorvip
· منذ 13 س
60٪، كم حجم هذه الرطوبة المعيارية... الذكاء الاصطناعي العام الحقيقي لا يزال بعيدا عن ذلك
شاهد النسخة الأصليةرد0
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$3.55Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.56Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.61Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$3.85Kعدد الحائزين:2
    1.29%
  • القيمة السوقية:$3.54Kعدد الحائزين:1
    0.00%
  • تثبيت