03:22
Kimi K2 Thinking установил новые рекорды в бенчмарках оценки логического мышления, кодирования и агентских способностей
Данные Jin10 от 8 ноября: согласно официальному сайту Moon's Dark Side, Kimi K2 Thinking установил новые рекорды в бенчмарках оценки логического мышления, кодирования и агентных способностей. K2 Thinking достиг 44.9% SOTA в бенчмарке HLE, 60.2% в тесте BrowseComp, а также в SWE-Bench

