Некоторая организация (SGLang) теперь достигает 7 583 токенов в секунду на каждый GPU, работающий с некоторой AI моделью R1 на GB200 NVL72, что является скачком в 2,7 раза по сравнению с H100.
Мы рады видеть, как экосистема с открытым исходным кодом продвигает оптимизацию вывода на GB200 NVL72, снижая стоимость за токен для отрасли на
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
22 Лайков
Награда
22
8
Поделиться
комментарий
0/400
AltcoinHunter
· 06-19 17:03
Жгите, жгите! Повышение в 2.7 раза,上市没
Ответить0
CryptoPunster
· 06-18 08:09
Аппаратная война в будущем покончит с быками.
Ответить0
LiquidityWizard
· 06-17 07:19
*теоретически* умножение эффективности на 2,7x означает -63% базовой стоимости... захватывающе
Ответить0
DeFiDoctor
· 06-17 01:31
Существуют сомнения в режиме цифрового увеличения, рекомендуется пересмотреть контрольную группу.
Ответить0
TokenAlchemist
· 06-17 01:16
мэ, сырые tps не означают оптимальную добычу mev, честно говоря
Ответить0
GasWhisperer
· 06-17 01:16
эти метрики tps текут как гладкие волны мемпула сейчас
Ответить0
ProposalManiac
· 06-17 01:15
Все-таки это Nvidia, очков не хватает.
Ответить0
HodlKumamon
· 06-17 01:09
Эй, какой мощный, ww большие расходы, вычислительная мощность маленького мастера.
Некоторая организация (SGLang) теперь достигает 7 583 токенов в секунду на каждый GPU, работающий с некоторой AI моделью R1 на GB200 NVL72, что является скачком в 2,7 раза по сравнению с H100.
Мы рады видеть, как экосистема с открытым исходным кодом продвигает оптимизацию вывода на GB200 NVL72, снижая стоимость за токен для отрасли на