Представляем DeepSeek-V3.2-Exp — нашу последнюю экспериментальную модель!



✨ Построенный на V3.1-Terminus, он дебютирует с DeepSeek Sparse Attention для более эффективной обработки задач с длинным контекстом.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 6
  • Репост
  • Поделиться
комментарий
0/400
TokenSherpavip
· 9ч назад
ну на самом деле, позвольте мне объяснить, почему разреженное внимание является фундаментально критичным для эффективности обработки токенов... *подправляет очки*
Посмотреть ОригиналОтветить0
LiquidatedThricevip
· 9ч назад
Наконец-то пришло. Можно войти в позицию в этот раз?
Посмотреть ОригиналОтветить0
DustCollectorvip
· 9ч назад
А, эта модель опять обновилась.
Посмотреть ОригиналОтветить0
MonkeySeeMonkeyDovip
· 9ч назад
Черт возьми, новая штука
Посмотреть ОригиналОтветить0
gas_fee_traumavip
· 9ч назад
Почему снова новая модель? Так бесит, не могу себе это позволить.
Посмотреть ОригиналОтветить0
probably_nothing_anonvip
· 9ч назад
Снова в модели текстового свёртывания…
Посмотреть ОригиналОтветить0
  • Закрепить