Apresentando o DeepSeek-V3.2-Exp — o nosso mais recente modelo experimental!
✨ Construído em V3.1-Terminus, estreia o DeepSeek Sparse Attention para um processamento mais eficiente de tarefas de longo contexto.
Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
14 gostos
Recompensa
14
6
Republicar
Partilhar
Comentar
0/400
TokenSherpa
· 21h atrás
bem, na verdade, deixe-me explicar porque a atenção esparsa é fundamental para a eficiência do processamento de tokens... *ajusta os óculos*
Ver originalResponder0
LiquidatedThrice
· 21h atrás
Finalmente chegou. Esta onda dá para entrar numa posição?
Ver originalResponder0
DustCollector
· 21h atrás
Ah, este modelo foi atualizado novamente.
Ver originalResponder0
MonkeySeeMonkeyDo
· 21h atrás
Uau, nova coisa!
Ver originalResponder0
gas_fee_trauma
· 21h atrás
Por que vem outro modelo? Que chato, não dá para aguentar.
Apresentando o DeepSeek-V3.2-Exp — o nosso mais recente modelo experimental!
✨ Construído em V3.1-Terminus, estreia o DeepSeek Sparse Attention para um processamento mais eficiente de tarefas de longo contexto.