2025-09-29 21:54:27

Présentation de DeepSeek-V3.2-Exp — notre dernier modèle expérimental !

✨ Basé sur V3.1-Terminus, il fait ses débuts avec DeepSeek Sparse Attention pour un traitement plus efficace des tâches à long contexte.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

13 J'aime

Récompense
13
6
Reposter
Partager

Commentaire

0/400

TokenSherpa

· Il y a 9h

eh bien, en fait, laissez-moi expliquer pourquoi l'attention sparse est fondamentalement critique pour l'efficacité du traitement des tokens... *ajuste ses lunettes*

Voir l'originalRépondre0

LiquidatedThrice