Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
👀 Nemotron-H aborde le raisonnement à grande échelle tout en maintenant la vitesse -- avec 4x le débit des modèles de transformateur comparables.⚡
Découvrez comment la recherche a réalisé cela en utilisant une architecture hybride Mamba-Transformer et un ajustement de modèle ➡️