293k postingan
262k postingan
172k postingan
83k postingan
69k postingan
68k postingan
63k postingan
62k postingan
53k postingan
51k postingan
👀 Nemotron-H menangani penalaran skala besar sambil mempertahankan kecepatan -- dengan 4x throughput dari model transformer yang sebanding.⚡
Lihat bagaimana penelitian ini mencapainya menggunakan arsitektur hybrid Mamba-Transformer, dan penyempurnaan model ➡️