Memperkenalkan DeepSeek-V3.2-Exp — model eksperimen terbaru kami!
✨ Dibangun di atas V3.1-Terminus, ini memperkenalkan DeepSeek Sparse Attention untuk pemrosesan yang lebih efisien dari tugas konteks panjang.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
14 Suka
Hadiah
14
6
Posting ulang
Bagikan
Komentar
0/400
TokenSherpa
· 18jam yang lalu
sebenarnya, izinkan saya menjelaskan mengapa perhatian jarang sangat penting untuk efisiensi pemrosesan token... *mengatur kacamata*
Lihat AsliBalas0
LiquidatedThrice
· 18jam yang lalu
Akhirnya datang, apakah ini bisa masukkan posisi?
Lihat AsliBalas0
DustCollector
· 18jam yang lalu
Wah, model ini sudah diperbarui lagi ya.
Lihat AsliBalas0
MonkeySeeMonkeyDo
· 18jam yang lalu
Wah, benda baru
Lihat AsliBalas0
gas_fee_trauma
· 19jam yang lalu
Kok ada model baru lagi? Sangat menyebalkan, sudah tidak sanggup lagi.
Memperkenalkan DeepSeek-V3.2-Exp — model eksperimen terbaru kami!
✨ Dibangun di atas V3.1-Terminus, ini memperkenalkan DeepSeek Sparse Attention untuk pemrosesan yang lebih efisien dari tugas konteks panjang.