Giới thiệu DeepSeek-V3.2-Exp — mô hình thử nghiệm mới nhất của chúng tôi!
✨ Được xây dựng trên V3.1-Terminus, nó ra mắt DeepSeek Sparse Attention để xử lý hiệu quả hơn các tác vụ có bối cảnh dài.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
13 thích
Phần thưởng
13
6
Đăng lại
Retweed
Bình luận
0/400
TokenSherpa
· 9giờ trước
thật ra, để tôi giải thích lý do tại sao attention thưa thớt lại vô cùng quan trọng cho hiệu quả xử lý token... *điều chỉnh kính*
Xem bản gốcTrả lời0
LiquidatedThrice
· 9giờ trước
Cuối cùng cũng đến rồi, đợt này có nhập một vị thế được không?
Xem bản gốcTrả lời0
DustCollector
· 9giờ trước
À, mô hình này lại được cập nhật rồi.
Xem bản gốcTrả lời0
MonkeySeeMonkeyDo
· 9giờ trước
Ôi mẹ ơi, đồ chơi mới
Xem bản gốcTrả lời0
gas_fee_trauma
· 9giờ trước
Sao lại có mô hình mới nữa vậy? Thật phiền phức, không đủ sức để theo kịp.
Giới thiệu DeepSeek-V3.2-Exp — mô hình thử nghiệm mới nhất của chúng tôi!
✨ Được xây dựng trên V3.1-Terminus, nó ra mắt DeepSeek Sparse Attention để xử lý hiệu quả hơn các tác vụ có bối cảnh dài.