Một tổ chức (SGLang) hiện đạt 7.583 token mỗi giây trên mỗi GPU chạy mô hình AI nào đó R1 trên GB200 NVL72, tăng 2.7 lần so với H100.
Chúng tôi rất vui khi thấy hệ sinh thái mã nguồn mở tiến bộ tối ưu hóa suy diễn trên GB200 NVL72, giảm chi phí trên mỗi token cho ngành công nghiệp tại
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
22 thích
Phần thưởng
22
8
Chia sẻ
Bình luận
0/400
AltcoinHunter
· 06-19 17:03
Hãy bắt đầu giao dịch nào! Tăng 2.7 lần, chưa niêm yết.
Trả lời0
CryptoPunster
· 06-18 08:09
Chiến tranh phần cứng trong tương lai cuốn chết bọn đầu cơ
Trả lời0
LiquidityWizard
· 06-17 07:19
*về lý thuyết* việc nhân hiệu suất lên 2.7x có nghĩa là -63% chi phí cơ bản... thật thú vị
Trả lời0
DeFiDoctor
· 06-17 01:31
Chế độ tăng cường số liệu còn nghi ngờ, đề nghị kiểm tra lại nhóm đối chứng.
Trả lời0
TokenAlchemist
· 06-17 01:16
meh, raw tps không có nghĩa là tối ưu hóa việc khai thác mev thật lòng mà nói
Trả lời0
GasWhisperer
· 06-17 01:16
những chỉ số tps đó đang chảy như những làn sóng mempool mượt mà rn
Trả lời0
ProposalManiac
· 06-17 01:15
Vẫn là Nvidia thôi, điểm số chưa đủ.
Trả lời0
HodlKumamon
· 06-17 01:09
Êi, mạnh mẽ quá ww, chi phí lớn, khả năng tính toán nhỏ.
Một tổ chức (SGLang) hiện đạt 7.583 token mỗi giây trên mỗi GPU chạy mô hình AI nào đó R1 trên GB200 NVL72, tăng 2.7 lần so với H100.
Chúng tôi rất vui khi thấy hệ sinh thái mã nguồn mở tiến bộ tối ưu hóa suy diễn trên GB200 NVL72, giảm chi phí trên mỗi token cho ngành công nghiệp tại