¡Presentamos DeepSeek-V3.2-Exp — nuestro último modelo experimental!
✨ Construido sobre V3.1-Terminus, presenta DeepSeek Sparse Attention para un procesamiento más eficiente de tareas de contexto largo.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
13 me gusta
Recompensa
13
6
Republicar
Compartir
Comentar
0/400
TokenSherpa
· hace9h
bueno, en realidad, déjame desglosar por qué la atención dispersa es fundamental para la eficiencia en el procesamiento de tokens... *ajusta las gafas*
Ver originalesResponder0
LiquidatedThrice
· hace9h
Finalmente ha llegado, ¿se puede introducir una posición en esta ola?
Ver originalesResponder0
DustCollector
· hace9h
Ah, este modelo se ha actualizado de nuevo.
Ver originalesResponder0
MonkeySeeMonkeyDo
· hace9h
¡Vaya! Nueva cosa.
Ver originalesResponder0
gas_fee_trauma
· hace9h
¿Por qué viene otro modelo nuevo? Es tan molesto, ya no puedo pagar esto.
¡Presentamos DeepSeek-V3.2-Exp — nuestro último modelo experimental!
✨ Construido sobre V3.1-Terminus, presenta DeepSeek Sparse Attention para un procesamiento más eficiente de tareas de contexto largo.