aquí es donde entra FastVLM



ellos aplican un MLP para proyectar tokens visuales de FastViTHD en el mundo del LLM

el resultado: muchos menos tokens (como 4× menos que FastViT, 16× menos que ViT‑L/14 a 336‑píxel res). Quiero decir, eso es una gran reducción en el conteo de tokens y complejidad, mientras
IN1.17%
MLP7.62%
PIXEL1.2%
TOKEN-0.07%
Ver originales
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 7
  • Republicar
  • Compartir
Comentar
0/400
GlueGuyvip
· hace4h
Esta operación, en teoría, es bastante impresionante.
Ver originalesResponder0
rekt_but_resilientvip
· hace9h
¡La mejora aquí es enorme!
Ver originalesResponder0
GasFeeLovervip
· 09-02 14:39
Así está bien, ¿qué hay para presumir?
Ver originalesResponder0
ser_we_are_earlyvip
· 09-02 14:39
Parece que FastVLM es realmente increíble.
Ver originalesResponder0
BlockchainBardvip
· 09-02 14:38
Increíble, me sorprende la cantidad de tokens.
Ver originalesResponder0
WhaleWatchervip
· 09-02 14:27
¡Ya han hecho algo nuevo!
Ver originalesResponder0
DiamondHandsvip
· 09-02 14:23
Ah, estoy un poco aturdido por el viento...
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)