这就是FastVLM发挥作用的地方



他们将一个MLP应用于将FastViTHD中的视觉标记投射到LLM的世界中

结果:代币数量大大减少(,比FastViT少约4倍,比ViT‑L/14在336像素分辨率下少16倍)。我是说,这在代币数量和复杂性上是一个大幅降低,同时
IN2.96%
MLP7.5%
PIXEL1.09%
TOKEN1.2%
查看原文
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 7
  • 转发
  • 分享
评论
0/400
胶水君vip
· 1小时前
这操作讲道理挺猛
回复0
rekt_but_resilientvip
· 6小时前
这里的提升巨大啊!
回复0
GasFeeLovervip
· 09-02 14:39
也就这样吧 有啥好吹的
回复0
ser_we_are_earlyvip
· 09-02 14:39
看来FastVLM真牛逼啊
回复0
BlockchainBardvip
· 09-02 14:38
厉害嗜了 被token数量惊到
回复0
巨鲸资深观察员vip
· 09-02 14:27
又整新东西了啊!
回复0
割肉不割爱vip
· 09-02 14:23
啊啊被吹的有点懵...
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)