AMD的锐龙AI Halo:本地AI处理即将重塑行业

从云计算到边缘计算的转变

基于云的AI推理变得成本高昂。尽管代币成本大幅下降——斯坦福数据显示,GPT-3.5等效模型的价格在两年内下降了280倍——企业仍然面临AI工作负载爆炸式的支出。当涉及到高级推理模型和AI代理时,问题尤为严重,因为它们所需的代币远远多于简单推理任务。

这为市场创造了机会。随着AI模型变得更高效,硬件性能提升,在个人设备上本地处理某些工作负载开始变得具有经济意义。德勤提出的框架识别出三种不同的部署场景:云端超大规模提供商处理复杂、实验性工作负载,需用到顶级模型;本地基础设施服务于可预测、敏感的工作负载,延迟至关重要;边缘设备,包括个人电脑,使用较小模型支持实时任务。

关键的洞察是什么?我们正进入一个分布式AI处理不可避免的时代。

AMD的答案:Ryzen AI Halo平台

在CES上,AMD推出了一款值得关注的产品,远超引人注目的MI440X GPU:Ryzen AI Halo。这款迷你PC将在第二季度推出,代表了其在下一计算周期中的重要定位。

规格说明了这一点:

  • 16核CPU架构
  • 128GB统一内存容量
  • 集成AI处理器与图形协处理器
  • 总AI计算能力:高达126 TOPS(万亿次操作每秒)(Trillion Operations Per Second)

这款产品并非面向大众消费者,而是为开发者设计的平台,旨在帮助工程师在本地构建AI应用。128GB的内存池支持运行大型开源AI模型——比如参数数以亿计的模型——直接在设备上。虽然这些模型无法与OpenAI或Anthropic的前沿模型相抗衡,但已足够应对复杂的实际任务。

这款产品对AMD未来的重要意义

Ryzen AI Halo可能不会实现爆款销售。它价格昂贵、专业化、定位狭窄,但这反映了AMD战略思考的深远意义。

该公司更广泛的AI PC产品线已经具备了实质性能力。Ryzen AI 400系列提供60 TOPS,已于本月开始出货,而Halo中的Ryzen AI Max+处理器支持完整的128GB内存配置,并能运行参数达1280亿的模型。

当今的AI PC面临诸多限制。处理能力仍不足,内存容量受限,内存供应问题依然存在。但这些只是暂时的障碍,而非永久的限制。

不可避免的融合

考虑像Claude Code这样的代码助手,它们已经改变了编程工作流程。配备相当复杂度的AI模型的笔记本电脑还需要多久?三年?四年?趋势指向一个方向。

在本地运行AI推理可以消除持续的云API成本,保护数据隐私,并将延迟降至接近零。这些优势会逐步叠加。同时,要求设备远程查询服务以完成本地能处理的任务,最终会变得不划算。

面向未来市场的定位

AMD不再仅仅与Nvidia在数据中心竞争。公司正为一种计算范式做准备——智能处理更接近用户,个人设备成为强大的AI平台,而其在这一转变中的重要角色也变得日益明显。

Ryzen AI Halo目前仍是一个细分市场,但未来强大的本地AI处理器将不再是。AMD正在打基础,为未来这一转变到来时做好准备——在不断演变的AI生态系统中占据多个层级的价值位置。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)