Arm发布全新终端计算子系统,引领AI驱动下的移动设备性能革新

  作者:ZongYu 时间:2024-06-05来源:EEPW

5 月 30 日,Arm发布了最新的 Arm 终端计算子系统 (Arm CSS for Client),为移动设备行业带来了新的突破。随着人工智能 (AI) 发展的逐渐深入,AI带给了我们越来越多的体验提升,我们正在见证 AI 从手机到笔记本电脑所取得的显著创新,并由此诞生了 AI 智能手机和 AI PC。就在这AI的浪潮之下,Arm所发布的终端 CSS 旨在加速设备端AI 的发展,为智能手机、笔记本电脑、可穿戴设备和数字电视等设备提供更强大的性能和更高的能效。

Arm 终端事业部产品管理副总裁James McNiven在日前举办的媒体沟通会上介绍了Arm发布的终端 CSS。

图片1.png

James McNiven表示,Arm终端CSS将物理实现与 Armv9 的 AI 优势结合在一起,整合了最新的 Armv9.2 CPU 和最新的 Immortalis GPU,最新的 CoreLink 系统互连和系统内存管理单元 (SMMU),并优化到内存及 SoC 其他部分的计算路径。其中,Arm首次在终端领域为CPU 和 GPU 提供物理实现,不仅简化了 SoC 设计流程,还可确保了产品上市速度。    

本次发布的重头戏是最新的 Armv9 CPU —— Arm Cortex-X925,以及 Immortalis GPU —— Arm Immortalis-G925。

我们先来看看Cortex-X925,命名的改变代表的不止是新一代的设计,更是性能的大幅提升。对此James McNiven进一步谈到,Cortex-X925 是 Cortex-X 推出以来取得最高 IPC 同比增幅的 CPU,通过结合新设计所实现的微架构改进和频率提升,Cortex-X925 在 Geekbench 中实现了 36% 的单线程性能增长。以 AI 性能为例,与去年的 Cortex-X CPU 相比,词元 (Token) 首次响应时间提高了 41%,其LLM的初始响应能力有了显著改善。Arm是怎么做到如此显著的性能提升的呢?James McNiven在现场对媒体进行了深入的阐述,得益于微架构的显著演进——Arm迄今为止最宽的解码和矢量设计带来了巨幅的提升,实现了 50% TOPS 数的增长。通过更强的可配置性和更大的私有 L2 缓存大小,保留进出过CPU的指令和数据。而且Arm的 RTL 和物理设计团队之间也展开了进一步协作,针对3nm工艺,提升频率和效率。

而在GPU方面,Arm带来了全新的Arm Immortalis-G925。与CPU的命名一致,作为Arm性能最强、效率最高的 GPU,其在名字上也作出了相应的调整。在各种图形应用上,Immortalis-G925 的性能同比提高了 37%;而在多个 AI/ML 网络上进行测量时,实现了约 34% 的性能提升。此外,还有光线追踪技术。2022 年,Immortalis 将光线追踪技术引入智能手机。今年,Arm大幅提高了光线追踪技术在面对复杂物体时的表现,其性能提升高达 52%。    

在 CSS 上的效率方面,James McNiven介绍到,与 Cortex-A720 相比,Cortex-A725 的能效提高了 35%。该成果源于Arm改进了微架构,并善用工艺和物理 IP 优化。“小核”Cortex-A520 CPU 也随着工艺和物理实现的提升而得到了改进。至于图形效率,Arm发现在提供与去年终端平台相同水平的游戏性能下,《堡垒之夜》等手游的功耗降低了 30%。至于可扩展性,Arm的合作伙伴可以利用这一系列不同的 CPU 和 GPU 选项,针对大屏幕计算、智能手机、数字电视和可穿戴设备等精心设计自己的解决方案。

图片2.png

除了通过 CSS 推动性能和效率提升之外,Arm也一直始终致力于为每一位安卓设备用户提高性能。在 Cortex-X925 带来的 30% 性能提升基础上,Arm对网页浏览器进行了改进,使其性能提高了 23%。除了 Chrome,中国的手机厂商也将这些改进引入到其浏览器中。与此同时,Arm继续携手 Google,推动其安卓动态性能框架 (Android Dynamic Performance Framework) 的发展。在最新版本的框架中,实现高端内容的每帧能耗降低了 25%,帧速率则提高了 35%。此外,Arm还调整了安卓工作负载在不同 CPU 核心之间的平衡方式,从而为 YouTube 节省了高达 10% 的功耗。针对 Google 的 AV1 视频编解码器,Arm对其进行了软件优化,使当下安卓设备的视频性能最多可提高 40%。    

Arm 终端 CSS 的发布标志着移动设备行业迈向了新的阶段,将推动设备端 AI 应用的普及和发展。开发者可以利用终端CSS 的强大性能和软件支持,打造出更加智能、高效和用户体验更佳的设备。

图片3.png

图:Arm 终端事业部产品管理副总裁James McNiven(图左)与 vivo 首席芯片规划专家夏晓菲(图右)分享双方合作

vivo作为Arm的合作伙伴也来到了沟通会的现场,vivo 首席芯片规划专家夏晓菲表示,vivo 非常注重用户体验,在 Arm CSS 的技术基础之上,vivo与 Arm 密切合作,共同推动开发者生态,使手机更流畅更好用,同时也为设备端带来了前沿的 AI 体验。Arm 持续加大 AI 技术上的布局。相信大家会看到 Arm CSS 里面集成更多更强大的 AI 能力,同时提供一个更加广泛的针对开发者的开发环境,能够让所有的开发者基于通用平台开发出自己基于端侧的生成式 AI 应用和体验。    

Arm 终端CSS 的发布为移动设备行业带来了新的机遇,将推动设备端 AI 应用的快速发展。其卓越的的高性能、高效率和高可扩展性,将帮助开发者打造出更加智能、高效和用户体验更佳的设备,为消费者带来更加美好的未来。    


关键词: arm CPU GPU 终端计算子系统 CSS

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版