新的Arm GPU助力释放设备市场中的游戏和AI创新潜能

  作者:Arm终端事业部GPU产品管理高级总监Anand Patel 时间:2024-06-13来源:EEPW

作为人们日常数字生活中不可或缺的一部分,Arm GPU赋能了从当今智能手机上的沉浸式游戏,到各类边缘侧人工智能 (AI) 体验的方方面面。目前,Arm合作伙伴的GPU出货量已超过100亿颗,而这一卓越成就归功于我们业界领先的生态系统。这些 GPU 广泛应用于包括智能手机、平板电脑、智能电视、机顶盒、智能手表和 XR 可穿戴设备在内的各类消费电子设备。

去年此时,我们推出了新的第五代GPU架构及一系列新的GPU,包括 Arm Immortalis-G720 GPU。 MediaTek的天玑9300 系统级芯片(SoC)平台便采用此GPU。之后,知名手机厂商vivo和OPPO的旗舰智能手机都先后采用了该芯片。

今年,我们很高兴推出第二代基于Arm第五代GPU架构构建的GPU产品,成为 Arm 终端计算子系统 (CSS) 的重要组件。其中包括新的 Arm Immortalis-G925 GPU、Arm Mali-G725 GPU 和 Arm Mali-G625 GPU,它们适用于从旗舰智能手机、高端手机,到智能手表、入门级移动设备等各类消费电子设备,这些 GPU 产品的两大设计重心:

●   作为手机游戏持续演进的一部分,实现沉浸式视觉体验

●   在主流应用中加速实现 AI 体验

出色的游戏性能

去年推出的 Immortalis-G720 在多数的图形基准测试中都以其峰值性能(每秒帧数, fps)和更长游戏时间的持续性能击败对手。通过推出 Arm 目前性能最强、效率最高的 GPU —— Immortalis-G925,我们持续推动这一出色表现。在 Arm 参考平台上进行比较时,Immortalis-G925 的性能 (fps) 比 Immortalis-G720提高了 37%。此外,在提供与 Immortalis-G720 相当的游戏性能时,Immortalis-G925 的功耗降低了 30%。

1718272591959307.png

图 Immortalis-G720对比其他SoC在领先的图形基准测试中的表现情况

这一出色性能延伸到了关键的手机游戏领域,与 Immortalis-G720 相比,Immortalis-G925 的性能平均提升了 46%。单看各款游戏,《原神》的性能提升 49%,而《Roblox》的运行速度加快 46%。其他热门手机游戏的性能提升幅度均在 29% 至 72% 之间,包括《使命召唤手游》、《暗黑破坏神:不朽》、《明日之后》、《堡垒之夜》和《绝地求生手游》。

这些令人惊喜的游戏改进对于开发者和最终的游戏玩家来说都意义非凡。

1718272616365355.png

图 Immortalis-G925整体性能提升

不断追求更逼真的游戏体验

手游内容趋势的演变是Arm持续关注的重点,用以确保我们的 GPU 产品能满足开发者和生态系统合作伙伴的需求。Immortalis-G925 也不例外,该 GPU 专为最新的游戏技术、功能和趋势而设计。而正是整个生态系统的协同合作,造就了更优异的游戏体验。

近年来,场景几何在手游领域持续发展,其可增加游戏对象的清晰度,有助于创建更逼真的地形,并为游戏角色赋予更高的真实感。事实上,随着开发者努力创建更多的场景细节和更高的真实感,热门游戏《堡垒之夜》和《原神》的几何复杂度同比增长了 9% 至 11%。

复杂的片段着色技术通过为对象和角色赋予纹理感,制作出更逼真的游戏体验。该技术可实现高质量游戏效果,如光晕、模糊和基于物理的着色。在《堡垒之夜》和《原神》中,片段着色器在 GPU 上花费的时间激增,同比增加 27% 到 43%。

为满足针对更复杂几何体的需求,Immortalis-G925引入了片段预处理 (Fragment Prepass) 的新机制。借助该图形技术,应用无需进行任何对象或原语排序,并且在处理几何工作负载时,能够更高效地减少过度绘制。通过片段预处理,我们观察到由于无需对象排序,渲染线程周期缩短高达 43%。这不仅提高了性能和能效,也减少了 CPU 的负载。

自从在 Immortalis-G715 GPU 中引入光线追踪以来,该技术正愈发普遍,其有助于创建更真实的阴影、反射和高级光照效果。Immortalis-G925 持续推动光线追踪内容的改进,对复杂对象的光线追踪性能提高了 52%。通过对光线追踪内容进行内部测试,我们正进一步提高其性能。例如,在游戏场景透明度方面保持相同准确度的同时,性能提升 27%。开发者也可选择将游戏场景透明度的准确性略微降低,由此带来高达 52% 的惊人性能提升,并降低 57% 的内存流量。

1718272651107406.png

图 Immortalis-G925光线追踪提升

增加着色器核心,以支持更多的消费市场

为应对笔记本电脑、Chromebook 和游戏手机等各类消费电子设备市场日益增长的性能需求,Immortalis-G925 所支持的着色器核心数量增加了 50%,达到 24 个核心的最大配置,而上一代最多只有 16 个。

为扩展到该性能点,图块吞吐量和命令流前端 (Command Stream Front-end, CSF) 均经过更改和优化。我们已经能够将图块吞吐量翻番,并对 CSF 进行了多项改进,包括对关键命令的硬件支持和增加硬件接口数量,以加快将作业分配给着色器核心的速度。

在新推出的 GPU 中,着色器核心的数量均已扩展。Immortalis-G925 可配置 10 个以上的核心,适用于旗舰智能手机等高性能消费技术市场。Mali-G725 可在六至九个核心之间扩展,主要针对高端手机市场。此外,它还能提供与 Immortalis-G925 相同的 API 支持,同时为 Immortalis-G925 目标范畴以外的稍低级别设备提供引人入胜的沉浸式游戏体验。Mali-G625 可在一至五个核心之间扩展,适用于智能手表和入门级移动设备。

1718272678552182.png

图  Immortalis-G925、Mali-G725和Mali-G625的核心数

AI性能提升

与前几代产品一样,我们不断提升 AI 工作负载在 GPU 上的性能和效率。作为 Arm 终端 CSS 的重要组件,Immortalis-G925 在 AI 和机器学习 (ML) 网络中的推理速度比 Arm 2023 全面计算解决方案 (TCS23) 中的 Immortalis-G720 提高了 34%。虽然大多数 AI 处理工作能够在 CPU 上进行,但 GPU 为各种 AI 用例提供加速功能,包括图像分类、图像分割、对象检测、自然语言处理和语音转文本等。

与 TCS23 中的 Immortalis-G720 相比,Immortalis-G925 作为 Arm 终端 CSS 的一部分,在关键用例中提供一系列 AI 性能改进。在图像处理方面(包括分割和分类),Immortalis-G925可实现41%的性能提升,表现抢眼。同时,在超级采样任务中,开发者可以使用神经网络对图像进行向上扩展,其性能可提高近30%,而在自然语言处理和语音转文本,性能可提高 50%,同样十分惊艳。

1718272702991100.png

图 Immoratlis-G925 AI性能提升

此外,Arm正携手生态系统合作伙伴,以提高AI性能。通过与Unity合作,我们帮助将int8支持引入面向基于 Unity 应用的ML框架Sentis。采用int8后,其性能提升44%,同时内存占用空间减少,从而改善了基于ML的移动游戏体验。

最后,作为 Arm 终端 CSS 的一部分,我们协同设计并交付 GPU 物理实现。我们携手领先的代工厂合作伙伴,实现了流片就绪的 Immortalis-G925 三纳米工艺的物理实现,助力我们的合作伙伴能够在三纳米工艺上充分发挥功耗、性能和面积 (PPA) 优势,同时通过生产就绪的芯片解决方案来缩短芯片的开发与部署时间。

生态系统协作推动图形技术进步

除了推出 GPU 新品,Arm 还致力于与游戏生态系统合作,从而带来先进的图形特性和功能。

我们正在与 Epic Games 携手,在安卓上启用其虚幻引擎 5 (Unreal Engine 5) 桌面平台渲染器。对于开发者来说,这将确保 Immortalis 和 Mali GPU 也能在移动设备上提供桌面级质量的渲染和图形效果。作为虚幻引擎 5 桌面平台渲染器相关工作的一部分,用于光线追踪的 Lumen 光照解决方案已针对 Arm GPU 进行了优化,尤其是支持基于硬件光线追踪的 GPU。使用 Lumen 的开发者可以利用我们的最佳实践建议来管理场景复杂性、更新频率和探测器设置,达到游戏主机品质的光照效果。

我们还与 Google 和 MediaTek 围绕安卓动态性能框架 (Android Dynamic Performance Framework, ADPF) 展开合作。借助这一来自 Google 的强大 API,开发者能够根据移动设备的实时热状态信息来优化其应用的用户体验和性能。在手机游戏等高要求应用中,这可以降低功耗、避免过热并延长游戏时间。通过在 Arm 技术驱动的 Google Pixel 8 智能手机上启用 ADPF,我们在 2024 世界移动通信大会 (MWC 2024) 上展示了 Steel Arms 手机游戏演示,呈现了25% 的每帧能耗减低,以及 35% 的帧速率提升。

与此同时,Arm还通过一系列GPU工具和资源,保持对游戏开发者一贯的生态系统支持。Arm Performance Studio 延续 Arm Mobile Studio 的成功,借助扩展分析工具,进一步支持移动设备和 GPU 以外的一系列新工作负载、平台和设备,包括面向服务器市场的CPU和Arm Linux平台。作为Arm Performance Studio的一部分,我们新增了Arm Frame Advisor,使开发者能够更易实现图形分析和优化,从而更准确地针对其优化目标,并更快地将软件推向市场。

为新一代AI和游戏体验而打造

随着手游和AI工作负载的不断演进,新一代 Arm GPU 可提供出色的性能和效率优势,带来无可匹敌的用户体验。之前的 Arm GPU 已应用于主要的消费电子设备中,并展现出优异的峰值和持续游戏性能,而新一代 GPU 将延续先前产品的强劲势头。

1718272732711638.png

通过Immortalis-G925、Mali-G725和Mali-G625,我们的目标是覆盖从旗舰到入门等不同级别的广泛消费电子设备,我们看到越来越多的消费者与合作伙伴要求更加沉浸式的手游和 AI 体验。我们新的 GPU 能够满足这些需求,提供无与伦比的游戏和 AI 性能。这意味着,全球数百万开发者和数十亿用户与基于 Arm 架构的设备进行交互,将获得更快、更沉浸式、更智能的视觉体验。

关键词: Arm GPU 游戏

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版