当我们谈论DPU时,我们在谈论什么

网络与存储 时间:2024-06-25来源:EEPW

2024年6月19日,重新定义DPU——中科驭数2024产品发布会顺利举办,这对中科驭数来说是个大日子。故事还要从6年前说起,据中科驭数CEO鄢贵海分享,“从创立之处中科驭数团队就带着对科技创新无比坚定的信念、对发展自主可控核心技术的不懈追求,对变幻莫测的市场的深深敬畏,和对未来智能计算技术趋势的研判,从实验室勇敢地迈出了科技创业的稳健步伐。不仅要把DPU做成一个产品,更要把“驭数”做成一个品牌,做成一个在数字时代助力数字中国的品牌,成为这个时代趁势而上的企业。”。

1719300527641869.jpg


在复杂大型芯片每代产品普遍3~5年的研发周期中,中科驭数用6年的时间,完成了三代芯片的迭代,平均每代芯片迭代仅有不到2年的时间。同时在成本控制上,也远小于行业的平均值。其秘诀——就是全栈技术自主研发,重硅前验证,快速迭代。用理论来指导实践,而非盲目地诉诸于通过工程试错来优化设计。

何为“重新定义DPU”

DPU是当下算力基础设施的核心创新之一,被寄予了数据中心三大支柱芯片之一的定位,戴上了“PU”的王冠。好比数据网络的——高铁时代,已经不仅仅是连通城市问题,而是彻底重构了地理位置的逻辑距离。

1719300550550932.png

如果把CPU比做大脑、那么GPU就好比是肌肉、而DPU就是神经中枢。CPU承载了应用生态,决定了计算系统是否可以通用;GPU提供了高密度各类精度的算力,决定了系统是否有足够的“力量”;DPU负责数据在各种CPU和GPU之间高效流通,决定了系统是否能协同工作。

关于DPU的重新定义,鄢贵海表示可以从两个维度来深入理解。首先,DPU已超越单纯的芯片范畴,它涵盖了更广泛的架构和软件生态。同时我们也强调了软件护城的概念,这意味着基础软件和平台在云端的深度集成与应用是DPU技术落地的关键。因此,要真正发挥DPU的潜力,需要在架构、软件以及应用这三个层次上共同发力。

第二个维度涉及DPU的目标应用。传统的DPU理解往往局限于卸载CPU上的某些任务,但这种观念已经过时且具有误导性。如今的DPU应用远不止于此,它处理的任务类型更为广泛和复杂。例如,在处理安全业务或构建分布式安全机制时,DPU能够轻松应对CPU难以有效处理的负载。DPU已成为算网融合的关键组件,特别是在网络中进行计算的任务,这是CPU无法替代的。

综上所述,DPU的定义需要分层次理解,不能仅局限于芯片本身。同时,也应该摒弃狭义的DPU功能认知,而是将其置于更广泛的分布式和集群性系统背景下考虑。这样才能更准确地把握DPU在计算机系统中所承载的负载类型,从而更好地利用这一关键组件提升系统的整体性能。

不同技术路线的DPU

       全球DPU芯片市场正在经历一场由多家科技巨头引领的变革。NVIDIA之外,Intel在2015年收购Altera后,于2021年6月推出了IPU类DPU产品,而Marvell自2018年起通过收购Cavium、Avera Semiconductor和Innovium等公司增强实力。Xilinx在2019年收购Solarflare后,于2020年发布Alveo系列加速卡,随后于2022年被AMD收购,进一步扩大了AMD在DPU领域的布局,完成了从CPU、GPU、FPGA到DPU的全云端覆盖。

国内市场上,除了阿里巴巴、华为和腾讯等领军企业外,新兴厂商如中科驭数、云豹智能、云脉芯联等也纷纷崛起。

在技术层面,DPU的不同技术路径各有优劣。ASIC以其高性能、低功耗和低成本著称,但可编程性较低;FPGA提供了高灵活性和可编程性,但成本高昂、功耗较大;而基于SoC的技术路线,如NVIDIA的Blue Field DPU,以其可编程性和高灵活性成为DPU发展的主流方向,为更复杂、更广泛的应用场景提供了更优的实施选项。

中科驭数CTO卢文岩指出,FPGA在过去两年中因其开发效率而受到广泛青睐,但其局限性也愈发明显:功耗偏高、频率难以大幅提升,且资源受限。因此,FPGA更适合作为DPU产品早期验证阶段的产品路线。

中科驭数所走的技术路线与AMD相近,强调可编程处理核心与轻量级控制的结合,这种技术策略近期表现出强劲的生命力。业界普遍认可的重数据通路加轻量级控制的趋势,正是中科驭数与AMD所采纳的发展方向,并经过数年探索,这一路线已得到业界的广泛认同。

打造独立自主的DPU生态

国内首颗量产全功能DPU芯片K2-Pro,由中科驭数研发,是专为突破大规模数据中心性能瓶颈而设计的高效数据处理芯片。它采用自主研发的KPU架构,集成了网络、存储、安全及计算等多功能,实现包处理速率翻倍至80Mpps,并支持高达200G的网络带宽。

K2-Pro凭借高度可编程性,为数据中心提供了灵活扩展性,并在处理复杂任务时能耗降低30%。作为纯国产高性能解决方案,K2-Pro适用于云计算、智能计算及高性能计算等领域。其背后的KPU架构基于“软件定义硬件”技术,通过定制化的功能核实现高效处理,而KISA指令集则是业界首个面向DPU的专用指令系统,支持敏捷异构。


1719300588368187.jpg 

在专用计算领域,DPU作为一种复杂的算力芯片,其编程范式的多样性和不统一性,很难满足上层应用敏捷迭代的需求。KISA(Kernel-based Instruction Set Architecture)是中科驭数面向DPU强IO、强数据、弱控制、敏捷异构的需求而推出的强扩展指令集,是业界首个面向DPU领域的专用指令集。不同于传统的CPU指令集,KISA面向数据而非控制,高计算密度型而非低计算密度型,以数据流为基本操作单元,而非字节。更重要的是,KISA首次在指令集层次支持敏捷异构,用一套统一的指令实现了多种异构处理核进行管理调度。

目前,KISA指令集涵盖了KISA基础架构、以及面向DPU专用处理扩展指令,包含包解析、转发指令、以及表查询指令等。基于KISA已经覆盖25大类应用场景,累计数百个用例,得到非常充分验证。

1719300630974763.jpg

此外,中科驭数还推出了DPU敏捷异构软件开发平台HADOS 3.0,该平台集成了DPU核心软件能力,并提供了丰富的API和模块,已广泛应用于金融、电信等行业,展现出与业界巨头竞争的实力。K2-Pro芯片的成功研发,使得中科驭数能够推出思威、福来、功夫三大产品系列,精准满足各类业务场景需求。

潜力无限的DPU市场

随着信息技术的持续发展,数据中心网络带宽从100G迈入400G,甚至将提升至800G或1.6T。然而,作为提供算力的物理载体,受限于通用CPU的结构的冯诺依曼瓶颈、摩尔定律逐渐失效等因素的影响,以CPU为网络核心的数据处理能力难以支持大规模新型数据中心的网络和数据的算力需求。

由此,DPU已经成为继CPU、GPU之后未来数据中心的第三颗主力芯片。DPU提供的高吞吐、低时延、基础设施卸载能力,帮助数据中心完美的规避了“信息孤岛”问题。未来的技术发展趋势将会是高度集成化的片上数据中心的模式(Data Center Infrastructure on a chip),即一个GPU、CPU、DPU共存的时代。

全球范围内,英伟达、英特尔、AMD、微软等业界巨头纷纷在DPU领域展开积极布局。特别是英伟达,凭借其GPU与DPU的强强联合,推出了针对高性能计算的先进算力方案,并在每年的GTC大会上持续展现其创新实力。而在国内,中科驭数更是脱颖而出,率先完成了三代DPU芯片的研发迭代,并成功实现规模化商用,展现了国内DPU产业的强劲实力。

从国际市场上来看,2020年,全球DPU市场空间为30.5亿美元,截至2021年达到50.7亿美元,预计至2025年,市场空间将有望达到245.3亿美元,五年复合增速为51.73%。

1719300646621123.png

近年来,受新基建、数字化转型及数字中国等国家政策推动,以及企业降本增效的迫切需求,我国数据中心业务收入呈现出持续高速增长的态势。据权威统计,2021年我国数据中心行业市场收入已高达1500.2亿元,同比增长率高达28.5%。随着各地区、各行业数字化转型的深入,预计数据中心市场收入将持续保持增长。

根据2023年《中国数据中心产业发展白皮书》,预计至 2025 年“十四五”规划期末,拟实现数据中心机架规模增长至 1400 万架,规模总量翻两倍,总增量投资约7000 亿元。

按服务器规模预计,未来几年云与数据中心领域每年国内服务器出货量将维持在500万台左右,其中DPU渗透率在10%左右,单台服务器可以配置一块到多块DPU板卡,预计每年DPU需求量将在100万片左右。

云计算行业也呈现出强劲的增长势头。随着数据中心带宽的不断迭代(平均每2-3年一次),DPU(数据处理单元)在支持用户数据中心带宽升级和灵活部署新功能方面发挥着重要作用。2017-2019年,我国云计算行业规模增速均保持在30%以上,2021年市场规模更是达到了3102亿元。亚马逊、阿里云、华为等云计算巨头纷纷发展符合自身需求的DPU产品线,以应对市场的高速增长。

在自动驾驶领域,DPU的部署将显著提升车载终端的处理能力和传输速率,降低时延,确保车辆在高速移动场景下维持稳定的数据交换。未来,智能驾驶的每个车机节点都可以视为一个小型数据中心,产生大量的数据处理、转发、交换和存储需求。预计每辆智能驾驶汽车都将配备DPU以降低无线侧传输时延。例如,NVIDIA的智能驾驶平台Atlan就集成了DPU芯片,并计划于2025年应用于车机之上。随着L3及以上级别自动驾驶汽车的逐步落地,DPU在车载领域的应用前景广阔。

       综上所述,DPU技术作为数据中心继CPU、GPU之后的第三颗主力芯片,其未来的发展势头强劲且前景广阔。随着数字化转型的深入推进和AI技术的飞速发展,数据处理和计算需求呈现爆炸式增长,DPU以其高效的数据处理能力和低延迟特性,正逐步成为算力基础设施中的关键组成部分。

我们期待在中科驭数作为国产DPU厂商能够带领行业扎实走好创新之路,助力大数据时代的发展,推动“3U一体”的国内认知和布局。

关键词: 中科驭数 DPU

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版