进军数据中心,FPGA需要做这些转变
这两年,赛灵思提出了“数据中心优先”战略,推出了加速卡,ACAP(自适应计算加速平台)及Vitis软件平台,成立了数据中心事业部。这家传统的FPGA、SoC芯片厂商,如何看待数据中心的机会?面对的挑战是什么?为此,电子产品世界等媒体采访了赛灵思执行副总裁兼数据中心事业部总经理Salil Raje。
赛灵思 执行副总裁兼数据中心事业部总经理 Salil Raje
1 数据中心的三大机会
赛灵思“数据中心优先”战略包括3个细分层面:计算,网络,存储。其中最大的市场规模是计算,2025年预计会达到70~80亿美元的总体规模;另外2个领域,即网络和存储的增速非常快。从赛灵思的收入角度来看,未来几年在这3个层面会平均分配。
在计算层面,现在大型的云服务厂商推出自己的AI芯片和加速卡,像亚马逊、百度、阿里等,但不会为赛灵思的业务带来很大的影响,因为所有超大规模的云服务提供商还是需要足够的算力,赛灵思的加速器可以解决一部分的算力。例如谷歌有自己的TPU,但是同时用了很多赛灵思的加速器。
中国的数据中心市场的特点是创新速度非常快,包括在社交媒体、智慧城市、物联网等。从技术层面来看,中国的网络设计和北美超大规模的数据中心相比,没有绝对的差别;而且中国的产品也需要很强的自适应能力。在此,赛灵思的产品非常契合,因为赛灵思的解决方案并不是固定不变的,而是可以很容易适配和调整的;可以说,任何在北美超大规模数据中心使用的方案,来到中国也可以很好地适配。
2 相比友商的优势
赛灵思对于数据中心市场很有信心,主要有3个原因。
1)赛灵思的产品有强大的自适应能力。赛灵思的产品是硬件可编程的,应用就像用软件编程的器件,可以针对应用进行定制,针对数据流,包括内存以及精度都可以定制化,而且是针对不同的工作负载来进行定制化的。
2)赛灵思FPGA有很强的带宽处理能力。随着一些数据流进来的时候,赛灵思FPGA可以同时进行数据的处理,不用等到数据转移到SSD或其它的一些存储器件上。所以赛灵思的FPGA方案完全可以做到实时或同时处理。
3)小巧。Alevo加速卡有可小可中可大的外形,而且这些数据可以存储在任何一个位置,即卸载到计算或者网络,或者SSD的任何一个位置。例如2018年三星推出智能SSD,赛灵思有一个很小的芯片在其SSD里。
那么,赛灵思宣布了Vitis软件方案,与此同时,英特尔也宣布了oneAPI软件策略。未来FPGA竞争的焦点将会从单纯的产品转到面向应用的平台化上?
Salil Raje称,英特尔的oneAPI是最新出来的,而且目前是Beta版本,主要针对英特尔自己的器件,包括CPU、GPU以及未来有FPGA的。实际上,成功的关键不仅在于有一个统一的API,更在于有强大的编译功能,而且要针对不同器件来设定目标。赛灵思的HLS(高层次综合软件)研发10年后推出来的,而且赛灵思的API是开源的、自适配的、灵活的。
值得强调的是,赛灵思的Vitis可以跨界,包括云端和边缘。赛灵思鼓励所有板卡的开发人员和供应商创建自己的板卡和平台,只要和Vitis兼容,开发人员可以使用Vitis相应的软件。赛灵思建议是一种开源的统一编写的方法论。
3 Vitis软件和硬件的关系
有了Vitis,是否以后开发不需要硬件开发者了?
确实,在美国有一个趋势,硬件工程人数越来越少,但是赛灵思的侧重点是既针对硬件,也针对软件的开发人员。
因此,还是要对硬件有一定的支持。这就像只在X86基础上编写的程序,不可能直接移到GPU上一样;反过来也如此,用C++编写了以后,不可能在X86和GPU自由地迁移。
在Vitis平台之前,赛灵思已有针对硬件开发人员的Vivado,是2012年推出的,在此基础上,2018年赛灵思推出了SDAccel、SDSoC等产品(如下图)。而2019年推出的Vitis主要针对软件,把云、边缘、端点全部集合在一起。
关于加速器Alveo,目前有4种型号,增速最快的是单槽半高的,即U50(如下图)。此外,赛灵思还有大的U280,是针对HMB2(Host Memory Buffer,主机内存缓冲技术)的。
4 向平台过渡的挑战
从传统的半导体公司转成平台化公司,最大的挑战不是来自于技术层面——实际上技术已非常成熟。现在,赛灵思希望能够打开知名度,让更多来自软件开发人员社区的朋友们更了解赛灵思,了解赛灵思在计算领域的超强算力,也了解赛灵思加速的不只是计算,而是整体加速,也加速存储,也有智能网卡可以加速网络。
那么,赛灵思在FPGA产品形态上一直在演进,从原来单纯FPGA,到后面的结合arm CPU融合的SoC形态,再到ACAP,传统的FPGA形态是否会被新的形态完全取代?
Salil Raje称绝对不会,因为赛灵思的核心价值主张就是FPGA,它是自适应的架构,人们可以加一些额外的元素,例如AI引擎,这也是自适应的。今后会有越来越多的硬化的元素,所有的这些都是自适应的。
传统的FPGA架构是现在的ACAP器件中的一部分。ACAP是专门针对软件开发人员的架构的,当然它有很多硬件的元素,可以接入到CPU的服务器上来,可以编程,所以很像CPU或GPU,它还有调试等功能。
具体地,FPGA在计算方面的应用,是可以直接把计算卸载到板卡上,然后板卡连接到CPU/服务器CPU上。网络方面,赛灵思也有智能网卡——SmartNIC,可在网络直接数据流入过程中同时进行处理。存储方面,实际上很多客户不想在SSD和CPU之间来回转移数据,即从SSD移到CPU,再从CPU转到SSD,用赛灵思的解决方案可以进行很好的计算存储能力的聚集,不用在SSD和CPU之间来回转移。
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码