国产FPGA,走到哪一步了?

时间:2024-07-30来源:半导体产业纵横

随着人工智能(AI)技术的飞速发展,其应用边界不断拓宽,从简单的图像识别到复杂的自然语言处理,再到自动驾驶、智能制造等前沿领域,AI 正以前所未有的速度改变着我们的世界。

在这场 AI 革命中,深度学习作为其核心驱动力,不断推动着算法与模型的革新,同时也对计算资源提出了更为严苛的要求。

诞生于 1985 年的 FPGA 虽然问世时间不长,但已经凭借「可编程」的独特优势,在百花齐放的芯片浪潮中夺得一席之地,成为 GPU 芯片的又一劲敌。

FPGA 的特点

FPGA 芯片是基于可编程器件(PAL、GAL、CPLD)发展而来的,是半定制化、可编程的集成电路。FPGA 主要有三大特点:

可编程灵活性高

无论是 CPU、GPU、DSP、Memory 还是各类 ASIC 芯片,在芯片被制造完成之后,其芯片的功能就已被固定,用户无法对其硬件功能进行任何修改。而 FPGA 芯片在制造完成后,其功能并未固定,用户可以根据自己的实际需要,将自己设计的电路通过 FPGA 芯片公司提供的专用 EDA 软件对 FPGA 芯片进行功能配置,从而将空白的 FPGA 芯片转化为具有特定功能的集成电路芯片。

每颗 FPGA 芯片均可以进行多次不同功能配置,从而实现不同的功能,具有高度灵活性。

开发周期短

在逻辑芯片里面,如 ASIC 制造流程包括逻辑实现、布线处理和流片等多个步骤;而 FPGA 无需布线、掩膜和定制流片等,芯片开发大大简化。一般逻辑芯片,如 ASIC、DSP、SOC 等,开发周期需要 14—24 个月,甚至更长,而 FPGA 则只需要 6—12 个月,比其他芯片开发周期减少 55% 的时间。

正如全球 FPGA 第一大厂商 Xilinx(赛灵思)认为,更快比更便宜重要,产品晚上市 6 个月,5 年内将减少 33% 的利润,每晚四周等于损失 14% 的市场份额。

并行计算效率高

FPGA 属于并行计算,也即一次可执行多个指令算法。而传统的 ASIC、DSP、CPU 都是串行计算,一次只能处理一个指令集。因此在部分特殊任务中,FPGA 的并行计算效率比串行计算效率更高。

CPU、GPU、ASIC 和 FPGA 是四种计算机处理器类型,不同处理器有着独特的优势。

FPGA 与主流芯片的对比

CPU 的逻辑运算单元(ALU)较少,控制器(control)占比较大;GPU 的逻辑运算单元(ALU)小而多,控制器功能简单,缓存(cache)也较少。架构的不同使得 CPU 擅长进行逻辑控制、串行计算,而 GPU 擅长高强度的并行计算。GPU 单个运算单元处理能力弱于 CPU 的 ALU,但是数量众多的运算单元可以同时工作,当面对高强度并行计算时,其性能要优于 CPU。现如今 GPU 除了图像处理外,也越来越多地运用到别的计算中。

可以说,CPU 更像是一个有多种功能的优秀领导者。它的优点在于调度、管理、协调能力强,计算能力则位于其次。而 GPU 相当于一个接受 CPU 调度的「拥有大量计算能力」的员工。

ASIC 即专用集成电路,指应特定用户要求和特定电子系统的需要而设计、制造的集成电路。ASIC 的特点是面向特定用户的需求,ASIC 在批量生产时与通用集成电路相比具有体积更小、功耗更低、可靠性提高、性能提高、保密性增强、成本降低等优点。

基于 ASIC 开发人工智能芯片更像是电路设计,需要反复优化,需要经历较长的流片周期,故开发周期较长。

量产后 ASIC 人工智能芯片成本及价格较低。虽然相较于 FPGA,ASIC 人工智能芯片需要经历较长的开发周期,并且需要价格昂贵的流片投入,但是这些前期开发投入在量产后会被摊薄,所以量产后,ASIC 人工智能芯片的成本和价格会低于 FPGA 人工智能芯片。

受益于与众不同的架构,FPGA 的可编程属性使其相比其他处理器,在算力、成本、功耗之间更能取得平衡。

FPGA 迎来爆发时刻

FPGA 由于具备可编程灵活性高、开发周期短以及并行计算效率高的特点,使得 FPGA 的应用场景特别广泛。

通信是目前 FPGA 规模最大的应用市场。FPGA 在通信领域的应用包括网络交换、通信协议转换、流量控制等。它可以用于实现高效数据处理和大规模的射频中继等。例如,在 5G 通信技术中,FPGA 被用于基站的信号处理和数据处理,提高了通信系统的性能和稳定性。

工业领域是 FPGA 芯片的主要应用市场之一。FPGA 在工业领域主要应用于视频处理、图像处理、数控机床等领域实现信号控制和运算加速功能。例如,在自动化生产线中,FPGA 被用于控制机械臂的运动和协调各个设备的运作。

数据中心是 FPGA 芯片的新兴应用市场之一。在数据中心运算处理领域,FPGA 芯片主要用于硬件加速。相比于 CPU,FPGA 芯片由于其无指令、无需共享内存的体系结构,能够同时提供强大的计算能力和足够的灵活性;相比 GPU,FPGA 芯片在数据中心具有低延迟及高吞吐的优势;相比 ASIC,FPGA 芯片可在灵活性、开发时间等方面达到出色的平衡。

随着电动汽车兴起,FPGA 在汽车中的应用越来越广泛。汽车电子行业对 FPGA 的需求主要来自 ADAS(智能感知系统)和 AV(自动驾驶汽车)。比如:FPGA 芯片可用于控制和驱动电动汽车电机控制系统,连接驾驶系统、仪表盘、雷达、超声波传感器等各种车载设备,实现激光雷达、毫米波雷达等信号处理和控制。在视频桥接和融合领域,FPGA 芯片可用于实现多个图像传感器的信号桥接、3D 环视视频融合、倒车辅助视频、辅助驾驶视频等功能。在辅助驾驶和自动驾驶领域,FPGA 芯片可用于实现机器视觉与目标检测等各种功能。

在人工智能时代,AI 的算法不断推陈出新,对于硬件的算力和灵活度要求很高,FPGA 的灵活性刚好符合 AI 的特性。FPGA 主要被用作矩阵乘算法的加速器和神经网络加速器的执行器。它可以实现低延迟的计算和高性能的运算,为人工智能的发展提供了强大的硬件支持。例如,在深度学习领域,FPGA 被用于加速神经网络的推理和训练过程,提高了人工智能系统的处理速度和能效。此外,随着异构计算融合等形式越来越受推崇,FPGA+CPU 等架构也给 AI 带来更多的潜在优势。

国际 FPGA 竞争格局

全球 FPGA 市场主要被赛灵思(已被 AMD 收购)和 Intel 两家海外企业双寡头垄断,在 2019 年,两家合计占据了全球市场份额的 85% 以上。由于技术壁垒高、更新换代速度快,全球 FPGA 市场高度集中,国内厂商占比较低。

AMD 产品已进入 7nm 复杂异构

AMD(Xilinx)FPGA 相关产品矩阵主要包括:四大 FPGA 产品系列(VIRTEX、KINTEX、ARTIX、SPARTAN),以及集成度更高的两大自适应 SoC(AdaptiveSoC)系列(ZYNQ、VERSAL)。

AMD(Xilinx)FPGA 高/中/低端产品系列对比

从芯片制程来看,主要有 UltraScale+(16nm)、UltraScale(20nm)、7 系列(28nm)和 6 系列(45nm)四大类,VERSAL 则是整体升级为 7nm 制程。

从芯片架构来看,FPGA 单芯片向更先进工艺、更高速电路结构、复杂异构 SoC 系统发展,AMD 的 VERSAL 系列产品中集成了 PCIe、Ethernet 通信协议以及 AI 引擎、NoC 架构等。

从产品价格来看,随着产品定位从低端走向高端,FPGA 容量等指标不断提升,通信架构逐渐升级,对应开发板的价格也从数百美元逐步上涨到一万多美元。

从应用领域来看,数据中心等高端应用所适用的 FPGA 芯片大多为高端 FPGA 产品线,仅有少部分中高端 FPGA 也能够满足数据中心网络加速需求。

英特尔:高端已大量出货,低功耗系列即将推出

今年 3 月,英特尔将其可编程解决方案事业部(PSG)独立运营,并以 Altera 的品牌形象重新呈现。新成立的 Altera 制定了全新的发展战略,旨在通过聚焦高性能 FPGA 市场来巩固并扩大其市场地位,同时积极开拓中低端 FPGA 市场,以吸引更广泛的客户基础并拓展发展空间。

Agilex FPGA 和 SoC FPGA家族基于英特尔 10 纳米制程节点构建,可提高性能并降低功耗。

Agilex9 FPGA 和 SoC FPGA为目标应用提供前所未有的功能和优化,超越了主流可编程逻辑的极限。目前已实现规模化生产。这款产品凭借业界领先的数据转换器,尤其适用于需要处理高带宽混合信号 FPGA 的应用场景。

Agilex7 FPGA 和 SoC FPGA是一款高性能 FPGA,提供业界领先的架构和 I/O 速度,是大多数带宽密集型和计算密集型应用的理想之选。英特尔 Agilex 7 的逻辑结构性能功耗比,对比竞争对手的 7nm 节点 FPGA,提升约 2 倍。

Agilex 7器件采用先进的 10 纳米 SuperFin 技术(F 系列和 I 系列)、英特尔 7 技术(M 系列)和第二代英特尔 Hyperflex FPGA 架构。这款产品的应用领域包括数据中心、网络、国防和工业。

Agilex 5是一款针对需要高性能、低功耗和小尺寸的应用进行了优化的中端 FPGA。该产品现已全面上市。

英特尔 Agilex 5 是首批支持 LPDDR4、LPDDR5(+DDR4、DDR5)的 FPGA、首批配备 AI 张量块的产品,拥有首个非对称多核应用处理器系统(2xArm A76、2xArm A55),可提升在边缘端 AI 推理能力。其 E 系列进行了功耗和尺寸优化,对比 16nm 竞品,性能功耗比提升 1.6 倍;D 系列进行了性能优化,对比 7nm 竞品,性能功耗比提升 2 倍。

Agilex 3即将问世,该产品系列具有更小的外形尺寸以及功耗和成本优化。这款产品旨在为云计算、通信和智能边缘应用中的低复杂度功能提供领先的低功耗 FPGA 系列产品。

综上所述,Altera 的产品线日益完善,其中 Agilex 9 正处于规模化生产阶段,Agilex 7 的 F 系列和 I 系列设备已投入生产,Agilex 5 已全面上市,而即将推出的 Agilex 3 将满足云、通信和智能边缘应用对低复杂度、低功耗 FPGA 的需求。

国产之争愈发激烈

目前,本土 FPGA 厂商和海外龙头的差距客观存在,有充分的追赶空间。

国内外厂商的差距

首先看一下国产厂商与国际厂商当前的差距。

从 FPGA 的容量来看,目前国产民用 FPGA 最高水平能做到约 400k 逻辑单元,而目前全球容量最大的 FPGA 为 AMD 在 2023 年 6 月 27 日推出的 VP1902(VersalPremium),逻辑单元数高达 18,507k,是国内的 46 倍。

从制程上看,目前国产最先进制程在 14/16nm,而 Xilinx 在 2018 年便发布了 7nm 的异构 FPGA 产品 Versal。

从收入来看,中国主要的 FPGA 公司有紫光同创、安路科技、复旦微电、高云半导体、国微电子、易灵思、西安智多晶、京微齐力等。中国作为全球 FPGA 市场的重要组成部分,2022 年市占率在 1/3 左右,但在供应链侧,国产 FPGA 芯片的全球市占率却不足 10%。

从下游应用看,目前最高端的 FPGA 两大领域——原型验证、数据中心加速计算仍未有国产 FPGA 能够进入。

从毛利率看,目前国产 FPGA 集中于在消费电子领域进行中低容量的替代,相比大容量 FPGA 市场的进入壁垒相对较低,出现了一定程度的「内卷」,典型毛利率在 35%—40% 之间,而 AMD 在高端 FPGA 市场竞争优势突出,近 10 年毛利率基本维持在 65% 以上,近 3 年更是接近 70%。

国产厂商技术进步迅速

中国 FPGA 产业虽起步晚,但近年来发展迅速。

在市场侧驱动和国家政策的扶持下,本土 FPGA 企业不断发力,在技术和市场两方面都取得了不小的成绩。

目前中国厂商的低容量 FPGA 技术已发展较为成熟。低容量 FPGA 的逻辑单元<100k,要求极致的低成本和低功耗,主要集中在 55nm、40nm 和 28nm 这三个节点。

国产厂商大部分在 2019 年及之前就推出了此类产品,它也往往是本土 FPGA 厂商的第一代产品。例如,紫光同创的 Logos 系列在 2017 年推出,为 40nm 的低功耗、低成本 FPGA,逻辑单元在 12-102k 之间;安路科技的 55nm 的 Eagle4 在 2016 年推出,逻辑单元 20k,主要用于伺服控制、高速图像接口转换的领域;高云半导体的 55nm 的 FPGA 小蜜蜂(LittleBee)在 2016 年推出,是公司第一代产品,逻辑单元数在 1-8k。

在 28nm 的中低容量市场,中国 FPGA 厂商也已经具备成熟的产品。中容量 FPGA 主要指逻辑单元在 100k-500k 的 FPGA,主要应用集中在无线通信的空口侧、工业、汽车、A&D 领域,中容量市场不追求最高的性能,性能和功耗同等重要,对成本亦有一定要求。比如紫光同创、安路科技、智多晶均在 2020 年推出了 28nm 的 FPGA 产品,主要对标 Xilinx 的 7 系列产品等。

此外还有部分厂商推出 22nm 的 FPGA,以实现替代部分 28nm 的中低容量 FPGA。比如高云在 2022 年 9 月推出的 Aurora V,是其 22nm 的 FPGA 产品,逻辑单元数为 138k。

500K 以上的高容量 FPGA 是目前国产替代的难点。需要本土公司在硬件架构、EDA 软件、IP 性能等方面深入发展。其中,最重要的是解决 EDA 软件在大规模 FPGA 的布局布线问题。

国产 FPGA 营收大幅增长

再看国产 FPGA 厂商的营收情况。

安路科技作为国内 FPGA 领域的领军企业,2018、2019 年,安路科技营业收入只有 2852.03 万元、1.22 亿元。之后在 2021 年、2022 年其业绩出现翻倍增长。

根据公开数据,2020 年安路科技的 FPGA 业务收入为 2.8 亿元,随后几年持续攀升。到 2021 年,其 FPGA 业务收入增长至 6.42 亿元,同比增长超过一倍。到 2022 年,这一数字更是增长至 9.89 亿元,显示出强劲的市场增长势头。

安路科技的毛利率同样表现优异。从 2020 年到 2022 年,其毛利率分别为 34.05%、34.18% 和 39.13%,呈现出稳步上升的趋势。特别是在 FPGA 业务领域,其毛利率在 2022 年达到了 39.13%。

复旦微作为国内老牌 IC 设计企业,在 FPGA 领域同样表现出色。近年来,其 FPGA 业务收入持续增长。2020 年,复旦微的 FPGA 业务收入为 2.04 亿元;到 2021 年,这一数字增长至 4.27 亿元;而到了 2022 年,更是达到了 7.81 亿元,显示出公司在 FPGA 市场中的强劲竞争力。

复旦微的毛利率同样处于较高水平。从 2020 年到 2022 年,其 FPGA 业务毛利率分别为 82.56%、84.71% 和 84.7%,保持了较高的稳定性和盈利能力。这主要得益于公司强大的技术实力和完善的产品线布局。

国产 FPGA 厂商机遇众多

目前 FPGA 国产化有两大有利条件:一是近年国产 FPGA 厂商收到的政府补助金额较大,体现国家对 FPGA 国产化的强烈扶持态度。二是 28nm 生命周期比以往代际更长,给了国产厂商较为充分的追赶空间。

从已披露数据来看,2018 年—2022 年 5 年间,国产 FPGA 厂商每年均收到了千万级甚至上亿的政府补助。2022 年,安路科技、复旦微、紫光国微计入当期损益的政府补助金额分别为人民币 3000 万+、6000 万+和 1.7 亿元。而主要产品为 CPU 的龙芯中科 2022 年政府补助金额为 1.9 亿元,主营产品为 CPU 和 DCU 的海光信息为 6000 万+,景嘉微为 3000 万+。根据 WSTS 数据,2022 年微处理器市场规模 508 亿美元,是 FPGA 市场规模的 6 倍。对比其它品类的数字芯片公司,FPGA 公司收到的政府补助金额依然较大,体现出国家对 FPGA 的强烈扶持意愿。

此外,作为典型的数字芯片,FPGA 生命周期一般只有 10—15 年(而模拟芯片可以高达 20 年以上),快速迭代的特征使其收入的顶峰往往发现在推出之后的第 4—5 年,60% 收入在前 6 年发生,随后是量价齐跌的市场。因此,市场玩家必须努力竞逐制程领先,因为制程落后厂商往往无法取得足够的收入以支撑下一代产品的开发。而 28nm 生命周期比以往代际更长,这正给了国产厂商较为充分的追赶空间。

未来,FPGA 芯片市场将继续保持快速增长态势。随着 5G、物联网、人工智能等技术的不断发展,FPGA 芯片将在更多领域发挥重要作用。同时,随着国产 FPGA 芯片技术的不断进步和市场份额的逐步提升,国内 FPGA 芯片市场也将迎来更加广阔的发展空间。

据 Frost&Sullivan 预测,预计 2025 年全球 FPGA 市场规模将超过 125 亿美元,国内市场规模将从 2022 年的 208.8 亿人民币提升至 2025 年的 332.2 亿人民币,三年 CAGR 约 17%。

总的来说,FPGA 芯片市场是一个充满机遇和挑战的市场。随着技术的不断进步和应用领域的不断拓展,FPGA 芯片将在更多领域发挥重要作用,并推动相关产业的快速发展。

关键词: FPGA

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版