我们认为随着5G、AIOT等行业的兴起,国产FPGA厂商竞争力提升,有望迎来业绩的爆发期。FPGA相比较于其他通用逻辑器件或者ASIC,在灵活性、小规模部署成本方面有优势,正好满足了5G通信业务灵活部署、AIOT市场长尾碎片化的需求。2020年是我国5G规模建设开启元年,处于全球领先地位,推动国内相关AIOT、工业控制等行业蓬勃发展,拉动FPGA需求。我们认为,从产品上看国内厂商在中低端产品领域已逐步接近国外龙头企业,随着高端产品不断突破,应用场景和案例的持续迭代,有望快速提升竞争力。
摘要
FPGA在灵活性、性能、功耗、成本之间具有较好的均衡性。1)FPGA属于硬件可重构的芯片结构,对于技术更替变化快或者需要满足应用功能灵活变化的环节适用性更强。2)FPGA是专用电路中开发周期最短、应用风险最低的器件之一,部分客户无需投资研发即可获得适用FPGA芯片,因此对于需求量暂时较低规模化还不显著的领域,FPGA性价比更高。3)FPGA芯片内部可按照数据包步骤数量搭建相对应的流水线,从而实现数据并行、流水线并行,具有较强的算力,在部分应用场景亦有功耗和时延优势。
解决下游应用痛点,需求快速增长。1)网络通信领域是FPGA下游应用最广泛场景,有效实现大量高速数字信号处理功能,同时5G灵活部署、业务多样化增加对FPGA的需求。2)工业控制领域集成化与安全性要求不断提高,FPGA可帮助实现更智能化、高性能、低能耗的解决方案。3)依托时延优势组成数据中心加速层,剩余资源可部署神经网络,我们看到微软已开始使用这一方案。4)据Frost&Sullivan,2020年全球FPGA市场规模达60.8亿美元,2021-2025年CAGR为16.4%,2025年市场规模125.8亿美元;中国FPGA市场从2016年65.5亿元增长至2020年150.3亿元,未来中国FPGA市场需求量有望持续扩大,预计2025年市场规模将达332.2亿元。
目前国产FPGA产品以中低密度产品为主,高端产品不断突破。目前活跃在市场的国产FPGA产品以中低密度产品为主,架构大多采取LUT+布线概念,中高密度FPGA的技术水平与国际领先商相比仍有差距,同时部分厂商已经有所突破形成追赶态势,像紫光同创、高云半导体、复旦微等均有28nm千万门级以上产品推出。
风险
5G建设不及预期、云数据中心部署不及预期、FPGA研发进展不及预期。
正文
FPGA芯片:兼具灵活性和性能的半定制化集成电路
FPGA:基于可编程器件发展而来的现场可编程门阵列
FPGA(Field Programmable Gate Array),即现场可编程门阵列,最初起源于Xilinx公司,该公司于1985年推出世界首款FPGA芯片“XC2064”。FPGA芯片是基于PAL、GAL、CPLD等可编程器件发展而来,既解决了传统可编程器件门阵列数有限的缺点,具备更大的规模容量进而提高性能;同时现场可编程的特点帮助其克服了定制电路(例如ASIC芯片)灵活性不足的缺陷。
图表:FPGA发展历程
资料来源:电子发烧友网,中金公司研究部
从结构来看,FPGA芯片由逻辑单元块以矩阵方式排列,并通过可编程的互联资源连接来实现不同功能的设计。FPGA芯片主要包含三大部分:可编程逻辑块(CLB)、可编程输入输出单元(I/O)以及互连布线资源。
图表:FPGA主要组成结构
资料来源:《Performance Analysis of Nanoelectromechanical Relay-Based Field-Programmable Gat》,Tian Qin等,中金公司研究部
在FPGA的内部结构中,可编程逻辑块(CLB)是FPGA内部最重要的资源,能够反映出不同FPGA在结构上的差异,帮助FPGA实现可编程。以Xilinx 7系列为例,其CLB包含两片Slices,每个Slice的基本单元由查找表(LUT),查找表本质上是随机存储器(RAM),因此可以将FPGA视为一个静态存储器(SRAM)。当用户通过HDL语言等方式描述一个逻辑电路后,FPGA开发软件会计算出逻辑电路的所有结果并存入RAM中,当用户输入信号进行逻辑运算时则近似于输入地址进行查表,从而输出运算结果。从这个角度来看,FPGA能够实现可编程的基础原因在于:理论上来说,只要扩大存储容量并增加输入信号线,查找表可以实现任意多逻辑函数的输入和运算。
图表:Xilinx 7系列FPGA中每个CLB中包含8个查找表(LUT)
资料来源:Xilinx官网,CSDN,中金公司研究部
FPGA芯片主要具备以下特点:
设计灵活,FPGA属于硬件可重构的芯片结构,内部具有数量丰富的可编程输入输出单元引脚及触发器;
适用便捷,FPGA是专用电路中开发周期最短、应用风险最低的器件之一(部分客户无需投资研发即可获得适用FPGA芯片);
并行计算,FPGA芯片内部可按照数据包步骤数量搭建相对应的流水线,从而实现数据并行、流水线并行;
高兼容性,FPGA可与CMOS等大规模集成电路兼容,进行协同工作。
基于上述特点,FPGA芯片早期作为ASIC芯片的半定制化电路替代品应用于部分场景中,近年来,随着微软、亚马逊等头部互联网企业不断加大数据中心建设,FPGA芯片的应用范围也不断拓宽。
FPGA在灵活性、性能、功耗、成本之间具有较好的平衡性
相较于CPU,FPGA并行计算能力可提升运算速率并降低时延。CPU的本质是利用大规模存储器在时间维度内复用处理单元,并在强大逻辑数据库支持下实现更多应用逻辑,但同时也会失去处理单元的并行处理能力。
相较于GPU,FPGA在功耗和灵活性等方面具备优势。一方面,由于GPU采用大量的处理单元并且大量访问片外存储SDRAM,其计算峰值更高,同时功耗也较高,FPGA的平均功耗(10W)远低于GPU的平均功耗(200W),可有效改善散热问题;另一方面,GPU在设计完成后无法改动硬件资源,而FPGA根据特定应用对硬件进行编程,更具灵活性。机器学习使用多条指令平行处理单一数据,FPGA的定制化能力更能满足精确度较低、分散、非常规深度神经网络计算需求。
相较于ASIC芯片, FPGA在项目初期具备短周期、高性价比的优势。ASIC需从标准单元进行设计,当芯片的功能及性能需求发生变化时或者工艺进步时,ASIC需重新投片,由此带来较高的沉没成本以及较长的开发周期;而FPGA包括预制门和触发器,具有编程、除错、再编程和重复操作等优点,可实现芯片功能重新配置,因此早期FPGA常作为定制化ASIC领域的半定制电路出现,被业内认为是构建原型和开发设计的较快推进的路径之一。
图表:FPGA与ASIC经济成本比较
资料来源:半导体行业联盟,中金公司研究部
图表:FPGA和ASIC综合对比
资料来源:《Field Programmable Gate Arrays for Military Application》, 中金公司研究部
专用EDA软件等构筑核心壁垒
FPGA芯片需要软硬件协同发展实现功能配置,FPGA专用EDA软件工具的编程复杂性以及专用性构筑差异化竞争优势。从设计流程上来看,FPGA与其他芯片的前端设计流程是相同的,也需要用到广义的通用EDA,但当芯片设计基本完成后,FPGA需要通过软件工具中的流程将用户写好的程序编译到FPGA中从而实现相应的功能。FPGA专用软件工具是一系列EDA的组合,从设计流程来看主要包括以下步骤:电路设计、逻辑综合、设计实现(工艺映射、布局布线等)、仿真模拟和编程下载等。
图表:FPGA软件工具设计流程图
资料来源:紫光同创官网,中金公司研究部
在FPGA软件工具设计流程中,除部分前端流程可借助第三方工具外,其余环节基本需要FPGA芯片厂商进行自主研发覆盖,存在较高技术壁垒。在布局布线中,由于需要通过FPGA专用EDA软件将电路描述为芯片配置信息,因此这一环节必须利用FPGA芯片的内部结构信息。
从国内外FPGA厂商软件工具研发情况来看:国外厂商方面,Xilinx最新推出Vitis统一软件平台,帮助用户进行软件开发;Altera提供可编程逻辑的设计工具Quartus II;Lattice软件工具为Diamond。国内厂商方面,紫光同创研发出支持千万门级FPGA设计的Pango Design Suite。
图表:部分国内外FPGA厂商软件工具研发情况
资料来源:各公司官网,中金公司研究部
FPGA软硬件相互驱动,特别是在高端大规模FPGA芯片领域,FPGA的设计流程往往是软件先行,甚至可以说软件工具研发水平对硬件规模和性能所能达到的高度有很大影响。为了在应用端最大限度地发挥硬件性能,FPGA厂商在软件工具编程设计时,除了需要考虑与芯片硬件架构的匹配和一致性,还要考虑应用场景多样性、时序模型的复杂性和用户使用体验及效率等,特别是对于逻辑综合、布局布线为代表的核心环节,研发难度较高,国内FPGA厂商相较于海外龙头企业仍有差距。
FPGA应用领域:“3+3”应用场景,下游不断拓展
三大核心应用场景:通信、工业、数据中心
通信领域:FPGA加强通信设备并行处理能力,5G开启新兴增量空间
网络通信领域是FPGA下游应用最广泛场景,有效实现大量高速数字信号处理功能。FPGA目前被大量应用在有线及无线通信设备中,实现接口扩展、逻辑控制、数据处理、单芯片系统等功能。在无线通信系统中,许多功能模块通常都需要大量的滤波运算,这些滤波函数往往需要大量的乘和累加操作,FPGA芯片内在的分布式逻辑和运算单元结构使其可以较容易地实现分布式的算法结构,因此可以有效地实现这些乘和累加操作,使其可以实现通信过程中大量的高速数字信号处理功能。
Massive MIMO技术创新,多通道波束成型中FPGA灵活性凸显。为了增强信号覆盖及频谱效率,大规模天线(Massive MIMO)成为5G引入的关键技术之一。Massive MIMO技术下,收发通道数由16T16R提高到64T64R甚至128T128R,同时需要对每个天线单元接受到的信号进行数字处理,由此在自适应波束成形中产生了大量的计算负载。FPGA在I/O、运算速度及延迟上比CPU、DSP更具优势,在多通道波束成形中FPGA更具有灵活性。
图表:FPGA在5G领域的应用
资料来源:芯师爷,中金公司研究部
工业控制:集成化与安全性要求提高,FPGA提供成本有效性方案
FPGA可帮助工业应用实现更智能化、高性能、低能耗的解决方案。以数控机床马达为例,与传统只能控制单一马达的专用芯片相比,基于FPGA的多通道马达控制能够实现:1)在增加以太网连接能力的同时不增加额外的器件,2)可使用灵活方法去控制多个马达和差异化的产品,3)实现支持马达控制和现场总线连接能力的单芯片方案;目前世界工业电力的2/3都用来驱动电机,我们认为,随着以自动化为核心要素的智能无人工厂的发展,未来各类能精准控制马达且可在单一芯片上实现多马达控制的FPGA将不断渗透。
图表:Altera Cyclone series:基于FPGA的工业以太网解决方案
资料来源:联诠科技,中金公司研究部
图表:Altera CyloneIII:基于FPGA的电机控制解决方案
资料来源:联诠科技,中金公司研究部
数据中心:依托低时延优势,FPGA构成数据中心加速层
FPGA组成数据中心加速层,剩余资源可部署于神经网络,产品形态主要为加速卡。FPGA芯片在数据中心领域主要用于硬件加速,位于网络交换层与传统服务器软件(CPU层面运行软件)之间。加速层通过众多FPGA支撑虚拟网络模型计算任务,使得硅片内存完整加载模型权重,突破DRAM性能瓶颈,同时剩余资源可用于深度神经网络等计算任务。FPGA在数据中心领域主要产品形态为加速卡(Xilinx及英特尔在FPGA数据中心运算方面产品形态均为加速卡),与CPU搭配,把CPU的部分数据运算卸载至FPGA,将部分需要实时处理/加速定制化的计算交由FPGA执行。
图表:FPGA加速平面介于网络交换层和传统服务器软件之间
资料来源:MICRO 2016,中金公司研究部
图表:数据中心加速层剩余资源可部署于神经网络
资料来源:MICRO 2016,中金公司研究部
微软是第一个在公共云基础设施中部署FPGA的主要云服务提供商,从Bing到Azure,微软在服务器中用FPGA代替传统CPU。2015年微软提出使用FPGA加速Bing搜索引擎的方案,每8块FPGA形成一条链,每块FPGA对应特定任务(提取特征/计算特征/计算文档得分),此方案下Bing的搜索结果排序性能提高了1倍,搜索时延大幅降低。2017年微软云计算部门Azure引入FPGA加速处理实时数据,网络计算速度的提高使得网络及存储虚拟化CPU成本激增(网络计算速度提至40Gbps,单位CPU核吞吐量仅100Mbps),此方案可解决网络及存储虚拟化成本较高问题,且通过轻量级传输层,同一服务器机架时延可控制在3微秒内,触达同数据中心全部FPGA机架时延可控制在20微秒内。
图表:FPGA加速Bing的搜索排序过程
资料来源:微软官网,中金公司研究部
图表:Azure服务器部署FPGA的架构
资料来源:SmartNIC: Accelerating Azure’s Network with FPGAs on OCS servers,中金公司研究部
三大新兴应用场景:消费电子、汽车电子、人工智能
消费电子:FPGA灵活支持接口转换,短开发周期特性匹配行业迭代周期
单一FPGA芯片可实现各种存储接口的控制,简化外围电路设计。消费电子产品中音视频信息需与运算芯片进行数据通信,以视频信息为例,摄像头需要将采集到的数据传递给计算芯片处理、将处理后的结果传递给屏幕进行显示等,由于设备内部信号协议都不尽相同,传统设计往往需多个专用接口芯片进行数据格式的转换,采用FPGA芯片方案后,单一FPGA芯片可以实现各种存储接口的控制,接口逻辑就都可以在FPGA芯片内部实现,大大简化了外围电路的设计。
类协处理器方案解决性价比问题,短开发周期特性匹配消费电子迭代周期。消费电子市场对产品性价比要求较为严苛,为实现性价比与差异化的平衡,消费电子厂商目前已形成一种类似协处理器、功能简单、功耗低、性价比高的以FPGA作为主芯片的解决方案。此外,消费电子产品迭代周期快,FPGA芯片开发周期较短特点与消费电子板块匹配。
汽车电子:FPGA在汽车领域应用覆盖广,头部厂商积极布局
FPGA在汽车领域可应用于ADAS、车载摄像头、传感器、激光雷达等,应用面广泛。由于FPGA具有强逻辑性,当汽车电子系统当中的逻辑单元较多时,采用FPGA技术能够将这些逻辑单元准确排列,提高汽车电子系统中逻辑单元的利用率;同时,由于FPGA内部结构较易实现分布式算法结构,对实现汽车电子中的高速数字信号处理十分有利。在系统接口及控制(驱动电控系统/连接各种车载设备/实现雷达信号处理等)、视频桥接和融合(多个图像传感器信号桥接/3D环视视频融合等)、辅助驾驶和自动驾驶(机器视觉与目标检测等)等领域,FPGA为多种应用提供灵活低成本高性能解决方案。
全球巨头积极布局汽车电子,抢占智能驾驶赛道。FPGA大厂赛灵思的汽车FPGA方案从ADAS向AD持续演进,在前视摄像头、激光雷达、成像雷达、传感器融合、计算加速平台等领域均有成功应用,截至2019年汽车领域器件出货量累计1.7亿片,激光雷达传感器市场赛灵思市场份额90%以上。赛灵思ADAS从计算机视觉逐渐过渡到AI深度学习处理,2019年赛灵思在开发者大会中预计前置摄像头在2022-2023年成为“标准功能”,同时二维雷达向成像雷达过渡,激光雷达技术高度分裂化/差异化,传感器探测目标范围将超过300米。
图表:安森美Interline Transfer CCD图像传感器采用FPGA方案
资料来源:中国半导体论坛,中金公司研究部
图表:Xilinx在FPGA汽车领域覆盖面不断提高
资料来源:2019赛灵思开发者大会,中金公司研究部
人工智能:高密度面向云侧并行运算需求,中低密度面向端侧推断任务转移
云端:FPGA流水线并行结构,可以实现更高的并发处理。FPGA可针对数据包步骤数量搭建同等数量流水线,数据包经多个流水线处理后可即时输出,无需像GPU一样数据单元一致输出,因此计算密集型任务(如图像处理、机器学习等)中,拥有流水线并行和数据并行的高密度FPGA效率更高。据赛灵思公布数据,赛灵思reVISION堆栈与英伟达Tegra X1对比,reVISION 堆栈在机器学习方面单位功耗图像捕获速度提升6倍,在计算机视觉处理的帧速率提升42倍,时延仅为1/5(毫秒单位)。
端侧:推断决策任务转至智能终端,中低密度FPGA的机会。随着智能终端对实时响应和多样化应用的需求,越来越多的推断任务被转移到端侧来完成。为实现推断任务的转移,通常对训练后的人工智能算法模型进行压缩,进而应用到推理环节,FPGA芯片可实现快速推断决策的特点也使其可广泛应用于该领域。
FPGA市场规模:通信需求主导,5G、AI、自动驾驶催化增量空间
FPGA应用场景范围拓展,且部分应用场景不可替代性,FPGA市场增量需求逐渐释放。全球FPGA市场规模潜力将逐渐释放,主要得益于1)下游应用场景不断拓展:FPGA芯片依托于高灵活性、开发周期短、节省流片成本与风险等特质,应用场景从通信收发器、消费电子逐步拓展至新兴高成长的汽车电子、数据中心、机器视觉等领域,存量与增量市场均存在扩容空间;2)部分应用场景中不可替代性强:在技术尚未稳定、灵活度/并行计算能力要求高的场景中,FPGA与其他逻辑芯片相比具有明显优势。
据Frost&Sullivan,2020年全球FPGA市场规模达60.8亿美元,2021-2025年CAGR为16.4%,2025年市场规模125.8亿美元;中国FPGA市场从2016年65.5亿元增长至2020年150.3亿元,未来中国FPGA市场需求量有望持续扩大,预计2025年市场规模将达332.2亿元。
图表:2016-2025年全球FPGA市场规模
资料来源:Frost&Sullivan,中金公司研究部
图表:2016-2025年中国FPGA市场规模
资料来源:Frost&Sullivan,中金公司研究部
FPGA市场呈现海外双寡头格局,但中国市场正在不断扩大,为本土厂商带来后发机会。2019年全球超85%的FPGA出货量来自Xilinx及Altera,FPGA全球市场呈现双寡头格局。近年来,由于FPGA下游不断拓宽,市场增量机会涌现,同时5G、AI市场未来增量大部分在亚洲,中国5G建设进度领先,因此我们认为FPGA的市场格局正在发生转变,中国FPGA厂商作为后发者迎来机会。
图表:2019年全球FPGA芯片市场格局(按出货量)
资料来源:Frost&Sullivan,中金公司研究部
图表:亚太地区是FPGA主要市场
资料来源:Market Research Future,中金公司研究部
文章来源
本文摘自:2021年8月12日已经发布的《契合下游应用新场景,国产FPGA步入加速期》
彭虎 SAC 执业证书编号:S0080521020001 SFC CE Ref:BRE806
石晓彬 SAC 执业证书编号:S0080521030001
唐宗其 SAC 执业证书编号:S0080521050014
本文转载自《中金点睛》
- 中金中证500C(003578)
- 中金中证沪港深优选消费50指数C(008520)
- 中金MSCI质量C(006342)
本文作者可以追加内容哦 !