ChatGPT 为代表的 AIGC 引发 AI 计算中心需求井喷,英伟达高性能 GPU 成为了新一轮 AI 掘金热的硬通货。如果 AI 进步的瓶颈在于算力,那么现阶段计算能力的主要限制则是英伟达的 GPU 供应能力,随着需求持续攀升,其生产正越来越受限于台积电 CoWoS 的产能。
尽管台积电在最新的业绩说明会中强调不认为在 AI 能在今年下半年驱动半导体需求恢复增长,但仍然为英伟达等主要 AI 芯片的客户启动了 CoWoS 产能扩张计划。然而远水救不了近火,CoWoS 严重短缺的当下,谁有机会分得一杯羹?
代工、封测产能过剩,CoWoS缘何逆袭?
2022 年下半年以来,半导体行业景气度急转直下,过高的产业链库存,使得除汽车领域之外的大部分代工、封测市场进入了产能过剩的状态。近期 TrendForce 的数据显示,与前两年的订单满载截然不同的是,当前各大晶圆厂的产能利用率未达到峰值。8 英寸晶圆产线中,台积电、联电、世界先进、力积电和中芯国际(约当 8 英寸晶圆)的产能利用率预计分别下降至 97%、80%、73%、86% 和 79.5%;12 英寸晶圆产线,台积电、三星、联电产能利用率分别下降至 96%、90%、92%。
封测方面,IDC 最新研究显示,由于封测厂仍处于清库存阶段,上半年产能利用率大部分维持在 50%-65%,随着库存调整后的需求温和复苏,下半年有望回升至 60%-75%,甚至来自先进封装的部分急单能让产能利用率提升至 80%,然而仍与 2022 年的 70%-85% 仍有差距。
然而就在这样的颓势下,台积电连月来不断传出 CoWoS 先进封装产能告急的声音。究其原因,正是 ChatGPT 为代表的 AIGC 驱动英伟达、AMD 等公司的高性能计算芯片 GPU、CPU 等需求井喷,而这些芯片大多采用了台积电的 CoWoS 封装。
TrendForce 最新报告指出,目前主要由搭载英伟达 A100、H100、AMD MI300,以及大型数据中心厂商如谷歌、AWS 等自主研发的 AI 服务器成长需求强劲,预计 2023 年 AI 服务器(包含搭载 GPU、FPGA、ASIC 等)出货量预估近 120 万台,年增率近 38%,AI 芯片出货量同步看涨,可望成长突破五成。
在全球对于 AI 数据中心算力的旺盛需求推动下,英伟达的 GPU 订单也在不断飙升,其最高端的 H100 在明年第一季度之前都是售罄状态。为此,英伟达近月来都在争取台积电对其 A100、H100 等 AI GPU 的产能支持,同时亚马逊 AWS、博通、思科和赛灵思等公司也都提高了对台积电的产能需求。这些芯片无一例外都使用了台积电的 CoWoS 封装。
例如英伟达 H100 采用台积电 4N 工艺、CoWoS-S 2.5D 封装。芯片流片在台积电位于台南的 Fab 18 厂,与其 N5 工艺共用相同的机台,由于 PC、智能手机和非 AI 相关数据中心芯片的需求严重疲软,台积电 N5 工艺的产能利用率降至 70% 以下,因此 H100 的晶圆生产没有任何问题,甚至因吸收了台积电的闲置先进产能而获得一些定价优势。而这些流好片的晶圆(WIP)存放在晶圆库中,等待 CoWoS 产能才能继续封装成为最后的成品。
供应链消息显示,仅英伟达今年对 CoWoS 的需求就达到 4.5 万片,比年初预计的 3 万片大幅增加了 50%,台积电原本产能就不多的 CoWoS 湿制程更难以满足如此庞大的需求。
AI 推动 HBM 成存储厂商救命稻草,但产能难以即时满足
除了 CoWoS 产能,HBM(高带宽存储)也正成为限制 AI 处理器的另一个重要瓶颈。
用于数据中心中的 GPU,扩展内存带宽越来越重要,尤其 AI 服务器中推理和训练工作负载是内存密集型的,随着人工智能模型中参数量的指数级增长,仅模型权重参数的大小就已达到 TB 级。因此,AI 处理器的性能受到从内存中存储和检索训练和推理数据的能力的制约,这就是俗称的 " 内存墙 " 问题。
集微分析师指出,由于 HBM 拥有比 DDR SDRAM 更高的带宽和更低的耗能,已经成为 HPC 处理器的首选内存技术,现阶段没有其他替代选择,在高端 AI 服务器 GPU 搭载 HBM 芯片更已是主流。比如英伟达 A100,H100,以及在最新整合 CPU 及 GPU 的 Grace Hopper 芯片中,单颗芯片 HBM 搭载容量提升 20%,达 96GB;AMD 更是大量采用 HBM,其中 MI300 搭载 HBM3,MI300A 达 128GB,更高端的 MI300X 则提升了 50%,高达 192GB。而谷歌在下半年推出的 TPU 张量处理器,据传也搭载 HBM 存储器,以扩建 AI 基础设施。
这极大地推动了 HBM 的技术更新以及市场增长。作为新一代内存解决方案,HBM 市场被 SK 海力士、三星、美光三大 DRAM 原厂牢牢占据。TrendForce 调查显示,2022 年 HBM 市占率分别为 SK 海力士 50%、三星约 40%、美光约 10%,预计 2023 年全球 HBM 需求量将年增近六成,达到 2.9 亿 GB,2024 年将再增长 30%。
作为 HBM 的先驱,SK 海力士在技术和市场占有率上都更胜一筹,是最新一代的 HBM3 的唯一大批量供应商,市场份额超过 95%,今年将推出具备 8Gbps 数据传输性能的 HBM3E 样品,并将于 2024 年投入量产。与此同时,三星和美光也将 HBM 作为下一步业务增长的关键动力。三星表示将投资 1 万亿韩元扩大 HBM 产能,并于今年推出 HBM3 产品;美光预计其相关 HBM 产品 " 将在 2024 财年贡献有意义的收入,并在 2025 年贡献大幅增加的收入 "。
在存储市场仍处于寒冬的背景下,几大存储厂商在过去一段时间都进行了减产动作,而 HBM 的需求突然降临无疑被其视为 " 救命稻草 "。不过,虽然这三大存储芯片制造商正将更多产能转移至生产 HBM,但由于调整产能需要时间,很难迅速增加 HBM 产量,预计未来两年 HBM 供应仍将紧张。
由于 GPU 核心与 HBM 堆栈通过 CoWoS 封装在同一基板上,HBM 的产能紧张也在一定程度上限制了 AI 处理器的出货。
CoWoS 产能不足,哪些厂商有望受益?
在产能需求持续升级之下,台积电才从一开始的保守转而在 Q2 业绩法说会上确认将积极扩充 CoWoS 产能,将投资 900 亿元新台币 ( 约 28.7504 亿美元 ) 打造位于竹科铜锣园区的先进封装厂,预计 2026 年底建厂完成、2027 年第三季开始量产,月产能达 11 万片 12 英寸晶圆,涵盖 SoIC、InFO 以及 CoWoS 等先进封装技术,同时将明年的 CoWoS 月产能提升至今年的 2 倍。
CoWoS 是台积电于 2011 年发布的 2.5D 先进封装技术,至今已演进至第六代,根据不同的中介层主要分为 CoWoS-S(硅中介层)、CoWoS-R(RDL 中介层)、CoWoS-L(LSI+RDL 中介层)三种。
简单来说,CoWoS 是先将芯片通过 Chip on Wafer(CoW)的封装制程连接至硅晶圆,再把 CoW 芯片与基板连接,整合成 CoWoS。利用这种封装模式,使得多颗芯片可以封装到一起,通过硅中介层互联,达到了封装体积小、功耗低、引脚少的效果。
" 其核心关键技术包括中介层、RDL、TSV、 Bump 等,需要前后道工艺结合,挑战在于散热、芯片间的信号串扰和延迟、设计布局以及可靠性等问题。" 集微咨询分析师指出。
多年来,台积电针对 CoWoS 技术的开发重点之一是支持不断增加的硅中介层尺寸,以支持构建在中介层之上的处理器和 HBM 堆栈,而面临产能紧张的一个重要原因,正是中介层的生产以及相关设备的供应紧张。因此,台积电才会传出需要寻求合作,并可能外包给合作伙伴。
目前,日月光、安靠、联电和三星等厂商都被指因台积电产能紧张而受益,那么究竟谁能分得一杯羹呢?
根据台媒消息,英伟达从 6 月下旬起,已开始推动台积电向传统封装厂商合作伙伴发送硅中介层载板产能需求,并同步推动联电扩大 2024 年硅中介层载板产能;同时近期安靠和日月光均在与 CoWoS 设备供应商密集洽谈,很可能意味着将进行扩产。
其中,一种方案是台积电完成晶圆和中介层生产,即 CoWoS 的 "CoW" 部分,然后交由自家(比如空余 InFO 产能)或别家封装厂完成 "oS" 部分;另一种方案是联电生产硅中介层,即 "Co" 部分,再送往安靠或日月光完成 "WoS" 部分。
先进封装技术专家王为(化名)对集微网分析,CoWoS 生产拆分成两个部分是可行的,但是涉及到很多工艺的 know-how,并且材料成本很贵," 能做 " 和 " 能做好 " 有很大的差别。" 客户的 SoC Die、HBM 堆栈等成本都很贵,如果良率不佳,将导致最终封测成品价格远高于台积电。" 他指出," 如果一个完整流程涉及不同公司,或半成品在不同厂房之间运输,也会带来商务纠纷的风险以及运输方面的麻烦。"
比如联电,最近在先进封装方面频频发力。根据该公司官网资料,联电是全球首个提供硅中介层制造开放解决方案的代工厂,即通过联电 +OSAT 的合作模式,由联电完成前段 2.5D TSI 硅中介层晶圆(FEoL+TSV+FS RDL),然后交由封测厂完成中段 MEoL 和后段 BEoL 工序。
在 7 月 28 日的日月光法说会上,该公司已经证实,正在与代工厂合作中介层相关技术,并具备 CoWoS 整套制程的完整解决方案,预计今年下半年或明年初量产。
不过,相比台积电,联电目前在中介层方面的产能仍然很小,原因之一与台积电一样,均是 TSV 所需刻蚀(DRIE)设备不足,并且由于在封装间距方面的限制,联电暂时只能做 A100。
集微分析师指出,虽然各家的 2.5D 工艺,对应的中介层层数、TSV 的尺寸、所用的材料、曝光次数及效率的差异都会影响最终成本,在某种程度上也是资金实力的竞争,因为高端设备十分昂贵,买得起更好的设备生产出来的产品也更好。在这方面,台积电因为先进制程的优势自然也具备更高端的设备。"CoWoS需要在晶圆上对芯片进行更精确的堆叠和互连,因此更高精度的电镀等先进设备必不可少。"
例如,硅中介层的最大尺寸受掩模版的曝光尺寸限制,因而与所用的光刻机种类相关。根据此前台积电公布的 CoWoS 路线图,今年推出的第六代 CoWoS_S 工艺,硅中介层尺寸达到了 3400mm2 左右,可支持更多 HBM 堆栈,而这无疑对光刻机提出了更高要求。此外,TSV 的制作挑战在于高深宽比的通孔和高密度引脚的对齐,生产过程中包括深孔刻蚀、气相沉积、铜填充、CMP、晶圆减薄、晶圆键合等工艺涉及的设备均与 TSV 性能息息相关。
CoWoS的潜在替代方案?
另一位业内专家大可(化名)告诉集微网,与台积电 CoWoS 类似的 2.5D 先进封装技术还有三星的 I-Cube/H-Cube、日月光的 FOCoS-Bridge、英特尔的 EMIB 等。
三星的 I-Cube 包括 I-CubeS 和 I-CubeE 量子方案,最新一代的 I-CubeS,I-CubeS 8 的硅中介层拥有 3 倍标线尺寸,可容纳 8 个 HBM 堆栈和 2 个逻辑裸片;I-CubeE 支持嵌入式硅桥裸片,对大中介层而言,更具成本效益。H-Cube 是三星推出的另一种 2.5D 封装解决方案,主要是采用面积较小的 ABF 基板或 FBGA 基板叠加大面积的 HDI 基板的方式,来解决当前 PCB 严重短缺的问题。
" 虽然三星在 2.5D 先进封装方面已经布局多年,百度 2018 年推出的第一代百度昆仑 AI 芯片正是基于三星 14nm 工艺及 I-Cube 封装解决方案,但是前道代工业务较弱也在一定程度上影响了其先进封装业务的进展,因而至今客户仍然很少。" 大可指出。不过随着台积电 CoWoS 短期内难以满足客户需求,三星有希望能接到部分订单,并且三星的优势在于它是唯一一家拥有从内存,处理器芯片设计、制造到先进封装业务组合的公司。
日月光方面,除了与代工厂合作完成 2.5D 封装,也在开发自己的完整解决方案。该公司在今年 5 月底推出了 FOCoS-Bridge,在 70mmx78mm 尺寸的大型高效能封装载板中,包含两颗相同尺寸 47mmx31mm 的 FOCoS-Bridge 的扇出型封装结,可通过 8 个硅桥(Bridge ) 整合 2 颗 ASIC 和 8 个 HBM 堆栈,面向 AI 和 HPC 应用。日月光强调,FOCoS-Bridge 可提供与硅中介层相似的电气、信号和电源完整性性能,但成本更低,并且没有掩模版尺寸限制。
最后,大陆整体封装产业尽管已跃居全球领先地位,但是在以 TSV 为代表的 2.5D/3D 等先进封装领域仍然较为薄弱。尤其当前采用 2.5D/3D 先进封装的芯片都是前沿先进工艺制程,线宽和芯片间距越来越小,比如当下主流的 HBM3 对线宽的最低要求是 1.8/1.8 m,目前只有代工厂有能力在硅中介层上将线宽降至 1.8/1.8 m 以下,封装厂还不具备这一能力;国内封测龙头长电科技披露的 XDFOI 平台当前可以实现 3-4 层高密度的 RDL 走线,其中介层线宽 / 线距最小可达 2 m。
而根据集微咨询发布《2022 年中国集成电路封测产业白皮书》,2022 年中国大陆本士综合性封测企业营收 TOP10 中,仅有长电科技、通富微电、华天已具备 2.5/3D 封装能力。据悉,国内在这一领域的主导者和主要推动者是 H 公司。
当越来越多的国产大模型进入到追赶 GPT 的队伍中,在进口高性能 AI 处理器受限的情况下,国产 GPU 的发展有望迎来随着巨大的算力需求缺口而产生蝶变,这就要求下游制造、封装技术也尽快提升,为突破 AI 领域的封锁补齐短板。并且,在国内先进制程发展受阻的情况下,加速 2.5/3D 等先进封装领域的追赶才能尽力弥补先进制程能力不足的遗憾。
文章来源--集微网
本文作者可以追加内容哦 !