英伟达推出H20,国内厂商可否与之一战?

作者: 胡楠

英伟达2023年的营业收入为609.22亿美元,同比增长125.85%;净利润为297.60亿美元,同比增长581.32%,业绩创出历史新高。为了不失去中国市场与业绩持续增长的需要,英伟达为中国市场定制了三款“特供”芯片,分别为H20、L20、L2,且于近期开始接受预定。

国内方面,以景嘉微、海光信息、龙芯中科等为代表的GPU厂商业绩并不乐观,2023年仅有海光信息业绩实现显著的正向增长。不过,在此轮GPU全球竞争中,国内厂商似乎并没有过于落后,从数据来看,华为昇腾910B与H20性能大体相当,在某些关键领域的FP32性能表现略优于后者,海光信息深算二号性能相比上一代产品提升了近一倍,昆仑芯、摩尔线程等公司产品也在持续迭代中。

海光业绩增长

据业绩预告,2023年,海光信息营业收入为60.12亿元,同比增长17.30%;归属母公司所有者净利润为12.62亿元,同比增长57.11%,其业绩增长远超国内其他竞争对手。

CPU是海光信息主要的收入与利润来源,因此,海光信息业绩增长的核心原因在于下游服务器需求旺盛。

据IDC数据,中国服务器市场快速增长。2022年,中国服务器市场规模为288亿美元,2018-2022年CARG高达20.20%,而随着东数西算项目的推进以及国产AI大模型应用的爆发,国内服务器需求将稳步上升,预计2027年将达到454亿美元。

需要指出的是,X86仍为全球服务器主流架构。据IDC数据,2022年,全球X86服务器市场规模达1109.55亿美元,占服务器总市场的比重为87.50%。从中国市场来看,2023年第一季度出货量中,X86架构服务器出货量占比高达92.40%。

而且,根据Mercury Research数据,2021年第四季度,X86 CPU市场几乎被海外巨头垄断,Intel占74%、AMD占比为26%,在中国市场亦是如此,X86 CPU芯片国产化率较低。

海光信息CPU产品可以实现上层应用无缝切换,减少迁移成本,相对于ARM服务器迁移风险小,但在2020年,其产品出货量仅占国内总体市场份额的3.75%。

幸运的是,国内信创产业的发展推动了海光信息CPU产品出货量的增长。2022年9月,政府下发79号文,要求到2027年,央企、国企全面完成国产替代。

据东吴证券数据,2022年,部分央企、国企服务器招标国产化比例已经超过了30%;而且,2023年,银行、运营商等央企、国企还放出纯国产服务器招标,其中海光信息和华为是行业信创服务器两大主要供应商。

除了国产替代的影响,规模效应使得自研无形资产摊销金额占营业收入的比重下降也是促进海光信息业绩增长的重要因素。

据财报数据,海光信息一直保持高强度的研发投入。2021-2022年,公司研发支出资本化金额分别为8.40亿元、6.54亿元,占当期研发投入的比重分别为53.02%、31.61%。

截至2023年上半年,海光信息账面无形资产非专利技术期末余额为33.15亿元,按照3-10的期限进行摊销,当期计提金额3.27亿元,而随着出货量的增加,规模效应显现,公司毛利率逐步上升,由2019年的37.31%增至2023年前三季度的60.63%。

英伟达H20竞争力如何?

根据中国通信院发布的《中国算力发展指数白皮书》数据,2022年,全球智能算力约451E Flops(基于FP32计算),预计到2030年,全球智能算力规模将达到52.5Z Flops,全球智能算力快速增长。

对于中国市场,根据IDC和浪潮信息发布的《2023-2024人工智能计算力发展评估报告》,2022年,中国智能算力规模为259.9E Flops(基于FP16计算),预计到2027年达到1117.4E Flops,2022-2027年CAGR约为33.90%。

具体至数值层面,Gartner研究显示,2022年,全球AI芯片市场规模为442.20亿美元,预计2027年将增至1149亿美元。而在中国市场,头豹研究院数据显示,2022年,中国AI芯片市场规模为954亿元,预计到2025年达到1979亿元。

需要指出的是,AI芯片可以分为GPU、FPGA、Asic,其中GPU是较为成熟的通用型人工智能芯片,FPGA、Asic则是针对人工智能需求特征的半定制和全定制芯片。根据TrendForce发布的数据,英伟达GPU为AI服务器主流芯片,其市场占有率约为60%-70%;其次为云端厂商自主研发的Asic芯片,市场占有率约为20%左右。

另外,全球GPU市场呈现“一超一强”的竞争格局。根据IDC数据,2021年,英伟达在企业级GPU市场份额为91.40%,AMD市场占有率为8.50%。

更为重要的是,由于美国对于中国的制裁加剧,国内企业很难获得先进的AI芯片,2023年10月17日,美国商务部宣布计划限制向中国出售更先进的A芯片,除了H100、A100、L40等产品外,新的政策还将将限制英伟达A800、H800芯片的出口。

为了不失去中国市场以及遵守美国的禁令,英伟达针对中国区开发出改良版AI芯片,包括H20、L20以及L2,其中H20性能最强,其采用中国台湾地区的台积电的CoWos封装,理论上等于H100的20%综合算力性能,另据路透社消息,英伟达对H20中国渠道定价设定在1.20万-1.50万美元。

那么,英伟达真的可以凭借“阉割版”的H100在中国GPU市场实现降维打击吗?

答案是否定的,近年来,中国颁布了一系列支持采用国产AI芯片的政策,例如北京颁布政策明确推动国产人工智能芯片实现突破,上海市提出拓展国产芯片应用,推广国产算法框架。

与此同时,以华为、海光信息、摩尔线程等为代表的GPU厂商也先后投入大量研发资金,其产品性能也持续迭代,甚至在部分领域已不弱于H20。

据国海证券研报,在FP16精度下,H20算力为148 TFLOPS,FP32精度算力为44 TFLOPS,FP64精度算力为1 TFLOPS;华为昇腾910在FP16精度下算力为320 TFLOPS,昇腾910B算力为376 TFLOPS。更为重要的是,据IT之家消息,在某些关键领域的FP32精度下算力,英伟达H20表现不如华为昇腾910B,而且昇腾910B市场价格约为12万元左右。综合来看,与华为昇腾910B相比,H20并没有明显的竞争优势。

海光信息深算二号性能同样表现不俗,其性能相比深算一号提升了一倍。

公开信息显示,深算一号FP16精度下算力为24.5 TFLOPS,FP32精度算力为11.5 TFLOPS,FP64精度算力为10.1 TFLOPS;三类精度下,深算二号的算力分别为49 TFLOPS、23 TFLOPS、10.2 TFLOPS。通过对比,海光深算二号在FP16与FP32精度下算力低于英伟达H20,但在高精度FP64的算力优于H20。

值得一提的是,据招股说明书,海光深算一号售价为1.93万元,低于英伟达A100的5万元,依次推算,海光深算二号售价大概率低于英伟达的H20,主打高性价比。

对于GPU来说,产品性能是一个门槛,另一个重要门槛是易用性,这涉及到生态问题,国外大厂经过多年的发展,已经形成了比较强的生态。

相对乐观的是,国内科技企业正在积极适配国产芯片。据路透社消息,百度为200台服务器订购1600颗华为昇腾910B芯片。2023年11月8日,在世界互联网大会乌镇峰会上,360集团创始人周鸿祎表示,360将采购华为1000片左右AI芯片,并与华为合作将AI框架移植到昇腾910B上。

2023年11月6日,寒武纪也对外表示,思元系列云端智能加速卡与百川智能旗下大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面适配,昆仑芯、摩尔线程等公司新品也持续迭代,国产GPU进入高速发展阶段。

当然,国内AI芯片厂商在发展的过程中也存在一些问题,例如国产AI芯片多采用NPU架构,例如华为昇腾、寒武纪等,NPU架构的优点在于体积小、功耗低、平均性能强,但其问题在于前期投入成本高、不可编辑,且技术风险较大。

上一篇 点击页面呼出菜单 下一篇