博通市值破万亿美元启示:国产芯片可另类突围

作者: 胡楠

2024年12月13日,定制AI芯片厂商博通总市值突破1万亿美元,并创出单日最大涨幅。随后,公司股价在次一个交易日又继续上涨,盘中创下251.88美元的历史新高。相比之下,通用AI芯片厂商英伟达股价则出现小幅下跌。

导致博通市值突破万亿美元的主要原因在于其四财季财报以及乐观的市场预期。财报显示,博通四财季营业收入为140.54亿美元,同比增长51.20%,净利润为43.24亿美元,同比增长22.70%。

另外,博通CEO还表示,公司正在与美国三家大型云计算厂商开发定制AI芯片。因此,华尔街多家投行纷纷上调博通股票目标价,例如,高盛将公司目标价从190美元上调至240美元,巴克莱将博通目标价从200美元上调至205美元。

需要指出的是,在定制AI芯片领域,国内寒武纪(688256.SH)、百度(09888.HK)、腾讯控股(00700.HK)等企业也早有布局,并取得了一定的成绩。而且,在下游客户方面,国内阿里云、天翼云、移动云、腾讯云均位列全球十大云计算厂商名单,这也为国内定制AI芯片的发展提供了必要的需求。

英伟达GPU竞品的前世今生

AI芯片是一种专为高效运行人工智能算法而设计的特殊处理器,这种芯片基于人工神经网络模型,模拟生物神经元工作机制,通过大量处理单元进行计算,以实现负载的数学运算和数据处理。

由于英伟达GPU在AI芯片领域的市场占有率较高,绝大部分人将英伟达GPU与AI芯片直接画等号。但实际上,市场上主流的AI芯片主要分为三类,第一类是以GPU为代表的通用芯片,第二类是以ASIC为代表的专用芯片,第三类则是以FPGA为代表的半定制化芯片,其中,GPU与ASIC为AI芯片的主要技术路径。

据慧博投研数据,在三大主流AI芯片中,GPU更适用于AI训练,其原因在于AI训练过程需要处理大量的数据和复杂的计算,对芯片的计算能力、内存宽带和并行处理能力要求非常高。GPU由于拥有众多的计算核心和高宽带内存,可以同时处理大量的数据样本和复杂的计算任务,能够加速AI模型的训练过程。而且,在训练过程中,由于需要不断的调整模型的参数和结构,GPU的灵活性使其更适合这种频繁的调试和迭代。

不过,GPU也存在一些局限性。例如,在功耗方面,GPU的功耗相对较高,且由于其通用的架构设计,在执行特定任务可能存在功耗的浪费。

在此情况下,兼具成本与能耗优势的ASIC成为各大云计算厂商在推理领域的首选AI芯片。ASIC是一种为了专门目的或者算法而专门定制的芯片,根据运算类型,ASIC又细分为TPU、DPU、NPU芯片。TPU是谷歌发明的AI处理器,主要支持张量计算;DPU则是用于数据中心内部的加速计算;NPU则是对应了上一轮AI中的CNN神经卷积算法,后来被大量SoC进了边缘设备的处理芯片中。

据国泰君安研报,ASIC成本与能耗低于GPU的原因在于其相对简单的硬件结构,ASIC是为了特定任务而设计,减少了很多针对通用加速计算的不必要的硬件设计,因此,其成本明显降低。

值得一提的是,ASIC单卡算力与GPU相比仍有一定的差距,例如,谷歌TPU v6和微软的Maia 100算力约为英伟达H100的90.00%与80.00%。不过,两者单价显著低于H100,故在推理场景中,ASIC更具有性价比。

据Marvell数据,2023年,定制芯片仅占数据中心加速计算芯片的16.00%,其规模约为66.00亿美元。随着AI计算需求的增长以及定制芯片占比的提升,预计2028年数据中心定制计算芯片市场规模将到429.00亿美元,2023年至2028年年均复合增长率为45.00%。

博通CEO对ASIC市场预计更为乐观,其在业绩说明会上表示,随着三大云计算厂商计划使用博通产品构建百万XPU集群,预计2027年博通AI ASIC市场机会将在600.00亿美元至900.00亿美元。

国产芯片突围

作为AI芯片的主要应用领域,全球云计算市场保持高速增长。据中国信通院统计,2023年,中国云计算市场规模达到6165.00亿元,较2022年增长35.50%,高于全球云计算增速。

而且,随着AI发展带来的云计算技术革新以及大模型规模化应用落地,中国云计算产业将迎来新一轮增长曲线,预计到2027年,中国云计算市场规模将超过2.10万亿元。

据Choice数据,2024年前三季度,阿里云收入为817.54亿元,同比增长5.55%。2024年上半年,中国电信天翼云收入为552亿元,同比增长20.40%;中国联通的联通云收入为317亿元,同比增长24.30%;中国移动云业务收入为504亿元,同比增长19.30%。与此同时,国内腾讯云、华为云、百度云收入也保持稳定增长。与北美市场相似,中国云计算市场的高速发展也为国内ASIC芯片厂商提供了大量需求。

据慧博投研数据,寒武纪是国内AI芯片领域的独角兽企业,采用公司终端智能处理器IP的终端设备出货量已经超过1亿台。而且,公司云端智能芯片及加速卡也已在国内主流服务器厂商产品中得到广泛应用。

2024年,寒武纪股价由最低点的95.85元最高涨至700元,市值最高接近3000亿元。不过,公司业绩仍处于亏损的状态,2022年至2023年及2024年前三季度,寒武纪营业收入分别为7.29亿元、7.09亿元、1.85亿元,同比分别增长1.11%、-2.70%、27.09%。扣除非经常性损益后归属于母公司股东的净利润分别为-15.79亿元、-10.43亿元、-8.62亿元,同比分别增长-42.20%、33.97%、9.07%,亏损有所收窄。

从数据来看,持续性的高研发投入是导致寒武纪出现亏损的主要原因。2022年至2023年及2024年上半年,公司研发投入金额分别为15.23亿元、11.18亿元、4.47亿元,占当期营业收入的比例分别为208.92%、157.53%、690.92%。

另外,截至2024年上半年,寒武纪共有727名研发员工,占公司总人数的比重为74.79%。其中,78.82%的研发人员拥有硕士及以上学历。

寒武纪高研发投入取得了成果,据慧博投研数据,在推理芯片领域,寒武纪先后发布MLU100、MLU200、MLU370和玄思1001等4个系列共8个产品。值得一提的是,思元370芯片采用7nm制程工艺,是寒武纪首颗采用chiplet芯片技术的AI芯片,也是国内第一款公开发布支持LPDDR5内存的云端AI芯片,其算力是寒武纪第二代云端推理产品思元270算力的2倍。

更为重要的是,370系列在高密度云端推理领域具有明显优势,其MLU370-X8提供256TOPS的峰值算力,高于英伟达的L20。与国内云端推理芯片相比,在150W功耗推理卡中,MLU370-X4峰值算力和昆仑芯R200、燧原I20相同,均为256TOPS。在高密度云端推理领域,MLU370-S4的能耗比为2.56,具有一定的能耗优势。

除了寒武纪之外,华为、百度等企业也先后发布自研ASIC芯片。华为于2018年10月发布了昇腾910和昇腾930两款AI芯片,其中,昇腾910是一款最大功耗仅为8W的AI芯片,可用于推理端。2023年9月,华为发布昇腾910B,单精度算力大幅提升,并接近英伟达A100水平。

百度在2018年发布1代昆仑芯片,截至目前,昆仑芯片已经经历两轮迭代。需要指出的是,与寒武纪、华为AI芯片不同,昆仑芯片适用云、端等领域,并在自动驾驶、智能交通等领域已经落地。

腾讯也先后发布三款自研芯片,分别为紫霄、沧海、玄灵。其中,紫霄主要用于AI推理,并在语音撰写、OCR等腾讯业务场景中得到应用;沧海则主要用于视频转码,目前已量产并投用数万片;玄灵主要用于智能网络,定位于云主机的性能加速,减少主CPU网络功能的占用。

上一篇 点击页面呼出菜单 下一篇