突破国产AI算力芯片,不能忽视中小企业助力
作者: 陈巍在大模型与ChatGPT等技术崛起后, AI算力成为产业圈甚至是老百姓津津乐道的话题。英伟达和台积电等企业被大众熟知,华夏大地也开始了如火如荼的算力基建,广东、江苏、上海等省市在集算力、存力、运力于一体的综合算力方面下足了功夫。
以往的新闻报道,往往聚焦于先进算力相关的半导体制造技术,也就是大家常说的7纳米或5纳米技术,对AI芯片的上下游链条少有提及。但对AI算力芯片产业而言,制造和上下游生态是产业发展的两条腿,缺一不可。
这里的生态,主要指的是AI算力芯片产业上下游的算力IP核(知识产权核心电路模块)和软件编译体系。制造首先解决“有没有”的问题,生态则要解决“生存和发展”的问题。这两者的自主技术发展壮大,才能让国内AI算力芯片“用得好、用得多”。在制造瓶颈逐渐解决之后,生态建设,特别是开源生态建设,就成了国产AI算力芯片发展的关键。
目前,国产AI算力芯片生态发展上遇到两个关键瓶颈。
一方面,国产自主可控的先进算力IP核仍需进一步发展。目前国内算力芯片厂商为降低产品量产风险,多采购国外第三方的IP核,类似于采用国外CPU和主板来组装国产电脑。这可能导致大量资源投入国外IP核的“包装”“升级”,反而抑制国产算力核心架构和IP核的发展。特别是传统GPGPU 95%以上的核心专利都在国外厂商手中,持续使用国外IP核,追着老外后面走,很可能为“外人”做了嫁衣。
另一方面,是需要市场认可的算力芯片开源编译体系。目前市场上普遍接受的算力芯片编译体系,是英伟达的CUDA商用(闭源)生态。而国产算力芯片采用的编译体系,具有非常明显的碎片化分布,各家都不一样,存在大量的重复建设。但建编译生态的工作量巨大且烧钱,例如英伟达历时10年斥巨资,以先发优势才打造出CUDA生态。即便AMD这样的老牌CPU/GPU厂商,面对英伟达的GPU生态都力不从心。如果国内AI算力芯片继续如梁山好汉一般单打独斗,忽视中小企业的创新贡献能力,不形成足够的合力,恐难以打破国外厂商的生态垄断。
就笔者看来,目前国产算力芯片需要借鉴Linux在Windows之后的开源崛起经验,重视中小企业贡献,汇聚更多的联合力量,形成生态的更大合力。
从先进技术的发展历程看,原始创新很多来自广大中小创新组织或企业,典型的如Linux、OpenAI、d-Matrix、Jim Keller(原AMD架构师)创建的Tenstorrent等。
在算力芯片领域,占多数的也是中小企业或机构。如果对广大算力芯片企业和上下游生态通过开源普惠方式进行支持,调动中小企业和机构的创新力,一个好汉三个帮,与大企业一起形成生态合力,对算力生态的发展会起到更大的促进作用。
类似的成功案例也发生在新能源车领域。例如特斯拉2013年开始,逐渐开放和免费授权与新能源汽车相关的专利,甚至是开放源代码。这些举措事实上促进了其他车企的技术跟进,降低了整个产业的研发成本。与之类似,可以鼓励2家或以上的机构/企业研发AI算力IP核或编译器,进行良性竞争,并对外完全实时开源,以开源开放带动行业内的中小企业合力贡献。同时,鼓励国外的开源社区参与生态建设,形成国际化共建,以四两拨千斤的方式带动生态建设。这样一方面可以避免碎片化的重复建设,另一方面也可以使有限的投入倍增形成更大影响力。