东数西算高楼渐起

作者: 翟晓汀 张军红

东数西算高楼渐起0

2022年可谓“东数西算”元年。2月,国家发展改革委等四部门批复同意京津冀地区、长三角地区、成渝地区、粤港澳大湾区启动建设全国一体化大数据中心国家算力枢纽节点。此前,四部门已批复同意在内蒙古、贵州、甘肃和宁夏等四个节点启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计,东数西算工程正式全面启动,开启了我国算力资源全国范围跨区域统筹布局的新篇章。

算力时代已来

算力通俗讲就是计算能力,是指对数据的处理能力。算力可用FLOPS(Floating-point Operations Per Second,即每秒浮点运算次数)计量。算力存在于各种智能硬件设备,是推动人工智能、大数据、物联网、区块链等技术创新与应用的基础支撑。

1964年,我国自行独立设计的通用数字电子计算机119诞生,运算速度为每秒5万次。然而,面对大量科研计算任务,这台国内唯一可用的电子管计算机匀不出足够机时,来自全国各地的科研工作者需要排队等候才能使用。尽管后来上海华东计算技术研究所将119型计算机复制了一台(J501计算机),但作为第一代电子管计算机,性能极不稳定。中国“氢弹之父”、著名核物理学家于敏就曾率领研究人员利用华东计算技术研究所国庆节假日期间空出的全部机时集中突击,为了避免出错又不浪费机时,采用“换人不停机”的方式工作,以减少机时损失。

如今,“抢机时”时代已经过去,超级计算机的运算速度以每秒千万亿次计算。国防科技大学的银河、天河系列,中科院的曙光系列,联想的深腾系列,无锡江南计算技术研究所的神威系列共同构成了我国超算力量,助力众多科研领域取得丰硕成果。2022年上半年全球超级计算机500强榜单显示,在全球浮点运算性能最强的500台超级计算机中,中国部署的超级计算机数量达到173台,位列全球第一。

当前,我国算力总规模已超过140 EFLOPS,近5年年均增速超过30%,算力规模排名全球第二。数据中心是算力的主要提供形式,截至2021年底,我国在用数据中心机架总规模超过520万标准机架,平均上架率超过55%。扫地机器人、无人驾驶汽车、智能音箱……各种智能场景的背后都暗藏着计算的力量。随着数字产业化、产业数字化进程不断加快,数字经济飞速发展,数据总量也呈爆发式增长。数据作为与土地、劳动力、资本、技术等并列的生产要素,与之相关的存储、计算、传输、应用等算力需求都在大幅提升,预计每年仍将以20%以上的速度快速增长。算力,已经深入到数字经济时代的各个角落,成为国民经济发展的重要基础设施。

东数西算高楼渐起1
参会者在2021 中国国际大数据产业博览会现场。 来源:新华社

数字经济时代,算力已经成为衡量国家经济发展程度的重要指标。《2021-2022全球计算力指数评估报告》显示,国家计算力指数与GDP的走势呈现出了显著的正相关。从15个重点国家的计算力指数看,平均每提高1点,数字经济规模和GDP将分别增长3.5‰和1.8‰,预计该趋势在2021年—2025年将继续保持。

同时,算力已成为推动我国经济高质量发展的重要支撑。国家信息中心信息化和产业发展部主任单志广在接受《经济》杂志、经济网记者采访时表示,从技术融合看,人工智能、量子计算、类脑计算等新技术与计算产业相结合,拓展了全方位计算能力;从领域协同看,数据的泛在分布推动计算从云端向物联网、边缘计算逐步普及,随着5G带来低延时、高带宽和高连接密度的管道,云游戏、云VR、云桌面、云手机等新兴业务需求蓬勃发展;从行业渗透看,计算已经跨越IT产业本身,成为数字化基础设施,为制造业、汽车行业、智慧城市等多领域的数字化转型提供支撑。“以算力为核心融合大数据、人工智能、物联网、区块链等新兴技术,并与智能制造、智慧城市、智慧医疗、智能交通等领域协同联动,将为数字中国建设和数字经济发展带来强劲动力。”单志广表示。

而东数西算最重要的意义在于有利于促进碳中和、碳达峰目标的实现。纵观中国算力版图,东部占60%,西部占20%,东部远高于西部。而从算力资源的空间分布潜力来看,西部潜力远高于东部。建设数据中心需要大量土地、电力,东部资源日趋紧张,而西部土地广阔、电价便宜、能源尤其是绿色能源丰富,将数据中心建立在西部,不仅能够节约“西电东送”的成本,还能提高对西部光伏、风电等绿色能源的使用,助力“双碳”目标实现。

具体来看,国家为8个算力枢纽内10个数据中心集群划定了物理边界,并明确了绿色节能、上架率等发展目标。比如,集群内数据中心的平均上架率至少要达到65%以上,可再生能源使用率要有显著提升。据了解,2021年我国数据中心的PUE(电能使用效率)指标为1.49-1.5,整体处于较高水平。按照国家一体化数据中心建设要求,东部数据中心集群的PUE平均要求小于1.25,西部则要求小于1.2。未来,数据中心具有很大的节能减排空间。从能耗构成来看,服务器能耗占比约45%,供电损耗占比约10%,散热能耗占比约43%,未来随着供电和制冷技术不断优化,加上西部天然的气候和能源条件,这些都有利于减少碳排放。

筑牢三大基石

数据、算力、算法是支撑数字经济发展三个要素。单志广提到,当前从总体发展情况看,我国数据发展“大而不优”,算力发展“结构不均”,算法发展“整体不强”,需要根据我国国情实际,切实做好数字经济支撑要素固根基、补短板、强弱项、增优势,不断做强做优做大我国数字经济。

第一,数据发展“大而不优”。数据是发展数字经济的关键要素。单志广介绍,我国是目前世界上数据总量仅次于美国的第二数据大国,到2025年中国数据总量预计将跃居世界第一。但是,由于各行业信息化水平不一,大数据技术建设和业务应用水平差异较大,导致数据质量特别是大数据质量总体上参差不齐,数据纯度不够、价值不高。同时,大数据产业链中存储环节总体上产能过剩,分析处理环节又欠缺失衡,导致数据通过清洗、加工、精化等提升数据质量的力度不够,影响数据治理的优化。另外,数据共享、数据开放进展缓慢、成效不彰,已成为数字政府、智慧城市和数字经济发展的瓶颈和制约。

第二,算力发展“结构不均”。单志广表示,我国算力发展存在“三多三少”的结构性失衡。

一是数据中心底层架构和服务能力存在结构性失衡,传统数据中心多、智能计算中心少。当前,我国数据中心以传统数据中心为主,通过虚拟化方式面向政府、企业和个人提供通用云计算服务,复杂计算能力不足。科技部主导建设了8个国家超级计算中心,通过超级计算节点互联方式面向海洋科学、油气勘探、气候气象、生物医药等前沿科学领域开展应用计算研究与服务,商业化服务门槛较高。但在人工智能普及应用以及算法模型参数量和复杂度不断提升的背景下,我国具有数据吞吐大、计算速度快、算法工具多、软硬件协同、服务价格适中等特征的智能计算中心则相对较少,难以满足产业数字化转型和智能化升级需求。

二是数据中心区域分布和规模类型存在结构性失衡,东部多中西部少、中小型多大型少。从区域分布看,北京、广东、上海、浙江、江苏等经济发达省份人口及互联网用户密度大,互联网、云计算等科技创新类企业多,是我国数据中心业务需求最旺盛的区域,也是数据中心资源最为集中的地区,上架率达到60%-70%。从规模类型看,2019年我国数据中心数量大约有7.4万个,数据中心机架规模达到227万架,可对外服务的IDC(Internet Data Center,互联网数据中心)数量为2213个,其中,中小型数据中心占比超过87%,超大型数据中心相对较少,整体上存在重复建设、利用不足、能耗较大等问题。

三是数据中心核心芯片和软件产品存在结构性失衡,进口依赖多、国产自主少。硬件方面,服务器核心的数据处理、存储和传输等高端芯片国产化能力偏弱,供应链集中在欧美日韩台等国家和地区,以我国主流服务器芯片为例,国内企业主要基于AMD公司授权进行x86架构二次开发,难以掌握底层技术,存在较高的授权终止以及数据安全风险。软件方面,长期以来,我国软件应用市场由国外企业主导,在服务器操作系统、数据库、高性能计算基础软件等领域缺乏拥有核心竞争力的本土龙头骨干企业。此外,数据中心国产化软硬件兼容方面还需不断完善。

第三,算法发展“整体不强”。算法已成为人工智能的基础。当前,数据和算力已经不再是人工智能发展的主要瓶颈,人工智能的创新主要就是算法的创新。在这样的背景下,只有不断探索新的算法机制,发展新的算法应用,开发新的算法模型,发掘和培养算法人才,才能为推动智能社会发展提供强劲动力。

东数西算高楼渐起2
西部云基地全景 来源:新华社

单志广认为,在数字经济的三要素中,数据位于价值金字塔的底层,算力处于价值金字塔的中部,而算法处于价值金字塔的塔尖,它的价值含量最高,对数字经济发展的作用最为关键。因此,应该高度重视算法基础设施,实现算法基建化。算法基础设施会被部署在算力基础设施上,共同推动应用的发展。“近年来我国算法发展进展很快,百度、腾讯、科大讯飞等深度学习的算法能力在多个领域达到国际先进水平,AI领域的明星创业公司如旷视科技、商汤科技等聚焦在深度学习最擅长的视觉识别和语音识别领域,推动中国相关领域的技术水平达到国际一流。但是,我国的算法发展仍然整体上竞争能力不强、人才储备不足、基础能力不够,迫切需要从整体上提升我国算法的国际竞争力和价值贡献度。”单志广说。

最大挑战是“摸清家底”

简单说,东数西算就是把东部的数据拿到西部进行计算。其中,数据指的是以二进制方式可以存储处理的数字化信息,计算则代表我国丰富的算力资源。需要强调的是,全国一体化大数据中心是全局性的大概念,目前批复的8个国家枢纽节点和10个国家数据中心集群是构建全国一体化大数据中心的雏形,是开展全国范围内的布局和优化,而东数西算相对而言是小概念,并不能单独讨论。而建设全国一体化大数据中心,其中一个方面就是实现集群之间的算力调度。无论是全国一体化大数据中心布局还是东数西算建设,背后都是复杂的巨系统的优化调度问题。

东数西算带来的最大挑战就是“摸清家底”。在东数西算工程实施中,数据资产和算力资源都存在持续性和动态性,要求人们必须实时摸清当前处于活跃状态的、正在被处理的数据资产和运行中的算力资源,以及处于静态环境里的被保存的数据资产和储备算力资源,由此才能实现最优化的算力资源调配,使得各类数据资产能够得到最为及时的分析处置。这需要对各类相关算力资产(IT硬件资产、IT软件资产等)“摸清家底”,以便更精准地进行能源资源的消耗调配和预储备,真正做到“心中有数”。

那么,这个大工程究竟应该如何布局?首先要对算力进行分类。算力分为三种类型,超算算力、智能算力和基础算力,与此相对应的是超级计算(HPC)、智能计算和大数据处理系统三种计算模式。近年来,我国算力结构随着应用需求的变化不断演化,基础算力占算力的比重由2016年的95%下降至2020年的57%,智能算力占算力的比重则由2016年的3%提升至2020年41%,超算算力在整体算力中的占比较为稳定,约为2%,主要用于科学计算与工程计算等领域。而东数西算工程目前是对超算算力和智能算力的调度和统筹,这是由于基础算力承载的多是电子游戏、短视频、即时通信等实时性较强的需求,就目前的技术而言,具有实时性的本地数据无法搬到异地计算,因此西部目前主要考虑的是承载后台加工、离线分析、存储备份等非实时算力需求。

上一篇 点击页面呼出菜单 下一篇