文 | 特约专家 刘鹏总编辑的推荐刘鹏先生在继《蜂窝坍塌?关于6G架构变革的思考》之后,再次推出6G时代天地一体话数据中心的思考,值得钦佩。
作为长期耕耘通信产业一线的资深通信人,在6G正在找方向、做定义的预研期,给出自己建议,体现了对产业未来的关切。
通信网发展至今,正在经历以连接为中心到以计算为中心的蝶变,通信网亦正演变为计算网。
数据中心在网络中的角色凸显,直接关系网络效能、成本、运营和业务生成。
显而易见,在6G时代,计算的中心地位会进一步加强,数据中心的构建将更为重要。
刘鹏先生提出天地一体化数据中心,令人耳目一新。
从“东数西算”到“地数天算”,这是一个巨大的飞跃,也是本质的变革。
希望刘鹏先生的“太空数据中心”构想,像马斯克的“卫星互联网”一样,在6G时代梦想成真。
《通信产业报》全媒体总编辑辛鹏骏序言在上一篇“蜂窝坍塌?关于6G架构变革的思考”中论述了6G太赫兹环境下,网络核心网、传输、无线接入架构的深刻变革。
本文从变革后网络架构和业务需求的背后的数据中心建设、组网的特征和技术趋势等问题进行了进一步探讨。
未来6G天地一体化的新型网络架构会引发带动惊人的变革。
按照专家的构想,未来6G天地一体化网络将是实现以社会的虚拟和现实相结合的“数字孪生”为特征的各种业务:AR/VR、人工智能、智慧民生、智慧工业、智慧农业等等。
其网络特征将是按需服务、至简、至柔、智慧内生、安全内生,被运营商称之为算力网络。
近来,又被业界热炒为“元宇宙”。
可见6G天地一体化无线网络架构背后最重要的基础设施就是为千行百业的应用的数据中心及其组网。
数据中心及组网既关系到数字化转型的千行百业的数据中心的指数级增长,又面临碳达峰碳中和节能减排的巨大压力;既要面对各种应用分布式热数据的快速增长,又要面对极其庞大的冷数据中心的长期存在。
更关键的是6G 业务应用数据交互时延是数据中心的命门。
数据中心牵扯到芯片、计算、存储、交换、安全、服务器和交换机的白盒化诸多领域,已有很多技术研究成果和进展,本文不再讨论。
只是关注冷热数据组网、数据中心组网的时延特征、数据中心的耗电和节能。
这些问题关系到诸多应用的体验、关系到碳达峰碳中和、关系到数据中心及组网的长远发展道路。
在数据中心建设和组网中有两个非常重要命题,其一是数据中心的交互时延将成为6G时代的数据中心组网的重要特征;其二是建立太空数据中心将成为天地一体化数据中心组网的重要组成部分。
下面,我们围绕这两个问题,对未来数据中心组网的指标要求以及太空数据中心存在的若干技术问题和发展趋势进行详细讨论。
图1 天地一体化数据中心第一章数据交互时延是未来数据中心组网的重要指标随着5G日益发展的壮大,国计民生、各行各业掀起了数字化的高潮。
尤其是人们对未来6G时代的应用规划远景:太赫兹的极高带宽、传送速率、极短时延;天地一体化无线覆盖;自动驾驶、人工智能、全息通信、AR/VR、数字孪生等应用都对数据中心提出了更高的要求,其特征就是数据的交互时延。
而目前业界还停留在冷数据、热数据的概念中。
1、 数据中心的热数据与冷数据:随着4G、5G的迅猛发展,移动互联网大大推动了互联网数据中心(IDC)建设的高潮,尤其是在数字化转型的浪潮下,企业数据中心(EDC)、国家级大型超算中心(NSC)如雨后春笋迅速发展起来。
随着MEC的兴起,边缘网络数据中心在地理位置上靠近客户,目的是降低延迟,减少网络拥塞,作为用户和中央数据中心之间的数据聚合和内容缓存点,但就数据中心建设和组网其主要的目的还是为了降低数据中心的成本。
例如,数据清洗与标注提升存储数据的质量,减少无效数据的存储,冷热数据分开存放;云边端协同优化数据处理效率。
尤其是冷热数据分开存放、东数西算、云边端协同优化数据处理都与数据中心组网强相关。
热数据是需要被计算节点频繁访问的在线类数据。
冷数据是对于离线类不经常访问的数据,比如企业备份数据、业务与操作日志数据、话单与统计数据。
所以,热数据因为访问频次需求大,效率要求高,一般就近计算和部署;冷数据访问频次低,效率要求低,可以做集中化部署,而基于大规模存储池里,可以对数据进行压缩、去重,建设在能源成本较低的边远地区降低数据中心的成本。
但冷热数据的概念忽略了业务数据交互的时延,因为一些业务为了保证体验质量必须有相应的交互时延作保障。
例如,VR/AR游戏要求的时延小于20ms,自动驾驶、特殊的工业控制数据交互要求时延小于5ms。
而很多被称之为热数据的交互50ms也是可以满足业务要求,其数据中心在比较了传输成本考量后可以建在能源成本较低的边远地区。
所以,冷热数据的概念虽然有兼顾时延因素,但根本上是考虑传输成本和耗能成本而已,用冷热数据的概念无法建立和表征未来6G时代不同业务交互时延的数据中心特征。
2、数据的“交互时延”是未来数据中心组网和选址的重要指标随着智慧城市、智慧工厂、自动驾驶、全息通信、AR/VR、特殊工业控制等要求低时延业务的需求,数据交互的时延体验不仅是冷热数据的区分标志,也将成为数据中心组网的重要指标。
现在业界还没有明确的提及,并把数据交互时延作为建立数据中心组网的重要指标。
一般说来,数据交互时延特征小于20ms-5ms-1ms称之为快数据,而大于50ms的数据交互时延就可定义为慢数据。
例如,贵阳的国家数据中心与北京业务交互距离2200公里,数据经过多端多节点传输,时延过长,显然不能满足快数据的交互时延。
因此小于1ms-5ms时延的数据库就应该设置在边缘计算(MEC)与终端侧;(例如:自动驾驶的交互数据就应设置在汽车内终端数据模块中),20ms 时延的数据库设置在本地数据中心(例如,VR/AR游戏类业务时延要求小于20ms);大于50ms时延的数据可以归于冷数据中心(距离比较远、能耗成本比较低的的超大数据中心)。
所以,数据中心组网要在兼顾数据交互频次、数据交互成本(包括数据传送成本、能耗成本)的基础上、要特别关注数据交互时延(业务要求的数据传送时延),只有这样组网才能达到既能满足业务时延的需求,又能降低成本,又能绿色节能。
数据交互时延理应成为数据中心建设和组网的重要指标。
图2 不同应用的时延指标要求第二章太空数据中心将成为天地一体化数据中心组网的重要组成部分关于未来6G的网络架构,天地一体化组网已经是业界的共识。
而地面数据中心在未来6G各种场景的应用下会有指数式的增长,其耗能面临碳达峰碳中和的巨大挑战。
为了寻求终极的解决方案,把在时延允许(大于20ms-50ms 时延)的条件下逐步把部分或大部分地面数据中心迁移到太空中成为必然的发展趋势。
在6G网络架构下,数据中心的组网必然是在地面数据中心的基础上,实施天地一体化数据中心组网。
地面的数据中心按数据交换时延、数据交换频次、数据交换成本组网。
而在太空通讯网络的数据中心如何组网、如何把地面数据中心与太空数据中心相结合,如何把本属于地面的数据中心迁移到太空中,建立太空数据中心,成了值得探讨的重要战略和技术问题。
最近有一则消息引起了业界的关注:SpaceX一段时间停止了发射星链(Starlink)卫星任务,该公司总裁格温·肖特维尔(Gwynne Shotwell)在8月中旬表示,公司暂停了Starlink卫星的部署,因为他们正在完成首批配备激光通信链路的下一代Starlink卫星。
这些带有激光通信链路的卫星群将无需与地球上的地面站通信就能完成数据传输。
同时,由于这些卫星由于是通过激光链路相互传输数据,因为光在太空真空中的传播速度要比通过光纤电缆快得多,这样就会比地面用户的数据传输速度更快。
SpaceX首席执行官马斯克日前透露,星链Starlink卫星互联网服务很快就能以接近光速的速度传输数据(可以达到光速的97%的传输速度,要比光纤传输速度快40%)。
星链星座作为天基互联网,很可能给世界带来极具颠覆性的效应。
星链网络架构正是基于此设计:用户终端——星链卫星(包括数据交互)——星间激光链路——星链卫(包括数据交互)——用户终端。
理论上用户在全球任意位置都可接入星链网络,从而享受高速度、低延迟的互联网体验,而不依赖地面互联网。
相对于目前地面传统互联网技术,虽然天基互联网不能代替地面移动互联网的作用,星链互联网系统可以在太空环境下完成全球任何地点的通信。
为将来6G时代的天地一体化组网满足众多应用开辟了值得借鉴的方向。
从天基互联网星链的部署计划可以很清楚看出,必然将在太空中建设数据中心。
在一些边远地区、海洋、高山以及特殊行业的卫星移动互联网通讯不需要依赖地面移动互联网的支持。
星链星座还可以作为任何一种卫星或地面设施的数据中继层。
一旦实现,在很多的行业应用如自动驾驶、航海业、航空业、甚至智慧城市、智慧工厂等应用就会会直接采用太空中的数据中心!太空数据中心会呈现出传输速度快、低成本、节能等重要特征。
因此,未来6G天地一体化数据中心的重点课题在于太空数据中心的建设。
1、 太空数据中心的时延可以满足太空与地面的大部分业务的时延要求按照近低轨卫星通信到地面的距离300-2000公里,它的数据交互时延:总时延=发送时延+传播时延+处理时延+排队时延。
发送时延:是从发送数据帧的第一个比特算起,到该帧的最后一个比特发送完毕所需的时间。
发送时延=数据帧长度(b) /信道带宽(b/s)(信道带宽就是数据率)传播时延:电磁波在信道中需要传播一定的距离而花费的时间。
传播时延=信道长度(m)/电磁波在信道上的传播速率(m/s)处理时延:主机或路由器处理所收到的分组的时间。
排队时延:分组在输入队列中排队等待处理,在输出队列中等待转发,就形成了排队时延。
可以看出数据交互时延的组成中,发送时延、处理时延、排队时延很重要,但不是刚性时延,一直在改进中,随着技术的进步会得到更理想的结果。
而传播时延相比来说是刚性时延!主要取决于传播距离,尽管在太空中无线电K频段(世界大多数公司都选择了K波段-20-40G)传播近似光速,除了向地面传输的大气层影响外,传播距离仍是影响时延的主要因素,这也是天基互联网要选择在近地轨星座组网的根本原因。
按照传播时延=信道长度(m)/电磁波在信道上的传播速率(m/s),电磁波段一定,近地轨卫星的传播时延大约在20-50ms。
马斯克的星链计划宣称时延可以达到小于20ms,其时延可以满足太空到地面的大部分业务应用。
图3 全球Starlink网络测试时延数据另一方面蜂窝通信、多址、点波束、频率复用等技术不断改进也为低轨道卫星移动通信提供了技术保障,聚焦宽带移动互联网服务,而且数据时延20-50ms可以存取在太空数据中心,加之低轨卫星间激光通信以极低的时延传输,不需要地面互联网就可满足。
整个宽带卫星网络的运营也类似于维护数据中心里的服务器集群,该集群也会频繁更新软件,以解决诸如性能和安全性等问题。
成为天地一体化数据中心组网的重要部分。
目前大多数地面数据中心的交互时延大约50ms左右,太空数据中心的建设在时延的指标上可以满足大部分业务要求。
2、 分布式是数据中心低轨卫星星座组网的必然选择现有水平的数据中心设备本身的体积大、重量大、耗电大,无法在太空中建设单一大型数据中心,决定了在太空中数据中心的组网必须是分布式的。
这是因为现阶段低轨卫星的容积有限,太阳能电力容量小于2000瓦,即使最大限度的小型化、模块化、节能化进步也无法建立巨大的单一数据中心,必须把数据中心分布建在每一颗卫星上,通过卫星激光通讯极低的时延进行数据交换,形成一体化的大型数据中心。
例如,现在国内最东北的用户要通过卫星通信联系最西南的用户:用户终端——星链卫星A——地面站核心网及传输——星链B——用户终端,完全取决于地面核心网数据获取及链接,而且还要通过地面站核心网及传输来解决卫星A和卫星B跟两个用户的链接。
即使两个用户同在一颗卫星覆盖下需求链接,也需要地面站核心网的链接。
这样就大大增加了链接传输的时延和成本。
一旦通过低轨卫星的激光通信而建立太空数据中心,就完全不需要地面站的核心网的支持,大大降低了卫星通讯的时延和成本。
太空分布式数据中心组网就成为6G天地一体化组网的必然选择。
图4 基于地面核心网的卫星通信3、逐步把部分地面数据中心迁移到太空数据中心能否把符合20-50ms的原本在地面的数据中心完全建立在太空中,充分利用太阳能源、太空中低温环境的自然冷却、太空激光通信的最低时延、低轨/中轨/高轨卫星可以防范地面自然灾害和信息安全(量子加密)将成为天地一体化数据中心组网的必然趋势。
传统地面站数据中心原本是为卫星通信提供支援,完全可以通过地面站把地面20-50ms的业务数据传送到太空数据中心存储和交换,建立地面数据中心迁移到太空中的地对空中转站。
所以,天地一体化数据中心的组网就可按数据存取频次、数据时延要求、数据存取交换成本组成。
而不需要拘泥地面和太空,而是以时延为特征,建立地面数据中心、分布式边缘计算数据节点(MEC)、太空分布式数据中心、应用于地面的低轨/中轨/高轨综合安全的太空数据中心。
实现未来6G天地一体化数据中心,尤其是实现未来“地数天算”的梦想。
图5 天地一体化数据中心组网4、特定垂直行业可能率先实现天地一体化数据中心例如,从遥感图像里提取信息,是遥感应用和遥感产业的基本生产方式。
但是越来越丰富的图像资源带来了新的问题: 判读员不够用。
按照国际业界共识,一名合格的判读员培养周期长达八年之久。
即使在技术人才最为充裕的美国情报部门,也长期面临着判读员严重匮乏的问题。
所以大部分卫星图像——不管是数字的还是胶片从来没有人看过。
高分辨率卫星的商业化和商业星座的普及,更是让数字遥感图像成了要多少有多少的海量资源。
这形成了遥感应用产业中最为薄弱的一个环节,庞大的资源和庞大的需求之间,靠极为有限的人力判读环节维持着。
国内外遥感应用界最近把这个问题推向前台,行业热议的话题正是“对地观测行业从销售数据转向销售答案”。
要从数据中取得答案,就不可能像传统上那样靠人力来分析数据,只能依靠人工智能和深度机器学习技术。
在遥感产业界规模最大、名气最大的数字地球公司,则把自己的业务全面转向了亚马逊网络服务公司(AWS),利用AWS所掌握的机器学习技术来实现深度分析,服务于防务、情报、公共安全、测绘、环境保护、油气勘探和导航等领域。
越广泛的行业应用,就需要越多的卫星图像数据传输、AI机器学习和分析、读图结果的传递,这对实时性和成本产生巨大挑战。
随着卫星遥感AI识别技术的成熟,将AI算力集成为微型数据中心,集成于遥感卫星中,可以实现实时侦测、实时分析,快速分发、结构化处理后的分析结果给各类用户,帮助更多的用户具备低成本快速决策能力,并且大幅度降低卫星链路的图像数据传输量。
类似AI遥感卫星数据中心的模式,未来在特定垂直行业,将率先将空间测绘+数据AI处理+ 结构化内容分发集将成为太空数据中心的核心模块。
第三章建设太空数据中心是未来数据中心实现碳达峰和碳中和的重要途径地面数据中心作为耗电大户,由于智慧城市、云计算等应用带来的庞大需求将会持续刺激数据量的增长,进而推动数据中心耗电量增长,预计未来数据中心耗电量仍能维持双位数增速。
工信部计划2022年数据中心PUE基本达到国际先进水平(PUR1.3-1.4),假设数据中心耗电量年复合增长率在2020年达到峰值的17%,之后增速逐渐下降到2025年的12%。
在上述假设基础上,按工信部的统计和预测2020年国内数据中心年耗电量约为2,045亿千瓦时,占全社会用电量的2.7%,2025年数据中心年耗电量约为3950亿千瓦时,占全社会用电量4.1%,2030年还会翻翻,给碳达峰碳中和的目标实现带来巨大挑战。
地面的大型数据中心耗电巨大。
对于数据中心而言,IT和空调制冷设备是数据中心的主要能耗