查看原文
其他

三年“国云路” 中国电信拿到一张人工智能“船票”

郝俊慧 孙永会 IT时报 2024-06-05

天翼云构建四大智算云能力体系

作者/  IT时报记者 郝俊慧  孙永会

编辑/  孙妍

5月的榕城,连日雨后的空气中隐有一丝清凉,但海峡国际会展中心依然是全城最“火”的目的地。一年一度的“数字中国建设峰会”第七次来到福州,向全球展示中国数字建设的最新成果。


这也是中国电信连续第三年在“数字中国建设峰会”举行云生态大会。“看,天翼云的Logo变了。”高峰论坛开始前,有眼尖的媒体记者发现,今年天翼云的英文名称变成了“State Cloud”(国云),这个去年还“犹抱琵琶半遮面”的名字今年终于正式亮相。


改变的不仅仅是Logo。今年大会名称从云生态大会改为智算云生态大会,不仅在“云”前面加了“智算”二字,屏幕上天翼AI与天翼云并驾齐驱。一切都显示,“AI融云”已成为这家全球最大电信运营商云的最显著特征。


“作为国家云,天翼云已经越过向智能云发展的拐点,迈入新的发展阶段。”中国电信董事长柯瑞文在大会演讲中透露,截至目前,天翼云智算规模已达13EFLOPS,预计到2024年底,智算规模将达到21EFLOPS。


当日大会,中国电信副总经理唐珂发布智算云能力体系。围绕人工智能算力、算法、数据三大要素,对原有以通算为主的能力体系进行完善、优化、升级,以适应人工智能时代对信息基础设施的需求。


三年来,中国电信走出了一条具有自身特色的国云发展之路,而这条路径的选择,也使得国云在推动人工智能发展应用上具有独特优势。国资委副主任苟坪在大会上透露,随着国资央企云体系建设持续深化,截至目前,国资委已推动36家中央企业深化40个行业云建设,20余个行业云一年内已实现营收超160亿元。天翼云承载了四十朵行业云中的二十四朵。


这一张驶向人工智能时代的“船票”,中国电信牢牢握住了。

独辟蹊径的国云路径

福州,有福之州。对于天翼云而言,这里的确是块风水宝地。


2022年7月24日,第五届数字中国建设峰会·首届云生态大会举行了“云上国资央企启动仪式暨国资监管云上线仪式”,天翼云作为国家云框架定位基本确立;2023年4月28日,第二届云生态大会上,柯瑞文表示,天翼云作为国云的框架已经成型;一年后,5月25日举行的第三届智算云生态大会再次宣布,国云框架全面成型,并在本次大会上举行国资监管云中央节点上线暨国资央企智算云调度管理平台启动仪式。


成为国云框架以来,天翼云一路高歌猛进。数据显示,2022年到2023年,天翼云在中国公有云市场份额占比从11.8%升到12.9%,营收也从579亿元升至972亿元。2023年,阿里云 2023 年的年度营收为 1053.96 亿元,两者已十分接近。


不久前公布的中国电信2024年Q1财报显示,产业数字化业务收入达386.79元,同比增长10.6%,天翼云在其中占比居多。根据这个速度,到2024年底,天翼云营收有望超1200亿元。


近日IDC发布的《中国公有云服务市场(2023下半年)跟踪》报告也显示,2023下半年IaaS市场中,阿里云、华为云、天翼云、腾讯云和移动云为市场排名前五。如今,天翼云的市场份额稳居全球运营商云第一、中国混合云市场第一、政务公有云市场第一。


“随着AI兴起和智算服务的快速发展,公有云市场的同质化局面正在被打破,不同云厂商积极结合自身优势进行研发创新,逐渐形成各自特色,并在一定程度上覆盖不同领域的新兴市场。”IDC中国企业研究部研究经理崔婷婷如是说。


这一点在25日举行的智算云生态大会上也得到了印证。


“我们坚持网是基础、云为核心、网随云动、云网一体,充分发挥云网融合优势,积极把握智能化演进方向,走出了一条具有自身特色的国云发展之路。”柯瑞文在演讲中表示,坚持云网融合并充分发挥其优势,坚持科技创新特别是科技自立自强,是这条道路的两个显著特点。


这三年,同样是中国电信打造科技型企业的三年。


柯瑞文透露,三年来,天翼云已经攻克了云操作系统等“卡脖子”难题,云底座平台摆脱了开源限制,构建了技术领先、自主可控的全栈云技术与产品体系。


比如,在云计算技术与平台方面,天翼云突破算网编排、算力度量、跨域调度等关键技术,升级算力互联互通平台“息壤”,单集群调度性能每秒超过2000多实例。


在大模型算法与应用方面,基于国云智算训练池,中国电信自训练并发布了千亿参数规模的星辰语义大模型、视觉大模型和多模态大模型。教育、医疗、政务等行业已规模商用20多个行业场景大模型。


今年两会期间,量子是当红“炸子鸡”,而中国电信去年11月便发布了自研的“天衍”量子计算平台,实现176比特超导量子算力的融合计算,构建量子密码资源池与云间量子算力网络,全面提升国云抗攻击能力。

独具特色的智能云能力体系

天翼云要向智能云升级。


2022年底ChatGPT横空出世后,生成式AI的快速发展引发算力需求爆发式增长,算力、数据、模型等都需要以云为关键载体,云计算作为基础资源和核心平台的重要性日益突出,AI与云相融互促成为人工智能时代最显著特征。


同时,生成式 AI对云服务市场的竞争格局产生了重大影响。2023年,三分之一的微软Azure AI服务的新增客户此前从未使用过微软Auzre云,手握先进大模型Gemini的谷歌云,在 2023 年也终于实现首次盈利,而AWS(亚马逊云科技)受未能抢占生成式AI先机等影响,2023年收入和利润同比增长仅分别取得13%和7%,大幅下滑至历史新低。


在2023年11月举行的中国电信数字科技生态大会上,柯瑞文明确指出,“没有AI就没有云的未来,除却AI不是云”。与互联网公司出身的云服务商不同,运营商云有着独一无二特征——云网融合,而中国电信独有的前瞻性布局,也让它在人工智能时代构建了颇具自我特色的智算云能力体系。


此次智算云生态大会上,中国电信从算力基础设施、智算平台能力、星辰大模型能力、数据要素能力等四个方面入手,打造了一个“算力·平台·数据·模型·应用”五位一体的智算云能力体系。柯瑞文表示,天翼云作为国家云已经越过向智能云发展的拐点,进入新的发展阶段。

在算力互联网方面,中国电信拥有全球最大的全光网络,云网融合的天翼云能实现跨域大资源节点的高速互联。目前,中国电信打造的400G弹性无损智算广域网络,算力池间平均时延降低至9.7ms,无损网络总容量达600T。


不久前,中国电信为某互联网头部客户开通的首批400G OTN精品专线正式交付使用。在超大带宽的加持下,客户在宁夏和京津冀两地数据中心的网络连接由单线“一车道(单波100G)”跃升为“四车道(单波400G)”,实现数据中心之间海量用户数据“运、存、算”等高效协同作业。这是全球首批交付商用的端到端400G客户级专线。


此外,在智算调度方面,算力互联互通平台“息壤”、通智超一体化智算加速平台“云骁”与一站式智算服务平台“慧聚”,都是基于运营商级的云网融合底层技术研发而来,因此,对网的性能监测、感知、调度和差异化保障能力更为突出,算力调度更为高效快捷,已使国云具备建设全国一体化算力互联网的能力。


尤其值得关注的是中国电信的数据要素能力体系,据中国电信数据发展中心主任张鑫透露,预计到今年年底,中国电信将有320TB原始文本、15TB高质量文本、10TB视频以及15万小时语音作为大模型的高质量数据集,同时,中国电信已经接入超过6700万视频设备的数据。


在智算云生态大会“数据要素”展区,现场工作人员向《IT时报》记者介绍了“海南省数据产品超市”的案例。全省各地市、各个委办局的数据皆已打通,通过该平台实现了“前店后厂”的模式,即所有的数据以目录的形式呈现在门户网站上,各个企业完成注册和登记之后,可以看到自身需要的数据,然后再向海南省大数据局提出申请,进而利用这些数据开发产品。


目前,除海南外,中国电信还服务了福州、泰州等18个省市级数据要素平台,让数据跨平台就可以加工建模,同时承办了首期国家“数据要素×大赛”的平台建设。


独有千秋的天翼AI

不知是否巧合,每次中国电信云生态大会举行前夕,都会迎来一次云商的“降价潮”。去年4月26日,大会举行同一天,阿里云宣布启动大规模降价;今年5月21日,大会举行前三天,阿里云再次全面降价,而这次降的是大模型。


“未来,大模型就是云。”阿里云智能集团资深副总裁、公共云事业部总裁刘伟光的这句话,讲出了业界的一个基本共识,未来大模型将是一种类似云计算的基础设施,公有云+API将成为企业使用大模型的主流方式,云商必须要有自己的大模型。


时至今日,全球云厂商们大多已经形成“服务大模型+大模型服务”全栈布局。中国电信也不例外。


此次与天翼云同台亮相的天翼AI,由中电信人工智能科技(北京)有限公司自主研发,该公司成立于2023年11月28日,是中国电信集团在2023年成立的第二个注册资本为30亿元专业公司,另一个是5月成立的中电信量子信息科技集团有限公司。


2023年7月举行的世界人工智能大会上,中国电信首次发布自己的大模型——星辰大模型。此后,基于“通用大模型、行业大模型、垂直应用大模型”技术迭代,天翼AI持续完善大模型能力,提升语言、视觉和多模态大模型的认知水平和推理性能,不同类型的大模型独有千秋。


本次大会上,中国电信人工智能公司总经理何忠江宣布了星辰大模型在语音和视觉方面的突破。


首先发布了业内首个支持30种方言自由混说的语音识别大模型——星辰超多方言语音识别大模型,可同时识别理解粤语、上海话、四川话、温州话等30多种方言,是国内支持最多方言的语音识别大模型。更关键的是,只需采集不超过100小时的方言数据,便可以很快得到一个新的方言模型。


在方言大模型赛道,星辰语音大模型颇具领先优势。在业内知名的多方言语音识别数据集KeSpeech任务上,星辰语音大模型打破纪录,领先之前最优结果20%,以高达92.97%的字准确率刷新最优结果。同时在NIST(美国国家标准与技术研究院)组织的Babel低资源语音识别项目电话粤语赛道上,刷新记录取得目前业内最好结果。


在上一轮人工智能浪潮中,视频监控识别是落地最多的场景,但产业界一直困惑于如何在小样本情况下解决大量长尾场景的问题。星辰视觉大模型可以通过自然语言对视频内所有要素进行检索,比如只要直接输入检索“一条以上的狗在打闹”的文本,大模型便可以将其转换为向量,并和从视频里关键帧分割出来的向量在高维空间对齐,最后从所有监控视频中找出相应的图像。


目前中国电信视觉大模型后台存有16亿特征向量。何忠江说,这意味着,基本可以在大模型里通过自然语言去检索万事万物。


除了自有大模型,天翼云还引入了开源模型和第三方模型,打造大模型超市,加强模型国产化生态适配,提供丰富的模型库。


当日大会上,天翼云科技有限公司总经理胡志强透露,今年天翼云重点面向国产算力,对“慧聚”平台做了全面能力升级,一是自研AI框架,实现技术自主可控;二是自研加速算子库,模型训练和推理效率提升20%以上;三是突破断点续性,解决稳定性问题,同时实现了万卡级的容器纳管和调度。


目前,慧聚已经为星辰大模型提供了平台服务。

排版/ 季嘉颖

图片/ 中国电信

来源/《IT时报》公众号vittimes

E N D

大家都在看

请加「星标」不错过我们

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存