随着人工智能的发展,算力基础设施加速迭代。近日,中国证券报记者跟随中国电信举办的2024年投资者反向路演活动,走进中国电信临港智算谷。
这里是长三角规模最大的运营商级算力资源池,也是国内首个正式投入运营的国产单池万卡液冷算力集群。目前,中国电信临港智算谷一期正在向10万卡的智算集群规模有序推进,终期规划为30万卡的高端智算集群。
● 本报记者 杨洁
“两弹一优”高标准示范
走进中国电信临港智算谷一期A4机房,上千台服务器“黑压压”整齐排列,在冷板式液冷等技术助力之下,实现了极致高密互联部署。
相比风冷,冷板式液冷散热方式更高效。记者明显感受到了机柜舱门内外的温差。据介绍,智算中心的平均PUE值达到国家新建数据中心1.25的标准,部分区域更是低至1.08。
智算谷相关负责人介绍,这里是全国首个国产液冷万卡集群,能够为人工智能大模型训练、推理等工作提供强大的基础设施支撑。
业内人士表示,构建万卡智算集群,仅GPU的采购成本就高达几十亿元。拥有万卡资源并不等于构建了万卡集群,多元异构的GPU芯片,对智算集群的系统管理提出了更高、更复杂的要求。
例如,为应对智算算力在供电、散热方面的挑战,智算谷创新采用“两弹一优”(即弹性供电、弹性制冷、气流组织优化)的方式,实现了随需应变的弹性能力。
数字信息基础设施持续演进升级,以满足人工智能发展需求。中国电信规划并建设全国“2+3+7+X”公共智算云池,在京津冀、长三角建设国内领先的万卡全液冷智算集群,在广东、江苏等5省打造千卡资源池,满足AI训练、推理需求。截至上半年末,中国电信智算总规模达到21EFLOPS,算力总规模持续领先。
中国电信坚持“两弹一优”,积极推进数据中心向AIDC升级。针对智能算力异构和分散化等问题,中国电信率先提出基于长距无损智算网,构建分布式智算集群,突破单体智算中心的算力、空间、供电等资源限制。
算力集群将进一步扩容
中国电信临港智算谷是上海临港算力产业版图中的重要部分,可为临港乃至整个上海数字经济发展提供强大支撑。
据了解,上海临港新片区已经形成8个高能级智算中心,批复的机架数超4.15万个,已建成的机架数超2.35万个。按照临港新片区的规划,未来将进一步扩容算力集群,力争2025年算力产业总体规模提升至100亿元。
智算谷项目一期占地119亩,规划建设10万卡高端智算集群,2023年9月1.1期投产,2024年9月1.2期两栋机楼成功封顶,具备机电进入条件。
未来,中国电信将持续构建高质量算力供给体系,以绿色低碳、超大规模、超高性能算力底座,推动开放、共赢、可持续的AI产业生态发展,打造具有国际影响力的人工智能产业生态集聚区。
(责任编辑:王婉莹)
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】