● 本报记者 杨洁
在3月19日英伟达2024 GTC大会上,英伟达CEO黄仁勋发布了更高性能的GPU芯片——基于Blackwell架构的B200以及超级芯片GB200。同时,黄仁勋还公布了由Grace Blackwell超级芯片GB200提供支持的服务器系统。由于功耗太高,液冷的散热方式成为系统标配。正如黄仁勋此前曾提到的,浸没式液冷技术将是未来方向,将带动整片散热市场迎来全面革新。
英伟达的选择在业内具有风向标意义。多家机构表示,这次发布会或将成为液冷发展的重要推动力。中信证券表示,在数据中心算力提升和能耗降低推动下,液冷技术将加速替代风冷技术,成为新的技术发展方向。在液冷技术中,冷板式液冷技术在性能与成本之间形成平衡,是现阶段最佳的散热方案,建议关注液冷系统及其核心零部件的投资机会。
液冷散热大势所趋
据黄仁勋介绍,GB200架构包含两个GPU、一个CPU,通过高速连接组合在一起,这将带来性能的极大提升。以大语言模型LLM推理训练为例,相较于英伟达H100 Tensor Core GPU,GB200超级芯片可实现30倍的性能提升。
英伟达还推出了超级计算机机柜DGX GB200 NVL72,拥有18个GB200节点机架,每个节点搭配2个GB200 GPU。黄仁勋表示,一个DGX GB200 NVL72机柜可以训练27万亿参数的模型。但由于功耗过大,所以也采用了液冷的方式,同时重量高达3000磅(约1361公斤)。
大会上,鸿海集团子公司鸿佰科技(Ingrasys)发布一款使用英伟达GB200芯片的NVL72液冷服务器,该服务器集成了72个英伟达Blackwell GPU和36个英伟达Grace CPU。鸿海的竞争对手和硕也发布了基于GB200 NVL36的液冷解决方案,用于处理计算密集型工作负载。
业内人士认为,算力器件的密度和功耗持续增长,对传统的风冷散热模式带来挑战,能耗成本不断抬升以及政策对PUE指标监管趋严,共同倒逼产业对液冷需求升级,冷板式液冷或率先放量,浸没式液冷为长期方向。
华西证券研报表示,AI大模型的火热引爆了各行业对算力基础设施的需求。更高密度、更大规模的数据中心建设,给数据中心带来了高功耗的挑战,液冷散热的渗透速度也在加快。主流技术方面,现在市场上主流的液冷解决方案是冷板散热;产业生态方面,从基础设施到AI设备的全栈交付模式已经基本成为行业共识;客户群体方面,互联网和电信这两个数据中心最大的行业客户已经对液冷表示肯定的态度。
国内厂商积极布局
据了解,我国液冷服务器普及率不足10%,随着AI和算力需求不断增长,数据中心单机柜功率密度将呈增长趋势,液冷服务器的占比有望进一步提升。根据赛迪顾问数据,单机柜20kW一般认为是风冷可解的散热极限,预计2025年新建数据中心的平均单机柜功率将达到25kW,数据中心液冷散热方式将逐渐取代风冷。
液冷散热目前的技术路线主要是冷板式液冷和浸没式液冷两种,选择哪种路线,与单机柜功率有较大关系。一般认为在只考虑初始投资成本时,单机柜功率不超过10kW时,采用风冷相对经济;单机柜功率在10kW-100kW时,采用冷板式液冷较为合适;当单机柜功率超过100kW的时候,采用浸没式液冷更经济。
曙光数创在接受投资者调研时介绍,随着产业不断成熟,当前冷板式液冷的初始投资成本已经接近甚至低于风冷,而考虑后期运维成本的情况下,浸没式液冷的CTO(总体拥有成本)在4.5年左右后与风冷持平。
冷板式液冷市场目前竞争激烈。曙光数创是新一代数据中心冷却技术领先的整体解决方案和全生命周期服务供应商。其表示,过去一年,液冷市场处于产业初期阶段,各家厂商以抢占市场份额为目标,尤其是冷板式液冷市场竞争较为激烈,导致公司整体毛利率与上年同期相比有所下降。赛迪顾问《2023中国液冷应用市场研究报告》显示,2021年至2023年上半年,曙光数创以平均58.8%的市场份额,位列中国液冷数据中心基础设施市场部署规模第一。
英维克近期在投资者互动平台介绍,公司拥有全链条液冷技术以及超过900MW液冷交付经验,能够为算力设备以及算力设备的机房部署提供适配各种场景的高效温控解决方案。近日,英维克作为第一中标候选人,中标了中国电信的弹性DC舱(2024-2025年)集中采购项目,该项目合计采购弹性DC舱3200套,其中包括数据中心液冷层DC舱323套。国信证券分析认为,运营商积极推进液冷应用,相关招标有望陆续启动和落地,国内液冷市场前景广阔。
(责任编辑:王婉莹)
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】