AI时代来临,算力即国力,高算力也意味着超高耗能,过去传统数据中心伺服器备援电力系统以BBU、超级电容为主,因应现今高算力数据中心更强大算力的AI伺服器系统,以锂电池为核心的UPS不断电系统解决方案因运而生,成为AI伺服器系统的备援电力方案新趋势,并出现在最新的GB300 NVL72 AI伺服器系统上。

辉达(NVIDIA)最强大的GB300 NVL72 AI伺服器系统究竟有多耗电?据了解,GB300 NVL72AI伺服器系统功耗达140千瓦,为传统数据中心伺服器耗电20倍以上,一年最高可吃掉122万6,400度电,一部GB300 NVL72AI伺服器机柜耗电量约等同于台湾270户家庭一整年用电量,一年总电费达523万元。

业者指出,传统数据中心与现今高算力AI数据中心,用电需求差异十分显着,高算力AI伺服器机柜系统用电量动辄高出10几20倍,这主要体现在硬体规格、功耗密度、冷却系统、运行模式等方面。

例如单位功耗差异上,传统数据中心以使用CPU为主的伺服器,功耗相对稳定;而高算力AI数据中心部署大量GPU(如NVIDIA A100/H100),整体热密度与耗电量显着提升。冷却与电力设计上,高算力AI数据中心伺服器採液冷散热,高冷却负载,电力规划每个机柜数十至上百kW。AI高密度训练任务(LLM、视觉、推理)训练,长时间高负载运行,散热需求高,液冷是发展趋势。NVIDIA等厂商正推动液冷部署。

高算力AI数据中心的用电量为传统伺服器中心3到10倍以上,对电力基础设施、散热设计、以及永续能源转型带来巨大挑战。因此,设计与营运必须与能源规划紧密结合。

锂电池业者表示,UPS与BBU在高算力AI数据中心中都扮演备援电力系统的重要角色,但两者应用场景、架构层级、技术特性与对于能源效率的贡献各有不同。

应用定位上,UPS以整体机房、机柜、机架级(集中式)为主,保证整个数据中心短时间内不中断供电,备援时间通常数分钟至数十分钟,技术特性结合大型电池组+逆变器+配电系统;BBU则以单机伺服器、单卡(分散式)为主,为特定伺服器设备短暂备援,保障数据写入完整性,备援时间约几秒到几分钟,足够写入缓存资料,专为紧急资料保护。

功能与技术差异上,备援电力类型UPS以AC供电(转换至DC),BBU直接DC电池供电,备援方式,UPS通常接续发电机(如柴油)或移转云端节点,BBU仅供特定硬体维持写入缓存作业,UPS整体而言在于保护整体运作,BBU仅保护储存层或特定伺服器。

AI数据中心备援电力系统趋势方向,高效UPS(模组化、三电平变换技术、Eco Mode)逐渐取代传统UPS,BBU不影响PUE,但强化资料保护。管理模式使用软体定义电力(SDP)、AI优化UPS能效与放电逻辑,趋势朝向UPS分散式与液冷、电池结合(如Li-ion UPS、模组式设计),UPS初期投资高,但支撑整体运营。

#电池 #伺服器 #数据中心 #备援 #BBU