手机、电脑用久了会发热,高速率数据中心的物理设备在运行期间更是会产生很多热量。这些难以驱散的热量又使室内温度急剧升高,让物理设备处于极端不利的高温环境,很容易造成机器故障甚至宕机的事故。
一个数据中心动辄数千台机器,大量设备消耗的电能几乎都变成了废热,因此人们积极探索数据中心的冷却系统,从传统的风冷、水冷到目前规划中的浸没液冷,业界为此绞尽了脑汁。
传统的制冷系统耗费了数据中心大约30%的电力,加上高度集中的交换机、服务器、光收发模块等it设备的耗电,每年的数据中心会消耗全球2%的总用电量。小易教你数据中心如何才能更高效,更节能节省能耗。
自然环境冷却
比如, facebook在瑞典北部靠近北极圈的地方建数据中心,利用自然低温为数据中心散热,降低能耗。
微软在苏格兰奥克尼群岛海岸附近建“水下数据中心”,利用寒冷的海水散热。
再比如阿里巴巴在张北的数据中心充分利用自然的气温低、空气干净的优势,大面积采用新风自然冷和水侧自然冷却技术,尽可能用自然冷源为服务器降温。
这些都是通过现实的寒冷自然环境进行的免费冷却方案,但是有时我们需要在炎热的内陆进行数据中心的部署,这时我们就需要应用新的技术。
我们通常会采取哪些新的技术呢?
浸没液冷
提到冷却方式,浸没液冷绝对是最近几年最受业界关注的新型散热技术,尤其是在sc14全球超级计算机大会上,来自国内外的多家服务器企业均展示了在浸没液冷散热上的产品,大幅提高了业界对液冷的关注度。
浸没液冷技术里的液体并不是水,而是一种绝缘冷却液,它的特殊之处在于:完全绝缘且无腐蚀性,即使浸没元器件20年以上,也不会对电子元器件产生任何影响。而高效的散热效率,可使机房无需空调等大型制冷设备,节省空间75%以上,与一般机房风冷散热方式相比,节约了30%以上的额用电量。
其接近1.0的pue也可以将有限的电力发挥出最大的计算能力,系统完全浸泡在封闭液体换金的设计使得计算部署密度获得大幅度提升, cpu和gpu计算部件可长时间稳定工作在高性能频率状态,并几乎完全免除湿度、灰尘、振动的影响,极大优化了服务器运行环境,提升了设备寿命。
服务器冷却方式 | pue | 噪声 | 冷却能力 | 商业化应用 |
---|---|---|---|---|
风冷 | 1.6 | 高 | <20kw/机柜 | 市场成熟 |
冷板式液冷 | 1.2 | 低 | 20~60kw/机柜 | 已实现大规模部署 |
浸没式相变液冷 | 1.05 | 低 | 60~200kw/机柜 | 定制开发 |
◮几种制冷方式比较
ai算法控制技术
除了上表中列出的这些制冷方案外,在过去几年中,谷歌一直在测试一种算法,让计算机自我学习如何最好地对冷却系统做出调整,以达到降低功耗的目的。该ai系统之前就曾向数据中心管理员提出过一些降低冷却功耗的建议方案,再由管理员来决定是否采纳,事实证明这些方案能使功耗降低40%。
美国能源部劳伦斯.伯克利国家实验室的研究人员在2016年做了一份报告指出,2014年美国所有数据中心的总耗电量约为700亿千瓦时,约占全国用电量的1.8%。根据这份报告中的数据,因效率提升而节约的能源几乎抵消了由于数据中心数量增加而造成的能源消耗的增加。预计到2020年,全美数据中心的总能源消耗量将达到约730亿千瓦时。
数据中心能源使用方面的顶级专家jonathan koomey认为,利用机器学习来降低计算机芯片的耗能会有更重大的意义,芯片才是整个数据中心最耗能的部分。他说:“我更希望看到谷歌和其他大公司应用这些工具去优化在计算上用的负荷,在计算方面的节能潜力要比冷却多数十倍。”
减少器件能耗
正如jonathan koomey所说,除去改革冷却方式,我们更应该做的是降低计算机芯片等方面的耗能。早期英特尔的cpu功耗约为120瓦左右,现在最新一代cooper lake cpu功耗达到了240瓦;对于gpu来说,英伟达最新的hgx2 gpu功耗更是达到了400瓦。
另外随着数据速率的提升,用于交换机之间互连的光收发模块功耗也大幅增加:比如100g qsfp28 psm4升级到400g dr4功耗从2.5w急剧增长到12w甚至以上。单波100g的芯片电驱动、应用了dsp信号处理芯片的高速率模块以及eml调制方式的激光器更是大幅提升了400g产品的总耗电量。
解决方式主要从芯片的创新开始。改造芯片制造工艺,将芯片尺寸从16nm减少到7nm可大幅减少芯片功耗。著名半导体制造商amd于去年11月发布了全球首款7nm数据中心cpu“rome”;著名芯片制造商macom也展出了首款面向服务于云数据中心应用的200g和400g光模块提供商的完整芯片组pg电子直营网的解决方案。该方案支持在低于4.5w的总功耗下实现200g模块以及在9w功耗下实现400g模块,这有助于通过确保极低延时的全模拟架构来实现业界领先的功率效率。
易飞扬通信(gigalight)在光模块的研发上十分重视功耗和性能之间的平衡,比如我们领先于业界的100g qsfp28 4wdm-40模块,采用创新的器件集成以及激光器调制等技术,功耗仅有3.8w, 充分代表了未来绿色数据中心的趋势和潮流。我们也通过硅基集成的方式,研制出了100g qsfp28 psm4以及100g的相干模块,都拥有非常好的产品性能。
降低数据中心能耗需要不断的研发投入以及技术创新,随着未来数据流量的爆发,减少能源消耗、提升能耗效率将越来越重要。作为参与数据中心建设的一员,易飞扬(gigalight)将坚持使用最新的产品技术,顺应时代潮流,积极研发生产符合未来数据中心应用的光收发模块,为实现未来低功耗的绿色数据中心建设贡献力量。