IT资讯 微软和Meta效仿Google 利用AI技术帮助安全运行其数据中心

merle · 2022-06-19 16:20:05 · 热度: 9

数据中心驱动着数十亿人每天使用的应用程序、网站和服务,对于建造和维护它们的工人来说,可能是一个危险的地方。工人们有时不得不在数据中心通电时对其电气设备进行维修。他们可能会接触到氯气等化学品,氯气被用作计算机和服务器的液体冷却系统中循环水的消毒剂。2015年6月,在北卡罗来纳州梅登的一个苹果数据中心发生氯气泄漏后,5人不得不被送往医院。

AHREFS_DC-5.webp

由于技术和规则的进步,数据中心比以前更安全,但为了寻求前瞻性的解决方案,一些科技巨头表示,他们正在探索如何应用人工智能来预防安全问题。例如,微软正在开发一个人工智能系统,分析一系列来源的数据,并为数据中心建设和运营团队生成警报,以"防止或减轻安全事故的影响"。一个互补但相关的系统也在开发中,试图检测和预测对数据中心建设进度的影响。

"这些举措都处于早期测试阶段,预计今年晚些时候将开始扩展到我们的生产环境中,"微软的一位发言人表示。

Meta公司还声称正在研究人工智能如何预测其数据中心在可能导致不安全工作环境的"极端环境条件"下的运作方式。该公司表示,它一直在开发物理模型来模拟极端条件,并将这些数据引入负责优化整个服务器的功耗、冷却和气流的AI模型。

"我们有来自数据中心的大量运营数据,在一些地区,频率很高,服务器、机架和我们的数据大厅都有内置的传感器,"Meta的一位发言人表示。"每台服务器和网络设备,承担不同的工作负载,将消耗不同数量的电力,产生不同数量的热量,并使数据中心内的空气流通量不同。我们的基础设施团队收集每台服务器的所有数据,然后开发出人工智能模型,可以在数据中心分配我们的服务器和机架,并将工作负载发送到这些服务器中,以优化性能和效率。"

当然,除了安全之外,公司还有相应的动机来确保数据中心保持在高峰状态。因为停机是昂贵的--而且越来越频繁。根据IT咨询公司IT正常运行时间研究所2020年的一项调查,三分之一的数据中心所有者和运营商承认在过去12个月中经历了一次重大的故障。六分之一的人声称,他们的故障使他们的损失超过了100万美元,这比2019年的十分之一要高出不少。

Meta在全球有20多个数据中心在运行,包括在德克萨斯州和密苏里州的新项目,估计总共花费16亿美元。与此同时,微软管理着200多个数据中心,并表示在可预见的未来,它将每年建设50至100个新的数据中心。

人工智能还有望在数据中心找到通常不为人知的能源--也就是成本--节约的机会,这是对企业有吸引力的另一个方面。2018年,Google声称,由其DeepMind子公司开发的人工智能系统能够比其数据中心的历史能源使用量平均节省30%的能源。一方面,Meta和微软都表示,他们现在正在使用人工智能来实现类似的能源调整目的。

微软在2021年底推出了人工智能"异常检测方法",利用电气和机械设备的遥测数据,衡量和缓解数据中心内的异常用电和用水事件。该公司还在使用基于人工智能的方法来识别和修复数据中心内电表的问题,并确定放置服务器的理想位置,以尽量减少浪费的电力、网络和冷却能力。

Meta公司则表示,它一直在利用强化学习来减少它为冷却目的而泵入数据中心的空气量。(强化学习是一种人工智能系统,通过试验和错误来学习解决问题)。该公司的大多数数据中心使用室外空气和蒸发冷却系统,使优化气流成为一个高度优先事项。

减少环境足迹是能源调节型人工智能系统的一个额外优势。根据环境调查机构的一份报告,2020年,数据中心消耗了全球电力需求的约1%,并贡献了所有二氧化碳排放量的0.3%。而典型的数据中心每天使用300万至500万加仑的水,与一个拥有3万至5万人口的城市的用水量相同。

微软此前曾表示,它计划在2025年前让其所有的数据中心100%使用可再生能源运行。Meta公司声称在2020年实现了这一壮举。

为您推荐与 微软 相关的帖子:

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册