据外媒报道,麻省理工学院的研究人员日前开发了一种基于人工智能的强化学习系统,可以改变数据中心的运营。
麻省理工学院的专家说,运行人工智能(AI)的数据中心将比使用人工编辑算法时间表的数据中心效率更高。研究人员表示,他们已经开发了一种自动调度程序,可以将群集作业的速度提高20%或30%,在高峰期甚至可以提高2倍。
麻省理工学院人工智能作业调度程序可使用一种称为“强化学习”(RL)的人工智能。这是一种基于反复试验的机器学习方法,可以根据特定集群中的实际工作量来修改调度决策。如果做得正确,人工智能可以取代当前的新方法,即算法。它们通常须由工作人员进行微调,从而导致效率低下。
麻省理工学院在与该技术相关的新闻文章中说:“该系统可以使数据中心使用更少的资源以更高的速度处理相同的工作负载。适应数据中心的强化学习形式可以改变运营。”
麻省理工学院电气工程与计算机科学系的学生Honghong Mao说,“如果使用机器进行反复试验的方法,他们可以尝试不同的调度工作方式,并自动找出哪种策略比其他方法更好。利用率稍有改善,即使是1%,也能节省数百万美元和大量能源。”
当今的数据中心算法面临哪些问题
当前在数千台服务器上运行任务的当前算法的问题是它们效率不高。理论上,它们应该是这样的,但是由于工作负载(任务的组合)是不同的,因此人类需要参与调整性能(例如,可能需要在作业之间共享资源,或者某些作业可能需要比其他作业更快地执行)但是人类无法处理修改的范围或范围;这项工作太大了。
在人工编辑的调度中,人类无法理解的排列可以包括以下事实:较低的节点(较小的计算任务)直到上节点(更大的、需要功率的计算任务)完成其工作才能开始工作。科学家们解释说,计算资源的分配非常复杂。
麻省理工学院的系统Decima可以处理节点和边缘(边缘连接节点和链接任务)的动态图形(表示)。而强化学习(RL)以前不可能做到这一点,因为无法充分理解图表,传统的强化学习(RL)系统不习惯处理这样的动态图。
麻省理工学院基于图形的人工智能与其他形式的图像人工智能有所不同。例如,机器人通过处理图像并在正确的情况下获取奖励信号来了解不同场景下对象之间的差异。
但是,类似于向机器人呈现图像,Decima系统中的工作负载被模仿,直到该系统通过接收人工智能奖励信号来改善其决策为止。这样,一种特殊的基准(与历史进行比较)就可以帮助Decima找出哪些行动是好事,哪些是不好的事,即使由于工作结构的复杂化使工作速度减慢,工作序列仅提供了较差的奖励信号。基线是MIT系统中的关键差异因素。
麦迪逊威斯康星大学教授Aditya Akella说,“Decima可以找到调度优化的机会,而这是繁重的工作,无法通过人工设计/调整过程来实现。那里的团队开发了许多高性能的调度程序。”