随着计算应用程序的日益复杂和数据集的不断增长,计算对环境的影响也在不断升级。从历史上看,这并不是一个大问题,因为不断增长的计算需求被硬件效率的提高所抵消,通俗地说就是摩尔定律。但随着硬件改进的减弱,另一个(通常看不见的)效率来源正在占据中心位置:改进的算法。
我们对计算日益增长的需求可以从数据中心的激增中看出来——它们可以跨越数百万平方英尺——并且需要大量的电力。国际能源署估计,数据中心占全球能源消耗的1%,而二氧化碳排放量占全球的0.3%。如果没有办法提高计算效率,随着我们在越来越多传感器的世界里解决越来越多的大数据问题,这些危害会越来越大。
在最近的一项研究中,Yash Sherry(麻省理工学院斯隆分校的研究子公司)和我研究了算法改进的速度,并将其与历史上不断增长的计算需求的最重要平衡摩尔定律进行了比较。在计算机硬件构建模块小型化的推动下,摩尔定律几十年来在计算效率方面提供了实质性的提高。就像农业生产力的提高促进了全球人口的增长一样,硬件生产力的提高也促进了世界计算的增长。
但是,如果说摩尔定律是经常出现在新闻里的华而不实的兄弟,那么算法改进就是幕后的兄弟。
算法是告诉计算机做什么和按什么顺序做的配方。虽然摩尔定律允许我们的计算机每秒进行更多的运算,但算法的改进一直在提供更好的方法,让每次运算做更多的事情——而且好处可能是巨大的。举个例子,假设你是谷歌地图,需要找到人们去的1000个热门地点之间的最短路径。很容易用旧算法计算比更现代的版本多100万倍。我们记录的另一个例子是文本匹配,例如搜索引擎在网页中查找关键字,或者律师在法律文档中搜索特定的参考文献。更好的算法可以很容易地使这样的搜索比原来快100倍,从而减少计算时间和能量消耗。
然而,虽然个别例子可能令人印象深刻,但我们想要一个更大的视角。在这项研究中,我们查阅了57本教科书和1000多篇研究论文,以找出计算机科学家认为最重要的算法。从中,我们提取了113个不同的“算法族”(以不同方式解决同一问题的算法集)。计算机科学教科书强调这些算法是最重要的。对于这113个中的每一个,从上世纪40年代到现在,我们每次提出这个问题的新算法,都会遵循。
那么算法改进和硬件改进相比如何呢?对于大数据问题,43%算法家族的同比提升等于或大于摩尔定律的收益。其中14%的提升大大超过了来自更好硬件的提升。这些改进彻底改变了这些领域的可行性,使得用硬件改进无法解决的方法解决问题成为可能。对于我们现在这个数据越来越多的时代,同样重要的是,算法改进带来的好处越大,需要解决的问题就越大。
处于计算前沿的企业和研究实验室已经开始响应投资更好算法的需求。中型组织使用6%到10%的IT开发人员来创建新的算法,11%到20%来改进现有的算法,这是一笔相当大的投资。习惯于仅通过购买新硬件来提高计算能力的其他组织将越来越需要效仿这些算法标准制定者,以保持竞争力。
算法越来越重要是推动计算进步的更大变化的一部分。历史上,改进主要集中在硬件上,但随着摩尔定律的终结,这种情况正在发生变化。相反,算法改进会越来越走在前沿,为解决新的、更难的计算问题提供引擎。
但推进计算前沿只是更好算法的好处之一,另一个是效率。对于政府或学术界,或者只是那些关心计算可持续性的人来说,更好的算法是一个理想的选择:它使我们能够获得相同的结果,但大大降低了环境成本。版权声明:本文内容由网民自发贡献,文中观点仅代表作者本人。本文(http://www.chuangzai.com)仅提供信息存储空服务,不拥有所有权并承担相关法律责任。如果您发现本网站涉嫌抄袭侵权/非法内容,请发送电子邮件至907991599@qq.com举报。一经核实,本网站将被立即删除。