谷歌称TPU击败了英伟达和英特尔。我们来解释一下。要解释的东西太多了。TPU张量处理单元。一名谷歌工程师将其描述为“一个全新的定义
谷歌称TPU打败了英伟达和英特尔。我们来解释一下。要解释的东西太多了。TPU张量处理单元。一位谷歌工程师将其描述为“一个全新的定制化机器学习加速器”。
好吧,但是TPU到底是什么?IEEE Spectrum:“谷歌的张量处理单元是一个印刷电路板,它插入现有的服务器,充当协处理器,一个为神经网络计算量身定制的处理器。”
它在机器学习测试中击败了至强(英特尔)和英伟达的GPU。不仅如此,据报道,它还击败了这两家公司一个数量级。
InfoWorld表示,同样重要的是,谷歌透露了其定制TTPU如何加速机器学习的细节。
InfoWorld的高级作家Serdar Yegulalp表示,该公司“正在提供TPU可以为机器学习提供多少能量的细节,这要归功于一篇深入研究技术的论文。”
EE Times的里克·梅里特表示,这篇论文“深入研究了TPU和基准测试,结果显示其速度比商用芯片至少快15倍,性能功耗比高30倍。”
硬件工程师诺姆·茹皮(Norm Jouppi)周三写了一篇关于这种芯片的博客,“量化我们第一个机器学习芯片——TPU的性能。”
他说,“今天(周三),我们将在硅谷计算机历史博物馆举行的工程学院会议上发布一份研究报告,与大家分享这些定制芯片的新细节。”
这个博客非常有用,因为除了基准测试之外,Jouppi还提供了一个TPU可以发挥作用的场景。
“对TPU的需求出现在六年前,当时我们开始在产品中越来越多的地方使用计算昂贵的深度学习模型。使用这些模型的计算成本令我们担忧。如果我们考虑到人们每天只使用谷歌语音搜索三分钟的情况,并且在我们使用的处理单元上运行我们语音识别系统的深度神经网络,那么我们将不得不将谷歌数据中心的数量增加一倍!”
TPU正面临这样的挑战。“TPUs使我们能够非常快速地做出预测,并使产品在不到一秒的时间内做出反应。每个查询背后都有TPUs它们为精确的视觉模型提供了强有力的支持,这些模型是谷歌图像搜索、谷歌照片和谷歌云视觉API等产品的基础……”
IEEE Spectrum高级编辑大卫·施奈德:“TPU是为推理而设计的。它的硬件运算是8位整数,而不是精度更高的浮点数。”
这是托马斯·克拉布对语域推理功能的看法:
互联网之王组建了一个团队,生产了一个定制芯片,可以处理他的一部分神经网络工作流程,也就是所谓的推理。在推理过程中,软件根据耗时且计算量大的训练阶段的数据进行预测。处理器位于PCIe总线上,接受来自主机CPU的命令:它类似于以前的离散FPU或数学协处理器,但显然升级到了今天的标准。
自2015年初以来,谷歌已经在其数据中心部署了TPU。施耐德表示,用于得出这些结论的基准测试是基于“人们在谷歌数据中心运行的六种实际类型的神经网络程序”。
梅里特说,一支由70多名工程师组成的团队为TPU做出了贡献。(Jouppi说,“设计、验证、实现和部署这样一个系统的硬件和软件确实需要一个村庄。”)
本文的题目是“张量处理单元的数据中心性能分析”。
为什么重要:“谷歌的方法将影响定制硅驱动的机器学习的未来发展,”InfoWorld说。
“现在应该很清楚,用于机器学习的定制硅将推动等式两边的硬件和软件的发展。显然,谷歌和其他公司几乎还没有开始探索什么是可能的。”
标签:声明:本文由用户上传。如有侵权,请联系删除!