乱测 硬件评测基地 luance 乱测网 乱七八糟的硬件测试

站内搜索
查看: 2618|回复: 0

谷歌小心了!微软加速Bing搜索能力大揭秘!

[复制链接]

超级版主

测试头衔

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

注册时间
2014-8-17
发表于 2015-3-6 01:36:58 | 显示全部楼层
我们搜索Google的网页索引时,大概只在约5,000亿张网页中的10%搜索而已。许多内容还埋藏在可见的表层网络的深层(不要和黑暗网络搞混)。竞争搜索引擎如Yahoo和Bing的索引(分别约为150亿张)大概只有Google的一半。为了迎头赶上,微软最近开发了进阶的「可程序化逻辑阵列(Field-Programmable Gate Array, FPGA)」技术,以便能更快、更有效进行大量网络爬梳。

Google的工程师之前估计一次0.2秒的网页查询时产生的索引与取回动作,大约耗用0.0003kWh的能量。以每个月Petabyte的索引量查询高达1,000亿次计算,优异的网页排序成了他们难以超越的优势。微软改良Bing的方法则是将搜索分成三部份—特征萃取(feature extraction)、自由查询语法(free-form expression)及机器学习评分。

Bing的文件选择服务汲取及过滤包含搜索词汇的文件,还是跑在Xeon处理器上。其排序服务是根据搜索结果的相关性为过滤来的文件评分,最近也移植到称为「Project Catapult」的FPGA系统上。微软可能采用客制的应用特制集成电路(application-specific integrated circuits, ASIC)来加速Bing的排序功能。但因为软件算法变化速度之快,微软不得不改采可程序化的FPGA硬件。

传统上FPGA一向是特殊运算用途的设备。因为它们的内部结构可轻易组态,所以经常被用在制作处理器原型。它们也很适合用以执行需要芯片大量输入、输出连接的应用系统。但还有另一处不惜任何代价会用到它,就是运算速度至上的地方。例如你的设备需要计算卫星上侦测宇宙射线的闪烁阵列接触到的射线总能量、判断何时有反应,而且一切都得在数奈秒之间完成,这些光靠软件就力有未逮。

Project Catapult源自于2011年PCI-Express Card的设计,它使用6个以一个控制器连结的Xilinx FPGA。然而将新的设备整合到既有服务器需要大幅重新设计,以满足设备能量耗用及热量排放的严格限制。它们最新设计则是使用Altera的Stratix V GS D5 FPGA。为了满足重度FPGA使用者需求,这项设备具备1,590个数位讯号处理区块、2,104个M20K存储器区块及36个14.1 Gb/sec收发器。如同Bing团队在ISCA 2014上所宣布,这项平台完成网页排序只需过去一半的服务器数量。

微软称之为「旋积神经网络加速器(convolution neural network accelerator)」。旋积经常用于讯号处理应用,象是计算机视觉、语音辨识或任何需要用到特殊平均或交叉相关(cross-correlation)的地方。在计算机视觉中,2D旋积可使用邻近信息和每个像素混合以获致多种过滤效果。旋积神经网络(convolutional neural network, CNN)是由人工神经元的小型集合组成,每个集合都只专注于一小部份影像,称为接收域(receptive field)。在一些比赛如ImageNet 1000中,CNN已经在物件分类上超越人类了。为排序而分类文件也是类似情形,现在也是微软希望以CNN解决的众多课题之一。

此时微软工程师已考虑开始使用Altera新的Arria 10 FPGA。这款芯片已为浮点大量运算的作业最佳化,传统上为DSP擅长领域。由于它具备Teraflop执行速度,能源效率又是同等级GPU的3倍,因此微软盼望可以靠它在网页搜索及排序市场上急起直追。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

乱测 硬件评测基地 luance 乱测网 乱七八糟的硬件测试

手机版|小黑屋|乱测 ( 桂ICP备13007413号-2 桂公网安备 45142302000013号 )|

GMT+8, 2018-11-20 20:21 , Processed in 0.040746 second(s), 13 queries , Memcache On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表