首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

谷歌宣布搜索算法重大升级,用BERT模型理解用户搜索意图

谷歌刚刚宣布,其搜索引擎的核心算法正在进行一项重大升级,这项升级可能会改变10%的搜索结果排序。此项升级应用了自然语言处理技术(BERT模型——Bidirectional Encoder Representations from Transformers)来更精确地理解用户的搜索内容及其背后意图,从而提供一个更加智能和友好的用户体验。谷歌在追求更具预测性的搜索结果的同时,也在努力使其产品更具对话性和实用性,这将使用户的参与时间更长。

搜索才是老本行,80%收入靠广告

近年来,谷歌在人工智能方面持续发力,取得了不少引人注目的成就。此次搜索引擎的改进与它旗下人工智能的实验性项目(如自动驾驶汽车)相比似乎显得有些乏味,但搜索仍然是其核心业务。该公司在许多市场都有90%以上的份额,搜索是广告的关键驱动力,占谷歌母公司Alphabet总收入的80%以上。因此,一个看似在搜索方面的改进可以立即导致用户参与度和收入的实质性增长。

新搜索算法有什么不同?

搜索引擎的基本工作流程是:获取用户输入,分析(包括分词,语义理解,预测等),索引(从索引库取数据),排序(计算相关性和权重等),呈现结果。

过去,谷歌算法把用户输入的句子进行“分词”(把长句子拆分为常用单词),并挑出它认为重要的单词。比如,你搜索“谁是一个帅气的程序员”,算法会把句子拆分为“谁,是,一个,帅气的,程序员”,“帅气的”和“程序员”这两个词显然比“是”和“一个”更重要。

但问题是,这样做可能会消除搜索语句中的语境(上下文),导致对真实搜索意图的理解出现偏差。

谷歌高级研究员兼高级副总裁杰夫•迪恩(Jeff Dean)周四在一次新闻发布会上表示,BERT模型可以通过查看单词的上下文来考虑其完整语境,这有助于公司理解搜索的“意图”。

他举了个例子:“ 2019 brazil traveler to usa need a visa ”,过去,谷歌忽略了“to”,并根据“ U.S. citizens traveling to Brazil(美国公民到巴西旅游)”返回查询结果。但是“to”显然很重要,BERT模型发现了这个差异,并基于“ Brazilian travelers to the U.S. (去美国的巴西游客)”返回查询结果。上下文单词之间的关系是理解完整含义的关键:它是关于一个巴西人到美国旅行的,而不是相反。人可以很自然地理解上下文,但软件开发做出同样的理解需要很长时间。

另一个例子是,假设你输入搜索语句“can you get medicine for someone pharmacy?”

旧算法会认为“medicine”和“pharmacy”比较重要,然后默认为你正在寻找附近的药店并返回本地化结果;而谷歌的新算法会注意到“for someone”,并最终确定你想查找关于是否允许你替别人取处方药的信息。相同的搜索查询,却得到完全不同的搜索结果。

还有一个例子是:“ Parking on a hill with no curb”。旧的算法忽略了“no”,给出了一个“ how to park on a hill with curbs (如何在有路缘的山丘上停车)”的查询结果。新算法意识到“no”的重要性,并提供了一个“ how to park uphill or downhill with no curb (在上坡或下坡没有路缘的山丘上怎么停车)”的搜索结果。

迪恩表示,BERT将改进目前美国英语搜索10%的结果,并将在未来扩展到更多语言和地区。

提到BERT,迪恩说:“我们远没有完善,但这是一个重要的进步。我们一般都在寻找很多可以应用的地方。理解语言是许多谷歌产品(如Gmail)的核心。”

BERT还标志着谷歌首次使用自己的Tensor处理器(TPU)来驱动搜索结果,TPU是为人工智能应用程序开发的专用芯片。TPU通常被应用程序用来完成一些任务,比如识别人们在录音中说的话,在照片和视频中发现物体,以及在书面文本中提取潜在情感等。谷歌还将这些芯片作为云服务提供给第三方开发者。

不管怎样,根据谷歌研究副总裁( VP of Research )潘杜·纳亚克( Pandu Nayak )的说法,“这是我们过去五年以来最有建设性的变化,甚至也许是自谷歌搜索创立以来最大的变化之一。”(相比百度三天两头的算法更新,Pandu的这个说法确实不为过)

——end——

爱吧机器人网原创

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20191026A01A1Q00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券