欢迎您光临本站,如有问题请及时联系我们。唯一指定客服QQ:2745372750

深圳seo:人工智能在搜索算法中的应用

    热度:℃      作者:互联网

深圳seo:人工智能在搜索算法中的应用

深圳seo认为,2016年以来,IT行业最大的技术突破应该是人工智能。不仅仅是一年左右的时间,在人类曾经认为机器很难打败人类的最后一款游戏中,AlphaGo Zero也在几天前出现,完全不需要学习人类的知识,自学三天就超越了人类。

人工智能领域最好的公司是国外的Google和国内的百度。都是搜索引擎。这恐怕不是巧合,而是因为搜索引擎是最适合开发人工智能的公司,他们拥有的数据量最大,包括文字、图片、视频、地图、路况、用户使用数据等等。

搜索引擎公司的AI成果在多大程度上应用到了他们的核心业务——搜索?他们没有明确向外界解释。从搜索工程师零碎的发言中,我们猜测它至少没有被大规模使用,也没有改变搜索算法的基础。毕竟人工智能的概念虽然存在了几十年,但只是近几年效果突飞猛进。目前还没有通用的人工智能。牛X在Go领域向搜索等规则模糊的系统迁移还需要一段时间。

但我认为人工智能大规模应用于搜索算法只是时间问题。据说以前百度的大搜索部和人工智能/深度学习部有些矛盾。现在吴恩达已经离开百度,齐鲁对百度做了很多人事调整,搜索部对人工智能的排斥可能会大大降低。

深圳seo认为人工智能已经被用于搜索算法。举两个例子。

百度DNN模式

深圳seo觉得,几个月前,我看到了百度朱的一篇《AI赋能的搜索和对话交互》演讲。几年前我采访了朱。当时他是谷歌的总设计师,也是著名的熊猫算法的主要参与者之一。现在他是百度的总设计师。讲座很多,通过搜索感兴趣的题目就可以找到全文,值得深入阅读。相当出乎意料的是,SEO行业很少有人注意到这个关于搜索算法的有价值的公开信息这么久了。

演讲中提到了百度2013年推出的DNN模型,大大提高了语义关联的判断范围和准确性。2013年,百度34%的相关性提升来自DNN模式,2014年全年25%的相关性提升来自DNN模式。DNN模型使用深度学习方法,通过100亿用户点击数据来训练模型,有超过1亿个参数。海药seo工程师推出的Google RankBrain是2015年推出的,所以百度是世界上第一家将人工智能应用于实际搜索算法的公司。

下图是DNN培训的示意图:

简单来说,对于同一个查询词,模型对真实用户点击的页面标题和未点击的页面标题进行分析,从而对哪些标题符合用户需求有更深入的了解。通常情况下,页面标题不包含查询词,但用户更愿意点击这些页面,这表明这些页面满足了用户的需求。这些页面的标题,即使不包含查询词,也与查询词的含义有关。这是经典的页面-关键词关联算法无法计算的。

演讲中提到的例子:

在DNN推出之前,当用户搜索“吉卜力前面的任何车牌”时,由于相关信息很少,并且没有以该查询词为标题的页面或者页面上出现这些关键词,搜索结果质量很低。传统的搜索算法只能通过关键词匹配返回一些与吉卜力相关的信息,而几乎没有“吉卜力前方放置任何车牌”的信息。

DNN上线后的搜索结果如下:

可以看到,搜索结果中仍然没有标题为“ghibli前面放置的任何车牌”的页面,但是解决了用户的需求。算法理解“前”“前”“前”是同一个意思,“放在哪里”“怎么安装”“怎么挂”“任何地方”是同一个意思,所以“吉卜力车牌挂”

深圳seo认为,这种对相关性的理解,不能用传统的基于关键词匹配的搜索算法来计算,而要用真实用户的点击数据来计算。用户在搜索“放置在吉卜力前方的任意车牌”时,经常会点击“如何悬挂吉卜力车牌”和“如何在吉卜力前方安装车牌”这两个页面。经过训练,DNN模型知道这些词在语义上是相关的。

谷歌排名

2015年推出的Google RankBrain也解决了对查询词的深度理解问题,尤其是比较长尾词,找到那些与用户查询词不完全匹配但实际上很好地回答了用户查询的页面。和百度DNN很像。Google没有具体说明RankBrain的训练方法,估计和百度DNN差不多。

2015年RankBrain上线时,15%的查询词由RankBrain处理,2016年全部查询词由RankBrain处理。

谷歌自己的RankBrain例子是这样的查询:

食物链最高层的消费者叫什么

来源:本文由互联网原创撰写,欢迎分享本文,转载请保留出处和链接!部分信息来源互联网,如有侵权,请联系删除。