《电子技术应用》
您所在的位置:首页 > 通信与网络 > 设计应用 > BP神经网络在查询结果排名中的应用
BP神经网络在查询结果排名中的应用
来源:微型机与应用2012年第5期
刘 晓
(暨南大学 信息科学技术学院,广东 广州 510000)
摘要: 介绍了利用BP神经网络对查询结果进行排名,通过了解人们在得到搜索结果以后都点了哪些链接,BP神经网络会将搜索过程与搜索结果关联起来,利用这些信息来改变搜索结果的排列顺序,让用户得到更好的搜索体验。
Abstract:
Key words :

摘  要: 介绍了利用BP神经网络对查询结果进行排名,通过了解人们在得到搜索结果以后都点了哪些链接,BP神经网络会将搜索过程与搜索结果关联起来,利用这些信息来改变搜索结果的排列顺序,让用户得到更好的搜索体验。
关键词: 神经网络;BP算法;搜索结果;排名

 随着信息技术的快速发展,互联网已经成为人们获知信息的重要渠道。面对一些门户网站庞大复杂的信息资源,仅依靠浏览器浏览的方式来获得所关心的信息是非常困难的,这就促使了站内搜索引擎的出现和快速发展。搜索引擎起到了信息导航的作用,已成为人们获取信息的有效工具。但是网站的信息量呈爆炸趋势增长,每天都有大量新的网页出现,使得搜索引擎对信息的覆盖率和搜索出结果的相关性、准确性在整体上呈下降趋势。检索出的结果集数量之多,经常都是几十万条甚至是几百万条记录,其中存在着大量的重复信息或是与检索主题无关的信息,要想从中快速、准确地找出所需要的信息变得越来越困难。
 目前简单关键字搜索已经无法满足需要,智能化搜索是未来发展的必然趋势[1]。本文通过对BP神经网络的深入了解,设计并实现了用BP神经网络对站内搜索结果进行排名,让用户得到更好的体验。
1 BP神经网络概述
 神经网络最早是由心理学家和神经学家提出的,旨在寻求开发和测试神经的计算模拟。粗略地说,神经网络是一组连接的输入/输出单元,其中每个连接都与一个权相相联。在学习阶段,通过调整神经网络的权,使得能够预测输入样本的正确类标号来学习。由于单元之间的连接,神经网络学习又称连接者学习。神经网络需要很长的训练时间,因而对于有足够长训练时间的应用更合适。它需要大量的参数,这些通常主要靠经验确定,如网络拓扑或“结构”[2]。
 神经网络的一个例子如图1所示。输入对应于对每个训练样本度量的属性,输入同时提供给称作输入层的单元层。这些单元的加权输出依次同时地提供给称作隐藏层的“类神经元的”第二层;该隐藏层的加权输出可以输入到另一个隐藏层;如此下去。隐藏层的数量是任意的,尽管实践中通常只用一层。最后一个隐藏层的加权输出作为构成输出层的单元的输入。输出层发布给定样本的网络预测。

2 用于对查询结果排名的神经网络的设计
 神经网络可以有多个中间层,不过在本文中,只使用一层。对输入的组合结果就是一组单词,因此可以将这一层看作是“查询层”。图2是本文神经网络的结构。所有位于输入层中的节点都与所有位于隐藏层中的节点相连,而所有位于隐藏层中的节点也都与所有位于输出层中的节点相连。
 为了让神经网络得到最佳查询结果,本文将与查询条件中出现的单词对应的输入节点设值为1。这些节点的输出端开启后,会试图激活隐藏层,相应地位于隐藏层中的节点如果得到一个足够强力的输入,就会触发其输出端,并试图激活位于输出层中的节点。位于输出层中的节点将处于不同程度的活跃状态,可以利用其活跃程度来判断一个URL与原查询中出现的单词在相关性上的紧密程度[3]。最终的结果取决于被逐渐纠正的连接强度,因此只要有人执行搜索,并从结果中选择链接,就对该网络进行训练。
 如图3所示,许多人已在搜索“apple iphone”之后,点击过有关apple iphone的相关结果,而这一点加强了单词与URL的联系。

 

 



 本文讨论了BP神经网络在搜索结果排名中应用,反向推理出搜索词与隐藏层在相关性上的紧密程度以及隐藏层对搜索结果排序的影响权重,使搜索引擎更具智能化,提高了搜索的精度与灵活性。
参考文献
[1] HATCHER E, GOSPODNETIC O. Lucene in action[M]. Manning Publications,2004.
[2] Han Jiawei, KAMBER M.数据挖掘概念与技术[M].范明,孟小锋,译.北京:机械工业出版社,2007.
[3] SEGARAN T. Programming collective intelligence[M].O′Reilly Media,2007.
[4] 王红霞.神经网络BP算法在网络搜索中的应用[J].微计算机信息,2007,23(15):53.

此内容为AET网站原创,未经授权禁止转载。