论文部分内容阅读
随着信息技术的发展,Web服务中的信息呈爆炸性增长。Web服务区分于传统信息服务的一个重要方面在于其整合了更为广泛的异构信息资源,同一服务中的信息资源不再是孤立零散的存在,而是体现出较强的相互关联。比如网页间跳转关系,地理信息服务系统中兴趣点的临近关系,以及社交网络的好友关系等。Web服务信息之间的关联性使得很多信息可以用图结构进行表示,比如网页跳转链接图、地图兴趣点的临近图、社交网络好友关系等。相较于传统信息访问,Web服务展示了更强的信息空间关联性,使用图结构可以有效的表征信息空间的关联,有助于研究Web服务中信息的交互,从而更好的揭示其中所蕴含的丰富知识。因此基于图结构的Web信息服务成为了当前的研究热点。 然而现有的大部分利用图结构的方法都仅仅把节点关联性当作节点属性使用,而忽略了信息传播特性。随着流形学习、标签传递等一系列利用图结构进行节点属性传播的算法的提出,图传播算法越来越受到研究人员的重视。这类方法本质上都是将节点上的属性传播给邻居节点,从而实现信息在整个拓扑图上的传播,并以此帮助解决日常遇到的分类、排序等问题。虽然这类方法一定程度上利用了信息传播理论,实现的效果仅限于利用单点的标签权重计算解决已有问题,并没有很好的研究如何利用传递后权重实现多样化的信息服务模式,以及其他利用信息传播理论的理论方法,从而不能更好的体现出图传播理论带来的信息化服务的优势。因此,本文从分析图结构与信息传播的关联性入手,研究如何多样化的利用信息传播理论提供各种各样的信息服务,主要工作包括: (1)利用图传播思想帮助提取商品网页隐式标签属性。如何获取优秀的数据一直Web信息服务的关键所在,同时是开展研究工作的基础。电子商务网站上面拥有大量标注过的商品信息,可以帮助提供多种多样的Web信息服务。然而这些标注信息往往蕴藏在网页中不易获得。因此本文根据搜索结果页面中商品集合的包含关系,并利用隐式标签在这些页面中的传播作用以及URL地址与搜索关键字属性的对应关系,提出了新的隐式标签提取方法,不仅实现了模板无关的标签提取,同时根据提取出的URL项可以轻松解决新搜索结果URL地址分析的问题。 (2)根据拓扑图标签传播方法提供新型地图密集区域搜索服务。地理信息系统一直是Web信息服务中主要组成部分。随着移动终端普及,基于位置的服务系统日益翻新。然而现有的绝大部分地理信息服务都是以兴趣点为服务信息单元,但人们有时候需要多种多样的服务模式。本文基于拓扑图标签传递算法,在获取到的商店属性信息以及地理位置信息的基础上,研究如何计算区域的关键字密度,从而根据搜索的关键字提供以区域为结果单元的新型地图密集区域搜索服务模式,并根据在线服务所需的反应速度以及用户个性化的信息进行改进,并探讨延伸其他类型密集区域搜索方法,并研究针对不规则区域的在线搜索策略。 (3)研究社交网络中提升网络信息传播能力的好友推荐算法。随着Web服务的普及以及移动互联网络的发展,社交网络成为Web信息服务系统中维持人们日常交流沟通的最重要手段。社交网络中发达的信息传播能力可以促使人们踊跃的与他人进行交流,如何提升社交网络的信息传播能力对于保持用户高活跃度十分重要,也是社交网络的价值所在。因此本文研究如何通过好友推荐这一手段来优化社交网络信息传播的能力,并同时尽可能降低对好友推荐准确率的影响。由于信息传播能力所需计算量过于庞大,不利于在线服务的应用,本文引入代数连接度模拟信息传播能力计算,从而大大提升了运算效率,保证在线应用的时间需求。模拟数据集与实际数据集上的实验结果充分验证了本文方法的有效性。 本文工作在图传播领域进行了较为深入的研究工作,部分成果具有较好的应用前景,能对后续基于图传播研究工作的拓展提供帮助。