基于图传播的Web信息服务技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:c2825015
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,Web服务中的信息呈爆炸性增长。Web服务区分于传统信息服务的一个重要方面在于其整合了更为广泛的异构信息资源,同一服务中的信息资源不再是孤立零散的存在,而是体现出较强的相互关联。比如网页间跳转关系,地理信息服务系统中兴趣点的临近关系,以及社交网络的好友关系等。Web服务信息之间的关联性使得很多信息可以用图结构进行表示,比如网页跳转链接图、地图兴趣点的临近图、社交网络好友关系等。相较于传统信息访问,Web服务展示了更强的信息空间关联性,使用图结构可以有效的表征信息空间的关联,有助于研究Web服务中信息的交互,从而更好的揭示其中所蕴含的丰富知识。因此基于图结构的Web信息服务成为了当前的研究热点。  然而现有的大部分利用图结构的方法都仅仅把节点关联性当作节点属性使用,而忽略了信息传播特性。随着流形学习、标签传递等一系列利用图结构进行节点属性传播的算法的提出,图传播算法越来越受到研究人员的重视。这类方法本质上都是将节点上的属性传播给邻居节点,从而实现信息在整个拓扑图上的传播,并以此帮助解决日常遇到的分类、排序等问题。虽然这类方法一定程度上利用了信息传播理论,实现的效果仅限于利用单点的标签权重计算解决已有问题,并没有很好的研究如何利用传递后权重实现多样化的信息服务模式,以及其他利用信息传播理论的理论方法,从而不能更好的体现出图传播理论带来的信息化服务的优势。因此,本文从分析图结构与信息传播的关联性入手,研究如何多样化的利用信息传播理论提供各种各样的信息服务,主要工作包括:  (1)利用图传播思想帮助提取商品网页隐式标签属性。如何获取优秀的数据一直Web信息服务的关键所在,同时是开展研究工作的基础。电子商务网站上面拥有大量标注过的商品信息,可以帮助提供多种多样的Web信息服务。然而这些标注信息往往蕴藏在网页中不易获得。因此本文根据搜索结果页面中商品集合的包含关系,并利用隐式标签在这些页面中的传播作用以及URL地址与搜索关键字属性的对应关系,提出了新的隐式标签提取方法,不仅实现了模板无关的标签提取,同时根据提取出的URL项可以轻松解决新搜索结果URL地址分析的问题。  (2)根据拓扑图标签传播方法提供新型地图密集区域搜索服务。地理信息系统一直是Web信息服务中主要组成部分。随着移动终端普及,基于位置的服务系统日益翻新。然而现有的绝大部分地理信息服务都是以兴趣点为服务信息单元,但人们有时候需要多种多样的服务模式。本文基于拓扑图标签传递算法,在获取到的商店属性信息以及地理位置信息的基础上,研究如何计算区域的关键字密度,从而根据搜索的关键字提供以区域为结果单元的新型地图密集区域搜索服务模式,并根据在线服务所需的反应速度以及用户个性化的信息进行改进,并探讨延伸其他类型密集区域搜索方法,并研究针对不规则区域的在线搜索策略。  (3)研究社交网络中提升网络信息传播能力的好友推荐算法。随着Web服务的普及以及移动互联网络的发展,社交网络成为Web信息服务系统中维持人们日常交流沟通的最重要手段。社交网络中发达的信息传播能力可以促使人们踊跃的与他人进行交流,如何提升社交网络的信息传播能力对于保持用户高活跃度十分重要,也是社交网络的价值所在。因此本文研究如何通过好友推荐这一手段来优化社交网络信息传播的能力,并同时尽可能降低对好友推荐准确率的影响。由于信息传播能力所需计算量过于庞大,不利于在线服务的应用,本文引入代数连接度模拟信息传播能力计算,从而大大提升了运算效率,保证在线应用的时间需求。模拟数据集与实际数据集上的实验结果充分验证了本文方法的有效性。  本文工作在图传播领域进行了较为深入的研究工作,部分成果具有较好的应用前景,能对后续基于图传播研究工作的拓展提供帮助。
其他文献
视频会议系统是一个为分布异地的人们提供包括视、音、文、图等多媒体全方位感知的空间环境.它集通信扮布性和视频的真实性于一体,具有明显的优势,因而成为当今计算机领域的
资源弹性部署是云计算的重要特征之一。目前,大部分云资源弹性部署技术仅注重快速调集资源响应负载上升以确保应用性能,而忽视低负载服务器造成的浪费。另外,典型的资源弹性部署
研究人员主要就是针对发电厂的这些需要进行了以下三项工作.(1)为参与竞价上网,提出如何实现商业化运营子系统中的报价参考辅助功能,以便供高层决策者做参考;(2)通过对发电成
学位
该文探讨了Web技术在信息发布方面的整体发展,具体对ASP技术进行研究,并与其他技术加以对比.认为ASP技术能比其他的技术更好的解决信息发布的快捷性与智能性问题, 并提出了两
该文讨论了对象关系数据库的面向对象的特性,如创建基本数据类型,构造复杂数据类型,对继承的支持和对规则的扩展;并介绍了对象关九据库中的查询优化.飞行试验管理系统是一个
该文将设备管理模块从信息管理系统中提取出来,从系统的高度深入研究了设备管理 的内含和性质.就读研究生期间,该文作者利用动态机制和GIS为天津市热电公司开发了一 个设备管
生活在大数据时代,而大数据给计算带来了巨大的挑战。许多经典的矩阵计算和机器学习方法由于时间复杂度、空间复杂度过高,故不适用于大数据问题。近年来矩阵数据的快速近似方法
该文以传统的Web结构及其应用集成框架为背景,分析了这些框架结构在集成目前复杂应用时存在的局限性,同时讨论了CORBA(公共对象请求代理结构)分布对象技术在Web应用集成方面
随着中国高等教育体制改革的深入,建设基于校园网的网络财务系统已经成为校园信息化建设和高校财务工作的一项重要课题."基于校园网的学费管理和财务查询系统"的设计开发是这
在计算机动画领域,群组运动控制一直是一个重要的研究方向,广泛应用于人群、交通流、鸟群、微粒子群体等行为的动画模拟。在数字娱乐业,群组动画可以高效地模拟成千上万的角色,在