主题相关的PageRank算法的改进策略的研究和实现

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:mqshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的迅猛发展,WWW已成为信息发布、交互及获取的主要工具,它涉及新闻、广告、消费、金融、教育、电子商务等许多领域。Web具有四个特点:庞大性、动态性、异构性、半结构化的数据结构环境。此外,Web还包含丰富和动态的超链接资源。面对Web这些固有特点,人们要从这些海量的数据中查找数据和信息,使用最多的就是搜索引擎技术。就搜索引擎技术领域来说,可以通过分析一个网页或整个网站链接和被链接的数量、对象,建立Web自身的链接结构模式,通过分析和研究PageRank、HITS等基于链接结构的搜索结果排名算法,可以指导网站链接结构优化,有组织,有规划地提高网页在搜索结果中的排名,避免盲目处理造成的混乱结果。本文主要针对目前主流的PageRank算法,集中研究了PageRank算法的形成思路、计算方法等。在实现了PageRank算法的基础上,针对PageRank算法在基于Ontology的海洋文献智能信息检索系统应用中的缺陷,对PageRank算法加以改进,在算法中增加了文本文档可能性的判断和主题相关性的判断,提出了IPageRank算法,并实现该算法。由于现在网络资源的繁多,为了提高系统的查准率,本文引入了Ontology技术(本体技术),设计并实现了基于本体的海洋领域智能文献信息检索系统,分析了传统网络信息检索方面的在知识检索中准确率不高的缺点,提出了基于Ontology的海洋领域智能文献信息检索系统的实现结构框架,将IpageRank算法应用于基于Ontology的海洋文献智能信息检索系统中,并做出验证。经实验证明,算法IPageRank有效提高了该系统检索准确性和有效性,验证了所提出的IPageRank算法理论的合理性,验证了算法在海洋文献智能信息检索系统的应用中的正确性。
其他文献
随着企业信息网络化的发展,网络在企业日常工作中发挥着越来越重要的作用。网络化在方便信息传递和共享的同时,也给企业信息的安全性带来了隐患。传统的基于边界安全的安全技
P2P技术在过去几年内快速成为计算机行业关注的话题,P2P将网络应用的核心从中央服务器向网络边缘的终端设备扩散。但是P2P系统的开放性以及节点匿名性等特征导致了计算机病毒
信息技术的快速发展聚集了海量的网络数据。如何从海量数据中快速有效地获取信息正面临着巨大的挑战。在社会网络分析领域,链接预测作为网络结构研究的一个关键问题,不仅要考
随着数字化技术的发展,视频资源日益丰富,但是部分违规视频也掺杂其中,违规视频对社会造成了极大的危害,因此,对视频进行监测已经成为亟需解决的问题。视频监测的两个重要特
随着互联网的快速发展,海量的信息以各种方式出现,其中最主要的还是文本信息,因此文本自动分类成为了国内外研究的热点,现在已经出现了大量有效的分类方法,例如:Naive Bayes、
信息技术的蓬勃发展大大促进了人类社会的进步。网上信息交流、电子商务、办公自动化、自动控制技术等信息技术极大地减轻了人们的劳动强度,方便了人们的工作、学习和生活。因
工作流管理系统越来越多的应用到电子商务与电子政务中,并已经取得了很好的应用。随着信息技术的不断发展,工作流系统变得越来越复杂,在满足应用需求的同时对其安全性有了更
网格门户是利用Web应用技术对网格资源和服务进行集成,给用户提供一个透明的针对特定问题的专有视图,降低了用户使用网格的复杂性。用户能够通过熟悉的Web界面、方便一致的操
作业车间调度问题(Job-Shop Scheduling Problem JSSP)是一种典型的组合优化问题,在工程应用中有着十分重要的地位。本文在研究现有JSSP求解方法的基础上,重点关注了基于免疫
第三方物流做为一种先进的组织方式和管理技术,被广泛认为是继降低物资消耗、提高劳动生产率之后的第三利润源泉。因此,研究物流系统建模技术及建立准确的物流系统模型,对更好地