基于小世界网络的搜索引擎算法研究

来源 :河北工业大学 | 被引量 : 10次 | 上传用户:ten_wang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的研究有很长的历史,随着Internet的飞速发展,人们越来越依靠网络来查找他们所需要的信息,如何有效的去发现我们所需要的信息,就成了一个很关键的问题。 “小世界效应”是1967年Milgram提出的,他描述了一个实验,将信在熟人之间传递,并推断很多表面上看起来距离很远、彼此陌生的人实际上被一条通过熟人的非常短的链连接起来,而且这个链的长度大约是6。在许多最近的研究中,Watts D.J.和Strogztz S.H.等人使用“小世界网络”来说明存在捷径的网络结构,提出Internet,World Wide Web和其他许多真实世界中的网络属于“小世界网络”。 既然Web是小世界网络,那么Web中的两个网页之间肯定存在捷径。我们怎样在只知道局部信息的情况下将此捷径找出?怎么帮助使用者从数量庞大的Web页中找到他们真正需要的东西?内容和链接信息通常被所有的搜索引擎用来进行爬行、索引、检索以及排序。基于这些线索的相似性方法和网页之间的语义结合的关系是决定任何搜索工具性能的关键。本论文在参考了大量国内外有关科技文献的基础上,对搜索引擎算法作了较深入的研究,并结合小世界的相似性方法给出了可行的算法,主要提高了搜索引擎搜索结果的准确性。 本文由三部分组成:第一部分讲述搜索引擎的代表、典型算法以及搜索引擎的一般评价方法。第二部分研究小世界网络的特性,小世界网络的模型,导航算法以及使用相似性方法从词法相似性、链接相似性和语义相似性三个方面分析小世界网络的特性。第三部分利用Internet的小世界特性对搜索引擎算法的改进,提高搜索引擎算法的精确度。
其他文献
目的探讨慢性乙型肝炎(chronic hepatitis B,CHB)合并非酒精性脂肪肝(nonalcoholic fatty liver disease,NAFLD)患者中肝脂肪变性与乙肝病毒复制状态之间的关系及对肝纤维化的影响。方法选取福建省立医院2016年12月至2019年2月期间就诊的CHB患者126例,其中59例合并NAFLD。分析单纯CHB组和伴脂肪变性CHB组之间的乙肝病毒复制状况,
物联网产业的发展方兴未艾,作为其核心技术之一的无线传感器网络在诸多领域内都具备广阔的应用前景。在其相关的应用场景中,无线传感器网络严重受到能源及其自身软硬件资源的限
目的了解北京大兴国际机场建筑工地流动人口艾滋病知识知晓情况,为调整艾滋病防制措施提供科学依据。方法选取承建北京大兴国际机场的6家建筑公司,开展现场问卷调查,采用描述流行病学方法分析结果。结果共收回有效问卷1 089份(96.3%,1 089/1 131),艾滋病知识知晓率为46.56%,仅有31.77%的人知晓"蚊虫叮咬不会传播艾滋病"。11.46%的男性调查对象最近一年有过商业性行为,其中坚持使
山东省建材信息网是一个基于Internet的分布式信息管理系统,主要任务是通过Internet在全省各地完成建筑材料价格的采集和统一发布。 本文针对该系统的特点,重点研究与探讨了
数据网网管系统因其能有效提高IP网络管理效率而被广泛采用,但仍尚未实现其随时随地接入与访问。通过分析数据网网管系统的架构和对其进行移动性扩展的影响因素,提出了一种利用
当今微处理器性能的提高已经不再依赖频率的提升,而是依靠处理器核数的增加来提高处理器的计算能力。例如,Intel公司的至强系列微处理器。但是,通过比较处理器核数和内存容量
本文对电信服务和电信服务质量的相关概念的内涵进行了讨论和定义;然后从经营分析系统的角度出发,对BSS/OSS中关于服务质量的相关支撑系统进行了调研分析(主要包括客服系统和SL
随着电信网与计算机网的逐步融合,市场竞争从以往的资源竞争转向服务的竞争,运营支撑系统也从面向网络和业务的管理转向了面向服务的管理。目前许多与运营支撑系统相关的组织非
纹饰作为外化于青铜礼器、乐器的文化表征,伴随青铜器产生、发展的全过程,并融汇、承载了青铜器物之文化属性与时代属性.不过,有学者认为音乐考古学研究中无须研究纹饰.纹饰
TREC(Text Retrieval Conference)是信息检索领域中最重要的国际会议,文本过滤是TREC的重要任务之一,自适应过滤是过滤任务的最重要的子任务。对TREC指标函数的优化是一个包