基于本体的个性化元搜索技术的研究和实现

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:blackcat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息的飞速增长,越来越多的人将搜索引擎作为网络信息获取的主要手段。但是,在浩如烟海的互联网信息世界中,通过现有的搜索引擎,人们寻找有用信息还是存在着很大的困难。其中的主要原因有两个:一是用户教育背景的不同和知识领域的局限性同传统的基于关键词的查询服务之间的矛盾;二是用户信息的个性化需求与现有搜索引擎的“一般化”服务之间存在矛盾。为了更快、更准的获取特定的网络信息,成为搜索引擎研究的重点。元搜索引擎正好符合这一发展需求,因此近些年来得到了飞速的发展。元搜索引擎通过调用多个搜索引擎来实现搜索,并对搜索结果进行综合处理,能较好解决现有的搜索引擎所存在的缺陷。论文在元搜索引擎上引入基于本体的关键词扩展服务和个性化服务的结构模型,并结合通用本体库上基于语义相似度的搜索策略,提高信息检索的查全率和查准率。论文在本体的基础上提出了一个基于语义相似度的本体库搜索策略,对关键词的扩展服务有明显的改善,改进了单纯依靠语义相似度阈值来抑制关键词扩展的速率,减少了无用词的产生。论文在个性化搜索的研究中,提出了一种基于个性化本体的用户兴趣模型。论文在个性化本体的基础上提出了一种间隔排列合成法和加权位置排列法两者的结合的成员调度算法,它是根据扩展关键词集合和个性化本体库中的用户兴趣信息做出的成员搜索引擎选择,有计算简单快捷和查全率高的优点。同时,基于个性化本体的用户兴趣模型具有根据用户反馈信息更新用户兴趣信息的能力。最后论文简述了关于检索结果的合并策略,包括无效链接检查和去重复网页的步骤。
其他文献
随着Internet的普及应用,人们对网络安全的需求日益增加,访问控制是防止非授权访问的一种重要的网络安全手段。基于角色的访问控制(RBAC:Role Based Access Control)模型有效
自愈调控是构建可信计算机系统的必要手段,也是系统高可用性的重要保证。传统的分布式系统失效恢复技术主要依赖高成本冗余和人为管理,由于系统失效后人为修复的难度和成本加
随着多媒体技术的飞速发展,复杂背景图像中的文本定位研究不仅丰富了图像处理理论,而且在诸如Internet环境下的图像检索、交通管理中的车牌识别等具有重大的价值。复杂背景文
随着企业信息化建设的快速发展,企业所产生的电子文档越来越多,面对浩瀚的企业内部数据,如何有效获取有用信息成为一个非常重要的问题;另外,由于企业文档涉及商业信息,利用商
随着社会经济的发展,煤炭工业在体制、资源、安全、环境和转产发展等方面的深层次矛盾逐渐暴露出来。山西省作为产煤大省这一问题尤为突出,煤炭工业、产煤地区经济和社会可持续
软件成本估算是软件估算的重要环节,成本估算的精确与否直接影响到软件的后续开发过程及软件开发质量。传统的软件成本估算存在很多不足,国外广泛应用的软件成本估算方法引入到
随着人们对地理信息需求的不断增长和Internet技术的快速发展,GIS技术与Internet技术相互融合形成了WebGIS。WebGIS应用越来越普及,已经渗透到各个应用领域。对于如何快速的开
电信网络的运营业务分为两大部分,即基础电信业务和增值业务。随着信息化的迅猛发展,电信市场的竞争日趋激烈,基础电信业务已经难以满足某些用户的需求。只有不断开拓新业务,
玉米作为世界三大农作物之一,在世界范围的播种面积和总产量中占有重要的地位,是重要的粮食作物和油料作物。我国是一个农业大国,农作物的种类众多,玉米是目前种植面积最大的
K-匿名作为一种简单有效的私有数据的保护技术得到了广泛的关注。它要求发布的数据中存在一定数量(至少为k)的在准标识符上不可区分的记录,使攻击者不能判别出隐私信息所属的