基于语义词典和局部分析的查询扩展研究

来源 :武汉理工大学 | 被引量 : 14次 | 上传用户:entine
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自互联网出现之后,互联网在各领域发展迅猛,知识与信息呈指数增长。同时,互联网的知识泛滥使得互联网用户备受困扰。为了解决信息过载的问题,许多商用搜索引擎成为了信息检索的重要手段。用户通过搜索引擎,输入相关关键词就会得到包含关键词的信息。但是文档与查询词之间的不精确匹配影响了信息检索的效果。为了解决词不匹配问题,可以采用查询扩展的方法,根据统计信息或语义识别技术对关键词进行扩展。查询扩展常用技术方法如下:基于全局分析的查询扩展、基于局部分析的查询扩展、基于局部分析的查询扩展、基于语义词典的查询扩展等。全局分析和局部分析都是以查询词为中心机械匹配的查询方法,不能从根本上消除用户查询意图与检索的语义偏差;利用语义知识词典的查询扩展方法能消除语义偏差而且不需要大规模语料库的支持,缺点是非即时性,特别是在时效性比较强的领域表现的较为明显。通过吸收语义扩展和统计扩展的长处,本文章对查询扩展问题展开了一系列研究。本文的创新点在于以下2个方面:1.提出了一种新的计算词语相关度的算法,并在此基础上,设计了一种基于语义词典和局部分析的查询扩展算法。算法通过语义词典WordNet和局部分析技术获得扩展词之后,运用权重调节技术,将两种扩展词加以融合,得到更多的扩展词。另外,本文也解决了多查询词的问题,使得此算法的实用价值更高。2.设计了一种可以迭代计算词的相关度和短文本的相关度的算法并分析了算法的时间复杂度。在实验分析部分,通过计算相关系数,验证了算法对词、文本相关度的判断更符合人的判断。
其他文献
德育是学校工作的重中之重,是培养人才的根基。对学生进行切实有效的德育教育是进行其他工作的首要基础。我们要多动脑n筋,采取多种方法做好对学生个体的教育工作。
四阶问题在现代科学和工程中得到了广泛的应用,经过许多学者的不断研讨,四阶差分理论日渐成熟。然而,四阶偏积分微分方程的数值方法和理论分析是一项困难的事,所以我们应该开发有
The circle geometric constraint model (CGCM) was put forward for resolving the open-pit mine ore-matching problems (OMOMP).By adopting the approaches of graph t
分析管道应力有很多方法,本文对这些方法分别进行说明。然后通过举例,构建一种比较稳定的分析模型,可供同行参考。
网格计算是伴随着互联网而迅速发展起来的,是专门针对复杂科学计算的新型计算模式。网格计算不仅受到大型科学计算的国家级部门,如航天、气象部门的关注,而且,目前一些公司和研究
8月14日,一场大伙扰乱了重庆北碚的安宁。而起火点正是北碚图书馆里面的一栋老房子——红楼。  作为抗战时期著名建筑的红楼,这场大火引起了所有人的关注。所幸,它里面的藏书早已转移,安然无恙。但这场火灾烧毁了红楼内部的木质,好在并未对红楼外墙造成任何损害,相关负责人告诉我们,预计国庆前完成修缮工作,不会延后工期。  北碚图书馆这栋著名的红楼,正是由卢作孚先生于民国廿一年组织修建,最初作为为中国西部科学
随着作息技术在日常生活中的广泛应用,越来越多的家庭已经普及了各项电子产品,它能带来便利和精彩,也能带来麻烦和困难.于是如何把电脑教育游戏运用到小学信息技术教学课堂中
本文主要研究大长宽比物体散射的高精度数值模拟方法。通过把谱元法与椭圆人工边界以及相应的精确无反射边界条件结合起来得到了一种求解此类散射问题的高精度数值方法。由于
在偏微分方程的理论研究中,对拟线性椭圆型方程的研究是十分重要的。物理学中的许多问题都可以归结为拟线性椭圆型偏微分方程及方程组的问题。而其中的A-调和方程在拟正则映
11月27日~30 日,以“智汇跨界新纺织”为主题的第十八届上海国际纺织工业展览会将在上海浦东新国际博览中心举办。目前本届展会已进入了最后的准备阶段,其规模如何?將呈现出哪些新亮点、新特色?有哪些看点?为此,本刊记者分别采访了展会主承办单位负责人——上海纺织技术服务展览有限公司总经理刘卫平、上海市国际展览有限公司副总裁卞国荣、香港雅式集团董事长朱裕伦。  The 18th Internationa