基于关键词扩展的智能模糊查询算法的研究

被引量 : 0次 | 上传用户:dudstar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
众所周知,目前大多数搜索引擎是基于关键词的简单匹配技术实现的,这种以词为中心建立关联的方式,使得搜索引擎存在以下的不足:主要表现在词汇关联性问题,同义词问题和复合词问题等方面。在总结传统搜索引擎的基础上,展开基于关键词扩展模糊查询算法的研究,提出智能搜索引擎的解决方案,并就方案中涉及的理论和关键技术进行深入的研究,主要包括以下工作。首先,针对智能搜索系统实现的要求,进行系统框架的详细分析,论述查询语句处理模块、信息查询处理模块和后期处理模块的主要功能和详细工作流程,展开基于关键词扩展查询算法的研究。其次,对关联性关键词、同义词关键词和复合型关键词的特性进行深入研究。根据关联性关键词的特性,建立关联性词表,将数据词典分成多个大类,每个大类又分为若干子类,通过两个词汇之间的距离来度量它们的相似度;根据同义词的特性,基于著名的语义词典WordNet建立模糊同义词词典,使用该词典对关键词进行同义词模糊查询扩展;根据复合词的特性,将合成关键词中的修饰词以及它所修饰的中心词根据同义词词典表进行扩展并重组,生成新的关键词进行查询。再次,通过对现有查询扩展技术的研究,提出一种基于动态知识库的查询扩展检索系统。根据关键词扩展算法,计算用户原始查询语句和经过关键词扩展处理后形成的关键词群之间的相似度,按相似度由高到低的顺序依次存入或修改到知识库中。知识库系统经过多次被使用后,就可积累一定数量用户的知识经验,逐渐建立起一个符合用户认识规律的知识库。最后,基于上述研究成果,对提出的算法进行了实验验证和结果分析。
其他文献
互联网最初创建就是为了提供一个平台以便促进用户之间的信息交流。社会媒介是web2.0的发展方向之一,基于社会媒介而形成的社会媒介公共空间本质上强调参与者话语的开放、分
近年来,计算机软件系统在日常生活和工作中的地位越来越重要,而计算机软件规模也日渐庞大,其安全问题也因此而受到更多的重视。在一些安全攸关的领域,软件的高可信已经变得十
随着思维科学研究的深入,以及数学教育的发展,培养学生形象思维能力必将成为本世纪教育研究的热点。小学阶段是儿童形象思维发展的活跃阶段,我们认为形象思维的发展在儿童时
随着工艺水平的进步及晶体管特征尺寸的不断缩小,目前集成电路已经进入了深亚微米与纳米级的SoC设计时代,单一SoC芯片的性能也朝着面积更大,频率更快,功能更复杂的方向发展。
本研究以女同性恋的社会支持现状为研究对象,采用了以问卷和访谈相结合的方法收集资料,针对的调查人群是在成都生活的,1980年代出生的女同性恋。通过对她们的社会支持网络的
临床应用表明减重步行训练是一种非常有效的下肢运动功能康复治疗方法,但其存在的理疗师工作量大、训练效率低等问题限制了其临床应用。因此,机器人辅助减重步行训练成为近年
随着高校毕业生就业压力的不断增大,地方高校的大学生更是把自主创业作为一种职业选择。而分析当前地方高校创业教育存在的问题,总结出大学生创业教育的有效路径,构建一个政
在经济危机背景下,全世界汽车销量的不断增长,中国汽车界也拉开攀登世界汽车领导地位的大幕。2009年,中国汽车达到了千万销售的规模,而且一举达到1300万辆的世界领先规模。20
随着社会市场经济的快速发展,为电视新闻行业实现自身管理机制与节目制作技术的进一步完善与优化注入了新鲜的活力。本文就基于以上因素,通过对电视新闻专题节目的发展现状进
随着中国奢侈品消费规模的不断扩大,学术界广泛关注中国奢侈品消费问题。金融危机的发生对中国奢侈品消费产生了一定的影响,使得中国奢侈品消费在金融危机中以及金融危机后出