基于概念格的Web文本管理研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:lggu770621
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决Internet上日益严重的“信息过载”和“信息迷航”问题,智能信息检索和个性化信息服务成为目前信息服务研究的重点。设计合理的智能信息检索系统,是实现智能信息检索和个性化服务的基础。由于目前的信息检索技术存在查询词难以准确体现用户查询意图和查询结果松散的不足,本文利用概念格技术进行上述两方面的研究,提出了一个基于概念格的智能Web文本管理系统的系统。首先,主要利用ontology构建知识库,采用基于概念的查询扩展代替以往基于关键词的检索方法,并利用数据挖掘技术,概念格等方法,提供结合领域知识基于概念格的交互式查询扩展,消除查询词的歧义,明确用户查询目的;其次,利用概念格等web文本挖掘工具对检索结果进行组织,按照页面彼此之间的相似程度结合领域知识分为若干组,每组都有一个比较明确的主题,用户可以迅速地扫描每一组并选择那些和他的目标最相关的组。本系统能够结合概念检索和交互式检索的优点,以及对检索结果挖掘重组,克服传统查询的缺陷和不足,从而提高目前信息检索的性能。论文的主要工作包括以下方面:(1)研究了现有的搜索引擎的特点以及不足,提出了一种基于用户交互的的智能web查询方法,利用概念格等web文本挖掘工具结合领域知识对查询词进行扩展,从而提高网络信息检索的性能。(2)特定领域ontology知识库的构建:从Yahoo目录层次中对每一个目录下的文档进行分析,抽取关键词,然后根据特定的关键词集与其对应的文档集形成一个概念,这一概念中的关键词就可以被用来进行扩展。(3)基于云模型属性概化的概念格创建算法:针对实际应用中数据的多值情况,提出了基于云模型属性概化的概念格创建算法,这种划分算法的特点是,所得到的概念反映了此属性中数据在定义域中的实际分布,同时,由于概念的边界是模糊的,不确定的,因而是一种软划分方法,这样所得到的结果集更加符合人的思维,同时又保持了传统硬划分所具有的优点。(4)基于概念格的查询扩展机制:研究在用户初始化查询的基础上,结合领域知识提供基于概念格的交互式查询扩展,消除查询词的歧义,明确用户查询目的。(5)基于概念格的查询结果管理:利用概念格等web文本挖掘工具对检索结果进行组织,可以进
其他文献
随着Android智能移动终端的普及以及3G和4G网络的全面覆盖与推广,“移动商务”、“移动娱乐”等新兴技术也随之快速发展起来,“移动阅读”也以其快捷方便等优势迅速得到用户的
本文根据作者多年来从事电信支撑系统的研发经验积累,基于成都电信本地网计费、深圳电信九七改造、太原网通本地网九七、湖北省电信业务支撑系统等项目的实际开发过程。文中阐
随着企业信息化的发展,作为ERP(Enterprise Resource Plan)系统中重要的内容:安全问题,迫切需要解决。基于公钥体制的PKI(Public Key Infrastructure)系统是一个较好的解决方
森林的健康、稳定与空间结构密切相关,研究基于智能信息处理技术的森林空间结构优化对我国森林可持续经营及“两型”社会发展具有重要的理论和现实意义。森林空间结构涉及多
短短数年间,云计算技术从提出概念转向大规模应用。云计算技术可以与多种行业进行融合,为用户提供便捷的服务,体现出巨大的应用价值和发展前景。为了满足对计算日益增长的需
在航空客运领域,收益管理是指航空公司通过预测和优化等科学手段把产品按不同的价格适时地卖给不同类型的旅客,使每一航班的每一航段的每一座位以最好的价格出售,从而获得最
随着网络技术的飞速发展,信息化的浪潮迅速延伸到国防、科研、经济等各个领域。在网络建设和应用中,校园网的建设以其突出的特点走在了其他行业的前列。目前,安全,高效,低廉的认证
学位
随着移动互联网的飞速发展,视频技术越来越多的进入了人们的生活,即时视频通讯软件、网络高清视频服务、无线高清视频监控等在我们周围越来越普及。另外,硬件的发展也非常迅速,超
朱鹮是当今世界濒危级鸟类,我国一级保护动物。自从1981年洋县重现发现以来,经过20多年的努力,种群数量已有明显增加,但并没有完全摆脱灭绝的威胁。鸟类鸣声包含丰富的信息,