基于概念格的检索系统中概念挖掘技术的研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:shenbincool
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“基于概念格的检索查询扩展系统”与已有的查询扩展方法不同,其主要特色是试图通过文本概念挖掘、文本间的概念关系、概念格构建算法的综合利用,从概念的角度为用户提供自动查询扩展。本课题以此为指导,主要在“基于概念格的检索查询扩展系统”的背景下,研究文本概念挖掘的方法。“基于概念格的检索查询扩展系统”,以概念为基础,以初始查询串为中心,并结合用户的主观调节,给用户提供全面而清晰的查询扩展方向。本文的主要研究工作和成果有:1,基于传统的信息检索系统,增加了查询扩展分支。以形式概念分析为理论基础,参考概念格在信息检索中的应用模式,设计并实现了基于概念格的检索查询扩展模块。以文档概念间的关系,建立查询扩展的方向,为用户提供以概念为基础的扩展建议;同时,图形化的概念格图也有效提高了系统与用户之间的交互性,使得系统能更好的利用用户对初次查询结果的反馈信息。2,本文以文本的概念抽取为研究重点,完成了建格预处理模块的实验性设计、实现与测试。尝试从信息熵的角度来评价特征对文本的贡献度,用特征熵取代传统的IDF。经过实验证明,基于特征熵的文本概念抽取效果与CHI统计方法的效果相当,但效率上却得到了较大的提高。3,基于以上理论基础,又引入了领域词典的知识背景,使得特征项的权值具有时间演变性,查询扩展的推荐词能够在内容相关性的基础上具备时间相关性;其次,加入Web文档结构信息的应用,考虑了特征项的位置权重。实验证明,以上措施可以在不影响计算效率的前提下较好地提高概念抽取的效果。
其他文献
智能控制是自动控制的最新发展阶段,主要用来解决那些用传统控制方法难以解决的复杂系统的控制问题。神经网络和模糊控制作为其重要的分支,有着十分广泛的应用前景。大型电机的无刷化是电机发展的重要方向之一。无刷励磁同步电动机最核心、最关键的组成部分,也是最有发展前途的部分是其无刷励磁系统。文章详细介绍了无刷励磁系统的原理及特殊性、分类、控制方式及其各自的优缺点,重点分析了基于S7-300和PROFIBUS-
三维扫描技术以其独有的优势正在工业、国防、医学、文物保护等行业中发挥着越来越重要的作用。标志点的识别是三维扫描系统中一个重要的环节,本论文对标志点的识别特点和各
学位
人工神经网络是解决许多问题的有利工具,但目前研究的神经网络大多是全连接网络,在实际应用中出现了一些问题,比如连线太多,硬件实现比较困难;网络结构不易选取,容易出现过拟
信道编译码技术是移动通信的重要组成部分,本文主要分析了WCDMA主要技术特点、发展现状和未来网络演进的方向。分别介绍了WCDMA技术在不同阶段的具体特征和相互演进的方法,未
无人水下航行器(UnmannedUnderwaterVehicle,UUV)自主航海是执行任务的重要保障,是其智能水平的体现。自主航海是一个以全局路径规划为导引,实时获取局部环境信息,在线规避未知
雷电灾害作为一种自然灾害,一直对人类的生命财产构成威胁,其危害在全球范围内普遍存在,因此雷电的研究及防护具有非常重要的意义。雷电监测数据采集作为雷电监测、研究及防护的基础,以探测闪电的物理参数为基本任务,为深入的雷电机理研究、地区天气资料、雷电预警等方面提供科学依据。本文主要研究针对雷电时差定位与分类要求的雷电监测数据采集系统。该系统利用GPS的时间、位置信息及1PPS信号为各监测点建立统一、精确
电力系统的设计与运行中,首要任务就是保证系统的安全和稳定。然而,短路故障是各种层出不穷的电力事故中最为常见的故障,严重危害系统的安全、稳定、运行,可见预防和控制短路
随着城市建设的不断发展,道路交通流量也迅猛增加。如何有效疏导交通、充分利用交通资源、避免道路堵塞、减少交通事故,已成为交通管理中必须解决的一个问题。采用智能交通信
本文以微机械惯性器件为测量元件,开展微小型惯性测量系统的研究。MEMS惯性器件在体积和成本上的优点较为突出,但在分辨率和精度上存在着很大的不足。论文从实际需要出发,以M