基于自动查询扩展的专利文档检索方法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wac725725
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来信息检索在社会经济发展中的重要性愈发显现。专利文档作为保存现代科技成果的重要方式,几乎包含一切应用领域的创新成果,涉及社会生活的方方面面。对专利文档信息的应用的第一步,就是对专利文档的有效检索。随着专利数量的增长,对高效专利检索的需求越来越高。本文在研究了当前常见的专利检索方法和查询扩展技术的基础上,分析了专利文档及专利检索的特点,提出了一种基于自动查询扩展的专利文档检索方法,用于对英文专利文档的检索。方法首先对专利文档进行预处理,利用国际专利分类体系,针对专利文档特点对TF-IDF(Term Frequency-Inverse Document Frequency)公式进行改进,提出基于改进TF-IDF公式的专利领域词表提取方法,成功构建了专利领域词表。接着对查询输入串进行分析得到查询关键词汇,同领域词表相结合,以确定查询所在领域及查询扩展难度。然后利用基于伪相关反馈的自动查询扩展技术,根据伪相关文档的术语分布差异分析以及词汇间语义关联度计算的结果,生成查询扩展项并排序,最后将扩展项与原始查询条件相结合,重新组成查询条件,完成专利查询。本文采用NTCIR-6的测试集,设计了一些实验,并进行了对比分析。实验验证了使用本方法完成专利检索的可行性,与其他检索方法的横向对比表明该方法具有较高的召回率和平均准确率,是一种有效可行的专利检索方法。
其他文献
本文主要研究了基于视频序列的人体检测和跟踪技术,该技术能够应用在智能监控,人体动作分析,人机交互,基于内容的视频检索以及智能驾驶系统等领域中,其涉及到模式识别、人工
由于GPS设备能够提供定位、导航和路线规划等多种实用功能,它已经成为人们出行生活中必不可少的电子设备。与此同时,这也更突显出GPS设备所携带的数据的重要性。对于取证工作
随着互联网的发展,数据安全和隐私保护的重要性越来越明显。信息的负表示是一种新的很有前景的数据安全和隐私保护方法。负调查就是在信息负表示思想的基础上提出的。这种调查
由于人脸分析具有广泛的应用前景,该研究在近些年来得到了越来越多的关注。目前的人脸分析的工作主要都针对可见图像。而光照变化影响可见图片的外观特征,因此,基于可见图像的人
无线传感器/执行器网络是近年来发展起来的一种新型、无基础设施、自组织的无线网络。它衍生于无线传感器网络,由众多的传感器和执行器组成,通过无线自组网方式,完成分布式感测
3D-HEVC中引入深度图实现更好的视图合成。针对深度图的特点3D-HEVC在深度图帧内模式选择过程中增加了深度建模模型(Depth modeling modes,DMMs)。目前3D-HEVC中的帧内模式除
随着网络的发展和移动视频的兴起,以及支持Web的各种移动设备、平板电脑的涌入和普及,在多样化的显示设备上高质量地显示视频和图像的需求越来越强烈。要求视频和图像不仅能够
闪存作为一种新的存储介质,正在逐步取代磁盘的主导地位。但是由于历史原因,关系数据库的页面存储结构主要是针对于磁盘的特点设计的,未能充分发挥闪存的性能优势。因此基于
随着快速发展的计算机图形学技术、计算机仿真技术、图像处理技术、人工智能技术等,增强现实逐渐成为近几年来的研究热点。增强现实技术将真实世界与虚拟对象无缝的融合起来,融
随着移动通信和互联网的高速发展,各种网络技术不断涌现并迅速进入实际使用,使得现有的网络环境日益复杂。对于应用程序选择合适的网络以及用户选择合适的程序造成了额外的负担