基于文本预处理的德温特专利信息分类方法研究

来源 :情报科学 | 被引量 : 0次 | 上传用户:bangliju
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对原始德温特专利信息内容表示粒度大,不能够满足对该数据直接进行专利统计分析的问题,本文提出了一种基于文本预处理的德温特专利信息分类方法。该方法结合文本预处理技术,通过对专利数据结构和内容的分析,实现了对专利内容进一步分类。实验结果表明,该方法有效的降低专利信息内容的表示粒度,从而提高了专利分析结果的准确性和多样性。 According to the fact that the original Derwent patent information content shows a large granularity and can not satisfy the patent statistical analysis directly, this paper proposes a Derwent patent information classification method based on text preprocessing. The method combined with text preprocessing technology, through the patent data structure and content analysis, to achieve further classification of patent content. The experimental results show that this method effectively reduces the representation granularity of patent information content and improves the accuracy and diversity of patent analysis results.
其他文献
在西南区话剧,地方戏观摩演出大会上,四川省工人、农民业余演出队和解放军成都部队战士业余演出队,分别为大会演出了三个精采纷呈的晚会,受到与会的专业戏剧工作者非常热烈
一、前言印度塔尔沙漠面积28600平方公里,是世界上居住人口最多的沙漠区。其气候和土壤条件特点是温度高、雨量低而不稳、蒸发远大于降水、土壤有机质含量低、干燥风强。随
黑龙江省市县经营林区开展森林资源档案的建立和数据更新工作,到今年已经有十年的历史了。我们感到有些单位掌握的资源数据出入较大,不能很好的监督和控制森林资源消长变化
在没有专业测绘软件的情况下,利用AUTOCAD及VB编程实现了潮州供水枢纽西溪上、下游围堰横断面图数字化测绘,提供了准确、美观的横断面图及工程量计算成果。 In the absence
为了了解不同人为干扰形式对典型草原碳贮量的影响,对采取了不同干扰形式(包括开垦、放牧、禁牧2年、禁牧7年和禁牧17年)的典型草原试验样地的土壤碳密度及总碳贮量进行了研
7月4日,三门峡枢纽局汛期发电过机含沙量自动遥测系统在3号机组安装试验成功。该系统中的高新技术,在国内外水文泥沙测验领域中处于领先地位。科学测定汛期发电试验中的过机
本文利用电子计算机研究了山地林道布设规划系统,在采运作业中首要任务是布设道路网,布设道路网必须考虑其林业经济效果。经济效果有直接和间接的两种。直接的即为林业的经
讨论了国内第一台千瓦级低温低阶模横向放电循环流动式CO激光器的电激励系统的设计,并对一些主要的放电特性进行了系统研究;研究了增益系数及其空间分布,研究了放电E/N值与激发速率常
电力部副部长查克明、汪恕诚在听取关于黄河上游水电滚动开发汇报后指出,建立黄河上游股份制滚动开发机制,一定要真正滚动起来。汪恕诚说,建立黄河上游滚动开发机制,就是要
Background: Despite previous randomised trials of early β-blocker therapy in the emergency treatment of myocardial infarction(MI), uncertainty has persisted ab