基于本体的专利信息动态监测与分析系统的研究与实现

被引量 : 0次 | 上传用户:Monking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识经济时代,知识是推动经济发展的关键资源,专利作为知识的重要表现形式,不仅是科研人员了解新技术、启迪思维、避免重复研发、提高研发效率的重要参考资料,也是管理者、决策者分析行业或国际技术趋势、有效进行资源配置、制定战略规划的必要情报分析源。目前国内外学者、机构研究开发的专利信息采集与分析系统存在很多问题,如:大部分专利信息采集技术主要基于关键词加权重,没有考虑到同义词、多义词等词间语义关系问题,造成专利信息检索不够全面,出现误检、漏检现象,使得基于专利信息的分析不够准确,无法反映技术领域的真实情况;专利信息采集方式仍停留在人工辅助采集方式,不能够适应网络环境下的用户动态多变、随时采集与分析的专利信息需求;很多专利信息采集与分析系统提供的专利信息分析指标与功能不够全面,分析结果的可视化能力低,不能满足用户灵活多变的个性化、交互性专利信息分析需求。为解决上述问题,本文以专利信息采集与分析为研究对象,设计和开发了一个集专利信息采集、信息管理和信息分析于一体的基于本体的专利信息动态监测与分析系统,该系统不仅能基于本体对用户的采集表达式进行语义扩展,从而提高专利信息采集的全面性,还能够动态监测和采集网络上的Deep Web专利信息,并以不同的分析指标对采集的专利信息进行分析,将分析结果以可视化的形式展示给用户,从而满足了网络环境下的用户动态多变、随时采集与分析的个性化、交互性专利信息采集与分析需求。系统基本实现流程如下:首先,利用中科院研发的汉语词法分析系统ICTCLAS对用户检索语句进行分词、停用词过滤等预处理,形成用户初始检索表达式,并利用所建的领域本体库对用户初始检索表达式进行语义扩展,形成用户的语义扩展检索表达式。然后,根据扩展后的检索式,编写专利信息采集程序,动态地从网络专利数据源中采集免费的专利数据,并对采集到的专利数据进行去重等数据清洗工作,存入专利数据库。最后,利用Open Flash Chart (OFC)丰富的图表库实现专利信息分析结果的可视化展示,并以服装领域为例,对系统的可行性、实用性进行验证。
其他文献
资本成本估算是现代财务理论中的一大难题,虽经数十年的发展演变,但至今仍没有达成广泛的共识。在资本成本估算技术没有取得重大进展之前,尤其是资本成本概念还没有引起人们
本文回顾了球罐建造的发展历史,对其设计、选材、安装、焊接、检验和无损检测等各个关键环节进行了比较详尽的分析讨论、并对如何提高球罐的质量提出了一些建议和措施,同时本文
东正教从拜占廷帝国传入俄罗斯后,迄今已有一千余年的历史,在其传播和发展过程中,适应俄罗斯的国情,形成了自己的鲜明特点,这些新特点表现为俄东正教与多神教的混合;俄东正教重视对
目的总结过去、纠正不足,加速我国临床药学发展。方法通过回顾和思考,总结我国临床药学发展历程及其经验与不足,从而确立临床药学学科定位和学科建设内涵的正确导向。结果与
本篇论文主要内容是我国帕米尔高原地区塔吉克族麻扎朝拜文化。在文献研究中我发现关于塔吉克族麻扎文化研究的资料少之又少,而其麻扎文化又与新疆其他穆斯林民族有着明显的
综述了转基因食品安全研究现状以及中国转基因产品管理法规的主要内容和管理制度。
指出纳米化的储氢材料将会被广泛用于燃料电池的汽车之中,介绍了纳米粉的其它典型应用领域。分别论述了实验室中物理与化学方法制备纳米粉的基本原理,分析了物理法制备纳米粉
1927年至1930年胡适居住在上海的日子在他人生中独立成一片断。在沪初期,他在政治上保持沉默,后因时局的诱因与他本人议政的爱好,他在《新月》月刊上发表一系列政论文章批评
<正> 在云、贵、川的一些高山地区,当地居民经常猎捕到獐子(麝)和灵猫(又名野猫)。他们很熟悉在獐子身上取麝香,而不知道在灵猫的身上取灵猫香。灵猫:现可分为大灵猫(Viverra
采用鸡胚共同增殖禽多杀性巴氏杆菌和H9亚型禽流感病毒的方法制备的抗原中含巴氏杆菌数≥4×1010CFU/mL、H9亚型禽流感病毒含量≥109.38EID50/mL,经灭活后制备3批二联灭活疫