论文部分内容阅读
本课题针对专利预警机制的专利信息采集、专利信息分析和专利预警三个阶段进行深入研究,充分运用网络爬虫技术、HTTP协议、DOM元素设计并实现了专利数据收集系统,借助Lucene思想,对IPC分类进行分析,通过JSON数据格式转化,以HighCharts实现专利信息图形化报表展现,最终实现了服务外包平台中知识产权预警机制的建立。主要研究成果包括以下三个方面:(1)设计并实现了知识产权专利信息收集系统。本文采用基于HTTP协议的信息提取技术,通过Get和Post两种交互方式,实现了直接从HTML源码中提取有用的专利数据信息。另外,在Get和Post请求服务器页面的过程中采用了拟人化技术,模拟人访问页面的规律进行页面的请求,从而避开了服务器端因接收请求的次数过多而拒绝访问的问题。实现的系统能够快速从国家专利局网站中检索出基于关键词的专利信息,并将其抓取到本地数据库中,通过数据库格式的转换和数据结构的重新调整,转换为本系统所需的专利数据库。(2)提供了丰富的专利信息图形化展现与分析形式。基于用户体验的角度,研究并实现了三种直观的图形报表形式展现、分析专利信息,可为用户分析专利的申请趋势提供较好的决策支持作用。本文采用JSON封装专利数据,统一专利数据格式,并将格式化为JSON的专利数据传输给HighCharts源码,HighCharts将获取到的JSON数据按照用户指定的报表展现形式在Web页面上画出相应的报表图。(3)设计并实现了专利预警功能,并应用于服务外包平台。本文设计并实现了专利关键词预警、企业预警、地区预警和行业预警四种专利预警方式,不同用户群体,可以根据不同目标选择不同的预警组合策略。同时,我们将设计实现的专利预警功能作为一项增值服务,运用到所参与的“服务外包基地城市软件与信息服务外包公共支撑平台建设”项目中,取得了良好效果。