基于非结构化专利数据的技术演化路径研究

来源 :厦门理工学院 | 被引量 : 0次 | 上传用户:wonder568
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“十四五”规划强调了技术发展对于推动社会高质量发展的重要战略作用,而专利作为技术的有效载体,记录了当前我国技术发展的动态,技术演化分析可以揭示不同阶段重点研究领域的变化,更好地把握技术变化的趋势,为政府、企业、个人的技术研发策略提供借鉴。当前技术演化分析主要依赖于IPC号、引用关系等外部结构化数据,忽略了非结构化专利数据中蕴含的深层次技术信息,无法深入挖掘非结构化专利数据的知识流动情况。因此,本研究针对非结构化专利数据开展技术演化分析研究,从专利文本内部深入挖掘技术信息,实现高效准确的技术演化分析。本研究包含以下三个主要内容:第一,针对专利非结构化文本数据存在的高维稀疏等问题,在非结构化数据的特征提取环节使用词分布状态度量词对文本表征的强度,随后通过加权得到分布式文本表征方式,并使用清华大学语料库验证算法有效性,实现高效的文本数据特征提取。第二,K-means聚类算法的初始质心决定收敛速度和聚类效果,本研究根据非结构化数据无标签特点,设计了一种基于方差决策树改进的K-means聚类算法,以方差最大化策略选择最优划分属性,当最大叶结点数为K个时终止分裂,计算叶结点的均值作为最优质心,并通过UCI标准数据集验证了算法的有效性。第三,根据所获得的专利簇提取技术簇,通过词共现关系和引入时间轴构造时间-关键词二模矩阵分别获得技术内容和时序,分辨出核心技术、边缘技术以及技术的时序性变化,最后实现技术演化可视化。本研究在技术演化分析中以专利文本数据作为研究对象,提出了一种基于词分布状态改进的词向量特征提取算法,实现对文本的高效表征;提出一种基于方差决策树改进的Kmeans聚类算法,提升了聚类效果和收敛速度;通过专利簇聚类提取技术簇,对技术簇内的技术关联关系从内容、时序细粒度地研究得到技术演化路径。
其他文献
随着全球高速发展和世界人民的生活质量需求不断提高,我国农林业结合过去自身情况和未来大潮流趋向,部分领域开始逐步从土壤栽培转向无土栽培。在往这个方向的发展过程中,营养液配置及灌溉控制技术已成为无土栽培中的关键技术,然而目前营养液管理控制中存在配置流程繁琐、营养液配比不精准及灌溉策略单一等问题,既对过去大规模的土壤栽培提供不了过多的有利帮助,并且还影响将来无土栽培技术的大规模扩展业务需求。针对上述各类
学位
背景:根据《中国结直肠癌诊疗规范(2017年版)》中的统计数据显示:我国结直肠(Colorectal cancer,CRC)的发病率和死亡率均保持上升趋势。2015中国癌症统计数据显示:我国结直肠癌发病率、死亡率在全部恶性肿瘤中均位居第5位,其中新发病例37.6万,死亡病例19.1万。其中,城市地区远高于农村,且结肠癌的发病率上升显著。多数患者发现时已属于中晚期。结直肠恶性肿瘤具扩散、浸润的特性,
学位
我国是林业大国,林业的发展是重中之重。而林地工作环境复杂、劳动强度大、现有林业机械无法很好地完成生产和经营的需求。林业机器人可有效解决上述问题,减少了劳动成本,提高了自动化、智能化水平。为了给林业机器人提供一个宽视野,这时候就需要用到图像的拼接技术。当所拍摄的图象位于同一个平面上时,这种视差比较小的拼接技术,现已比较成熟。但由于林业环境恶劣,机器人在其运行的过程中无法使镜头维持平衡,也很难保持镜头
学位
敬畏情绪是人类的一种重要情绪体验,通常被认为是积极情绪。当前有研究发现个体的生理、心理层面都会受到敬畏情绪的影响。但仍然缺少敬畏和道德判断的系统研究,Greene将道德判断类型划分为个人和非个人两种,而敬畏情绪在不同类型中到底如何影响个体的道德判断当前的研究尚不明确。本研究通过对敬畏情绪下个体在道德判断中的不同选择,探究敬畏情绪对道德判断的影响。研究一是单因素被试间实验设计,采用《特质性敬畏情绪量
学位
随着全球温室气体排放增多,世界各国应对气候变化的行动刻不容缓,我国于2011年10月在七省市开展了碳排放交易试点政策。随着我国《生态扶贫工作方案》的提出,将碳交易与生态扶贫相结合,既能保护地区生态环境又能促进农村减贫。现阶段,随着全国碳交易体系的不断完善,碳交易与农村贫困之间的关系成为学术界研究重点。然而,现有文献中关于碳交易机制与贫困之间的研究多侧重于微观和理论层面,宏观实证分析较少。基于此,本
学位
随着家具产品的消费更趋向于差异化与个性化。独立家具设计品牌作为家具行业中新锐设计与新销售模式的代表,发展至今逐渐成为新消费群体的关注焦点,但是仍然缺少完整的发展体系。因此构建独立家具设计品牌的发展要素,研究建设策略,对从业者明确品牌发展方向和优化发展思路有着重要的意义。本文基于服务设计和品牌资产理论,总结归纳国内具有代表性的独立家具设计品牌的发展共性,归纳发展要素。并以此为基础提出了独立家具设计品
学位
绢毛匍匐委陵菜等委陵菜属(Potentilla)植物隶属蔷薇科(Rosaceae),是我国华北地区重要的乡土植物,抗逆性强、观赏价值高,极具发展潜力。在自然的生长环境中,乔灌草、乔草等不同的群落结构和配置模式会形成不同的光照条件,影响植株的生长发育,研究委陵菜属植物的光适应性对挖掘北京地区委陵菜属植物的应用潜力,丰富园林绿化中地被的选择具有重要意义。本研究以绢毛匍匐委陵菜(P.reptans va
学位
本研究是在当前全球生态矛盾突出,生态系统全球化保护的背景下,以我国自然保护地体系和湿地保护体系构建为契机,聚焦于内蒙古高原地区的湖泊型湿地公园设计问题,结合当地文化和自然属性,对内蒙古高原湖泊湿地的规划设计进行研究和探讨。首先结合国家自然保护地体系构建,内蒙古自治区湿地保护体系建设的背景,以及高原湖泊湿地研究的现状问题,对于内蒙古地区高原湖泊和湖泊湿地公园进行概念阐释,明确研究对象,阐明内蒙古高原
学位
<正>~~
会议
植物是生态系统的重要组成部分,其叶功能性状可体现植物如何参与物质能量循环并反映植物适应环境的机制,是预测生态系统是否稳定和全球气候如何变化的重要指示之一。本文以江西九连山的亚热带常绿阔叶林作为研究对象,研究其群落结构特征,并对81个常见树种叶功能性状的相关性及差异性进行分析。主要涉及的叶功能性状指标有叶面积(LA)、厚度(LT)、组织密度(LTD)、干物质含量(LDMC)、氮含量(LNC)、磷含量
学位