论文部分内容阅读
未来技术分析在科技规划、科技管理与战略领域发挥了越来越重要的作用,对于情报研究而言,除了在拥有良好基础的动态监测和态势分析的基础上,还应在技术创新领域开展更多的面向未来的技术分析工作。基于文本挖掘与计量分析的技术形态关联方法是发现未来技术机会的重要手段。
论文研究围绕当前技术形态关联分析方法存在的三个主要问题展开。针对技术形态特征词选择的效率提升问题,论文首先比较了词频一逆文档频次方法、修正互信息量方法、C-Value选词等方法,并且提出通过引文选择特征词的思路和方法,以及特征词选择的组合策略,实验证明引文共现选词有较高的候选词集约减率且有较高召回率,在此基础上的特征词选择组合策略进一步提高了候选词集的约减率。虽然,最终形态特征词的确定还需结合人工判读,但是论文提出的方法已经明显提高了形态特征词的选择效率。目前因子聚类分析方案是构建技术形态结构一种有效手段,论文比较了“关键词-文献”、“关键词-引文”、“关键词-引文作者”三种数据模型对因子分析效率的影响。实验证明
“关键词-引文作者”数据模型有较高的KMO和Bartlett检验值,并且有较高的因子缩减率,更适合因子分析。另外,研究还尝试结合社会网络中心度分析与PageRank等级排名算法解决形态等级结构的命名问题。针对技术形态关联分析方法,研究以形态关联矩阵分析方法为基础,比较了共篇矩阵与共句矩阵在形态特征词相关性计算方面的差异,结论是以两者融合矩阵既能得到较强的关联度又能提高关联的准确性。
方法整体有效性验证研究部分对论文优化方案组合的整体有效性进行了验证,证明论文中提出方案在一定程度上能够提升形态分析和形态关联分析的效率,也证明技术形态关联分析方法能够用来揭示论文与专利间的技术转化。