技术形态关联分析方法优化研究

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:wshzzfdc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
未来技术分析在科技规划、科技管理与战略领域发挥了越来越重要的作用,对于情报研究而言,除了在拥有良好基础的动态监测和态势分析的基础上,还应在技术创新领域开展更多的面向未来的技术分析工作。基于文本挖掘与计量分析的技术形态关联方法是发现未来技术机会的重要手段。   论文研究围绕当前技术形态关联分析方法存在的三个主要问题展开。针对技术形态特征词选择的效率提升问题,论文首先比较了词频一逆文档频次方法、修正互信息量方法、C-Value选词等方法,并且提出通过引文选择特征词的思路和方法,以及特征词选择的组合策略,实验证明引文共现选词有较高的候选词集约减率且有较高召回率,在此基础上的特征词选择组合策略进一步提高了候选词集的约减率。虽然,最终形态特征词的确定还需结合人工判读,但是论文提出的方法已经明显提高了形态特征词的选择效率。目前因子聚类分析方案是构建技术形态结构一种有效手段,论文比较了“关键词-文献”、“关键词-引文”、“关键词-引文作者”三种数据模型对因子分析效率的影响。实验证明   “关键词-引文作者”数据模型有较高的KMO和Bartlett检验值,并且有较高的因子缩减率,更适合因子分析。另外,研究还尝试结合社会网络中心度分析与PageRank等级排名算法解决形态等级结构的命名问题。针对技术形态关联分析方法,研究以形态关联矩阵分析方法为基础,比较了共篇矩阵与共句矩阵在形态特征词相关性计算方面的差异,结论是以两者融合矩阵既能得到较强的关联度又能提高关联的准确性。   方法整体有效性验证研究部分对论文优化方案组合的整体有效性进行了验证,证明论文中提出方案在一定程度上能够提升形态分析和形态关联分析的效率,也证明技术形态关联分析方法能够用来揭示论文与专利间的技术转化。  
其他文献
通过梳理搜索算法中出现的各种特征因子,提出一种更全面的特征因子分类方法,按其自身特点将特征因子划分为6类,分别是文字内容特征、Web拓扑特征、主题分布特征、文档类型特
期刊
一、教学目的:专利查新是国际上广泛采用的查新形式.在技术研发、引进转让、专利申请、侵权诉讼等方面应用十分广泛。专利情报分析是从专利文献中提取技术、经济、法律信息形成
human library概念引入我国时间虽然很短,但近年来研究进展迅速,在图情领域形成了研究热点。系统回顾我国human library研究历程,总结其本土研究短期内飞跃发展、前瞻创新性
陈兆祦先生是我国现代档案学人的杰出代表,为我国档案界留下了宝贵的思想财富,这些思想丰富了我国档案学的理论体系。本文归纳了先生档案学思想的五个主要方面,并以这五个主
读过《红楼梦》的读者应该都有一种感受,贾宝玉对女性的崇拜,简直达到无以复加的地步.rn首先是言语上的推崇,满口所说总是极力贬低男子,抬高女子.如书中借冷子兴之口写道贾宝
期刊
“见字如面”,这句信函常用语,现在很少有人用了.如今,给报刊投稿,或编辑来信,只需要在电脑或手机上轻轻一点,便完成了往来操作.有的编辑更简便,干脆来个自动回复,全没了手写
期刊
目的:本文旨在利用某儿童医院信息系统中的历史数据,分析门诊就诊流程中影响患者等待时间的因素,在定量分析患者流量与患者等待时间的基础上,找出患者排队的规律。通过建立等待
对于情境而言,好多数学老师并不陌生,多少人知道李吉林的"情境教育"在语文教学实践中得到了很好的应用,但没有引起数学教学的应有重视。当今的数学教学特别是小学数学教学中,虽然也
本文通过对荣华二采区10
随着互联网的发展和微博的日趋流行,新浪等中文微博网站已成为海量信息的发布平台,然而目前对中文微博的研究大多还是针对单一的用户关系分析,对微博本身内容的挖掘分析研究较少