论文部分内容阅读
科技论文质量是各科研院所、高等院校、政府部门对科研人员进行绩效考核、职称评定、科研奖励的重要手段,合理的科学评价能为科学研究、奖励、管理提供依据,使科研人员客观地了解自身的水平和学术影响,而论文数量的激增为科研评价带来了更大的困难,科学合理的评价论文质量,筛选优秀论文,对评价科研人员水平乃至评价科研单位研究能力具有重要意义。
SCI数据库采用文献计量方法测评学术论文的影响力,F1000数据库采用同行专家评议的方法评价学术论文的重要性,是国际上有影响力的具有科技论文评价功能的两个文献数据库。科技情报人员运用这两个数据库所提供的数据,开展学科研究态势分析、学术机构比较、学术影响力评价等方面的情报分析和研究。
本文研究的内容是,(1)运用统计分析的方法,判断SCI数据库和F1000数据库在评价同一学科领域的学术论文时,两者结论的一致性的比例。(2)F1000数据库具有及时评价学术论文的特点,建立神经网络模型,可对F1000论文的未来被引频次进行预测。本论文选定的学科领域为胚胎干细胞研究领域。
通过分别检索F1000和WOS两种结果的对比分析,两种检索结果在年度趋势分布、国家与地区分布、期刊分布中差异不大,但只有不到40%的F1000文献也是WOS中的高被引文献,基于论文间的引用会对文献重要性的发现造成滞后性。单纯的依靠被引频次会遗漏很多重要文献。基于此本文讨论了造成结果差异的因为以及因此呈现的优缺点,进而综合同行评议法和文献计量法两种评价方法对科技论文质量提出了新的评价指标体系基础。该评价体系利用ISI中科技论文的被引频次这一直观的评价指标,兼顾论文所在期刊的影响力水平,同时结合F1000中结构化的同行评议模式,可以定性定量的评价论文质量。
利用样本的先验概率-Bayes定理和基于风险最小的Bayes决策规则对新的样本进行分类,产生了概率神经网络(简称PNN)。这种基于统计原理的神经网络模型,具有训练时间短且不易收敛到局部极大点的优点,因此本文根据统计结果,应用概率神经网络回归分析,确定了影响因子、F因子、评价等级和评论人数的权重,拟合了论文被引频次与其他论文指标的关系,利用该模型,可以发现F1000论文未来被引频次的趋势,达到同行评议法与文献计量法的综合统一,并运用神经网络进一步分析,发现不同分段的F1000论文在其他评价指标的影响下将分布在何种被引频次的区段,可以对优秀论文的质量达到初步综合评价的结果。