论文部分内容阅读
科技文献作为科研成果的载体是科研人员重要的学习和参考资料,随着科技文献数目的迅速增长,对文献质量进行有效、及时的自动评估越来越成为一项必需的工作。目前文献质量评价的研究主要侧重于引文分析,但这种方法对新文献评价结果偏低,对引入作者、期刊会议等文献相关信息来进行质量评价的研究也较少,也没能利用现有Web2.0系统中的用户行为信息来辅助文献质量分析。
本文基于以科技文献共享为目的的PKUSpace平台设计并实现了一个文献质量评估子系统。本文的方法以科技文献之间的引文关系为基础,引入与文献相关的作者和期刊会议,考虑时间因素,对这三种实体之间的关系建模构建学术网络图,模拟了文献质量和作者学术声望、期刊会议学术质量之间的相互促进作用。在此基础上,文中还考虑了Web2.0环境下用户行为对文献质量的反映,通过对用户行为建模,协助分析科技文献质量。论文将用户行为分析和学术网络图分析统一在带重启动的随机游走算法框架下。
本文的方法是一种融合了基于学术网络的分析和基于用户行为分析的组合分析框架,在给出文献质量分析结果时还能够给出作者学术声望和期刊会议学术质量的分析结果。本文的主要贡献如下:
●综合考虑了文献之间,文献与期刊会议和作者的关系,并考虑时间因素来构建学术网络图进行文献质量分析。本文的方法能充分利用文献质量和作者的学术声望、期刊会议的学术质量之间存在相互促进的关系,并较好的解决了新文献评价结果偏低的问题。
●将Web2.0环境下用户贡献的信息引入到文献质量分析中,对用户行为建模,协助计算文献质量。用户生成的信息代表了用户的观点和态度,利用这一资源来分析文献质量的研究还非常少。
●通过使用带重启动的随机游走算法框架,解决了如何整合学术网络图分析和用户行为分析的问题,对文献质量进行自动分析的同时还对期刊会议的质量和作者的学术声望给出分析结果。
实验结果表明,本文提出的方法在论文、作者和期刊会议的评价方面均具有较好的效果。