论文部分内容阅读
在企业和机构内部,科技项目查重能够避免科技资源浪费、恶性科研竞争等重复立项带来的问题。本文提出基于行业词库预训练的科研项目查重方法研究,以申报材料中的关键指标为研究对象,对其段落、句子、词等不同级别构建相似度比较模型,采用Elasticsearch数据库实现海量数据的快速索引。有效提高立项审批过程中工作效率,节约科研成本。