相似比例在科技论文剽窃检测中的适用性评价

来源 :中国科技期刊研究 | 被引量 : 0次 | 上传用户:jimgui19810917
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]考察查重报告中相似比例作为稿件重复与否判断标准的可信度,并识别错判原因.[方法]对Cross-Check/iThenticate生成的642篇查重报告进行人工核查,采用分类算法的评价指标对相似比例的可信度进行评价,并分析错判原因.[结果]整体相似比例[包括总相似比例(TS)和主体部分相似比例(MS)]和单篇相似比例(SS)判断法的正确率均小于75%,SS法的召回率(85%)和精确率(47%)平衡协调较好(F1=0.61),3种判定方法按照相似比例可信度的排序为SS法、MS法、TS法,但仍存在大量错判案例.[结论]设定合适的阈值,MS和SS可作为判断稿件重复与否的参考,但仍需对易出错条目进行人工核对,不宜过度依赖查重系统的检测结果.
其他文献
目的 探究糖尿病肾病早期诊断中生化检验的应用价值.方法 随机在本院2019年1月—2020年1月收治的所有糖尿病肾病患者中择选40例为研究对象,同时随机选择40例健康体检者为对照.其中健康体检者为对照组,糖尿病肾病患者为研究组.分别给予两组患者生化检验,测定两组患者尿清蛋白/肌酐(UALB/Cr)、血清中C-反应蛋白(CRP)、αl-微球蛋白(αl-MG)、血清胱抑素C(CysC)、糖化血红蛋白(HbA1C)的水平.同时就联合检测分析与单一检测的阳性率结果进行对比.结果 研究结果显示,研究组的尿清蛋白/肌