【摘 要】
:
基于统计的TF-IDF相似度计算方法由于不考虑词语的语义信息,不能准确地反映文本间的相似性.针对该问题,提出一种结合语义理解和TF-IDF的科技项目相似度计算方法.在项目分词的
【机 构】
:
杭州电子科技大学软件与智能技术研究所
【基金项目】
:
2013年浙江省公益技术应用研究项目“基于语义的科技项目查重研究与实现”(2013C33G2040027)2013-2014
论文部分内容阅读
基于统计的TF-IDF相似度计算方法由于不考虑词语的语义信息,不能准确地反映文本间的相似性.针对该问题,提出一种结合语义理解和TF-IDF的科技项目相似度计算方法.在项目分词的基础上,利用《知网》计算两个项目间的特征项语义相似度,基于TF-IDF计算每个特征项的权重,然后针对权重大于给定阈值的特征项进行加权进而计算得到项目相似度值.实验结果表明,该方法效果优于单纯的TF-IDF和语义理解的方法.
其他文献
许多学者分别从关系、能力或信任等不同角度对家族企业的治理模式进行了有意义的描述,但这些分析的视角往往比较单一,并不能很好地解释各种因素之间的联系,与家族企业的实际运作
2011年11月5-6日,由江苏省外国文学学会、江苏省作家协会外委会主办,南通大学外国语学院承办的“江苏省外国文学学会、江苏省作家协会外委会2011年年会暨学术研讨会”在南通
【目的】分析中华医学百篇优秀论文(Top100论文)的特征,为医药卫生期刊吸引优质稿源、提升期刊影响力提供参考。【方法】以2016—2018年度评选的中华医学Top100论文为研究对
本文从系统功能语法理论角度探讨现代汉语无致使关系评价型"V得C"小句,研究发现它含有嵌入性显赫趋向特征,其中述语指向类"得"前内容是以事件为中心构成的嵌入式小句,多为关
今年1季度,我国呈现经济增长加速、市场消费活跃和物价水平回升的良好局面。2季度,受SARS疫情的影响,消费品零售额增长明显回落,由于政府措施得力,疫情对经济的冲击控制在较
随着油田的不断开发,气液两相流中的气相对油井的影响越来越明显,气体也是造成抽油机泵效率较低的重要原因。只有降低进入泵的气体的量才能有效的提高泵效率。所以,井下分离
目的:初步研究黄芩、牛膝、杜仲、山楂、嫦莶草五种中草药对血管平滑肌细胞(VSMCs)钙通道的影响。方法:大鼠离体胸主动脉环观察对去甲肾上腺素(NA)诱导的内钙依桢性与外钙依牵负性
唐代大诗人白居易的《琵琶行》,已经成为了咏歌琵琶的千古绝唱,其影响所及,已远远超出了琵琶或者音乐的范围。诗中的很多语言,在我们的日常生活中不断地被引用,被引申,"浔阳
全国教育大会中明确提出要实现教育现代化。教育信息化的不断发展,催生了大数据背景下城区初级中学的发展创新方式。同时,四川基础教育改革聚力"高品质学校建设",江阳区进一
目的通过空白加标的方式建立顶空气相色谱测定水中三氯甲烷、四氯化碳的方法。方法用顶空自动进样,HP-5毛细管柱气相色谱法测定水中的三氯甲烷、四氯化碳。结果本方法三氯甲