融合耦合距离区分度和强类别特征的短文本相似度计算方法

来源 :电子学报 | 被引量 : 0次 | 上传用户:weiwen1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短文本相似度计算在社会网络、文本挖掘和自然语言处理等领域中起着至关重要的作用.针对短文本内容简短、特征稀疏等特点,以及传统的短文本相似度计算忽略类别信息等问题,提出一种融合耦合距离区分度和强类别特征的短文本相似度计算方法.一方面,在整个短文本语料库中利用两个共现词之间的距离计算词项共现距离相关度,并以此来对词项加权从而捕获词项间内联和外联关系,得到短文本的耦合距离区分度相似度;另一方面,基于少量带类别标签的监督数据提取每类中强类别区分能力的特征项作为强类别特征集合,并利用词项的上下文来对强类别特征语义消歧
其他文献
无线片上网络中,无线网络拥塞可以分为无线节点级的拥塞和无线链路级的拥塞,这两种拥塞都会造成网络性能下降.针对无线节点和无线链路级拥塞,本文设计了一种拥塞避免的高效无
基于超扩展规则,证明了EPCCL(Each Pair Contains Complementary Literal)理论的合并过程是可并行执行的,并设计了针对多个EPCCL理论的并行合并算法PUAE(Parallel computing
执教快30年了,凭着'滴水穿石'的'水磨工夫',一边享受着水文化的滋养,一边用似水的柔情滋润着一个个鲜活的生命。
对于学生学习能力的培养,初中阶段是关键时期。在初中语文教学中,作文教学很重要。因此,教师必须不断地优化初中作文教学模式与方法,提高学生的作文水平,进而提高初中语文教
高中阶段是塑造学生人格的重要阶段,语文学科具有工具性和人文性的特点,在课堂教学中培养学生人文素养,不仅具有可行性,而且还能提高语文课堂教学效率。更重要的是,可以帮助
宽带水声信道通常被建模为多扩展多时延(MSML)信道,不同路径的多普勒扩展不同给信道参数估计带来了挑战.本文提出一种新颖的MSML信道参数估计算法,称之为改进的粒子群优化(MP
对于略读课文的教学,教师在引导学生解读文本的过程中,要力求做到在教学中“疏中有密”“密中有疏”,选取典型的几点,体悟最精妙的语言,体悟最有价值的语言规律。既要力求简单化,又
DKCHER算法是基于超扩展规则的求差知识编译算法,也是目前为止表现最好的EPCCL理论编译算法.本文通过研究DKCHER算法的执行流程,设计了一种新的启发式策略MOVR(maximum occur
高中地理教学对提升学生的思维反应能力有重要影响,在教育过程中,需要从实际情况入手,以学生为中心,按照教学要求落实教学举措。但是受多种因素的影响,地图教学中存在很多问
摘 要:主要对微课在小学英语教学中的应用形式进行探究。具体结合《义务教育英语课程标准》,探究微课这一教学模式在课前预习阶段、课堂教学以及课后反馈阶段的具体应用。希望这一教学模式将会获得更大的应用空间。  关键词:微课;小学英语;应用形式;优势  微课在教育领域中的应用,实质上就是以视频为媒介,将教师传授的知识点或教学活动录下来。通常来说,微课时间在5~10 min。知識经济一体化时代,微课渗入教育