融合共现距离和区分度的短文本相似度计算方法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:voyager4032
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对短文本内容简短、特征稀疏等特点,提出一种融合共现距离和区分度的短文本相似度计算方法。一方面,该方法在整个短文本语料库中利用两个共现词之间距离计算它们的共现距离相关度。另一方面通过计算共现区分度来提高距离相关度的准确度,然后对每个文本中词项进行相关性加权,最后通过词项的权重和词项之间的共现距离相关度计算两个文本的相似度。实验结果表明,本文提出的方法能够提高短文本相似度计算的准确率。
其他文献
驱动程序是操作系统的重要组成部分。驱动程序运行于内核态,其可靠性对于操作系统的安全可靠非常关键。针对Linux驱动程序,研究基于符号执行的驱动程序缺陷自动检测方法。提
在认知无线电网络中,当认知用户存在虚假感知信息SSDF时,协作频谱感知的性能会受到巨大影响.为了确保频谱感知的鲁棒性,提出了一种基于信誉度加权序贯频谱检测算法来识别恶意
摘 要:经济的飞速发展,提高了人们的生活质量,人们外出出行的交通工具也越来越丰富,飞机已经成为人们生活当中常见的一种出行选择,因此必须要做好在飞行方面的工作,提高飞行的质量,而飞行质量的关键就是飞行员自身的素质。本文所探讨的主要内容就是在飞行教育活动当中,优良作风对于飞行学生的重要意义。  关键词:优良作风;飞行学生;重要影响  一、 引言  目前,我国飞行事业都发展越来越兴盛,因此对这方面的人才
随着高等教育普及化时代的到来,实践教学面临全新的机遇和挑战。在此背景下,围绕重庆大学建筑学专业模型制作课的教学改革,探讨高校建筑教育“践行实作”的改革途径。作为建
田径教学在小学体育教学中有重要位置,是培养学生体育素养的重要手段。本文从小学田径教学的现状出发,分析小学教师选择田径教学策略时应遵循的原则,同时介绍了小学田径教学
在多标记学习中,每个样本都由一个实例表示,并与多个类标记相关联。现有的多标记学习算法大多是在全局利用标记相关性,即假设所有的样本共享不同类别标记之间的正相关性。然
<正>四川省苍溪县自2016年申报创建国家畜牧业绿色发展示范县以来,认真贯彻落实中央五大发展理念,创新发展机制,强化工作措施,加大资金投入,有力推进了畜牧业绿色发展,较好地