结合关键词微变和LD算法的文本相似性研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:hello_junz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决基于传统向量空间模型的文本相似性算法没有考虑向量高维及关键词的微变,而导致文本相似性计算结果不够精确的问题,提出了关键词微变情况下基于聚类和LD算法的文本相似性算法TSABCLDA(Text Similarity Algorithm Based on Clustering and LD Algorithm)。对文本进行移除数字、标点符号和停用词等预处理;采用聚类的方法约简文本中的低频词,利用LD算法计算特征词间的相似度,建立文本相似度矩阵;用特征词相似度及其权重构建的空间向量计算文本间的相似度,这
其他文献
<正> 断肢(指)再植经历20多年之实践,已有成熟经验,再植成活率能达90%上下,然而掌部离断再植,由于解剖结构较复杂,损伤相对地重,再植比较困难。 根据解剖与再植的特异性,断掌
为了解决双列角接触球轴承轴向游隙难以控制、合套率低的问题,采取修磨内圈小端面的方法较好解决此类轴承轴向游隙超差的问题.附表2个.
在平面连杆机构运动学概率分析的基础上,建立了平面连杆机构动力学参数的概率分析模型,给出了平面四杆机构运动副反力的概率数字特征值计算公式,并以一简单平面铰链四杆机构
泡沫是一种气体-实体复合的多孔材料,因其具有质轻、吸声吸能、隔热等优点而广泛应用于包装、汽车零部件、隔热、建筑、航空航天等领域。相比聚乙烯、聚苯乙烯等其他通用塑料
该文结合作者接触的一些公路混凝土路基工程,谈对公路混凝土路基施工技术的一些见解。
利用ANSYS通用有限元程序中的金属蠕变Creep准则来模拟混凝土的徐变效应,在ANSYS平台上实现了桥梁混凝土结构的徐变分析计算。在此基础上,通过实例验证了这种模拟方法在实际
该文首先分析了市政道路旧路改造的特点,在此基础上,作者根据实践经验,阐述了旧路改造工程的施工技术,并以沥青施工技术为代表对旧路改造施工技术进行了介绍。
进行中卫香山高海拔地区提高压砂地红枣坐果率试验研究,结果表明:喷水、喷赤霉素、摘心、摘心加环切4项措施可以明显提高当地红枣坐果率,且在坡下栽植的红枣坐果率明显高于坡
患者,男,49岁.2001年3月5日初诊.1月前因车祸伤突然出现双眼球突出、视力下降、开睑困难等症状,并呈进行性加重.检查:VOD 0.4、VOD 0.3,右眼球、左眼球突度分别为23 mm、24 m
针对原有手动高速旋转试验台自动化改造,开发了试验台自动控制系统。介绍了系统的组成、工作原理、软件设计。在Delphi编程环境下,采用第三方控件SPComm实现工控机与智能测速仪