深度学习在文本相似度中的应用

来源 :现代计算机 | 被引量 : 0次 | 上传用户:wjbbio
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本相似度是自然语言处理中的重要内容,传统的VSM和TF-IDF是基于词语在文章中出现的频率进行相似度的计算,仅以“词频”度量词的重要性,根据文本中权重构成特征值序列,但词之间各自独立,无法反映序列信息,且易受数据集偏斜的影响。针对这些问题,提出基于BiSRU的文本相似度算法,BiSRU可以用于捕捉文本上下文的信息,考虑特征之间长期依赖关系。其相对于BiLSTM模型进行了简化,且计算速度也相对较快,在此基础上再融入注意力机制,将单词级别融合成句子特征,强化对句子贡献大的词,使句子表达更准确。实验结果表明,
其他文献
乳腺癌组织病理学图像识别对于乳腺癌诊断、治疗和预后具有十分重大的意义,随着计算机和图像识别等相关领域的技术的不断发展,针对医学图像识别的算法和研究也层出不穷。本文将针对医学图像中包括但不限于乳腺癌细胞图像识别的相关算法进行了回顾性总结,针对细胞图像的分割、特征提取和选择以及细胞识别等方面,做出了相关讨论,并对乳腺癌病理图像识别方法进行了总结和展望。
随着技术的不断发展,同步工程的分析范围不断扩大,分析项目不断增多.由于各主机厂在软硬件设施、人员配置、工艺条件等方面差异较大,各厂商同步工程开展的程度也千差万别.本
为了适应航空电源产品的防护要求,提高航空电源产品表面防护性涂料质量水平,对现使用的17种防护性涂料从附着力、三防性能等方面进行了初筛、分类,然后进行了涂料在不同基材
针对现有电子创新设计实践的教学实际,提出一种在线课程的实践方案。该方案包含慕课学习、在线讨论、仿真实践三个环节。改革后的课程,要求学生首先通过慕课学习课程相关章节,随后在微信群中参与课程讨论与互动答疑,之后再在TinkerCAD平台验证设计方案。全新的课程设计更加注重学习与实践相互推进,学生足不出户即可通过在线仿真完成创新设计。课程项目的实施对促进知识内化,激发创新活力,改善教学效果起到了积极作用。
为分析复杂应力条件下超弹性本构方程的适用性,以炭黑填充天然橡胶(NR)的短粗三点弯曲压缩试样(简称三点弯曲试样)作为研究对象,采用Abaqus有限元软件建立与试验过程相符的有限元模型,分析在有/无永久变形条件下试样力与位移的关系,并与试验数据进行对比,判断不同本构方程的计算精度。结果表明:在同时输入材料单轴拉伸、平面拉伸以及等双轴拉伸试验应力-应变数据时,不同本构方程对在有/无永久变形条件下三点弯曲试样力的计算精度不同;Arruda Boyce、Marlow、一至二阶Polynomial、一至三阶Ogde
通过涂装生产中遇到的一次面漆缩孔问题的解决方法,对此类问题的防控及处理措施进行了分析,希望能够帮助更多从业人员拓宽思路,提升汽车涂装质量问题防控能力.
探索肝硬化患者中医用药的聚集现象和相关性,从中发现和探求中药治疗肝硬化的组方用药规律。从中国知网、万方、维普等3个数据库中收集中医治疗肝硬化的文献病案,采用IBM SPSS Statistics和SPSS Modeler软件导入数据进行频数分析和聚类分析。共筛选出445例符合标准的医案,使用中药202味,药物总频次6044次,202味中药被分为18类,且集中分布在补益药、活血祛瘀药和利水渗湿药等3类药中,高频中药聚类分析分为5类。中药治疗肝硬化有规律可循,茯苓、鳖甲、白术、白芍和柴胡等为其常用药物和要药,
磷化作为涂装前处理工艺的重要工序,用来提高涂层的附着力和耐腐蚀性.槽内磷化液的流动,会对磷化膜产生影响,磷化槽的搅拌管需要合理排布,尽可能消除槽内流速较低区域.采用计
主要介绍了涂装同步工程分析中,如何利用MTM方法计算工位工时,排查超节拍风险工位,对工艺理论HPV分析,通过合理工位排布和工位工时优化,使节拍平衡率达到最优状态.
本文提出了一个基于实体描述和关系图卷积神经网络的模型(DR-GAT),在R-GCN模型的基础上融入了实体描述信息和加入了注意力机制,并将其应用于基本的知识库完成任务:链接预测(Link Prediction),即缺失三元组的恢复。实验结果证明,DR-GAT+模型与现有的基线比较时,在FB15K-237数据集上比现有基线R-GCN+的Hits@10指标高出0.81%,验证了改进后的模型链接预测效果更佳。