【摘 要】
:
传统相似度计算方法仅考虑文本结构特征或语义信息,从而导致准确率较低。结合短文本特征稀疏的特性,提出一种多重检验加权融合的短文本相似度计算方法 MCWFS。使用基于改进编
【基金项目】
:
中国博士后科学基金(2017M613216),陕西省自然科学基金(2017JM6059),陕西省重点研发计划(2019ZDLNY07),陕西省博士后基金(2016BSHEDZZ121)
论文部分内容阅读
传统相似度计算方法仅考虑文本结构特征或语义信息,从而导致准确率较低。结合短文本特征稀疏的特性,提出一种多重检验加权融合的短文本相似度计算方法 MCWFS。使用基于改进编辑距离、考虑词频、基于Word2vec与LSTM的3种方法分别计算相似度,对满足多重检验标准的文本进行加权因子线性融合,以避免因一种相似度值过大或过小导致加权相似度值异常的问题。在此基础上,通过加权融合计算短文本相似度,使得计算结果更加准确合理。实验结果表明,相比层层检验和无检验融合方法,MCWFS方法的平均准确率分别提高16.01%和7.
其他文献
运用网络信息技术可以优化高中地理课堂,教师在创新教学手段的过程中要充分利用网络资源,提升地理教学质量。要运用网络高效备课,运用网络资源导入新课,要为学生自主学习提供
针对基于深度学习的目标跟踪算法模型参数多、难以部署于嵌入式设备上的问题,提出一种改进的孪生卷积网络实时目标跟踪算法。设计一个非对称卷积模块来构建整个网络框架,通过非对称卷积模块的压缩层减少模型参数量,利用非对称层进行特征融合,以在保证精度的同时压缩模型大小。使用三元组损失函数代替逻辑损失函数进行模型训练,在输入不变的情况下提取表达性更强的深度特征,从而完成目标跟踪任务并提高模型的跟踪精度。在GOT
文章以合肥市某临近地铁1号线区间隧道的深基坑为工程背景,探究基坑施工对轨道交通结构的影响,基坑东侧临近地铁线路,采用排桩+斜撑支护方案。采用有限元数值模拟分析和动态
目的探讨精细化护理对结肠息肉电切术后患者舒适度及血糖影响。方法将2018年4-9月住院的328例结肠息肉患者作为研究对象,根据患者性别、年龄、疾病类型均衡可比的原则分为对
医学院校实验室是培养医学生创新能力、实践动手能力和操作能力、实施素质教育的重要场所,同时也是医学院校教师和实验技术人员进行实验教学、科研项目研发及创新的重要基地
文章以国内某电站下水库为例,该拦砂坝坝基为淤泥质土,土层的力学性质比较差,土质的均匀性不好,且在受压状态下会产生液化,经检验其地基承载力只有80kPa,承载力小,不适宜做水
临床指南是建立在大量循证医学证据基础上对临床实践有指导意义的重要文件。结合临床实践中遇到的常见心血管疾病及其相关指南,通过对指南应用中的个体化治疗、诊疗指南完善
目的调查糖尿病低血糖患者诱发心血管事件的现状,探讨护理应对措施。方法选取医院2018年6月—2019年12月住院部接诊的糖尿病患者为研究对象,根据是否低血糖分为低血糖组(205
基于卷积神经网络的部分可观测马尔科夫决策过程(POMDP)值迭代算法QMDP-net在无先验知识的情况下具有较好的性能表现,但其存在训练效果不稳定、参数敏感等优化难题。提出基于
目的探讨先天性巨结肠患儿术后发生小肠结肠炎的危险因素,并制定针对性预防措施。方法选择2017年1月—2019年1月在医院经根治性切除术治疗的先天性巨结肠患儿122例作为研究对