基于WV-CNN的中文文本语义相似度计算方法

来源 :华北理工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:qinslin5043
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决传统中文文本语义相似度计算存在的语义及句法信息缺失、人工提取特征误差较大等问题,融合词向量与卷积神经网络方法,构建中文文本语义相似度计算模型,并给出WV-CNN(Word Vector-Convolutional Neural Network)文本语义相似度计算方法。通过Embedding层将词语向量化后的结果作为CNN的输入,CNN中设置了卷积、Dropout、池化和Flatten4层网络,经过参数选择、训练、调优后输出结果。选取第6届全国数据挖掘竞赛提供的数据集以及在百度的WebQa数据集作为实验对象,使用Accuracy值、F1值、AUC值、KS值4种评测指标进行对比实验。结果表明,WV-CNN具有更好的计算精度和效果。
其他文献
我们所说的学风问题,说到底是对待马克思主义的态度问题.端正学风,就是要用科学的态度对待马克思主义.那么什么是对待马克思主义的科学态度呢?在当前,就是要像江泽民同志要求
以薄板坯连铸连轧实际生产数据的统计分析为基础,通过连铸坯表面纵裂纹形成机理的分析,从成分控制、工艺操作、设备安装精度保证等方面研究了薄板坯表面纵裂的影响因素,提出
文中主要探讨了通信机房、基站内直流电源系统电缆截面积的选择方式。
我国经济建设的步伐较快,同时用电量也在不断地上涨,这对电力系统是否能够可靠且稳定地供电,提出了较高的要求。电力调度作为保证电网安全稳定运行的重要组成部分,发挥着重要
本文对现有的棒材在线计数装置进行了介绍,分析比较了各种计数装置的特点,并阐述了该课题的发展趋势。
推进和加强公民道德建设,是促进社会文明进步和提升公民整体素质的客观要求.为更好地贯彻和落实<公民道德建设实施纲要>的各项要求,把我国公民道德建设的各项活动进一步推向