基于卷积神经网络的句子分类算法

被引量 : 0次 | 上传用户:stbruce
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句子分类是自然语言处理领域中重要的问题之一。最近的研究表明,基于神经网络的句子分类算法可以更大限度地利用上下文信息,在句子情感分类、问题归类等句子分类任务中取得很好的效果。目前用于句子分类的神经网络模型主要有递归神经网络、循环神经网络与卷积神经网络。本文提出了两种新的句子分类算法,分别为预训练词向量分类算法与动态扩展句子分类算法。(ⅰ)预训练词向量分类算法将大规模语料预训练得到的广义通用语言场景下的分布式词向量用于初始化卷积神经网络的输入层。这相当于为神经网络模型引入了一般场景下丰富的语义信息。(ⅱ)动态扩展句子分类算法在预训练词向量分类算法的基础上,通过对训练数据进行基于统计学的特征选取,对语义信息较少的句子进行动态扩展,扩展后的句子会被当作新的训练样本用于神经网络模型的训练。实验结果表明本文提出的句子分类算法能够在语义并不丰富的训练数据上为分类模型提供一些额外的语义信息,提高分类准确性。
其他文献
《伤寒论》中三阴三阳是对外感病的阴阳划分,分为太阳病、少阳病、阳明病、太阴病、少阴病、厥阴病。若只见三阴三阳就视为"六经脉",不见后面的"病"字,是错拿三阴三阳六个概
目的观察白苓健脾颗粒与转移因子合用防治小儿反复呼吸道感染的临床疗效。方法将反复呼吸道感染患儿150例随机分为治疗、对照两组,各75例。治疗组用白苓健脾颗粒合转移因子治
本文介绍了基于西门子S7-300可编程控制器、STEP7和WinCC flexible组态软件的电梯控制系统。阐述了电梯控制系统的组成及PLC、STEP7和WinCC flexible的程序设计方法。PLC执行
应用控制论中“黑箱”理论的原理 ,参考经济合作与发展组织 (OECD)对环境政策影响的评价和芬兰森林资源核算的研究 ,创造性地使用压力 -状态响应评价法 ,设计了森林生物多样
<正>景宁畲族自治县是全国唯一的畲族自治县,也是华东地区唯一的民族自治县,地处浙江省南端,位于瓯江、飞云江源头,是浙江的重点林区县,素有"九山半水半分田"之称。近年来,景
<正>以前的中国电视综艺节目领域模仿风气很重,都说"大陆抄港台,港台抄日本,日本抄欧美,韩国抄日本,湖南抄韩国"。随着知识产权保护意识的增强,引进模式节目现已成为颇为流行
目的:H型高血压可导致动脉结构性改变和功能异常,通过颈动脉彩超检查评价H型高血压患者与单纯性高血压患者颈动脉结构和血流动力学变化,探讨H型高血压患者血浆HCY与颈动脉粥样
通过室内、室外试验,分析石灰土灰剂量对最大干密度和最佳含水量的影响及灰剂量随时间衰减的规律。提出了不同龄期石灰稳定土的最大干密度标准及工程应用,对石灰稳定土的施工
通过对中亚热带山区天然林、人工林(用材林和经济林)、次生林、果园和坡耕地等7种典型土地利用方式的土壤有机碳储量及质量的研究,结果表明:中亚热带山区天然林转变为其他土
在整个道德规范体系中,责任居于重要地位。正如康德所言,“每一个在道德上有价值的人,都要有所承担。不负任何责任的东西,不是人而是物。”大学生作为我国社会主义事业的建设