基于卷积神经网络的短文本分类研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:woaichensi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着互联网的普及与快速发展,对互联网中的文本进行分类的需求越来越迫切。文本分类是指根据不同文本的内容及其所表达的语义将未知类别的文本自动划分为不同类别的过程。本文以短文本分类为研究问题,围绕卷积神经网络模型进行改进,主要内容如下:针对文本分类中卷积神经网络模型可以与其他算法相结合从而改进模型性能的问题,提出一种基于卷积神经网络与极速学习机的混合短文本分类模型(简称CNN-ELM混合模型)。首先,该模型使用词向量构成文本矩阵作为输入数据,然后使用卷积神经网络提取特征并使用Highway网络进行特征优化,最后将误差最小化极速学习机(EM-ELM)作为分类器完成短文本分类任务。在多种英文数据集上的实验表明了CNN-ELM混合模型比机器学习模型与深度学习模型更适合短文本分类任务。针对目前使用在文本分类中的卷积神经网络普遍为浅层模型且对网络短文本的特征表达能力有限的问题,提出一种基于字符级深度卷积神经网络的短文本分类模型(简称Char Deep CNN模型)。首先,该模型使用字符级特征作为输入,这能够更有效的对短文本进行表达,再使用多层卷积神经网络结构完成特征提取工作。对于不同规模的数据集,Char Deep CNN模型能够使用不同层数的模型结构从而获取最优分类结果。实验表明,Char Deep CNN模型在不同规模的数据集上比经典深度学习模型更优秀。最后,在上述两种模型的基础上,本文针对大规模数据集提出结合了字符级特征、深层结构、极速学习机与Highway网络的深度卷积神经网络混合模型(简称Hybrid Deep CNN模型)。该模型在Char Deep CNN模型的基础上使用Highway网络进行特征优化,并使用EM-ELM分类器完成分类任务。在大规模数据集上的实验表明Hybrid Deep CNN模型能够进一步提升原有模型的性能。
其他文献
提出了利用色差R-G和色差比(R-G)/(G-B)相结合的苹果识别方法。在顺光、逆光等不同情况下对拍摄的苹果图像进行了识别,并对识别后的图像进行消除噪声、区域填充等预处理,获得
思想政治工作在医院的人事管理工作中具有十分重要的作用,在调节医院医护人员的工作热情的同时,很大程度上还能维持医院人事结构的稳定性。思想政治工作是实现经济社会科学发
纳米零价铁(NZVI)技术正迅速地成为环境修复中应用最广泛的纳米技术。尽管如此,关于NZVI的反应活性、胶体稳定性以及环境健康风险的基础性问题仍尚未得到解决。本课题系统地
陶行知先生曾经说过:"生活教育是生活所原有,生活所自营,生活所必需的教育。教育的根本意义是生活之变化。生活无时不变,即生活无时不含有教育的意义。"离我们最近的就是生活
目的比较不同置入途径下使用Y形钢板和双钢板治疗肱骨髁间骨折的疗效。方法以2013年2月至2016年2月70例肱骨髁间骨折手术治疗患者为研究对象,依据手术所选择的固定材料将所有
面临严重国家危机的德意志于1810年建立了柏林大学。柏林大学从建立之初就渗透了教育家费希特、洪堡的"教学与研究相结合"与"学术自由"原则,而这两条原则也随着德国大学对世
预养护对策选择是路面预防性养护的关键技术之一,决定着预养护措施选择的科学性和合理性。以上海市某高速公路为例,详细地分析和叙述预养护对策选择的方法和过程。分析过程和结
<正> 1.关于《春》的结构干漪《<春>课堂教学实录》曾刊文《<春>教案》等文章认为,课文主要是以材料的归类,空间的转移为线索来安排结构的。全文可分为盼春、绘春、颂春三大
本文对中频炉配置方案的部分细节问题做了描述,并提出一些建议。
为贯彻习近平总书记关于"实施国家大数据战略,加快建设数字中国"的指示精神,从2015年开始,人民银行在落实《促进大数据发展行动纲要》的基础上,逐步扩大对大数据应用领域的探