基于CP-CNN的中文短文本分类研究

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:wf1899
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短文本具有长度短、特征稀疏以及上下文依赖强等特点,传统方法对其直接进行分类精度有限。针对此问题,提出了一种结合字符和词的双输入卷积神经网络模型CP-CNN。该模型通过加入一种用拼音序列表征字符级输入的方法,构建字符级和词级的双输入矩阵,并在采样层使用k-max采样方法,增强模型特征的表达能力。利用豆瓣电影评论数据集对该模型进行识别精度评估,实验结果表明,与传统分类模型和标准卷积神经网络模型相比,该模型可有效提高短文本分类效果。
其他文献
【正】 据《中外报刊选摘》今年第5期报道,上海大学生每周用于课外阅读报纸杂志、文艺作品、社会科学类书籍内容之广,时间之长,超过了过去任何时期。这是上海高校对大学生课
【正】 当前学习研究蔚然成风,令人鼓舞。刘勰有几句话,至今值得深思。他说:“才有天资,学慎始习。斫梓、染丝,功在初化。器成彩定,难可翻移。”(《文心雕龙·体性》)意
农田基本建设知识讲座云南省农业厅农田保护建设处第三讲农田基本建设规划可行性论证报告的编写(撰稿写葛龙光)一、进行可行性的研究耕作土壤(田和地)不仅受自然地理和气候的影响
随着科技的飞速发展和农村电网工程的开展,电力需求也得到飞速发展,确保电力电缆安全运行显得非常重要。本文重点讨论电力电缆常见的故障及检测方法。
2015年对浙江省缙云县柳杉(Crypotomeria fortunei)人工纯林样地调查不同间伐措施对其平均胸径、平均树高、蓄积量及胸径生长的影响.对照样地为 1983年造林,至今未间伐;1977年
【正】 现在,越来越多的图书馆在国书编目中都实行了定额管理。因为,实践证明实行定额管理能加强劳动纪律、提高工作人员业务水平、调动工作人员的积极性。本文拟就图书编目
【正】 嘉定新县志的编纂工作正在全面展开,这是促进我县两个文明建设的一项巨大文化工程。县图书馆怎样为新县志的编纂工作服务,这是摆在我们面前的一项新课题。要把搜集地
【正】福伊特造纸(Voith Paper)和特吕茨勒(Trützschler)研发成功一种新型非织造布。今年10月,两家公司联合开发的该产品成功通过了INDA和EDANA的官方可冲散测试,并且被
【正】 专业图书馆(研究所)产生的背景是为了解决科研个人或集体,在科教实践中要求提供情报资料的问题。它的出现是现代图书馆适应科研需要,加强情报职能的体现。由于现代科
獭兔饲养知识讲座峨山县畜牧兽医站653200王家元第五讲獭兔常见病防治一、病兔识别方法1.一般检查。①营养状况,触摸獭兔脊柱,浑圆者即为营养良好,无病;如脊柱算盘珠样者即消瘦,营养不良的