基于吸引子传播聚类的改进双通道CNN短文本分类算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:passat168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的文本分类方法在处理短文本分类任务时遇到了很大的困难,针对短文本分类任务上的数据稀疏等难点,本文尝试在短文本特征输入和卷积神经网络结构上进行改进.在特征表示Word embedding训练时采取non-static和static两种方式,将训练好的Word embedding进行聚类处理,聚类得到的Word embedding库作为模型输入的词典库;提出一种改进的双通道卷积神经网络结构,网络通过双通道获取更多的局部敏感信息增加特征数目,然后经过连续的池化实现特征抽取.经实验验证,提出的语义聚类处理和改进的网络模型与传统的机器学习方法相比,在短文本分类任务的准确率上有显著的提升.“,”In view of the difficulty of short text classification task,tried to improve on short text feature representation and convolution neural network structure.Above all,Word embedding training is taken in two ways:non-static and static.and the Word embedding is used as a model to input Word embedding clustering.Then an improved CNN structure,the network obtains more local sensitive information through two channels to improve the number of features.Experiments show that the improved semantic clustering approach and improved CNN model have a significant improvement on the accuracy of short text classification tasks compared with traditional machine learning methods.
其他文献
对不同年龄新疆山羊母羊的羊绒细度、色度、长度进行分析,结果表明新疆山羊母羊成年后,随着年龄的增长,羊绒细度明显变粗,长度没有明显变化,色度差异较明显,为今后新疆山羊的
活动图像专家组日前决定,将NEC公司和三星电子高级技术协会(SAIT)共同提议的面部识别技术加入即将发布的MIDEG-7标准。 The Moving Picture Experts Group recently decide
期刊
各有关省、自治区、直辖市及计划单列市发展改革委、国土资源厅(局)、环境保护厅(局)、住房和城乡建设厅(局)、文化厅(局)、林业厅(局)、文物局:rn为进一步加强文化和自然遗
"我相信存储市场的发展,将成为中国信息化社会的一个先决条件,而存储应用中不容忽视的信息保护与数据安全就是信息化基石最核心的两个支撑基点。"
消毒是贯彻养殖业“预防为主”方针的一项重要措施,而聚维酮碘具有广谱的微生物杀灭或抑制作用,对皮肤黏膜和呼吸道无刺激性和损伤,不产生二次污染,易于稀释,使用简便,性状稳
在当今信息时代,随着移动设备、互联网应用以及云计算模式的快速发展,数据中心已成为社会基础设施。然而数据中心面临资源利用率与应用服务质量之间的矛盾,一方面通过多个应用同
七星鲈曾经是高贵海鱼,售价曾高达一台斤600元,人工繁殖成功后产量增加,成为平价鱼种。养殖鲈鱼开始外销后,养殖产量渐增,产销偶有失调,近年池边价曾有18元/台斤的低价,也有130元/台
企业安全文化的定义和范畴企业安全文化是企业在长期生产经营活动中逐渐形成的或有目的人为塑造的,为企业全体员工所认同、接受和遵循的,具有企业特色的安全生产与生活的精
2002年3月18日至30日,中国消防标准化代表团赴澳大利亚参加了“第四届性能化规范与建筑防火安全设计方法国际会议”及ISO/TC92 2002年度会议,并利用与会的间隙,应邀参观考察
为保护石墨资源,优化资源配置,提高资源综合利用水平,引导石墨行业健康可持续发展,依据国家有关法律法规和产业政策,制订本准入条件.rn本准人条件所称石墨是指:晶质石墨(也称