结合深度学习和特征嵌入的句子分类方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:hcyzhcyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展导致网络文本数据的急剧增长,深层次的神经网络模型因能较好地表达数据特征而被广泛应用于文本分类任务中,其中最为成功的是卷积神经网络(Convolutional Neural Network,CNN)和长短时记忆网络(Long Short-Term Memory,LSTM),但其性能却受到了一词多义、同形异义问题的影响。因此,研究如何缓解词的歧义性问题以提升深度学习模型的分类性能具有重要意义。通过系列实验,剖析了短文本数据稀疏对分类性能的影响和度量了主题特征的语义连贯性。针对短文本数据集,结合融合连续语义信息和离散主题信息的思想,使用主题特征提供的全局信息对“词语”和“句子”两个粒度的特征进行修正,分别提出了基于主题嵌入和卷积神经网络的句子分类方法与基于主题嵌入和长短时记忆网络的句子分类方法。针对短文本呈现序列化且前后逻辑相关的特点,结合双向LSTM捕获完整上下文信息的特性,在输入层融合词向量和字符向量,并在双向LSTM层之间嵌入特征,提出了一种基于多连接双向LSTM的句子分类方法。在公开的真实短文本数据集上进行分类性能对比和特征融合分析实验,实验结果表明,所提方法在准确度上优于现有的基线方法,也即表明将有效特征融入到深度学习模型中能有效地缓解词的多义性问题,从而更好地表示短文本的语义,提高分类性能。
其他文献
随着我国建筑行业的崛起,高层建筑已成为建筑行业发展的一种趋势,擦窗机作为高层建筑外墙维护清洗设备,得到了越来越广泛的使用,擦窗机的实用性、易维护性和安全性越来越受到
在整个项目管理中的项目质量管理的地位举足轻重。项目质量管理工作的成败很大程度上决定了项目的成功和企业的发展。优质的项目质量,除了可以给项目工程以及企业带来社会声
钙是枣果实生长发育过程中不可缺少的营养元素,对枣裂果的防治也有重要的作用,本试验以山西省太谷县壶瓶枣(Ziziphus jujuba Mill.‘Huping zao’)为试材,对壶瓶枣树喷施不同
随着现代农业的不断发展,化肥的施用量不断增加,进而导致Ca(NO3)2的过量积累,对植物的正常生长造成胁迫。大量研究证明,在C02浓度升高时,植物的生物量及其产量均有所增加,且
目的:通过观察在止咳1号方干预下慢性阻塞性肺疾病(痰热郁肺证)患者中医证候积分、炎症指标、肺通气功能、6分钟步行距离、肝肾功能等变化,评价止咳1号方治疗慢性阻塞性肺疾病(痰热郁肺证)的临床疗效,探求治疗慢性阻塞性肺疾病的临床新思路。方法:总共纳入病例72例,干预组及对照组各36例。干预组给予西医常规联合止咳1号方治疗,对照组予西医常规治疗。治疗10天后评定疗效。观察治疗前后对照组及干预组中医证候积
新疆八一钢铁地处石油资源丰富的新疆,占有得天独厚的地理优势。因此J55油井专用套管的研制开发对八钢的产品升级与效益的提高都至关重要。本文结合八钢设备改造和新产品开发
反式脂肪酸(Trans Fatty Acid;TFA)是含有反式非共轭双键的不饱和脂肪酸总称。食品中的反式脂肪酸主要来源于植物油的氢化加工和精炼脱臭过程,也产生于过度加热过程。少量天
基于结构动力响应测量对结构刚度等物理参数进行识别,借此描述结构状态和损伤,评估结构状态与性能,进而对结构进行补强,提升结构的性能是土木工程领域重要的课题之一。实际工
污水处理系统中往往本身含有一些日常生活中常见的纳米颗粒,如ZnO、TiO_2等,这些纳米颗粒由于在人们日常生活中起着不可替代的作用而不可避免地会富集在污泥中。为了探究常见纳米颗粒对市政污泥的影响,本文选用了TiO_2、Fe_3O_4、Al_2O_3、ZnO四种氧化物纳米颗粒,探究了这四种氧化物纳米颗粒对污泥胞外聚合物含量、胞外聚合物中蛋白质二级结构产生的影响以及这四种纳米颗粒对污泥脱水性能产生的影
水平受荷分析是桩基设计计算的重要内容之一。以往的水平受荷桩的研究大多针对于平地桩基,而随着我国西部山区基础设施建设的高速发展,为了满足公路平纵线性及保护自然环境的