基于组合深度神经网络的文本情感分析方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:jeeryf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机以及信息技术革命的推进,全球互联网用户在电商以及社交新闻平台频繁的活动产出了海量的不平衡文本数据,人们迫切希望从这些文本数据中来取得有用的信息并进行应用,文本情感分析方法就是其中的一个解决方法。文本情感分析方法目前比较成熟且应用于多个领域,如电商评论分类,新闻分类以及舆情控制等,但仍有以下挑战需要解决:第一,针对文档级别数据的特点,需要考虑其组成性语义特点,且句子之间的语义以及句子表征之间的依赖对文本分类是很重要的;第二,针对文本数据集的特点,应该考虑数据样本类别分布不平衡的情况。针对以上问题,本文研究基于组合深度神经网络的文本情感分析方法,本文的主要创新工作如下:(1)本文针对文档级别的文本数据的结构特性,提出了基于注意力组成神经网络的文档级别的情感分类(Att DR-2DCNN)方法,该方法首先构建了具有组成语义关系的文档矩阵表征,并在此步骤使用注意力机制来区分不同句子与单词之间的重要性;接着在文档表征上使用二维卷积神经网络来捕获句子维度上以及特征维度上的重要依赖关系,并在该步骤使用卷积注意力模块来改善卷积生成的卷积特征表达。实验结果证明了Att DR-2DCNN在文档数据集上的有效性。(2)针对现实生产环境下文本数据类别分布不平衡的特点,提出基于记忆模块的自适应不平衡文本情感分类学习方法(AILM),该方法在不需要人工数据重采样以及敏感函数设计的情况下,使用记忆模块来记住困难样本并在后期训练中提高困难样本出现的频率来自适应调整少数文本样本的分布,从而提高分类的准确率。(3)在上述研究基础上,使用中文文本数据集对基于记忆模块的自适应平衡文本分类学习方法的通用性进行实践,并通过微调参数来构建一个最优的中文新闻分类模型。
其他文献
双酚F(BPF)和双酚AF(BPAF)是一种内分泌干扰物(EDCs),通过干扰人和动物的内分泌系统,进而会造成人和动物包括生育能力下降、女性化、生殖器官异常等变化。研究出一种灵敏、简单、快速的分析检测方法检测环境样品中BPF和BPAF,对EDCs污染的防范监控并使其在安全使用范围内具有重要意义;通过电化学和光谱方法研究BPAF与人血清白蛋白(HSA)的相互作用,揭示了 BPAF的毒性及在血液流通过
自十九大以来,中央及地方政府接连发布多项措施,对房地产市场进行调控,进一步遏制房价上涨。对于地产开发商,不但需要面对国家调控政策所引发的房价下行压力,同时还需面对不
随着经济的不断升级和发展,传统的商业模式已经很难跟上现代经济的发展,市场环境的变化使得企业间的竞争升级为商业生态系统间的竞争,更多企业开始采用平台战略来提升公司竞
四氧化三姑(Co3O4)是一种典型的p型半导体气体传感材料,如何有效改善Co3O4材料的气敏性能是研究人员关注的热点。论文采用水热法通过表面活性剂辅助制备了棒状Co3O4材料和K元
三元乙丙橡胶(EPDM)饱和的分子主链使其具有优异的耐热、耐老化、耐臭氧等性能,广泛应用于汽车、密封条、电线电缆等。本文选用长链支化度不同的EPDM为原料,并对长链支化进行
随着红外遥感技术的发展迅猛,红外测量设备在卫星对地观测、军事战略部署、辅助气象观测以及灾情的监测防治等领域被广泛应用。随着技术的不断发展、红外遥感信息定量化应用
林业是生态文明建设的主体,森林具有生态、经济和社会等多种功能。森林保险工作是深入推进集体林权制度改革的重要金融配套措施,在保障国家生态安全、保护森林资源、稳定林业
行人检测一直是计算机视觉领域的研究热点,近年来随着深度学习研究的快速发展,行人检测已被广泛应用于自动驾驶、智能安防和智能机器人等多个领域,这使得行人检测在学术界和
在传统的化工生产流程中,往往需要建立一个可靠的数学模型用来表示进料输入与产出之间的联系,为操作人员更加精准地把控生产流程提供方便。然而,目前存在于石油化工流程中的
巨菌草种植属于其产业全程机械化生产劳动强度最大且作业最为繁琐的一个环节,现有种植设备存在喂入人工多、种植均匀性与连续性较差以及损种导致发芽率低等问题,尤其不能适应