【摘 要】
:
在如今大数据时代的背景下,各种各样的社交媒体的出现带来了互联网中数据的指数型增长。有了可获得的大量数据,越来越多的研究学者也就根据这些数据进行了大量相关的研究工作,比如社交网络中关键节点的发现研究、社区发现研究、基于文本的推荐算法研究或者情感分析相关研究。本文的研究工作将是对短文本中所包含的情绪进行分析,并且也将文本中出现的非文字信息表情符号纳入情绪分析的过程中。本文的研究工作目的是将根据美国学者
论文部分内容阅读
在如今大数据时代的背景下,各种各样的社交媒体的出现带来了互联网中数据的指数型增长。有了可获得的大量数据,越来越多的研究学者也就根据这些数据进行了大量相关的研究工作,比如社交网络中关键节点的发现研究、社区发现研究、基于文本的推荐算法研究或者情感分析相关研究。本文的研究工作将是对短文本中所包含的情绪进行分析,并且也将文本中出现的非文字信息表情符号纳入情绪分析的过程中。本文的研究工作目的是将根据美国学者Ekman的情绪分类理论,把文本中所包含的情绪分为开心、伤心、愤怒、惊喜、难过、恐惧等六类当中的某一类。通过对相关研究文献进行阅读整理,现有的研究工作主要是进行情感的二分类或者三分类即把情感分为积极、消极或中性,很少对中文短文本进行情绪分析。并且在进行情绪分析时,已有的研究工作大多数都将短文本中所出现的非语言信息直接过滤掉或直接与文字信息一同处理。目前深度学习的方法在其它文本处理方面的应用呈现较好的效果,所以本文将深度学习方法引用到文本情绪分析任务中来的也是一种新颖的应用方式,因此本文就此进行了如下的研究工作:(1)将短文本中所出现的表情符号纳入文本情绪分类任务中来。根据数据集当中表情符号的分布情况,通过数据统计分析的方法得到每个表情符号对每一种情绪种类的倾向程度。(2)输入文本的分类预处理。在进行文本嵌入之前,通过情绪词典和表情符号词典来判断输入文本当中是否含有显性情绪词或表情符号,从而将输入文本分成四种不同的句子类别。然后在后续的任务当中,根据不同文本类别学习不同的融合权重,从而进行情绪特征的融合以达到更好的情绪分类效果。(3)情绪分析模型的提出。根据(1)、(2)部分的研究并且结合深度学习方法当中的Bi-GRU网络推出本文基于语义和表情符号的情绪分类模型SEER(Semantic Emoticon Emotion Recognizer,SEER)。模型中通过Bi-GRU网络并且也引入自注意力机制,来更精确的提取自然语言文本中所包含的语义情绪特征,然后和表情符号的情绪特征进行融合进而完成文本情绪分类任务。最后,通过在两个数据集上进行对比实验证实了表情符号在文本情绪分析任务当中的作用,也证实了本文所提出的新模型对文本情绪分类的有效性。
其他文献
随着我国工业与交通业的快速稳定发展,轻型车排放的污染物对我国大气环境质量造成的影响越来越大。而行驶工况是评价车辆油耗与尾气排放的重要指标,所以构建有效的行驶工况能够促进汽车节能减排技术的发展。本文数据采集时长为两个月,采集地为福州,以三辆轻型车作为试验车辆,构建福州市轻型车城市道路的行驶工况,本文的主要内容如下:选取了插值补齐与设定阈值上下限的预处理方法,对不良数据进行筛选去除。然后制定短片段划分
电液位置伺服控制系统因其功率密度比大、高精度、高频响等诸多优点广泛应用于导弹系统、数控机床、航空航天、军工武器等领域。由于属于典型的非线性系统,存在参数摄动、扰动大、不易获得精确数学模型,从而影响电液位置伺服系统的动态响应速度、控制精度和抗干扰性能。基于此,本文研究了在参数摄动、随机扰动情况下的阀控非对称缸电液位置伺服系统控制策略及其实验验证。首先针对电液位置伺服系统具有强非线性、参数摄动等因素以
公路大件运输承运货物往往是国家重点建设项目(如桥梁、铁路、核电站等)的关键设备,生产周期长、价格昂贵,须保证静态装载和动态运输的安全可靠性。为了实现静态装载和动态运输货物重心可视化,根据《超限运输车辆行驶公路管理规定》(2016年第62号令),满足大件货物交通运输要求,提出一种基于Android的公路大件液压平板装载及运输货物重心可视化监测方法。对货物装载和运输相关参数数据进行接收、处理及显示,对
在前人研究斜循环矩阵、H-循环矩阵的基础上,探讨以Pell与Pell-Lucas数列之积为元素的斜循环矩阵、左斜循环矩阵、H-循环矩阵的相关性质.首先通过构造变换矩阵的方法研究了n阶斜循环矩阵An的行列式,利用Euclidean范数公式、行最大范数公式、列最大范数公式,求得An的三种范数,再利用公式求得An的扩展式的上下界,同时又由Euclidean范数与谱范数之间的关系,获得An的谱范数的上下界
氮化硅陶瓷材料是结构陶瓷材料中的超硬材料,具有强度,硬度高、蠕变小、抗氧化性好、耐磨损、耐腐蚀等优异性能,是一种理想的高温结构材料和高速切削工具材料。目前学者对于其制备工艺的研究主要集中在热压,气压等烧结方式,对于常压烧结研究较少。常压烧结适合批量化大规模工业生产,但同时带来了烧结工艺难控制、烧结试样变形严重、试样致密度差,力学性能差等问题。本文就氮化硅陶瓷基复合材料在常压烧结条件下的工艺研究以及
随着互联网的发展和移动通信技术的进步,短视频成为新的信息传播载体。短视频的用户量和数据量十分庞大,其发布需要进行内容审核,当前大部分审核需人工完成。将视频内容自动标注技术应用于短视频内容审核,将极大提高审核效率。本文主要研究基于迁移学习的短视频语义标注生成方法,包括关键帧提取、重点区域检测和图像语义描述等步骤。研究结果可广泛用于视频内容审核和媒体资源管理系统中,具体研究内容主要包括以下几方面:(1
高粱是我国重要的杂粮作物,但由于其自身抗营养因子含量高、蛋白质品质不佳、赖氨酸缺乏以及口感粗糙等原因在食用方面仍停留于传统的加工方式。国内对高粱加工品质与应用特性缺乏系统深入的研究,且滞后于国外。高粱不含麸质,是制备无麸质食品的优良原料。近年来,我国因麸质过敏引起的乳糜泻患者不断增加,而目前治疗乳糜泻唯一有效的方式就是严格控制含麸质食品的摄入。当前国外市场上已有较成熟的无麸质食品,而我国对无麸质食
随着智能技术的快速发展,车辆智能化成为目前最热门的研究方向之一。车辆高级辅助系统与车联网的有效结合,能够为驾驶人员提供安全的驾驶环境,减少交通事故的发生概率,从而提高行车安全。其中,车辆前向碰撞预警作为车辆高级辅助系统中的关键技术之一。基于传统视觉的前车碰撞预警方法中,由于存在目标检测精度不高,无法对多目标进行有效测距以及碰撞风险评估策略不准确等问题,导致整个系统预警误差较大,针对上述问题,主要研
中国制造业向着高端化、智能化、信息化不断发展,由于工作环境的错综复杂、人机交互的日益频繁,各式各样的机器人随之出现以适应环境的不同,一类高负载比、小质量、安全性可靠却伴随着精度和抖振问题的柔性关节机械臂受到了广泛的关注。由于执行器不可避免存在输入饱和、死区等非线性特性;同时随着科技的进步,对暂态和稳态控制性能要求日益增高,需要对系统输出进行约束;并且由于柔性的存在,在保证轨迹跟踪的基础上,设计出实
随着我国经济的快速发展,对于汽车的需求不断增加,消费者对于汽车的要求也越来越高,汽车不仅要具备良好的驾驶性能,车身外观也要求具有更好的品质。要获得高质量的车身,就需要具有更高性能的涂装设备。在进行车身涂装时,旋杯静电雾化器喷涂是最为常用的涂装方式,凭借其性能稳定、节能环保、涂覆均匀、对人体伤害小等优点,被广泛的应用于自动化喷涂技术中。大多数的旋杯静电雾化器采用的是气动涡轮来进行驱动的,该涡轮的核心