面向社交文本的情感识别研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:zxtx001209
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自Web2.0普及后,人们逐渐习惯在互联网的各种平台上分享他们的想法和情感。透过对这些媒体进行情感分析,可以得知人们对特定人事物的想法和态度。对人们的想法快速作出响应能够带来相应的商业价值和政治价值,其相关技术也因此得到了重视。文本作为社交平台上的主要媒体之一,面向文本的情感识别在近年也成为了热门的研究领域。本论文的主要内容如下:1.多分类器分层识别算法。随着现实中应用场景变得复杂,需要解决的多分类问题越来越多。当区分的类别越多,机器学习算法对数据进行拟合的难度越高,另外对识别性能的要求也变得复杂。为此,我们提出了一种多分类器分层识别算法框架,把一个多分类问题拆解成多个子分类问题的叠加,再透过逐步回答每个子问题得出识别结果。此算法框架有以下优点:首先,由于识别过程中每一步只关注一个子分类问题,整个算法的识别性能能从局部进行调整,以满足特定的性能要求;其次,算法中的每个组成部分可以分别采用不同的模型,以此结合不同模型的建模能力;最后,此算法框架与研究的媒体无关,适用于其他领域的多分类问题。本文基于国际比赛Sem Eval-2018任务三的微博反讽识别进行实验,结果显示算法超过了当时排名第一的系统,而透过对算法中间结果的分析验证了算法设计的合理性。2.结合上下文的多通道模型。在某些场景下,仅凭一段文本无法准确理解发言者想表达的意思和态度。为了处理这种情况,一些文本情感识别研究会引入上下文作为提示。为此我们提出了一种多通道模型框架,让不同部分的上下文经过不同的编码器来提取特征,再合并正文的信息得出识别结果,以此应付各部分上下文对识别目标起不同作用的情况。我们将此模型应用于面向三轮对话的情感识别,并结合前述的算法框架提出了另一个多分类器分层识别算法。在国际比赛Sem Eval-2019任务三的参赛结果显示算法达到了当时排名前?的性能,这同时验证了多分类器分层识别算法框架适用于不同的多分类问题。
其他文献
20世纪90年代,随着福利分房制度在我国取消,房地产商品化制度开始全国推广,这一变化对改善民生、拉动经济增长起到重要作用。随着房地产经济过热愈演愈烈,国家宏观调控变得常态化、长期化,纯住宅类产品给企业带来的利润空间越来越小,房地产企业的生存环境日益恶劣,迫使房地产企业更精准的分析市场,推出符合需求的产品。另一方面,随着社会经济的发展,人们的生活水平已发生了翻天覆地的变化,对房地产产品的要求标准也日
学位
学校文化是一个集显性事物与隐性事物于一体的复合体,是涵盖学校内的一切精神文化与物质文化的统称,是学校一切精神文化与物质文化的凝结、融合与升华,主要包括精神文化、制度文化、物质文化。学校文化的价值主要体现在凝聚力、约束力及社会影响力三个方面,但当下学校文化建设则面临着与学校课程设置分离、缺乏参与积极性以及规范的体系结构等困境。基于此,学校物质文化建设可以给予学生适当的权限并让学生参与校园的空间布局规
期刊
近年来,中国越来越重视发展清洁能源,作为高效清洁能源代表的核电迎来大发展。核电具有技术先进、质量要求高、安全可靠、分工精细等特点,被广泛应用在能源结构升级。但目前核电建设存在周期长、投资巨大特点,核电建设中出现的一些进度滞后问题,其经济效益越来越被重视研究。柴油发电机组作为核电站的重要系统设备,其能否顺利完成相关安装,对重要节点的实现有着较大影响。本文以核电站柴油发电机组安装作为研究点,从总承包商
学位
不论是何种意义上的法治教育,科学性、系统性和实践性都是法治教育的基本特征。面对新时代我国法治国家建设和法治教育实践的现实问题,以我们正在做的事情为中心,着眼于对马克思主义理论的运用,对实际问题的现实思考是我们当前研究《道德与法治》教材法治教育内容所应具备的基本价值取向。全面推进中国特色社会主义法治国家建设事业的发展,无疑是当前中国社会发展的一大实际,也是进行《道德与法治》教材相关理论研究和实践发展
学位
过去30多年来,铜氧化物被认为是最有潜力的高温超导材料。传统BCS理论的电声相互作用是否能解释铜氧化物的高温超导电性一直存在争议。寻找铜基超导体系内各种氧化物的结构共性,例如层状结构、CuO2超导层、反铁磁Mott绝缘体母体,已成为理解铜氧化物高温超导电性微观机制的良好切入点。铜氧化物的超导电性来自于对电荷库层的掺杂,而超导主要发生在CuO2面上。因此,紧紧围绕CuO2超导层这一关键点进行研究,对
学位
建设生态文明,是关系人民福祉、关乎民族未来的长远大计,全方位构建生态文明是历史的必然。在原城乡规划领域,国土空间规划体系建构就是对其重要地位的最好阐释,展示了文明演替和时代变迁背景下的重大变革方向。另一方面,在国家复兴的伟大征程上,保护历史文化遗产,树立民族自强自信也是极为重要的工作之一。因此,在生态文明中,尤其是在生态文明最直接的载体空间——绿地生态空间中如何更好地结合历史文化遗产,传承民族文化
学位
采用预应力混凝土剪力墙是解决高层建筑中剪力墙在地震作用下拉-剪破坏的方法之一。本文研究了有粘结预应力钢筋混凝土(RC)剪力墙的抗震性能,检验其正截面和斜截面承载力计算公式,并同钢骨混凝土(SRC)剪力墙抗震性能进行对比。主要工作和结论如下:(1)完成了剪跨比λ=2的3个预应力RC高墙试件和1个SRC高墙试件的拟静力试验,研究了预应力RC高墙在定轴力或拉-压变轴力及水平往复荷载下的破坏模式和抗震性能
学位
进入21世纪以来,世界范围内可再生能源发电所占的比重持续增加,对电化学储能技术的需求越来越高。作为电化学储能设备的关键组成部件,液态金属电极一方面具备固态金属电极的高导电性,高导热性的优点,另一方面能有效避免电极出现腐蚀现象及枝晶生长,因此具有广阔的应用前景。液态金属电极与电解质是否匹配对电化学储能设备的性能表现至关重要。本文将以固体氧化物燃料电池为例研究液态金属电极与固态电解质的耦合特性,以液态
学位
Ablowitz-Ladik方程是孤子理论中最为重要的非线性微分-差分可积方程之一.近年来,在对于局部??~1的Gromov-Witten不变量的研究中,Ablowitz-Ladik方程以及与其相联系的可积方程簇进一步显示出了它的重要性,Brini猜想这些Gromov-Witten不变量的生成函数给出了Ablowitz-Ladik方程簇的一个特殊解的tau函数.本文的一个主要结果是给出了Ablow
学位
既有建筑的地基加固技术的运用,在国内已有很多相关研究,其主要技术例如托换、高压注浆技术等的研究和实践,在实际工程中提供了诸多成功案例供同类工程参考和借鉴。但随着我国每年新增大型项目特别是大型电厂工程逐步增多,其建设场地的地质条件和环境较为复杂,当大型厂房在安装调试阶段出现不均匀沉降时,对其作为既有建筑物的属性需要具体分析,考虑其所处环境的特殊性,在选择基底加固方案时需要保证工期要求,确保厂房及其基
学位