面向新闻文本的情感原因抽取算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:szmms
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新闻媒体的发展,越来越多的网民通过官方微博、官方微信公众号、新闻客户端等途径来了解热点新闻,然而由于新闻的数量巨大且不断传播、存在重复的新闻等,导致单靠人的浏览和阅读很难系统的整理出所有新闻、并从中提取出有价值的信息;同时另一方面,大量的文本使得决策者难以客观的评价新闻的准确性并做出及时的回应,例如辟谣等。最好的情感分析模型能深度学习文本,并且在预测文本的情感极性上可以达到80%至90%的准确率。很遗憾,尽管有很多应用已经做到分析文本的情感,但这是远远不够的。为了使得情感预测能够被更好的应用,决策者需要知道是什么原因导致的这个情感。舆情分析系统中,决策者需要知道哪些根源性的问题导致的舆情分布,而这目前在热点事件中的民众情绪分布原因较少涉及。情感原因抽取任务目标就是从带有情感色彩的长句中抽出含有原因的子句。本文将从以下三个方面研究:基于条件随机场的情感原因抽取、基于神经网络结合条件随机场的情感原因抽取、基于记忆网络的情感原因抽取。实验结果表明基于条件随机场的原因抽取要优于基于知识库、基于规则的方法;基于神经网络结合条件随机场的模型识别非原因子句有极大帮助;基于记忆网络的原因抽取、相同词向量矩阵的记忆网络、结合注意力机制的记忆网络、增加上下文窗口的记忆网络是有助于实验效果的提升的,同时更改问句的方式、更改句子长度、更改层数大小对实验结果都有直接影响。
其他文献
情绪原因提取任务是自然语言处理领域中最重要的应用之一,是文本情绪分析的一种。该任务的主要目的是从大量的文本数据中提取出导致情绪词产生的原因。目前对互联网文本情绪分析的研究较多,但是大多数研究仅仅关注情绪类别,属于比较浅层的情绪分析,这对文本情绪分析而言是远远不够的。因为大多数时候决策者更关心到底是什么原因导致了这些情感,由此衍生出了更深层次的情绪分析任务:情绪原因提取。但是由于情绪描述和文档之间存
随着市场经济体制的逐渐完善和数字化经济的飞速发展,商业银行之间的竞争愈加激烈。传统依靠物理网点建设和人海战术的零售业务营销模式,也同样面临着数字化变革。而且随着外部监管形势趋紧,资管新规、LPR等政策的推行,商业银行的利差空间逐渐被压缩,如何以更低的成本准确获取客户需求、提供服务、拓宽基础客群,进而实现可持续发展,将是当前乃至未来商业银行零售业务面临的发展方向。故此,本文对商业银行零售业务数字化营
“脱贫攻坚”是保障和改善民生的重要工作,有利于完成全面建成小康社会的目标。《人民日报》作为中国共产党中央委员会机关报,对“脱贫攻坚”这一专题给予了高度的关注。在脱贫攻坚工作验收关键时期,研究新闻评论话语表达可以使《人民日报》更好地引导舆论,凝聚社会向心力,为脱贫工作顺利验收贡献力量。批评性话语分析强调将话语分析与社会现实相结合进行分析,本文运用批评性话语分析方法正是契合了从话语分析出发研究新闻评论
社区冲突在政府将权力下放至基层后成为现代社区建设不可回避的重要议题之一,并且随着社区功能的拓展和地位的提升,社区冲突时常发生。此外,现代社区逐渐由"单位制”转变到"社区制”,这种社会管理体制的转变在一定程度上给人们带来了人与人之间、人与公共空间之间距离的疏离和情感上的疏远,这也是引起社区冲突的原因之一。有效的社区冲突解决机制是化解城市社区冲突的重要保障,传统冲突解决机制中普遍依靠的是行政强制力量,
经过几十年的发展,我国在高速铁路建设领域取得了举世瞩目的成就,高速列车技术领跑世界,“和谐号”和“复兴号”已经成为快速、舒适的代名词,无论是长途还是短途出行,越来越多的人选择乘坐高铁。传统列车通信网络只能保证列车控制业务的可靠传输,不能为旅客提供稳定、可靠的上网服务,但是在移动通信技术高度发达的今天,如果乘车期间无法保证旅客对网络的有效访问,那么将严重影响旅客的乘车体验,甚至造成极大的经济损失。随
连续刚构桥的主梁具有较强的抗弯和抗扭刚度,其桥墩柔度又可以适应由荷载、徐变和温度等因素导致的结构变形,因此可以满足跨径较大时的结构受力要求。然而连续刚构桥在广泛应用的同时,部分桥梁发生的过度下挠已经威胁结构安全。因此,有必要采取措施对连续刚构桥结构下挠予以控制。本文以里耶特大桥为工程背景,对应用于连续刚构桥挠度控制的自适应系统进行研究,其主要内容和结论如下:(1)比较了卡尔曼滤波法、BP神经网络和
糖尿病性视网膜病变是糖尿病的严重并发症之一,已经成为当今世界成年人视力障碍和失明的主要原因。将深度学习应用到该病的病变检测中,根据病变程度的不同进行分类,可以辅助
教育改革的实施过程中,加快小学数学教学的改革进程就显得比较重要,要充分注重在数学教学中运用生活化以及情境化的方式,促进教学质量的提升。基于此,本文先就小学数学教学的
灰阶超声及超声造影技术目前被成功用于筛查乳腺肿瘤,而且由于其具有无创伤性,价格低廉等优势,是乳腺肿瘤早期筛查的主要工具。随着人工智能技术快速发展,将深度学习及模式识别技术运用于临床医疗的辅助诊断分析中,已成为当今医疗影像的研究热点。本文研究将乳腺灰阶超声及超声造影结合,形成双模态影像进行良恶性识别。由于双模态影像存在成像质量问题:如对比度低、含有斑点噪声、病灶区边缘不清晰等,且乳腺肿瘤中的困难样本
2019年上半年,全国海关监管进出境快件1.38亿票,商品价值247.5亿元,同比分别增长53%、10%。进出境快件业务商品的多样性、参与环节及构成的复杂性、业务本身的创新性等特征,决定了如何在保证海关监管质量的前提下做好进出境快件业务监管风险管理,是当前海关面临的棘手挑战。本文首先通过相关领域的背景研究及文献综述,提出有关理论在与海关进出境快件实际监管业务上结合的不足,认为进出境快件业务由于其自