中文社交网络短文本情感分析研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:yehyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
移动互联网的井喷式发展使得社交平台短文本正以爆炸式的速度产生,然而传统文本分析方法难以应对短文本的稀疏性、随意性与热词性,且大部分应用深度学习的短文本分析都是针对英文语料,如何高效地分析、提取中文社交网络短文本的情感倾向具有不可估量的商业和社会价值。本文首先系统分析了传统文本情感分析模型,将词典方法与机器学习模型结合,完成情感分类器的训练。发现词典方法并不适用于简短随意的短文本,且传统方法数据预处理阶段滤除表情字符,造成重要情感特征的缺失。本文引入深度学习模型,结合社交网络短文本的特点,提出面向中文社交网络的短文本情感分析新机制。一方面使用word2vec工具训练词向量,提取短文本的语义特征,另一方面保留、提取微博文本中的表情字符,作为情感特征,共同构成多维特征集合;再通过卷积神经网络模型挖掘深度抽象特征,最终训练分类器完成情感分类任务,解决传统方法难以对短文本有效建模、分析的问题。实验结果表明,表情字符的融入使得情感分析准确率相对提高2.62%;此外,相比基于词典的机器学习模型,基于卷积神经网络的多维特征情感分析新机制将情感分析准确率与F度量分别相对提升21.29%和19.20%。
其他文献
由P W M整流器和P W M逆变器组成的变频器称之为双P W M变频器或AFE(Active Front End),可实现能量双向流动,能够提高电能的利用率,把由电动机产生的再生能源回馈到交流电网,
在"建设新江苏"的宏伟蓝图下,分析江苏省终身教育发展现状,探索终身教育体制建设和体系建设,以教育信息化视角审视信息化在现代教育体系中的重要作用,构建"建设新江苏"所需的终身
Daintain(大炎肽)是1994年由Chen等从猪的小肠中分离纯化出的一种新的生物活性蛋白,其氨基酸序列与1995年由Utans等人在大鼠心脏移植排斥反应中克隆出的巨噬细胞因子Allograf
语文教学必须致力于学生各方面能力的提高,培养学生的创新能力是语文教学的重要目标。在语文教学中,应该鼓励质疑驳问,引导学生进行求异思维、求同思维,激发学生联想和想象,
期刊
以硝酸铈铵(CAN)为引发荆,采用水溶液聚合法.制备了阳离子瓜尔胶与丙烯酰胺的接枝共聚物(pAAm—g—cG40)。将制得的接枝共聚物作为阳离子絮凝剂,应用于生活污水的净化处理。结果表明
黑龙江外事学校是经省教育厅批准备案并直接管辖,归省招生办直接录取,由省教育厅颁发并验印普通中专毕业证书,省人事厅颁发派遣证的一所民办普通中专学校。
期刊
当生产力发展到一定程度的时候,在高速的经济趋势的带动下,技术就开始了它自身发展脚步。最近这几年,我们国家在很多领域都出现了与之相对应的技术。其中工作中用到的人机识别体系的发展,为我们开展工作提供了非常有利的帮助,笔者基于这种背景环境重点的分析了以马赛克图形为基础的人机识别体系。
目的:探讨分析补肾扶正汤在临床上治疗不孕不育症中的效果。方法:选取我院2014年11月-2015年11月收治的免疫性不孕不育男性患者80例作为观察对象,将其随机分为观察组和对照组各4
目前,我国经济正开始走向一个新的时代,“房住不炒”的定位决定了未来房地产行业的发展方向,政策的改变影响着房地产项目的投融资决策.论文理论联系实际,为房地产项目前期咨
所谓管理,乃是适应共同劳动的需要所进行的计划、组织、指挥、调节、监督等一系列活动。对于渔业生产来说,只有把每个渔业劳动者的行动统一于共同目标之下,使个人目标服从共同目