机器学习混合情感词典方法在客服热线情感分析的运用

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:carinalove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社交媒体的快速发展,越来越多的人倾向在社交平台发布消息,表达自己的意见,传达自身的情感。通过汇总这些信息可以分析主体的情感倾向,从而进行舆情监控和市场营销。同样在很多服务性行业通过使用情感分析技术对客户进行情感追踪,将会更好地服务客户,提升客户对企业的信赖。  情感分析的主要任务是判定文本数据的情感倾向,即积极,消极还是中立。一般用于情感分析的方法有基于情感词典和基于机器学习的方法。其中,情感词典需要在通用的情感词典库上建立领域的情感词典库,最终通过匹配文本的极性词,判定文本所属的情感极性。而机器学习则需要对大量的行业语料库进行标注,选择合适的分类模型对文本进行情感状态判定。本文选取申能集团客服热线的文本数据作为研究对象进行情感分析工作的研究,将领域情感词典用于情感分析的方法与机器学习混合情感词典的方法进行实验对比。论文的主要研究工作如下:  ①结合目前的基础情感词典,加入了否定词、程度词以及停用词,通过word2vec开源工具对领域情感词典进行扩展,有效地提高了基于领域情感词典对于文本数据情感倾向判定的识别率。  ②提出了声学特征融合情感词典方法对客服热线数据进行情感分析,验证了声学特征在一定程度上对情感倾向具有辅助作用。  ③使用机器学习方法混合情感词典方法对文本数据进行情感判定,选取XGBoost分类器代替传统机器学习方法,提升了识别效果。
其他文献
联机分析处理(OLAP)是当前数据仓库应用和决策支持系统(DSS)的研究热点.OLAP查询通常需在海量数据上进行即席(ad hoc)的复杂聚集查询,并要求及时向用户提供分析数据,用以辅助
分子对接旨在预测研发许多疾病药物的先导化合物,这在生物信息学的药物设计过程中有着举足轻重的作用。然而,其需要巨大的计算成本。为此,缩短分子对接时间消耗将有效的加速药物
随着网络技术与应用的不断发展,计算机网络在我们的日常生活中已经变得越来越普遍。这些网络的发展使得大到国家经济命脉小到个人日常生活严重依赖于计算机网络,因此网络运行的
电子病历文本中的时间信息,对于标识患者从入院到出院期间不同阶段的病情变化,有着不可替代的作用,因而时间信息抽取在医学领域中受到越来越多的关注。时间实体抽取难点在于:电
RadM造型系统是我们针对虚拟现实场景造型和虚拟角色造型的需要,构造的一个界面简洁友好、操作方便的造型系统。为了使该系统输出的模型能够以更优化的形式提供给大多数的实时
随着互联网的快速发展,信息安全问题显得日益重要。相关网络安全协议应运而生,而它们的基础都是安全高效的加密算法,椭圆曲线加密系统与其他公钥加密系统相比有许多优点,受到国内
该论文从计算机视觉的几何理论出发,针对计算机视觉中的一些热点问题进行了研究.论文的主要研究内容及研究成果如下:●首先对图像匹配问题进行了研究.图像匹配是立体视觉、运
元搜索引擎通常被称为搜索引擎之上的搜索引擎。用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一
医疗术语的翻译对于科技交流十分必要。然而,由于医疗术语数量巨大,并有一定的组合特性,不能完全由字典覆盖。此外,医疗术语的翻译既有领域特性,又有句法特性,具有一定的难度。  
显露模式(Emerging Patterns,EPs)是指那些从一个数据集到另一个数据集支持度发生显著变化的项集,它们能够捕获数据库中两个数据集之间的多个属性上的差异,可以用来建立分类器。