基于主题融合的情感分类算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:ctk0836
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和智能终端的爆发式发展,巨大的社交网络群体和组织产生了海量网络信息,如何在非结构化的网络信息中捕捉分析民众的情感走向和发展,是一项重要的研究课题。中文文本数据相对于英文文本数据来说具有不同的表达形式,存在语法特殊性、语义多元、隐寓表达等诸多特点,除此之外当前大部分的中文文本情感分类方法属于比较浅层的学习方法,分类结果的准确性依赖于人工抽取的样本特征,且文本表达能力有限,随着数据量的增大和表达方式的增多,难以获得比较高的中文文本情感分类准确率。因此,结合中文文本特点进一步提高中文文本情感分类的准确率和性能是情感分类领域需要急切研究和解决的问题。本文结合中文文本的特点,在现有算法基础上加以改进与融合,展开对中文文本情感分类算法的研究,主要研究内容如下:对于中文长文本的情感分类模型,针对在传统深度学习模型中只使用词向量作为文本特征进行文本情感分类的缺陷性和局限性,提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)和双向门限循环单元(Bidirectional Gate Recurrent Unit,BGRU)主题融合的情感分类模型,该模型将使用topic2vec向量化技术得到的在同一向量空间的主题向量和词向量作为情感分类模型的输入,最后经过实验对比分析,验证模型的有效性;对于中文短文本的情感分类算法,针对在传统情感分类算法中词向量信息不足的问题,使用P_BTM模型得到的主题信息对词向量信息进行扩展,以获得更多的中文短文本特征,其中P_BTM模型是基于词对主题模型(Biterm Topic Model,BTM)改进,中文短文本的词向量通过改进的特征频率和倒排文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)算法得到,最后经过实验对比分析,验证算法的有效性。
其他文献
干净的图像可以为视频监控、目标追踪、目标检测、自动驾驶提供有保证的输入信号,保证这些任务可以正常运行。然而,雨是日常生活中常见的天气,在雨天拍摄的图像严重降低了视
“一花一世界,一叶一追寻”,在中国古代文学中,浪漫多愁的文人墨客总会在植物身上埋藏下自己当时的情思,赋予植物很多象征意义,因此书中花叶总有情。清代文学家张潮在《幽梦
随着移动互联网、人工智能等新技术的发展,如何安全、高效地对用户身份进行认证已变得日益重要。现有的移动端身份认证方法,如基于口令,指纹和人脸的身份认证,均属于一次身份验证方法。这些认证方法只在登录时认证一次用户身份,无法在用户后续访问期间提供连续认证。持续认证方法能够对用户身份进行持续地认证,能够有效地解决上述安全隐患。本文提出了两种持续认证方法,为满足用户在线认证需求,我们提出了基于长短记忆网络的
土地是人类生活的空间和载体,是生产发展的基本和源泉。我国城镇化的快速发展需要进行土地扩张,在城市土地资源供不应求的情况下,部分乡村建设用地由于缺乏约束机制出现土地粗放利用的问题。为确保常态有序地管理用地,昭化区在各乡镇开展城乡建设用地增减挂钩项目工作。本文通过对昭化区虎跳镇城乡建设用地增减挂钩土地整理项目的实际情况调研,同时借鉴国内外土地复垦适宜性评价研究成果,以第二次全国土地调查数据为基础,对虎
随着科技的发展,人们对天线辐射性能的要求越来越高,这种要求不仅体现在军事上也体现在我们的日常生活之中。目前的多波束天线大多数通过切换端口来获得多个波束,可以同时产
随着计算机技术的普及和生物领域的高速发展,生物医学领域文献的增长呈现指数级。如何从海量数据中快速高效地获取生物医学知识,这就涉及到信息抽取技术。问题蕴含识别是信息
椭圆曲线密码ECC(Elliptic Curve Cryptography)具有安全强度高、功耗低、存储空间小等优点,因此被广泛应用于身份认证、快速加密、数字签名等领域。但常见的ECC系统由于所基于的有限域、椭圆曲线及不可约多项式各不相同,所以无法避免互通问题,而设计一款支持双域运算的ECC协处理器可以有效的解决这一问题。本论文主要针对双域ECC协处理器设计中的关键问题进行研究。椭圆曲线加密的核心
物联网的发展促使海量实体接入到网络中,为其赋予了“智慧”,使物理空间与信息空间的融合加深,同时,将人与物、物与物紧密的联系在一起。然而,物联网环境中传感设备呈指数级
近年来,基于位置服务的应用发展迅速。用户可以基于位置进行信息检索,从而得到更加符合现实需求的检索结果。作为基于位置的信息检索的基础,空间文本查询越来越受到学者的关注。在空间文本查询领域,学者提出了多种查询方式解决现实场景中的问题,但现有的查询方式鲜有考虑到周围兴趣点对返回结果的影响。基于Top-k空间文本聚集查询,本文提出了基于密度聚类的空间文本查询。该查询方式为用户返回符合密度要求的结果簇集,即
近年来,随着我国工业的飞速的发展,对智能体的要求也变得越来越高。智能体可以为一个飞行器、一个卫星、一个带有微处理器的传感器等等。如今,单个智能体显然已经无法满足日渐复杂的控制需求。多个相对简单智能体的协作控制,概括而言,就是将单个复杂的智能体转换为多个简单的智能体的协作控制,使用团体协作的方式来完成复杂的控制任务。多个简单智能体的协作控制,符合现阶段科技技术发展的趋势。本文研究了由一般线性化智能体