基于深度学习的中国-东盟微博情感分析研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:aramis_Rose
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国-东盟互联互通不断深入,对于中国和东盟国家的网络舆情研究尤为重要,现有对于中国-东盟民间舆情分析的研究相对较少,因此本文基于深度学习算法展开中国-东盟微博情感分析,研究具备较强的理论意义和实用价值。首先,采集并筛选了与“东盟”话题相关的微博评论数据作为本文的实验数据集。基于微博数据的特点和结合民间舆情观测库需要,提出CONV-SAWB和LST-SAWB情感分析算法。进行超参数调优实验和网络模型训练,利用训练好的模型对测试集进行预测分类,通过实验结果对比表明CONV-SAWB和LST-SAWB的各项评价指标都优于SVM,表明深度学习模型比传统机器学习模型能更好地进行中国-东盟微博情感分析。其次,由于CNN只进行局部特征提取,LSTM计算量大且对长文本的上下文联系会减弱。研究将两种算法进行结合,提出CLST-FMSA融合算法,利用CNN提取特征能力降低数据计算量以及LSTM的学习记忆能力更好地进行情感分类。虽然LSTM拥有长期记忆功能,仍无法对句子的后面信息进行获取,仅依靠前面的历史信息是不全面的。因此对LSTM网络进行改进,提出CBLS-FMSA融合算法,使其能综合前文信息和后文输入序列对情感极性进行整体分析。考虑到某些特殊情感词包含的信息对情感分类会产生关键影响,提出Att-BLS-FMSA融合算法,将注意力机制引入到双向长短期神经网络,提高语义特征中重要部分的权重来生成最终的文本特征。进行实验对比分析发现多模型融合比单模型更精准地做出情感分类预测,其中Att-BLS-FMSA融合算法的情感分类效果相比其他算法更具优势。最后,将本文提出的多模型融合应用到中国-东盟海洋大数据平台情感分析上,用户可以查询东盟各国的情感极性、各类指标得分情况。不仅满足中国-东盟海洋大数据平台对民间舆情观测的需求,而且为民意调查和舆情控制提供数据有力支持,为政府分析双边关系和预测风险提供决策支撑,充分体现了本文研究成果的实际价值。
其他文献
在离散高端装备制造业中,如大型船舶、航天飞机、高端数控机床、工业机器人、轨道交通装备等,都属于复杂产品制造。复杂产品代表了装备制造业的技术制高点,是促进我国装备制造业智能转型升级的重要途径,也是国家国防、工业产业和国民经济的重要支柱,更是提升国家综合国力和国际竞争力的重要保障。复杂产品的装配环节与产品的可靠性和稳定性有着密切关系,是重要的质量控制环节;并且复杂产品以定点及手工装配作业模式为主,导致
高级辅助驾驶系统(Advanced Driving Assistance System,ADAS)是典型的智能物联网(Artificial Intelligence Internet of Things,AIo T)应用,目标检测是其中重要的感知任务之一。受限于硬件资源,ADAS中基于AI的目标检测方法在车载系统中较难落地。第五代精简指令集(Reduced Instruction Set Comp
随着市场对汽车轻量化的需求日趋旺盛,第三代先进高强钢(AHSS)的开发和研究越来越受到重视,淬火配分(Quenching and Partitioning,Q&P)钢是最有应用前景之一的第三代先进高强钢。针对汽车用钢面临的复杂加工工艺,本文选用QP980轧制板材研究加工过程对材料组织以及力学性能的影响。利用扫描电子显微镜(SEM)、X射线衍射仪(XRD)以及电子背散射衍射(EBSD)等先进表征设备
在5G的时代背景下,在新一轮人工智能浪潮中,中国科学家开始展现人工智能领域的研发能力,占据了全球人工智能科研领域的一席之地。本文在5G大时代背景下,选择了一家在人工智能领域已经取得一定成绩的科技公司,研究开发科技公司技术员工胜任力模型,通过开发出适合科技公司的胜任力模型,发挥员工的潜在价值,助力科技公司的持久健康发展。本文采用了文献研究法和专题分析法相结合的研究方法,首先,从国内外对胜任力的研究现
当前,国内的量化投资市场正处于稳健的发展阶段,并且机器学习技术也在各个领域的运用上取得了相当大的成就,利用机器学习来进行量化交易逐渐成为了跨学科研究中的热点,这将使得量化投资已不再是早期简单的结合技术分析来构建投资组合策略,而是使用相关的算法进行证券池中的证券选取、证券价格变化预测、证券指数变化预测,通过模型的预测结果给予投资者在制定投资组合上一定的参考。本文主要利用循环神经网络建立了五个模型,对
目前,在以Docker为代表的容器化技术加持下,基于容器化技术的大规模应用的开发和部署已经成为主流。而Kubernetes在容器编排领域也成为了事实上的行业标准。然而,现有的Kubernetes自动伸缩策略中,存在一定不足:其HPA操作仅支持通过静态检测阈值触发的方式,且无法动态调整冷静期窗口以兼顾副本抖动抑制和自动伸缩灵活性;HPA和VPA不支持混用,无法在使用HPA的集群中进行Pod部署资源值
随着中国咖啡市场的日益发展,人们对于咖啡饮品的态度更加包容,需求也在逐年攀升。作为拥有悠久茶文化的国家,消费者正在慢慢改变消费习惯,逐渐接纳来自西方的提神饮品。以星巴克为代表的连锁咖啡品牌正在领导这个市场的消费趋势。而以Manner咖啡、瑞幸咖啡为代表的本土咖啡连锁品牌,正在打破这个行业的既有规则。通过不断创新和品牌联名,加速品牌成长,与星巴克分庭抗礼。T公司作为后来者,正面临最激励的竞争环境。T
伴随着经济的进一步发展,票据业务同样呈现出蓬勃发展之势,然而当下仍旧有很多票据诈骗事件出现。中国当下正在进行深入化的改革,N银行和相关银行均有关于汇票交易背景方面的了解度不高、相关审查不够严格、填写规范性不高等问题出现,由此便导致整个票据业务的秩序变得更加混乱,同时可展现出的是N银行当下在票据业务方面的整体风险在提升。以最大程度上辅助N银行的商业票汇业务发展为目的,即需对其予以总体上的把控。本文研
随着神经网络模型的发展,神经网络与传统序列标注模型的组合逐渐替代了传统的基于隐马尔科夫或条件随机场的序列标注模型,成为命名实体识别领域的主流方向。医学文本来自于医学专业书籍,是构建医学知识图谱的重要资料。而医学文本命名实体识别对医学知识图谱的构建起着重要的作用,基于此背景,本文针对医学领域的文本的命名实体识别展开研究。首先,本文构建了多粒度文本特征融合的医学文本命名实体识别模型。因为多粒度文本特征
由于人们的生活不规律、饮食不健康和吸烟等问题的影响,使得肺癌的致死率远高于其它癌症。随着影像技术的进步,医学图像分析在疾病早期筛查诊断的过程中起到非常关键的作用。现阶段大量的影像数据带给医生很大压力,使得诊断常伴随漏诊和误诊。近年来,随着人工智能应用于医学领域中,医学图像智能分析也迎来了新的突破。影像组学通过从数量庞大的医学图像中挖掘深层次的信息,并构建机器学习模型辅助医生做出决策。医学图像分割是