融合语义关联挖掘的文本情感分析算法研究

来源 :硅谷 | 被引量 : 0次 | 上传用户:out000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 随着互联网技术的快速发展,信息世界的消息传输也更加快速,人们获取知识和信息的途径也更加多样,同时也要求信息搜索的结果更加精准。本文即对融合语义关联挖掘的文本情感分析算法进行研究。
  关键词 语义关联挖掘;文本情感;分析算法
  中图分类号:TP311.13 文献标识码:A 文章编号:1671-7597(2013)13-0073-01
  文本情感分析,即是针对用户带有主观情感色彩的文本意见进行分析、处理、归纳和挖掘。当前文本情感分析的应用涉及多个领域,主要用于信息过滤、信息预测、产品应用评价、观点分析等方面,同时在情报采集模型、网络监控系统中发挥着重要作用。对文本情感信息的研究除了能够为人们的信息检索提供极大的方便外,在商业系统中的关注点、服务对象以及功能实现上也都有很大差别。
  1 融合语义关联挖掘的文本情感分析算法
  融合语义关联挖掘的文本情感分析,即是利用关联挖掘技术,对文本中的语义情感进行分析。其核心思想就是对信息中的特征概念和情感关键词进行判别和提取,通过算法模型将非结构化或半结构化的文本信息转化为结构化的数据,然后通过关联挖掘获取数据间的语义关联,并通过信息归纳后将最终分类结果返回。
  进行文本情感分析需要很大的工作量,根据事件处理的逻辑顺序,结合关联挖掘技术,于是融合语义关联挖掘的文本情感分析的过程一般需要经历文本情感信息提取、文本情感信息关联挖掘及文本情感信息归纳和检索三个逐层递进的阶段。具体流程如图所示。将针对每个阶段的具体算法实现进行研究。
  1.1 文本情感信息提取
  1.2 文本情感信息关联挖掘
  进行文本情况信息关联挖掘即是对所提取的文本情感信息进行关联分析,对所获取的文本情感关键词、评价主体对象以及组合评价单元间的语义进行分析。实现中通过本体的层次结构和语义的对应关系对情感语义数据元进行概念化和泛化处理,建立初始关联数据库,然后逐层针对节点修整。
  1.3 文本情感信息归纳和检索
  2 实验结果分析
  通过实验得到,随着数据集的逐渐增大,该算法的执行时间呈平缓的线性增长趋势,这是因为其在运行时将自动集成浅层次的关联规则和修整语义重复规则,在运算过程中只产生深层次的强关联规则,所以受到数据量变化程度的影响就较小,执行时间的变化也较为平稳,也就具有较好的可伸缩性。
  3 结束语
  在互联网中文本情感信息数据量极大,且快速增长的情况下,关联挖掘技术的应用不仅能够对信息数据进行智能化的分析,更能获得深层次的关联数据,对信息检索、企业竞争以及决策提供准确而全面的数据,因此对融合语义关联挖掘的文本情感算法研究具有重要的潜在价值。本文即是在对文本情感信息概述的基础上,对其实际应用进行分析,并根据其逻辑分析的阶段进行算法实现研究,以准确、快速为目标进行算法设计,最终通过模拟对算法实验结果进行分析,说明算法优势所在。
  参考文献
  [1]叶强,张紫琼,罗振雄.面向互联网评论情感分析的中文主观性自动判别方法研究[J].信息系统学报,2007,1(1).
  [2]明均仁,何超.基于语义关联挖掘的数字图书馆跨媒体检索方法研究[J].图书情报,2013,4(7).
  [3]何超,张玉峰.基于语义关联分析的商务情报分析算法研究[J].情报杂志,2013,32(4).
  作者简介
  程超,男,汉族,本科在读,西南大学计算机与信息科学学院,研究方向:自然语言处理。
  杨力,男,汉族,重庆人,本科在读,西南大学计算机与信息科学学院,研究方向:网络入侵检测与数据挖掘。
  陈嘉鑫,男,汉族,四川人,本科在读,西南大学计算机与信息科学学院,研究方向:网络工程-分布式处理与网络
  计算。
其他文献
中国现代化的井下无轨设备起步源于20世纪70年代,在冶金部主导下,从波兰引入的井下无轨铲运机给国内井下开采带来了巨大变化,让人看到了机械化采矿的高效率。也是从那时起,国
2004年元月31日至2月21日,我有幸参加省教育厅组织的湖北省职业学校教师赴英学习培训团,在英国伯恩茅斯普尔学院进行了为期21天的学习培训。通过听课、与英国教师面对面讨论
摘 要 变频放大电路是某种新型相控阵雷达的重要组成部分,它结构复杂,精度要求高,生产过程中实现该电路装调一体化,有效提高了雷达的稳定性能和可靠性。  关键词 变频放大电路;装调一体化  中图分类号:TN95 文献标识码:A 文章编号:1671-7597(2013)13-0067-01  数字阵列雷达是一种在有源相控阵雷达基础上发展起来的新体制雷达,而变频放大电路作为该雷达的关键部件,对雷达发射接收
摘 要 位数比较大的整数运算,称为大数问题。大数问题中C++提供的int、long等整数类型都无法满足精度要求。解决这类问题一般通过高精度算法,人工模拟整数运算过程,但此过程相对复杂。在某些情况下,我们可以巧妙的利用double类型来实现大数运算,从而简化解题过程。  关键词 大数;高精度  中图分类号:TP3 文献标识码:A 文章编号:1671-7597(2013)13-0071-01  1 题
命题特点    一、以考查语言能力应用为主,以考查语法基础知识为辅。
“云计算”(Cloud Computing的中文意译)是一种崭新的互联网应用模式,具有超大规模、虚拟化、高可靠性、通用性和成本低廉等特点,它的出现彻底改变了旧有的互联网应用模式,被
国务院同意国家教育委员会、国家计划委员会、国家经济委员会、劳动人事部《关于全国职业技术教育工作会议情况的报告》,现转发给你们,请照此执行。几年来,我国职业技术教育
本文主要阐述了煤与瓦斯区域突出危险性与工作面突出危险性的预测方法等问题。 This article mainly expounds the outstanding risk of coal and gas areas and the predic
一、传统的教育模式技工学校作为国民职业技能的专门培训机构,它在中国的发展历史并不算长。古老的传授技艺的方式是“师傅带徒弟”。新中国成立后,随着经济的发展,“师傅带
摘 要 本文联系生产实践,为改进和提升钛合金材料构件制孔效率以及质量,从钻削制孔缺陷的形成机理中探寻用铣削取代钻削制孔的新工艺。  关键词 钛合金;钻削;铣削  中图分类号:V262 文献标识码:A 文章编号:1671-7597(2013)13-0072-01  当前我国复合材料叠层制孔的主要方式是手工加工,加工质量满足不了生产设计的需求,且工作强度大,效率低,对于大直径、大厚度的钛合金材料叠层结