论文部分内容阅读
摘 要 随着互联网技术的快速发展,信息世界的消息传输也更加快速,人们获取知识和信息的途径也更加多样,同时也要求信息搜索的结果更加精准。本文即对融合语义关联挖掘的文本情感分析算法进行研究。
关键词 语义关联挖掘;文本情感;分析算法
中图分类号:TP311.13 文献标识码:A 文章编号:1671-7597(2013)13-0073-01
文本情感分析,即是针对用户带有主观情感色彩的文本意见进行分析、处理、归纳和挖掘。当前文本情感分析的应用涉及多个领域,主要用于信息过滤、信息预测、产品应用评价、观点分析等方面,同时在情报采集模型、网络监控系统中发挥着重要作用。对文本情感信息的研究除了能够为人们的信息检索提供极大的方便外,在商业系统中的关注点、服务对象以及功能实现上也都有很大差别。
1 融合语义关联挖掘的文本情感分析算法
融合语义关联挖掘的文本情感分析,即是利用关联挖掘技术,对文本中的语义情感进行分析。其核心思想就是对信息中的特征概念和情感关键词进行判别和提取,通过算法模型将非结构化或半结构化的文本信息转化为结构化的数据,然后通过关联挖掘获取数据间的语义关联,并通过信息归纳后将最终分类结果返回。
进行文本情感分析需要很大的工作量,根据事件处理的逻辑顺序,结合关联挖掘技术,于是融合语义关联挖掘的文本情感分析的过程一般需要经历文本情感信息提取、文本情感信息关联挖掘及文本情感信息归纳和检索三个逐层递进的阶段。具体流程如图所示。将针对每个阶段的具体算法实现进行研究。
1.1 文本情感信息提取
1.2 文本情感信息关联挖掘
进行文本情况信息关联挖掘即是对所提取的文本情感信息进行关联分析,对所获取的文本情感关键词、评价主体对象以及组合评价单元间的语义进行分析。实现中通过本体的层次结构和语义的对应关系对情感语义数据元进行概念化和泛化处理,建立初始关联数据库,然后逐层针对节点修整。
1.3 文本情感信息归纳和检索
2 实验结果分析
通过实验得到,随着数据集的逐渐增大,该算法的执行时间呈平缓的线性增长趋势,这是因为其在运行时将自动集成浅层次的关联规则和修整语义重复规则,在运算过程中只产生深层次的强关联规则,所以受到数据量变化程度的影响就较小,执行时间的变化也较为平稳,也就具有较好的可伸缩性。
3 结束语
在互联网中文本情感信息数据量极大,且快速增长的情况下,关联挖掘技术的应用不仅能够对信息数据进行智能化的分析,更能获得深层次的关联数据,对信息检索、企业竞争以及决策提供准确而全面的数据,因此对融合语义关联挖掘的文本情感算法研究具有重要的潜在价值。本文即是在对文本情感信息概述的基础上,对其实际应用进行分析,并根据其逻辑分析的阶段进行算法实现研究,以准确、快速为目标进行算法设计,最终通过模拟对算法实验结果进行分析,说明算法优势所在。
参考文献
[1]叶强,张紫琼,罗振雄.面向互联网评论情感分析的中文主观性自动判别方法研究[J].信息系统学报,2007,1(1).
[2]明均仁,何超.基于语义关联挖掘的数字图书馆跨媒体检索方法研究[J].图书情报,2013,4(7).
[3]何超,张玉峰.基于语义关联分析的商务情报分析算法研究[J].情报杂志,2013,32(4).
作者简介
程超,男,汉族,本科在读,西南大学计算机与信息科学学院,研究方向:自然语言处理。
杨力,男,汉族,重庆人,本科在读,西南大学计算机与信息科学学院,研究方向:网络入侵检测与数据挖掘。
陈嘉鑫,男,汉族,四川人,本科在读,西南大学计算机与信息科学学院,研究方向:网络工程-分布式处理与网络
计算。
关键词 语义关联挖掘;文本情感;分析算法
中图分类号:TP311.13 文献标识码:A 文章编号:1671-7597(2013)13-0073-01
文本情感分析,即是针对用户带有主观情感色彩的文本意见进行分析、处理、归纳和挖掘。当前文本情感分析的应用涉及多个领域,主要用于信息过滤、信息预测、产品应用评价、观点分析等方面,同时在情报采集模型、网络监控系统中发挥着重要作用。对文本情感信息的研究除了能够为人们的信息检索提供极大的方便外,在商业系统中的关注点、服务对象以及功能实现上也都有很大差别。
1 融合语义关联挖掘的文本情感分析算法
融合语义关联挖掘的文本情感分析,即是利用关联挖掘技术,对文本中的语义情感进行分析。其核心思想就是对信息中的特征概念和情感关键词进行判别和提取,通过算法模型将非结构化或半结构化的文本信息转化为结构化的数据,然后通过关联挖掘获取数据间的语义关联,并通过信息归纳后将最终分类结果返回。
进行文本情感分析需要很大的工作量,根据事件处理的逻辑顺序,结合关联挖掘技术,于是融合语义关联挖掘的文本情感分析的过程一般需要经历文本情感信息提取、文本情感信息关联挖掘及文本情感信息归纳和检索三个逐层递进的阶段。具体流程如图所示。将针对每个阶段的具体算法实现进行研究。
1.1 文本情感信息提取
1.2 文本情感信息关联挖掘
进行文本情况信息关联挖掘即是对所提取的文本情感信息进行关联分析,对所获取的文本情感关键词、评价主体对象以及组合评价单元间的语义进行分析。实现中通过本体的层次结构和语义的对应关系对情感语义数据元进行概念化和泛化处理,建立初始关联数据库,然后逐层针对节点修整。
1.3 文本情感信息归纳和检索
2 实验结果分析
通过实验得到,随着数据集的逐渐增大,该算法的执行时间呈平缓的线性增长趋势,这是因为其在运行时将自动集成浅层次的关联规则和修整语义重复规则,在运算过程中只产生深层次的强关联规则,所以受到数据量变化程度的影响就较小,执行时间的变化也较为平稳,也就具有较好的可伸缩性。
3 结束语
在互联网中文本情感信息数据量极大,且快速增长的情况下,关联挖掘技术的应用不仅能够对信息数据进行智能化的分析,更能获得深层次的关联数据,对信息检索、企业竞争以及决策提供准确而全面的数据,因此对融合语义关联挖掘的文本情感算法研究具有重要的潜在价值。本文即是在对文本情感信息概述的基础上,对其实际应用进行分析,并根据其逻辑分析的阶段进行算法实现研究,以准确、快速为目标进行算法设计,最终通过模拟对算法实验结果进行分析,说明算法优势所在。
参考文献
[1]叶强,张紫琼,罗振雄.面向互联网评论情感分析的中文主观性自动判别方法研究[J].信息系统学报,2007,1(1).
[2]明均仁,何超.基于语义关联挖掘的数字图书馆跨媒体检索方法研究[J].图书情报,2013,4(7).
[3]何超,张玉峰.基于语义关联分析的商务情报分析算法研究[J].情报杂志,2013,32(4).
作者简介
程超,男,汉族,本科在读,西南大学计算机与信息科学学院,研究方向:自然语言处理。
杨力,男,汉族,重庆人,本科在读,西南大学计算机与信息科学学院,研究方向:网络入侵检测与数据挖掘。
陈嘉鑫,男,汉族,四川人,本科在读,西南大学计算机与信息科学学院,研究方向:网络工程-分布式处理与网络
计算。