基于潜在语义分析和最大熵的中文情感分析研究

被引量 : 28次 | 上传用户:yefenggege
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前微博、论坛、贴吧等已经成为人们发表意见、表达情感的重要渠道,这些渠道产生的大量情感信息反映了人们对热点事件、话题的褒贬态度。因此,对这些情感信息进行挖掘和分析能够更好地分析热点舆情,了解大众的观点,给政府、企业等提供重要的决策依据。传统的信息检索技术,大多以关键词为基础,无法对这种需求提供很好的支持;而传统的信息抽取和文本分类技术也均未涉及深层次的语义理解,常常不能很好地挖掘和分析情感信息。文本情感分析从情感的角度对带有情感色彩的主观性文本进分析,能更快地从海量信息中发现网络中新的热点话题、突发性事件,把握社会的舆论导向。它是传统话题发现与跟踪研究的拓展和深化,并为文本分类、信息抽取、自动摘要等提供了新的思路和方法,在企业智能分析、政府舆情分析、信息安全和自动文摘等领域具有广阔的应用空间和发展前景。情感倾向分析研究的涉及面很广,本文着重对其中情感词、句的识别和分类的关键技术进行了深入的研究。本文首先对文本情感倾向分析的国内外现状进行了介绍。其次,本文提出了基于潜在语义分析和最大熵模型的情感词识别及褒贬分析方法,其主要思想是利用潜在语义分析方法,计算情感词与人工选择的褒贬基准词的相似度,并结合多种情感词特征函数建立最大熵情感词识别模型。本文在情感词识别的基础上提出了一种融合多种特征的中文情感句倾向性分类方法。最后,对情感词、句识别模型进行了实验验证,选取第一届中文倾向性分析测评数据(COAE2008)中935篇中文文档测试,情感词褒贬分类得到83.5%的准确率及79.3%的召回率,情感句褒贬分类得到76.8%的准确率及78.3%的召回率。
其他文献
台溪乡是传统的茶园种植地,为适应发展的需求和提高茶的品质。近年来,台溪乡广泛推广生态茶园。其中科学施肥是关键。本文根据生态茶园的特点和养分状况,施肥管理中存在忽视有机
近年来,中职学前教育专业的舞蹈教学,为了配合学生技能大赛,重在追求高难度的基本功、复杂的舞蹈组合,而忽视了幼儿舞蹈的教学与创编能力。为了对接学生将来的工作岗位,应根
目的建立滴定法测定含碘复方苯甲酸醇溶液中碘和碘化钾的含量,为制定其质量标准提供依据。方法分别以硫代硫酸钠(0.1mol/L)、硝酸银(0.1mol/L)为滴定液,用滴定法测定含碘复方苯甲酸醇溶
目的通过回顾和文献复习,探讨超声心动图对冠状动脉瘘的诊断价值。方法分析12例冠状动脉瘘的超声心动图表现,其中5例升主动脉、冠状动脉造影和手术。结果冠状动脉瘘的超声瘘
通过对一个"后进生"转化成功案例的剖析,总结出了全面了解学生、关心热爱学生、加强与家长的联系、加强班集体建设、坚持不懈地帮教等经验。
2005年3月,在十届全国人大三次会议上温家宝总理宣布,将在2006年全面取消农业税。农业税的全面取消,标志着我国农村税费改革迈出了实质性的飞跃。全面取消农业税有效地遏制了
电子商务是传统产业与现代信息技术理想结合,是改造传统产业的关键推动力。电子商务的发展有利于促进我国优化产业结构,提高国民经济的运行效率与质量,实现我国信息化带动工
马克思在《哲学的贫困》一书中说的“两个相互矛盾方面的共存、斗争以及融合成一个新范畴,就是辩证运动”这句话,本来是对黑格尔关于范畴的辩证运动及其构造体系的方法的概括,我
随着我国经济发展和城市化进程的不断加快,城市扩张的触角已经伸向了农村地区,农村进入了新的发展阶段。为适应村级行政区划调整和税费改革后农村工作的新形势,从20世纪90年
生姜(Zingiber officinale Rosc.)为多年生宿根作物,生长期长,养分需求量大,若栽培管理不当,极易造成植株早衰或徒长。因此,通过合理施用植物生长调节物质调控其生长发育进程