基于语义的文本倾向性分析与应用研究

被引量 : 10次 | 上传用户:pp084
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅速发展,如今越来越多的人通过互联网发表他们对商品服务的意见、交流对各种事件的看法,互联网已不仅仅是人们获取信息的仓库,更成为人们发表观点、交流看法的园地,对于互联网用户来说,互联网不仅改变了他们的工作方式,同时也改变了他们的生活方式。通常,人们对某件事物进行评论或者表达自己的观点的时候,常常是具有倾向性的,为了能从这些丰富的信息中提取出有用的信息,文本的倾向性分析研究便应运而生了。对文本的倾向性进行分析,是现在自然语言处理中比较活跃的一个领域,其目的是判断一篇文章对评价对象所持有的倾向是支持还是反对。本文的主要工作概括如下:(1)分析研究了传统的文本倾向性分析方法,并指出了其中的不足。通过对语义信息和语义倾向的理论知识分析,讨论了三种基于语义倾向的语义分析方法。(2)提出一种基于HNC的语义相关度方法计算词语的原始极性算法。在深入研究HNC基本理论的基础上提出了基于HNC概念基元符号体系理论的语义相关度计算方法,根据HNC理论给出了语义相关度计算策略,并实现了概念符号比较的量化计算的详细方法。最后将基于HNC的语义相关度方法运用到词语的原始极性分析上,从而可以较容易也较准确地计算出词语的原始极性。(3)提出一种改进算法计算词语的上下文极性。首先给出文本倾向性算法的整体框架,然后对算法的流程进行了详细的说明。由于忽略句子中的关联词有可能导致极性词的方向或者强度发生错误,所以提出基于上下文的词语的倾向性分析方法来解决这一问题。利用计算极性成分在文本中出现的广度、密度和强度的方法,根据极性词语的分布情况确定评论文本的倾向性。(4)在理论研究的基础上,将文本倾向性分析应用到网络舆情监控系统—国保情报系统中,实验表明,将文本倾向性分析应用到网络舆情监控系统中可提高系统的使用效率。
其他文献
近年来,教育信息化推进教育现代化已成为我国发展教育事业的一项重要战略举措。基础教育更是呈现了以信息技术与学科课程整合应用为特征的发展态势。然而信息技术在当前学校
我国现有近6000项食品及相关产业标准,但总体水平较低,要加快对食品中的农兽药残留、有毒有害污染物、致病微生物、真菌毒素、食品添加剂标准进行修订完善,并依法整合形成相
证券市场是一种信息市场,投资者按照其所获知各种信息来作出其投资决策。虚假陈述行为背离了公正、公平和公开原则,既损害了投资者的利益,也动摇了投资者对证券市场的信心。
非接触性作战,非线式作战、非对称性作战,简称“三非”作战,从上个世纪,本世纪初所爆发的几场局部战争中,已经初现“三非”作战的端倪。随着凸代科学技术的发展,武器装备的不断更新
为落实在证券公司全面推行第三方存管的要求,保障客户交易结算资金第三方存管业务的运行安全和秩序,保护投资者利益,促进证券公司规范发展,证监会组织研究制定了多银行模式证
改革开放以来,随着社会主义市场经济体制的逐步完善,非公有制经济迅速发展,非公有制人士阶层不断壮大并成为社团组织的重要成员。2006年中央第20次统战工作会议提出“建立健
<正> 郁病多由情志不畅、气机郁滞而致病。多见于神经官能症、癔病。长期的情志不畅,日久必致气滞痰郁。正如《证治要诀》云:“痰饮者,多因气道闭塞,津液不通,譬如沟渠壅遏,
目前,高速宽带无线通信,尤其是第4代移动通信技术(4G)正成为通信领域的热点问题之一。4G通信技术最重要的特点就是具有较高的频谱利用率以及能够对抗频率选择性衰落及多径衰
江西境内现今仍保留有演傩的地市主要是抚州、萍乡、上饶、宜春、赣州等区域,就此五地市的傩俗及其相关文化现象的田园调查情况而言,各地市关于演傩的起源有不同的说法。赣傩
Emig(1977)于二十世纪七十年代在研究写作过程中,提出writing as a mode of learning,writing-to-learn即“以写促学”。随后吸引了一批学者对其进行大量的研究,这些探索多是