基于网络信息文本倾向性分析的领域应用研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:lanshuye6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机和互联网技术的迅猛发展,网络已经成为人们获取信息的不可或缺的重要来源。自互联网进入Web2.0时代以来,网民越来越习惯将网络作为自己表达观点、想法、态度的平台,而不只是被动的接受网站所发布的信息。由于大量的用户参与到信息的产生,网络信息的内容形式也变得越来越多样化,大量的具有个人观点性的内容充斥着网络。而这些观点对于电子商务、网络信息安全、网络舆情等方面具有非常重要的意义。文本倾向性分析是指通过采集、组织和分析这些文本中的市场、观点、看法、态度、情绪等主观信息,从而对文本的情感倾向做出褒贬判断。这一技术可以广泛的应用于商品评论分析、微博态度分析、社会舆情分析、问答分析与评价等多个方面。本论文以互联网信息中的评论文本为研究基础,利用信息采集、文本处理技术、借助于数据挖掘、计算语言学等领域的理论与方法,以领域应用为研究对象,开展文本倾向性的建模、分析与计算研究,探索文本倾向性分析的新技术与新方法,将其应用于特定领域,并取得良好的效果。本文主要包括以下几个方面:首先,本文介绍了文本倾向性分析的研究背景及意义,国内外研究现状,并阐述了网络信息文本倾向性分析的流程及其中的关键技术。其次系统的介绍了文本分类的相关知识,并研究分析了基于统计和基于语义两种文本倾向性分析的办法,并对这两种主要的文本倾向性分析办法进行优缺点总结。然后在此基础上提出了基于模式抽取和匹配基础上的文本分类算法,并使用两个公开的语料库:中文情感评测语料COAE以及中文情感挖掘语料ChnSentiCorp对算法进行测评,该算法在保持较高性能的同时获得了一个比较理想的准确率。接着对提出的算法进行技术实现并通过对当当网的图书评论、新浪微博利比亚事件、新浪博客利比亚事件、外交部例行记者会实录问答数据进行文本倾向性分析,挖掘出评论内容的长短与情感倾向之间的关系,以及随着时间的变化网民对同一个事件的态度转变。最后,对本文的研究工作进行总结,提出了今后进一步的研究方向。
其他文献
随着计算机技术和互联网技术的飞速发展,信息行为的多样化发展趋势引起了学者们越来越多的关注。不管是国外还是国内的学者,对于信息行为的研究,已经不仅仅会满足于对信息行为本
翻译记忆(Translation Memory)作为一种计算机辅助翻译技术,经过三十多年的发展在理论和应用上已逐渐成熟。翻译记忆系统在全世界多种语言的翻译中得到应用,显示了良好的辅助翻译
六西格玛作为一种突破性的质量改进方法于八十年代末由摩托罗拉公司提出并付诸实施。六西格玛质量改进和质量管理方法已经在制造业领域获得了巨大的成功,其完整的统计方法也非
在高中学校管理工作中,校长个人的思想观念、形式作风、知识才学以及独特的领导才能都对学校管理有着非常大的影响,作为学校管理的核心人物,校长需要发挥其独特的引领作用,保
10月20日,第六届Milano Unica中国面料展与2014中国国际纺织面料及辅料(秋冬)博览会在上海同期开幕。意大利驻沪总领事Stefano Beltrame、Milano Unica面料展主席Silvio Albi
本文总结了新型冠状病毒肺炎疫情期间血液透析中心的应急管理实践,包括成立疫情防控小组,制定应急管理预案,强化医护人员自身管理,加强透析患者三级防控工作,加强患者及家属
网络的普及和发展,扩展了人们的眼界,涌现了新的商业模式,开创了新的交流方法,但在为人们生活带来便利的同时,网络中的某些技术却在为不法分子所用,不断地触动现有法律的底线
知识经济的时代已经悄然到来,信息受到了比以往更多的重视,也成为企业最为看重的战略资源储备之一。信息资源的开发和利用一方面体现着企业对科技及新技术的接收和适应能力,另一
[目的 /意义]采用h LDA从专利语料库中抽取层次主题,以描述隐藏在专利文本中的技术结构,并基于层次主题随时间变化情况进行技术演化分析。[方法 /过程]从专利术语中获取闭频
近年来随着我国就业制度的改革以及高等教育的招生规模的不断扩大,大学毕业生的就业问题也随之显现出来,成为社会关注的热点问题。根据国家文件要求,以及形势的发展,近年来各高校