论文部分内容阅读
互联网以其开放性和传播迅速等特点成为网民表达观点、传播思想的平台,任何热点敏感事件的发生,均可以通过互联网迅速传播。这些互联网上的信息在对社会发展产生积极作用的同时,也有大量舆情信息不利于社会的健康发展,甚至成为构建和谐社会的重要隐患。因此,及时准确地掌握互联网舆情,加强网络舆情信息的监测与引导具有重要意义。对于网络舆情文本,其特点是口语化,并且大都以短文本形式存在,还存在倒装、省略、主语缺失等情况,传统基于关键词统计分析的网络舆情分析方法由于缺少对舆情文本必要的语义处理,往往导致分析结果不准确。同时,由于数据稀疏,传统统计理论的方法难以对舆情苗头进行及时准确的发现。正是基于这样的背景,论文立足于网络舆情文本的语义分析技术,从语义和知识层面上构建网络舆情精准分析新方法。提出一种基于语义文法的网络舆情精准分析新方法。该方法包括两部分:首先是可执行的网络舆情精准分析语言Eipoaal,Eipoaal程序包括实现网络舆情精准分析的本体知识库、语义文法等,可根据实际舆情分析需求设计Eipoaal程序,满足不同结构文本不同处理粒度的需求,具有通用性;二是网络舆情精准分析系统IPOAAS,为Eipoaal程序提供编译和运行平台。目前,我们已经实现了该系统,并应用到热点事件网络舆情分析中,实验结果证明了方法的有效性。本文研究内容主要体现在以下几个方面:首先通过语义文法建立从无结构的网络舆情文本到结构化的网络舆情语义的映射,研究了网络舆情语义文法的设计方法;然后设计了可执行的网络舆情精准分析语言Eipoaal,Eipoaal是一种为实现网络舆情精准分析而设计的通用编程语言,满足对不同领域、不同结构的舆情文本的处理需求;最后研究实现了高效的多主体网络舆情精准分析系统IPOAAS,系统以网络舆情本体为元知识,以网络舆情语义文法作为实现精准分析的依据,输出结构化的网络舆情语义表示。本研究将为新一代基于语义的舆情监测分析系统提供理论基础和技术支持,具有重要的理论意义和明显的实用价值。