基于语义理解的意见挖掘研究

被引量 : 4次 | 上传用户：nihao136

【摘要】

：

随着网络技术的不断发展和普及,越来越多的网民将自己对新闻事件、商品服务的观点和看法在评论、博客、微博等网络应用上进行表达,互联网上集聚了海量的用户观点信息。从上世

【作者】

：

曹高辉

【发表日期】

：

2010年01期

【关键词】

：

意见挖掘情感分析极性分类主题模型指代消解

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着网络技术的不断发展和普及,越来越多的网民将自己对新闻事件、商品服务的观点和看法在评论、博客、微博等网络应用上进行表达,互联网上集聚了海量的用户观点信息。从上世纪末开始,计算机科学、计算语言学、认知心理学、语言学、行为科学等领域的学者开始研究利用自动化手段对网络用户的评论意见进行搜寻、分析、挖掘,这一方面的相关研究被称为意见挖掘。意见挖掘是当前互联网智能化信息处理中的一个重要研究热点,是一项具有较大实用价值的研究课题,其可以在信息检索、信息过滤、电子商务、网络舆情监控、垃圾邮件处理、网络用户行为跟踪等领域得到广泛应用。本论文借鉴文本数据挖掘的基本研究框架,尝试从语义层次对网络用户评论数据进行意见挖掘,采用主题模型、句法分析、组合原则、评价理论等模型方法重点对主题抽取、主题指代消解、情感分析、评论数据排序四个核心问题进行研究。文中附图25幅,表17个。全文约13万字,共分为7个部分,主要内容如下：第0章以意见挖掘的四个基本子任务为主线,分别归纳总结了主题抽取、陈述选择、情感极性分类以及意见挖掘实验系统在国内外已有研究中的研究思路、理论方法、技术路线、发展趋势,在此基础上提出本文的研究任务和研究思路。第1章对意见挖掘研究的理论基础进行解析。在对意见挖掘内涵分析基础上提出意见挖掘的研究框架,指出情感计算理论是意见挖掘的理论源泉,文本分析、文本分类其技术基础,文本挖掘是其方法基础；并对情感计算、情感表示、文本情感计算方法、文本词法分析、句法分析、文本情感识别方法、文本分类步骤、文本分类器等内容进行归纳总结,从而为后文的研究奠定理论方法基础。第2章对评论主题的自动抽取进行研究。本章首先对评论数据主题抽取的概念、任务进行分析,在分析总结常用概率主题模型的基本思想及实现算法的基础上,提出基于主题模型方法hPAM实现评论数据主题抽取的思想,并通过获取各离散主题之间语义信息,生成层次化评论主题。第3章对评论数据的文本分割进行研究。本章对评论数据中存在的主题指代现象进行分析,归纳了11个指代消解特征,采用SVM方法实现评论数据的主题指代消解,并在此基础上采用Labeled LDA算法完成评论数据的文本分割。第4章对评论数据的文本情感分析进行研究。本章构建了静态极性词典,确定词语的先验极性、极性强度、极性权重,归纳总结了词语搭配情感极性判断的6个基本原则,并依据这些原则,构建了21条动词词组极性判断原则,在此基础上借助于句法分析工具和组合原则方法,完成评论句子情感极性分析和情感强度分析。第5章对评论数据排序问题进行研究。本章基于系统功能语言学中的评价理论框架,将意见表达形式分为情感、评判、鉴赏三种类别,并结合情感强度、情感表达式频率构建评论数据的价值评价体系,依据此体系完成评论数据进行排序。第6章对本文的研究进行总结,指出其中存在的不足之处,并对未来的研究做了展望。

其他文献

加味玉屏风散防治小儿肺炎支原体感染后反复发作50例

<正>小儿肺炎支原体感染(Mycoplasma pneumonia,MP)占学龄前及学龄儿童呼吸道感染病原的5%～20%,本病易于反复发作,已成为小儿反复呼吸道感染的一个重要原因。用大环内酯类药物

期刊

肺炎支原体感染加味玉屏风散中医治疗

运用证素及中医体质理论探讨脾胃湿热型慢性胃炎的中医病理特点

目的总结脾胃湿热型慢性胃炎的中医病理特点。方法通过传统辨证方法收集湿热型慢性胃炎患者90例,同时采集患者的证素信息,填写体质量表,并统计分析证素分布特点及体质类型。

期刊

慢性胃炎脾胃湿热证素中医体质中医病理

论社会主义市场经济条件下的义与利的关系

改革开放30年来,社会主义市场经济体制逐步建立和完善,生产力得到了巨大的发展,但是随着市场经济的不断深入,在物质条件巨变的同时,利益冲突与矛盾亦日显加剧,经济领域中的伦

学位

义利观传统义利观和谐社会

运水入土、运土入水手法机理初探

<正>运水入土、运土入水是小儿推拿临床常用的手法之一,关于其操作方法、功效、主治,历代各个医家尚未有完全统一的观点,其作用机理亦少有论述。笔者有幸承蒙小儿推拿泰斗张

期刊

运水入土运土入水手法机理小儿推拿

法律思维与民法适用

<正> 解决民事问题、处理民事纠纷的主要任务在于民事法律的适用,谈及法律适用,我们应该以法学方法论上的意识性及警觉性去解释适用法律。

期刊

民法适用法律思维私法自治原则利益法学派法律方法价值判断法律概念

呼伦贝尔草原生态文明建设存在的问题及对策

呼伦贝尔草原生态文明建设是一个崭新的历史课题,本文通过对生态环境建设十几年来取得的成果和问题进行梳理,从一个崭新的视角审视生态环境建设的未来走向。生态文明建设是生

期刊

呼伦贝尔草原生态环境建设生态文明建设制度化

车间生产过程物流优化问题的模型研究

随着我国的市场经济体制的逐步建立,市场竞争日益激烈,多个品种、多道工序和小德批量的情况在当代的中国制造业中的普遍出现。因此,就要求我国的制造企业能够在生产过程中,尽

学位

车间生产物流模型次要因索遗传算法优化

空间目标RCS特征参数提取技术研究

空间监测是关系国家安全的重要领域,也是开发和利用空间资源的重要基础。空间监测雷达是用于空间目标探测与识别的重要工具之一,是目前实现空间监测的重要手段。雷达散射截面

学位

RCS空间目标特征提取物理域变换域周期提取尺寸估计概率分布时频分布

白术抗肿瘤作用的研究及应用进展

通过对国内外相关文献的查询,对白术单药及其配方在抗肿瘤、改善肿瘤患者胃肠功能中作用机制的研究及临床应用进行介绍。中药白术不仅具有燥湿利水,止汗安胎,健脾补气的功效,

期刊

白术挥发油肿瘤进展

粟特人在渤海国的政治影响力探析

"安史之乱"中,辖管渤海都督府的平卢军节度使两次遣使渤海征发兵马,意图助其戡乱,然而渤海却始终采取严守中立的态度。本文认为当时正值文王大钦茂统治前期,渤海国内形成了一

期刊

渤海国粟特人安史之乱

基于语义理解的意见挖掘研究

与本文相关的学术论文