教材在线评论的情感倾向性分析研究

来源 :新疆师范大学 | 被引量 : 0次 | 上传用户:repopw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务的迅猛发展,网上书店已经成为很多商家销售图书的重要平台,网络购物因其价格实惠、购买便利等优势,逐渐成为人们购买图书的首选方式。越来越多的用户阅读图书后,也热衷于在线分享自己对所购图书的真实看法或体验。电商网站中涌现的大量图书评论,蕴含着用户对图书的评价,潜在消费者可以据此降低购买风险,从而获得满意的购物结果,商家和出版社也能根据其做出合理有效的决策。可见图书在线评论的挖掘,对消费者、商家和出版社有很重要的意义和实用价值。本文运用细粒度情感分析技术,分析教材类图书的在线评论,挖掘教材特征级的情感倾向性分析结果,为消费者和商家提供有价值的参考信息。本文首先分析了粗颗粒度和细颗粒度在线评论情感倾向性分析的国内外研究现状,其次详细调研了细粒度情感分析的相关理论和技术,明确了情感分析的步骤和每步中的关键技术。在此基础上,通过网页爬虫软件采集教材的在线评论信息,对采集数据进行去重、清洗、拼音英语替换等去噪处理,形成教材评论分析的训练和测试语料。利用中文分词软件和自定义分词词典,完成并优化评论语料的分词和词性标注。然后,基于标注结果,根据产品特征通常为名词和名词性短语的规律,归纳了名词性短语的构词规则,利用该规则从训练语料中抽取候选产品特征,通过词频过滤和人工校验进行筛选,建成教材产品特征词库。接着,根据教材评论的领域特性,在通用情感词典的基础上,利用训练语料构建了领域情感词典、网络情感词典和极性修饰情感词典,形成面向教材评论的情感词典资源。最后,分析了现有SBV算法运用于教材评论时还无法识别某些特征-意见对的问题,提出改进思路,利用本文构建的极性词典和特征词库,设计教材评论文本的情感倾向性分析算法。通过测试语料进行实验,分析结果表明,本文算法和词典资源相比通用情感词典和SBV算法,评价指标明显提升,从而证明了本文构建资源和算法设计的有效性。
其他文献
随着全球化进程的加速,各国之间开放与合作的力度不断加大,英语作为国际通用语言,也日益受到非英语国家教育部门的高度重视。2001年9月,新的《义务教育阶段英语课程标准》(实验稿
宝马的VANOS系统是一个由车辆发动机管理系统操纵的液压和机械相结合的凸轮轴控制机构.2015年6月18日,宝马正式召回相关车辆的VANOS单元有松脱甚至断裂危险的螺栓.
本研究以湖北省具有代表性的4所高校(包括武汉体育学院、中国地质大学、武汉工业学院、武汉科技大学)的高水平毽球运动队为研究对象,采用文献资料法、问卷调查法、调查访问法
消费观是指人们在消费活动中对价格、货币、消费等经济活动的认识,从深层次看,消费观是对在消费活动中产生的人与人、人与自然的关系的认识,是属于经济伦理的范畴.该文研究小
米其林近日宣布面向中国市场推出《米其林自驾旅游指南》-《北京天津河北山西山东内蒙古自驾游指南》及《上海江苏浙江安徽江西自驾游指南》,这是米其林旅游指南首次在中国推
该文着眼于使学生一方面学习书本知识,另一方面培养锻炼学生的自学能力、创造能力为目的.学会学习,学会求知,尽可能多的在最短时间内掌握最多的知识,增加学习知识的数量,加快
目前国内关于错误适应、错误加工的研究少之又少,且大都停留在对国外相关文献的综述阶段;而国外已有的研究中,大都采用简单匹配任务范式考察错误适应。事实上,简单匹配任务中的错
车型:广汽本田雅阁,配备2.4L发动机,CP2车型(第八代雅阁)。  故障现象:该车发生正面碰撞后,气囊弹出,发动机、变速器未受到直接撞击,来店进行维修。将发动机、变速器总成一并拆下,未
什么是线阵列?声学工程师Olson在1957年的著作中描述:“线阵列是一组振幅相等并同相紧密地排成一条直线的声辐射元素”。由于该阵列具有垂直指向性,从而有效地投射声音,因此适用于大
该文在批判教学构成观的基础上,构建起了教学生成观,突现了教学初始阶段合理性的研究意义.在生成论的基础上,提出了"教学生子"的概念,以马克思主义实践哲学为导向,根据对教学