手机评论观点信息抽取系统的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:qishikdjj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机的普及,手机逐渐成为人们日常生活中不可或缺的一部分。手机评论通常是在用户购买手机之后,由用户生成的,针对手机进行整体的或者某些方面主观性描述的文本。手机评论中包含丰富的观点信息,对于用户根据不同特征选择手机及手机商家针对性的改进有重要的意义。但是由于电商平台手机评论数量巨大,书写形式自由,故而我们需要一个自动化系统来更为准确的挖掘和分析手机评论中观点信息。对于观点挖掘工作学术界已经有很长时间的研究历史,常常被定义为以下两种任务:1.认为这是一个特征词和观点词抽取任务。2.认为这是一个特征词抽取及特征词情感判断任务。这两个任务的定义均只能解决部分问题:没有情感分析,则抽取观点词之后无法统计用户情感倾向;没有观点词抽取,则不能给以用户情感倾向统计的证据来源;没有特征词的分类,则无法统计不同特征词类别的情感分布,难以被用户和商家直接使用。为了研究电商评论观点信息抽取系统的构建方法,搭建一个较为完善、准确率较高的中文手机评论观点抽取系统,本文根据实际需要及相关研究的不足之处,定义了四元组(“特征词”,“观点词”,“情感”,“特征词分类”)作为信息抽取目标,并进行了以下工作:1.数据集构建,从京东、淘宝等电商网站中爬取34万条手机数据并进行预处理工作,根据任务定义和评论质量、分布进行标注,构建了包含10000条评论的数据集,包含特征词、观点词、情感。2.任务模型研究与实现,分别对于特征词与观点词抽取、词对判断、情感分析、特征词分类4个子研究任务进行设计并优化,最终取得较好效果。其中本文提出的GLSTM(图结构LSTM)可有效优化词对判断任务。3.搭建手机评论信息抽取系统,包含信息抽取演示功能、爬虫功能、数据分析和可视化展示功能。使用信息抽取演示功能可以直观的展示每条评论的观点信息,用户可以针对性阅读。使用数据分析和可视化展示功能可以使用户和商家了解用户对商品各方面特征的情感分布,进行对比分析。
其他文献
随着经济社会的快速发展,人们对于数据传输速率的要求越来越高,而传统的电域传输方式已经不能满足这种快速发展的需求。作为世界通信网的骨干光纤通信系统得到了迅速的发展。为了适应当下短视频、增强现实和虚拟现实等互联网业务爆炸式的增长,各种复用技术如高阶调制、脉冲成型、偏振复用应运而生。虽然利用高阶调制格式能够提高系统的频谱效率,但调制格式越高阶伴随而来的问题是对光信噪比(OSNR)的要求越高。在这种情况下
随着铁路网络的不断扩张,铁路不可避免地与现有道路网产生很多的交叉。由于当前大部分的平交道口都配备了摄像头,利用监控视频实现实时地智能监控具有重要意义。不但能够减轻完全由人工监控带来的成本,还能够极大的避免由于人工疏忽带来的不可预料的后果,有利于铁路平交道口的安全畅通。为此本文实现了一个基于视频监控的铁路平交道口的障碍检测系统。本文首先介绍了课题的研究背景和意义,并且分析了课题的国内外研究现状。基于
化学链燃烧(CLC)作为一种新型化石燃料高效利用技术,具有能够实现近零能耗二氧化碳内分离、通过两步反应实现化学能梯级利用、无热力型氮氧化物的产生等特点,被认为是化石能源利用和转化极具有发展前景的技术之一,引起了全球专家学者的广泛关注和深度研究,近年来获得快速发展和进步,这些研究大都聚焦于燃料反应机理、氧载体的材料选取和反应器设计等具体技术层面。随着化学链燃烧技术的研发带来更多新的应用和拓展,将面临
讣闻不仅是一种报丧形式,还是一种缅怀死者的方式,具有强烈的人文情怀色彩。作为一种新闻文体,讣闻在美国等西方国家颇受欢迎,仅居于时事政治版面之下。很多享誉世界的报纸都
党的十九大报告中强调要“善于运用互联网技术和信息化手段开展工作”。国家网信办在2016年全力推进争做“中国好网民”工程,从2016年3月正式启动,持续开展5年。2017年教育部发布的《中长期青年发展规划(2016—2025年)》中明确提出“把互联网作为开展青年思想政治教育的重要阵地”。在“互联网+”的新时代背景下,校园好网民的培育既是新时代大学生思想政治素质内在发展的必然要求,也是引领大学生积极践
当今世界经济,变化频仍,发展态势不稳定,整体情况复杂。作为全球第二大经济体,我国为世界经济的稳步发展做出了巨大贡献。与此同时,不断更新经济领域的研究成果,保持与世界前沿的交流对话,对我国乃至世界的经济发展都具有基础性的作用和意义,而经济学术文本的翻译则在这一过程中起到了积极的推动作用。本翻译实践报告以美国哥伦比亚大学商学院,美国国家经济研究局弗雷德里克·S·米什金(Frederic S.Mishk
众所周知,《中华人民共和国政府信息公开条例》(下文称《条例》)于2008年5月1日起正式施行。《条例》的颁布与实施,昭示着我国的政府信息公开工作即将进入一个崭新的时段,同
2020年8月24日,习近平总书记在主持召开经济社会领域专家座谈会时,结合国内外发展形势和发展情况,作出“十四五”时期我国将进入新发展阶段的重要战略判断。从现代化维度来看,新发展阶段是实现国家治理体系和治理能力现代化的发展阶段。乡村治理是国家治理的基石,乡村治理现代化是国家治理现代化的重要内容,而党的领导是乡村治理现代化的根本保障。在新发展阶段,乡村治理现代化不仅是乡村内部的自我发展问题,也关系到
学位
基于原子力显微镜(AFM)的纳米加工技术,因其具有加工步骤简单,加工材料多样化,并且可实现纳米级图案化的原位成像表征等优点,被广泛作为一种新的纳米加工方法进行研究。但是基于AFM轻敲模式下的加工机理尚不明确,无法实现深度可控的纳米结构的加工,并且工艺参数尚需要摸索。因此针对上述问题,本文开展了轻敲模式下的加工工艺的实验研究,主要工作包括:首先,研究轻敲模式下加工沟槽的形成过程,将高频振动的探针持续
随着移动互联网的发展,智能手机已成为网络时代的主流设备,其中Android系统占据着智能手机操作系统市场的最高份额。与此同时,大量的恶意应用严重影响Android系统安全和用户的隐私、财产和信息安全。通过对Android应用进行分析,对恶意应用进行检测与查证是保护Android安全的重要手段。本文在现有Android安全研究的基础上,设计并实现了动态行为特征信息获取与特征处理方案,构建了一个基于动