基于细粒度观点搭配汽车产品评论情感分析

来源 :山西大学 | 被引量 : 1次 | 上传用户:worthylifelv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络、电子商务和移动互联网的发展,数以亿计的人积极主动的参与到了网络发展的长河中,使得互联网信息量与日剧增。电商网站、微博或论坛上一些用户乐于分享自己的观点,使得评论信息铺天盖地,这类信息体现了人们对某事物的不同的态度和相异的情感倾向,如肯定、赞成、批评、质疑等。对商品评论进行分析,不仅可以让广大消费者更加清楚某些产品的市场评价,进而做出更加合理的决择,也可以让商家利用分析结果来取得最真实的产品反馈,进而做出更加正确的决策。毋庸置疑的是,在数以累计的评论数据中仅仅通过人工的方法理出脉络是一件异想天开的事情,因此这就急切需要利用计算机来快速准确的挖掘这些评论数据中有价值的信息。对于汽车产品论坛网站上的评论,其语言表达方式多样,表达形式各异,有的甚至没有任何有价值的信息,例如“本人想购买二手经典福克斯,哪位福友想出手请回复一下!”又例如“关注凯越已经一段时间了,总体很是满意,也去了4S店看了实车,询问目前无优惠,最近急需用车,想知道成都哪里有优惠,感谢各位大侠!”该评论只有一部分具有情感,如果通过分析能将其抽取出来会极大减少信息获取成本。本文面向汽车领域中产品评论的情感倾向问题,给出了一个基于细粒度观点搭配的情感分析方法,该方法可以实现从评论文本中自动抽取观点搭配组合、分析其情感倾向,并将结果进行可视化展示。首先,采取网络爬虫的方法来爬取相关汽车产品论坛网站上的评论数据,并对数据进行预处理。使用LDA主题模型抽取文本中蕴含的主题词,在此基础上进行总结、归类,构建领域专用要素词词典,并完善情感词典与副词词典。然后通过分析汽车领域中各种词性之间的可能出现的搭配,设计并完善了各种观点搭配组合的抽取模式,并给出了用以计算不同的观点搭配组合情感极性值的方法。以抽取的要素搭配为基础,构建带权文本向量空间模型,对产品评论进行向量化表示。最后使用KNN算法对测试集进行情感倾向性判别。实验结果显示,本文所给出的方法分类准确率可达95%,具有一定的应用价值。同时,本文对汽车产品评论中基于细粒度观点搭配及其情感倾向进行了可视化展示,使得情感分析结果更加直观明了。
其他文献
本报讯 王廷杉、特约记者张坤平报道:国家应急通信系统、战区应急通信系统、野战地域网通信系统——北京军区某通信团构建的融“三系统”为一体的新型通信指挥作战平台,在前不
报纸
现代陆生植物的祖先大约在5亿到4.7亿年前登陆,这是植物进化过程中的重要事件。光照不仅是植物的主要能量来源,还是主要的环境信息来源之一。一般认为,光合作用效率越高,植物
江苏省行业特色型高校众多。本文在分析中国高校智库、江苏高校智库、江苏行业特色型高校智库发展现状的基础上,提出了推进智库协同建设,成立省域智库联盟;汇聚知名专家学者,
成骨不全作为罕见性遗传性结缔组织疾病,具有临床异质性与遗传异质性,迄今已经分为15个亚型.有常染色体显性遗传与常染色体隐性遗传两种遗传方式.常染色体显性遗传以Ⅰ型胶原
<正>鳟鱼包括虹鳟、金鳟、硬头鳟等品种,我国从20世纪50年代开始养殖鳟鱼。鳟鱼对养殖环境要求极为严格,不仅要求温度低,而且水质必须良好。鳟鱼骨制少,肉质鲜美,具有较高的
本文严格以财政部《企业会计准则———关联方关系及其交易的披露》及其指南为依据 ,对上市公司关联方关系及其交易的披露状况及其特征进行探讨。采取比较分析和列联表分析的
利用辽河盆地东部凹陷32口井11 431 m火山岩井段的岩芯、岩屑、测录井资料,通过火山地层-地震连井对比,研究了东营组火山岩的岩性、岩相、纵向序列及喷发期次;通过225口探井5
LG730冷轧管机机架危险位置合理设计是决定其应力高低和寿命的关键。本文在LG730轧机整体建模有限元分析的基础上,重点对机架危险位置的结构形式提出了四种优化方案,通过有限
目的:评价比索洛尔联合生脉胶囊治疗不稳定型心绞痛的临床疗效。方法:将48例不稳定型心绞痛患者随机分为治疗组及对照组各24例,治疗组在对照组基础上加服比索洛尔及生脉胶囊。
武威市天祝藏族自治县城位于河谷地形内,自河谷内大型碳化硅工业园区建成投产以来县城空气质量显著下降。为判断县城大气污染物的来源,利用HYSPLIT后向轨迹模式和NCEP气象再