电商和微博评论中商品属性与倾向性识别技术的研究与实现

被引量 : 4次 | 上传用户:mfklyga
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在电子商务和社交网络席卷世界的今天,用户在网上购物的同时,会发表自己对于商品的观点。这些观点以用户为中心,反映了用户的使用体验,包含了用户对产品的特征、功能和性能等的看法。然而,随着网络评论数量飞速增长,评论内容越来越复杂,很难人工地根据评论内容,得到有用的信息。因此,迫切需要一种自动化的收集用户评论信息,分析用户对商品的评价属性和识别用户观点的技术。商品评论的情感挖掘分析技术正是在这样的背景下产生并迅速发展起来的。挖掘产品特性、挖掘用户对于产品特征的主要观点以及判断主要观点的情感导向是商品评论的情感挖掘的三个核心问题,本文针对这三个问题进行了深入的研究。同时考虑到网上评论信息的特点,即用户在网上发表评论时通常不太遵守语法规则,句子的语法结构不完整,在句子中常常省略主语,重点分析了隐式主语的抽取问题。对于没有显式主语的句子中,识别并且抽取出真正的主语。本文的工作主要包括以下三个方面:(1)识别评价对象和评价词。利用POSEM算法来抽取评价对象和评价词二元组。并且,由于网络上产品评论信息的语法结构比较自由,很多句子没有完整的主谓宾结构,提出隐式主语抽取的方法,提高了评价对象和评价词抽取的召回率和准确率。(2)判定评论者的态度,也就是从用户的评论中找到和产品属性相关的评论者的观点极性。要从用户的评论中找到观点极性,首先需要找到评价词汇,然后综合利用形容词、副词情感词库和领域词库来对词汇的极性进行判断。因为词汇所代表的极性往往与词汇的背景上下文和特定领域是息息相关的。相同的词在不同的领域所代表的情感极性很可能是截然相反的。(3)设计并实现商品评论信息分析工具,工具主要包括自动抽取网页DOM树中特定标签下的评论信息,数据预处理,主观评价句抽取,评价对象和评价词抽取,评价词极性判别等功能。
其他文献
南极磷虾(Euphausia superba)是多细胞生物中生物量最大的单种生物资源,其生物质能约有五亿吨,可以说是地球上进化最成功的物种。其现存量估计为6.5×108~1×109吨,每年的可捕获
自20世纪80年代以来,随着思想解放浪潮的冲击,人的解放问题的重新提出,女性民俗发生了很大的变化,尤其是许多的女性禁忌民俗逐渐走向消亡。在这一背景下,破除禁忌后的女性民
为适应日益严格的环保要求,烟气处理技术一直在推陈出新。对比了氨法、钠碱法、半干法烟气脱硫技术的优缺点,通过这三种技术在高含硫天然气净化尾气处理过程中的应用,分析了
通常来说,中国高校内部包含三种权力——党政权力、行政权力以及学术权力。在该文中解决的第一个问题便是三种权力的划分问题,多数学者主要讨论三种权力的两种,即:学术权力和
指出了遂昌县2001年启动公益林区划界定工作,2004年进行森林生态效益补偿试点。其10年的公益林建设使遂昌县域林业生产力和生产关系发生了重大变化,林业开始进入由生产木材为
在Pro/E中对齿轮进行参数化建模进行减速箱的装配以及运动仿真,然后将齿轮模型导入ANSYS软件中,实现接触应力及接触疲劳寿命有限元分析,从而实现了CAD/CAM的一体化,大大提高
供应链管理是企业整个采购管理中一个很重要的组成部分,供应链管理的完善能够帮助CM降低总采购成本,提升CM公司的核心竞争力。而在供应链管理中对供应商的选择和评价,则是重
本文运用文献资料法、分析法、观察法等研究方法,从体育美学的角度对2008、2009年的中国学生健康活力大赛的现场观察和视频分析发现啦啦操音乐与动作选编的好坏是影响比赛成
随着现代装备制造业的快速发展,深孔加工技术被迅速推广至航空航天、造船冶金、模具汽车、仪器仪表等各个领域。镗刀作为深孔加工的主要工具,直接影响着深孔加工技术的发展。但
日光温室设施调控系统在中国发展起步较晚,科研落后于生产矛盾突出,结构的规范化,环境的有效调控能力和机械化、自动化管理水平与发展现代设施园艺产业还存在较大差距,本课题设计