产品评论的方面级观点挖掘技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:jiajia_jiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和网络购物的日益流行,产品的评论通常被作为是否选购该产品的重要依据,因此,如何从大规模的产品评论中高效地获取到对潜在消费者和商家更具有价值的信息逐渐成为研究热点。本文对产品评论进行方面级观点挖掘技术研究,能够快速准确地获取到产品各属性的评价情况,对潜在消费者选购和商家改进产品都有重要意义。本文的主要研究工作如下:1.针对目前多数评价搭配抽取方法存在人工标注工作量高、依赖于外部情感词典和动词词性考虑较少等问题,提出了一种基于规则的评价搭配抽取方法。该方法通过词性、依存句法分析和语义依存分析的结果制定规则,首先进行核心搭配的抽取,然后引入识别并列评价对象的算法及改进的识别修饰成分的算法,结合核心搭配组成部分的不同词性进一步制定规则来识别完整的评价对象和评价短语。在中文手机评论数据集上进行实验的准确率达到71.95%,召回率达到66.74%,F1值达到69.25%;在中文酒店评论数据集上进行实验的准确率达到60.42%,召回率达到62.24%,F1值达到61.31%。实验结果表明本文方法进行评价搭配抽取的有效性。2.针对已有的方面级情感分类研究中,大多数方法通常需要构建完善的情感词典和判断规则,而基础的机器学习方法存在分类性能有待提高等问题,提出了一种基于情感词汇与机器学习的方面级情感分类方法。该方法选取部分正向、中性和负向情感词组成情感词汇,并将互信息中各类别的占比作为基础机器学习方法分类概率的权重,选择加权后概率最大的类别作为情感倾向。在中文手机评论数据集上进行实验的宏平均值达到84.46%,比基础的机器学习方法提高了4.53%,微平均值达到84.49%,提高了4.55%;在中文酒店评论数据集上进行实验的宏平均值和微平均值都达到83.62%,都提高了4.11%。实验结果表明本文方法可以有效提高方面级情感分类性能。3.设计并实现了一个产品评论的方面级观点挖掘系统,该系统通过用户输入的产品ID,自动地进行评论数据爬取、预处理、评价搭配抽取及其情感分类,然后将观点挖掘的结果以图形化界面展示。
其他文献
2011版义务教育生物学课程标准要求学生在教师帮助下建立生物学重要概念,并能应用其解决新情境下的相关问题。课堂教学中基于“五何”法的多层次提问通过陈述事实、解析内涵、
昆汀·塔伦蒂诺的电影具有强烈的后现代主义色彩,而《低俗小说》正是这一风格的集大成者。《低俗小说》不仅将后现代主义的特色融入其中,解构了传统的权威和"圣光",更是
建立国土空间规划体系并监督实施,建立以国家公园为主体的自然保护地体系,强化国土空间规划对各专项规划的指导约束作用,是党中央、国务院作出的重大战略部署。在此背景下,风
设计了一款适用于手机的小型化WLAN天线,尺寸为10 mm×35 mm,天线的主要结构为一个折叠型倒L-L结构.设计过程中采用了共面波导馈电(CPW)技术,有效地增加了天线的带宽.仿真
<正>2019年10月10~11日,由广西壮族自治区自然资源厅、云南省自然资源厅指导,《规划师》杂志社主办,华蓝设计(集团)有限公司、广西国土资源规划院和云南省设计院集团有限公司
本文通过对大学生在"双十一"购物狂欢节期间的网上购物心理与行为的调研,分析在"双十一"购物狂欢节期间当代大学生的网购消费群体特征,剖析大学生网络消费心理和消费行为,反
张枣诗歌中的“传统”要素历来受到读者和评论家的关注。他的创作衔接了废名、戴望舒、卞之琳、九叶派等在传统与现代之间的探索。张枣的创作并未一以贯之,写作过程中,他的创
当前,我国已进入新时期发展阶段。全面建立空间规划体系,推进多规合一,实现主体功能区规划、土地利用总体规划、城乡规划、海洋功能区划等空间规划有机融合是党中央、国务院
构建了两个无几何相位组合以及一个无几何伪距相位组合,并将其组成3个线性无关的周跳探测量,三者均能有效探测出小至一周的周跳。针对该探测组合存在的方程组病态的问题,提出
独立学院学生对于学生自治管理体系具有较高认可度,但是自治程度较低。应从建立和完善学生自治章程与制度、设立系统性实施架构、培养学生骨干、营造学生自治校园文化及从社