产品评论中的用户建议挖掘研究与实现

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:yan19891989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和电子商务的快速发展,越来越多的人选择在网上购买商品或者服务。在市场竞争白热化的情况下,商家需要及时发现消费者对产品的一些新需求,以提高产品的市场接受度和竞争力。而产品评论中的用户建议描述了用户对产品或企业提出的一些具体建议,可以帮助企业改进后续产品和制定相应的营销策略,具有十分重要的应用价值,需要对其进行挖掘。对产品评论中的用户建议挖掘研究而言,首要任务是从大量的产品评论中检测出包含用户建议的评论。本文针对建议检测任务中缺少相关数据集、中文建议表达方式灵活、特征构建困难、人工标注工作量大等问题进行研究,并以此为基础构建了产品评论中的用户建议挖掘原型系统主要模块。具体而言,本文的主要研究内容如下:1.首先针对缺乏建议挖掘标注数据集的问题,抓取数据并人工构造了关于中文产品评论的建议挖掘数据集。接着提出了一种集成学习模型来进行建议语句分类。首先使用Stacking组合分类器来构建概率特征空间,使用卷积神经网络和段落向量模型分别构建评论文本的卷积神经网络特征空间和段落向量特征空间,然后对上述特征进行融合,并训练Bagging分类器来对建议语句分类。在中文数据集上的实验结果表明了本研究模型可以有效地检测建议语句。2.考虑到传统建议语句分类方法中存在规则复杂、标注工作量大、特征维度高、数据稀疏等问题,提出了一种基于PU学习的无监督建议语句分类方法。首先,使用简单规则从无标注评论集合中选择建议语句的正例集合。然后,为了降低特征维度,缓解数据稀疏性,在自编码网络特征空间中使用Spy技术划分可靠反例集合。最后,利用正例集合和可靠反例集合来训练多层感知机对剩余的无标注样例进行分类。实验结果验证了该方法的有效性。3.构建产品评论中的用户建议挖掘原型系统中的主要功能模块,包括数据收集、数据预处理、建议语句检测以及建议信息抽取模块,可以从产品评论中自动检测建议语句并抽取建议信息。
其他文献
品 牌 延 伸 是 传 统 的 市 场 营 销 理 论所 推 介 的 重 要 营 销 策 略 之 一 , 即 以 现有 品 牌 名 称 推 广 新 产 品 。 品 牌 延 伸 策略具 有多 种 优势 。首 先,
随着电力电子化的分布式可再生能源大规模接入电网,同步振荡和谐波失稳现象越来越受到人们的关注。相较于传统的电力系统,新型微电网更多地表现出负阻抗性、低惯性、负阻尼性
杉木(Cunninghamia lanceolata(Lamb.)Hook)在我国南方广泛种植,是优良的造林、用材树种之一,具有生长快、出材量高等特点。杉木正常生长受到多种生态因子的影响,其中水分因
《语文课程标准》指出:“培养学生广泛的阅读兴趣,扩大阅读面,增加阅读量,提倡少做题,多读书,读好书,读整本书。”当前农村小学高段学生课外阅读现状不容乐观,学生缺乏阅读兴趣,学生的
<正>《金融知识国民读本》摆在我面前时,我的第一反应是把它放到一边,我想它肯定又是一本枯燥生硬的金融数据与金融理论的堆砌物。然而,当我无意间打开它的扉页,一些简洁、通
<正> 大庆石油管理局(以下简称大庆局)是中国石油天然气公司旗下最大的工程技术服务企业,拥有资产总额650多亿元,所属单位26个(含处级成员企业136个),职工总数近16万人。伴随
风险导向审计能够揭示出重大错报从而防范会计报表风险,却不足以有效化解审计风险。文章采用演绎方法,分析基于重大错报的审计模式的缺陷,提出建立以诉讼风险为起点的新审计模式
目的:分析急性有机磷中毒合并呼吸衰竭患者发生医院感染的相关因素,提出相应的护理对策,以降低感染率。方法回顾性分析2011年6月-2013年6月81例急性有机磷中毒合并呼吸衰竭患者
【目的】在2型糖尿病(Type 2 Diabetes mellitus,T2DM)人群中,探讨阻塞性睡眠呼吸暂停低通气综合征(Obstructive sleep apnea hypopnea syndrome,OSAHS)与糖尿病周围神经病变(Diab