产品评论的有效评价句提取及自动分类技术的研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:tiancejiangjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科技的发展与进步,有关产品评论的意见挖掘的发展已经成为一个新兴的研究领域,无论在国内外,都属于比较热门的研究课题。作为产品评论的意见挖掘以及其他文本处理的重要辅助手段,产品有效评价句的提取方法是文本的研究重点,其具有重要的意义。中国市场广阔,拥有世界最多的网民和最大的网购群体,创造了巨大的产品评价数据库。对产品评价的研究,在研究消费者满意程度,研究消费者消费习惯,新的消费增长点等方面都有着重要的意义。本文采用机器学习等领域的技术方法,通过特征提取特征选择,机器学习方法,对产品评论的有效评价句提取做了较为深入的研究。基于特征的意见挖掘的目的是从产品的评论中提取出产品的评价反馈。这在之前也有类似的工作,提出了很多基于统计以及基于模型的方法。然而,当网络评论数据是中文的情况下时,其提取的结果总是不太令人满意。经过统计分析发现,部分方法在某类句子中达无法正确地抽取评价对象和评价词,而这些句子大多数并没有包含有价值的评论。因此,本文的核心思想就是,滤掉数据集中无效的评价句,从而获得有效评价句集合。本文将获取有效评价句的问题通过文本分类的方法来解决。首先通过对所有评论数据的深入分析,从文本的组成单元——词与文本的结构两个角度入手,挑选了关键词与模式两个具有代表的数字特征,作为产品评价文本分类的分类特征;然后选择了BP神经网络作为分类器来探索产品评价数据中有效评价句提取的方法。本文使用化妆品行业实际获得的5000多条评论作为数据集,实验表明,使用这两个特征和BP神经网络分类得到了较为满意的结果。产品评论数据的分析与处理对电商提高服务,厂家提高产品质量,获得更大发展空间,价值很高。通过对产品有效评价句的获得之后,为进一步的产品评价的意见挖掘工作等提供了便利。因此,研究基于产品评价数据的有效评价句提取是一项非常重要而有意义的工作。
其他文献
随着物联网技术的发展,信息量丰富的视频传感器在物联网中的应用也越来越广泛。然而,由于物联网视频传感器本身的物理特性,决定了他们在数据带宽、计算能力以及链接稳定性上
本文所述研究是家庭电子医疗平台研究项目的一部分,主要致力于建立电子医疗平台的数据管理系统部分的研究。主要研究对象是生理学时间连续数据。在家庭电子医疗平台中,存在生
学位
信用风险是商业银行面临的最重要风险之一。近年来,神经网络因良好的非线性映射能力使其对在解决商业银行信用风险评估问题上具有独到的应用优势。其中BP神经网络已有了较为广
随着测序技术的不断发展和千人基因组计划的推动,基因组数据已经大量出现,着眼于全基因组范围的关联研究成果正不断被发表出来。基因组浏览器已成为广泛应用的工具之一,结合各类
学位
学位
互联网的多媒体资源广泛呈现出跨媒体(Cross-media)特性,即不同类型的数据及其丰富的社会属性之间存在着各式各样的复杂关系。跨媒体数据的增长给传统的多媒体检索与分析的研
近年来,分布式拒绝服务攻击(DDoS)、垃圾邮件(Spam)、网络钓鱼(phishing)、蠕虫(worm)传播、窃取敏感信息等恶意活动使网络安全面临着重大的威胁,导致了巨大的经济损失,而其
随着互联网技术的飞速发展以及学术国际化程度的日益提高,英文论文的写作与发表成为每个科研人员及高新人才的必备技能。对于非英语母语的人群来说,写作高水平的英文科技论文需