基于文本处理技术的产品网络评价信息的挖掘研究

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:bad_47
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
愈来愈多的在线消费用户开始浏览大量的网络评论来了解产品和服务的口碑,帮助自己做出可靠的决策。同时网络客户评论作为反馈机制也帮助了服务提供商改进其服务从而获得竞争力。但是,网络评论数量的飞速增长,使得信息内容越来越庞杂,造成客户评论中有用信息难以获取的后果,尤其使得客户难以在短时间内获得对于人物、事件、产品的观点和态度。因此,迫切需要一定的技术手段来使这一过程变得更为准确而便捷,此时“评论挖掘”应运而生并吸引了众多研究者进行学习和研究。评论挖掘主要涉及情感倾向分析、特征挖掘、主观内容识别等;其中情感倾向性分析目的是通过挖掘和分析文本中的立场、观点、情绪、好恶等主观信息,对文本中的主观态度进行判断,涉及人工智能、机器学习、数据挖掘、自然语言处理等多个领域。在英文评论研究领域,研究者已初步取得一些成果,而针对中文网络用户评论的研究却仍处于起步阶段。随着中国电子商务在世界领域内的崛起,亟需关于中文评论中有用信息的自动提取的先进技术。本文以中文网络中对形成旅游预订决策非常重要的酒店评论为研究对象展开探讨。酒店在线评论是非常具有代表性的,与其它在线评论不同的是其更受客户的依赖,对客户是否进行产品预订或购买起到决定性作用;它是顾客对酒店服务质量的真实感知,学术界已经有利用其进行酒店服务质量研究的相关成果,但多釆用内容分析法,不能对评论进行批量处理,成果应用大受限制。基于以上问题,本文采用机器学习的方法针对网络评论文本进行情感倾向性分析研究,旨在为中文领域内的客户和企业提供更为方便和科学的评论挖掘工具。本文采用开源爬虫框架从太平洋电脑网客户评论获取语料并按五个维度的评价对象类别进行分类;重点详细介绍了语料库的预处理,包括中文分词和去无用词;然后选用朴素贝叶斯特征提取方法和标准分类器,结合本文提出的客户评论情感模型在语言环境中实现了多种算法分类结果的进一步改善;实验结果表明该计算路径下得到的分类效果更好、准确率更高,不仅克服了文本分析中高维稀疏的数据问题及训练集中的噪声问题,并具有稳定的面向海量文本切分的实用性能,实验结果还表明这种分类后的倾向性分析更能准确和细致地反映客户的立场和观点,帮助管理者快速地掌握客户对于手机产品各个方面的喜爱或者厌恶程度,具有实际的意义。
其他文献
公路隧道施工监控量测作为新奥法施工的关键要素,是保证隧道现场施工安全和信息化设计的基础。文章总结分析了公路隧道施工监控量测发展现状以及存在的问题,分析得出了公路隧
我该如何调整用药?  我患糖尿病1年多,一直服用中成药。最近以来,血糖一直上升,居高不下,最近查血糖为13.4毫摩尔/升。请问我该如何调整用药,是否应该用西药?  乌鲁木齐 孙宾  答:你的血糖现在比较高,需要抓紧治疗。应该在医生指导下,使用疗效肯定,有科学根据的降糖药或者胰岛素。要特别提醒广大糖尿病患者注意,中成药只起保健作用,不能降糖。有的号称纯中药的降糖药,降糖效果很好,却多被查出有西药成分
在重症监护室中,临床干预的实时预测仍然是一个挑战。由于近来数字化趋势的发展,医院记录的信息越来越多。医生可以访问有关患者的大量数据,但能用来处理数据的时间和工具很
本文研究了DESI在蔬菜表面芳去津残留测定上的应用,在不需要进行样品前处理的情况下,实现了蔬菜表面农药残留的快速、灵敏、高通量检测,采用二级质谱保证了方法的准确度。
当前时代,我国科技水平迅速提高,计算机技术已经深入融合到人们的生产生活中,尤其在医疗领域、物理学领域、智能高科技领域都有较为长足的应用。本文深入讨论了计算机图像处理和板形识别技术融合在众多领域中的应用,在理论与实际应用基础上,讨论了二者之间的密切联系,并对板形识别技术的提升和发展,提出了一定的理论依据。
Pt~(2+)和3,5-二Br-PADAT反应的灵敏度高(ε_(616)=7.30×10~4),在pH6.5~0.6N HCl形成稳定络合物后不被强酸分解,可在0.6~4N HCl(或H_2SO_4)介质中测定铂。铜、镍、钴等普
目的建立女贞子HPLC指纹图谱及多指标成分测定方法,为女贞子质量标准提升提供参考。方法采用HPLC法,以乙腈-0.1%甲酸水溶液梯度洗脱,体积流量1.0 m L/min,检测波长224 nm,建
胰腺癌的预后极差,5年生存率仅为8%,预计到2030年将成为全球第2大肿瘤死因。由于胰腺癌早期诊断困难,多数患者确诊时已失去手术机会,且对放化疗均不敏感,因此探索有效的治疗
使用基本的与已知的不等式,将田彦武的一类涉及参数的分式不等式继续推广为更为一般情形与别的情形.
根据联合利华(中国)有限公司基于大量餐饮客户及食客的UFS大数据分析,总结我国目前餐饮业的构成现状;提出菌菇类食材适宜的烹饪味型、主流烹饪方式和不同菌菇品种的适宜烹饪