基于模糊综合评价模型的美团评论数据情感分析

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:armodmli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
美团平台上店铺的评分是一个综合性的评分,并不能从多个角度说明商品的情况,客户根据综合评分很难选择到符合自己需求的商品。现有的评价模型在商品属性的选择和权重量化上依靠有经验的管理者给出,存在很大主观性。鉴于此,本文主要针对评价角度的多样性和评论结果的客观性提出了基于模糊综合评价的情感分析模型。本文主要工作如下:(1)提出了一种多角度分析评论情感的模型。该模型采用关键词提取与模糊矩阵结合的方法,对评论的语料进行关键词提取,根据关键词的权重设置模糊矩阵。将评论情感分析的结果放在模糊矩阵中,构建出基于模糊矩阵的模糊综合情感评价模型。模型给出了店铺除综合评分以外的其他关键词得分,全面地分析了店铺的口味、环境、价格等因素的评分,为顾客提供了多角度的选择指导。所得出的评分也给商家提供了很好的指导意见,帮助商家调整自己的经营模式和策略。(2)美团平台评论的情感倾向分析主要是集中在商铺整体情感分类的问题上。对于不同评价因素对应的情感分类问题的讨论比较少。对于海量的评论数据来说,评论的关键因素提取也有一定的难度。该模型通过对评论语料的关键词提取,结合模糊矩阵的方法,能够确定消费者对一个或几个因素的态度。本文首先对纯文本的评论数据进行分析,该方法在美团评论数据集上实验得出的综合评价结果与美团平台的综合性评分只相差了4%,验证了模型的可靠性。模型同时给出了评论数据对于不同关键词的情感得分,实现了对商品的多角度分析。(3)情感的倾向分析包括纯文本和含有表情符号的评论数据。针对现下网络符号和表情的广泛性、多义性,本文将含有表情符号的评论语料进行提取。首先查找出含有表情符号的评论数据,然后对表情符号的含义进行人工标注,最后根据表情符号词典,将评论中的表情数据替换成相应的情感词汇,再进行情感倾向分析。通过对含有表情符号的大量评论数据进行实验,基于模糊综合评价计算出的情感倾向最佳值被作为最终的模糊评价结果,并且与用户评价的平均值相比,仅仅相差1%。显然,含有表情符号的评论数据相较于纯文本的评论数据能更一步接近用户的真实评价。(4)不同的用户关注的商品属性也不同,模型增加了个性化的用户评论推荐模式。当用户选择系统中自己感兴趣的关键词后,系统将根据用户选择的关键词,设置关键词的权重,由权重和模糊矩阵计算出综合评价结果。用户可以参照这个结果来做出消费选择。
其他文献
近年来,准晶体已经广泛地在凝聚态物质体系中被观察到,其中包括有:软物质材料,硬质材料等。由于准晶体较晶体而言具有更加独特的性质,突出表现为非周期性,吸引了来自材料科学
本论文对水热法合成大晶粒Beta沸石及其金属改性进行了研究,并对其物化性质进行表征。首先,分别采用两种模板剂(四乙基氢氧化铵(TEAOH)和四乙基溴化铵(TEABr)),通过水热法合成Beta
随着我国经济的高速发展,人民的生活水平日益提高,同时带来的是市场的快速变化。企业面临的最大问题就是快速响应市场变化,生产多品种、小批量的产品是有效的应对方法。生产过程中的物料搬运成本在生产总成本中占的20%-30%,有效的车间设施布局是降低物料搬运成本的重要方法,面对生产计划的频繁变化,如何快速的进行生产车间设施布局优化同时减少其他成本的增加是一个非常棘手的问题。单元制造模式是一种可以快速响应生产
近年来,高性能软体驱动材料在生物医学、驱动传感、仿生机器和人造肌肉等领域有着广阔的应用潜力而受到越来越多的关注。要获得成本低廉、结构简单、自由度高、快速响应的多
如今,随着网络技术的不断应用发展,网络环境的安全也在遭受着越来越严峻的挑战,僵尸网络便是当前威胁网络安全的敌人之一。智能手机以及物联网的快速发展,使得僵尸网络的受害者范围不断扩大。为了延长自身的生存周期,僵尸网络也在提高着自己的隐蔽技术,而Fast-flux技术就是其中之一。这种技术使用了数量庞大的IP地址来掩护真正的僵尸母机,而传统的检测方法难以应对Fast-flux僵尸网络。因此使用了Fast
1.引言传统叠后波阻抗反演方法分辨率有限,复杂地质情况下,很难精细刻画地下岩性展布。拟声波重构方法,利用对岩性相对敏感的伽马曲线重构拟波阻抗曲线,作为岩性指数曲线,利
会议
楚—萨雷苏盆地大部分位于哈萨克斯坦境内,部分延伸到吉尔吉斯斯坦,为一内陆盆地。本论文应用含油气盆地分析、石油地质学等理论指导研究,以含油气系统分析为突破口,对楚—萨
福寿螺原产于南美洲亚马逊河流域,目前已侵入我国在内的许多亚洲国家。2000年世界自然保护联盟将其列为恶性外来物种之一。福寿螺不仅危害农作物等水生作物,而且还传播广州管
随着通信技术的飞速发展与互联网的普及程度越来越高,伴随而来的是网络规模不断扩张、网络结构日益复杂,如何让网络用户得到更好的网络环境成为现在亟待解决的问题。网络流量作为网络运行状态的指示牌,对其进行有效监测与控制可以为发现网络资源瓶颈、优化网络配置和保障网络运行稳定提供首要参考。目前常用的网络流量测量方法主要有两种:一种是通过Netflow包交换技术对流经网络设备的流进行统计;一种是利用在PC平台上
表面增强拉曼光谱是一种功能强大、灵敏度高的分析工具,在化学和生物分子分析以及环境监测等领域有着广泛的应用。自20世纪70年代发现其增强光谱以来,从贵金属到过渡金属氧化