基于DP-FastText的服务质量模糊云评价

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:icewangb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着服务经济的不断发展,服务质量成为服务行业的核心竞争力,服务质量评价研究受到越来越多关注。传统的服务质量评价方法在数据获取和数据处理过程中耗时过长、智能化程度低、数据规模和广度无法得到有效保证。随着电子商务和网络经济的不断发展,在线评论数据快速增长,数据范围不断扩展,在自然语言处理技术和网络爬虫技术的推动下,非结构化的在线评论数据成为解决传统服务质量评价问题的突破口。本研究立足于服务质量评价的不足,在管理学方法的基础之上引入自然语言处理技术,打破传统的过度依赖人力进行服务质量评价的思路,提出一个以在线评论数据为数据源的集自动数据采集、智能数据处理、实时数据分析为一体的服务质量评价模型架构。模型主要分成文本数据准备、细粒度情感分析和模糊云评价3个模块。文本数据准备模块是模型的数据支撑,负责从外部网站抓取评论数据并进行分词分句等文本预处理操作,形成标准的细粒度情感分析输入数据。细粒度情感分析模块是服务质量评价的数据转换中心,主要负责两部分工作,首先是利用标注数据集预先训练基于某个领域的细粒度情感分析模型,其次是利用预先训练好的模型将非结构化的在线评论数据转化为结构化的情感标签数据。模糊云评价模块是服务质量评价的核心模块,采用了基于云模型的模糊综合评价方法,使用云模型替代隶属度函数,将情感标签数据和权重数据进行模糊合成,得出由云模型的三个数字特征构成的服务质量评价结果,其中“期望”代表了评价的分值,“熵”代表了顾客评价的稳定性,“超熵”代表了顾客评价的随机性。细粒度情感分析模块是研究中实现智能数据处理的核心模块,也是本研究区别于传统服务质量评价方法的重要模块。细粒度情感分析模块的核心是利用标注好的数据集构造细粒度情感分析模型,研究中以fastText模型为基础模型,混合使用多个NGram特征,并加入通过依存句法分析技术得到的紧密关联词语构成的词组特征(简称DP特征),提高模型的分类效果。针对原始数据集数据不平衡问题,研究中提出了一种基于种子句的少数类构造方法(Minor Class on Seed Sentence,简称MCSS),MCSS算法通过增加少数类样本的数目达到平衡数据集的作用。实验结果证明MCSS算法和DP特征都能提高fastText细粒度情感分析模型的效果。最后,研究将提出的“基于DP-FastText的服务质量模糊云评价模型”用于餐饮数据集进行实证分析。实证分析中首先利用层次分析法构造初始权重集合,接着利用预先训练好的DP-FastText模型预测实证数据的情感标签,再利用云模型求出权重集合和单因素评价的云模型数字特征矩阵,最后通过合成算子进行模糊合成。通过对比分析实证模型结果与美团、点评的评分结果,证明了研究中提出的模型用于实际服务质量评价任务中的可行性和优越性。
其他文献
中国“走出去”步伐的越来越快,对外直接投资成绩显著:2018年共实现了1430.4亿美元的对外直接投资额,累计1.98万亿美元,涉及全球188个国家和地区,覆盖国民经济的18个行业大类。中国企业也越来越重视在全球范围内优化资源配置,对外直接投资已成为企业发展的重要内容,因此各类相关研究也愈发深入。与此同时,近年来各地积极倡导人才引进等企业活动的进行。城市为吸引优秀人才筑巢扎根,各种优惠政策层出不穷
玄武岩作为探测地球深部的“探针”和“窗口”,其空间分布对构造背景、岩石圈深部的动力学背景和地质找矿潜力等研究具有重要意义。由于大面积的第四系沉积物的覆盖,集宁玄武岩的岩性特征、边界不甚清晰,使其岩性识别成为一大难题。近年来,物化探、遥感技术作为人类研究地表的重要技术手段已广泛应用于覆盖区岩性识别中。然而,由于光学遥感数据只能获取地表信息、物化探数据存在采样不连续、比例尺小等缺陷,覆盖区岩性填图精度
电子式电流互感器随着智能电网的发展和推进得到了越来越多的应用。应用中,将电子式电流互感器就地、就近布置在高压设备附近或外壳上,实现实时的监测高压设备运行状态,提升电网智能化运行水平。但是,由于电网复杂的电磁环境,会对布置于其中的电子设备产生电磁干扰,从而导致电子设备的误报警、误动作,甚至使得电子设备发生不可恢复的损坏,危及电网安全,制约智能电网的建设。本文围绕电子式电流互感器的采集卡,分析电网开关
我国制浆造纸原料短缺,随着对进口废纸的限制,原料短缺的矛盾更加突出,寻找可替代的植物资源是当务之急。废菌棒、中药渣等生物质废弃资源,含有大量的纤维素、半纤维素和木素
随着物质生活的不断丰富,人们越来越关注的生活质量,特别是食品质量安全。地理标志农产品作为一种经过质量认证具有地域性、人文特性的消费食品,越来越受到消费者的喜爱。在消费者现实购买决策过程中,购买意愿及购买行为会受到多种因素的影响。本研究采取理论研究和实证研究相结合的研究方法,选取在南宁市居住一年上的367名消费者为调研对象,通过文献回顾、问卷调查以及实证分析的方式,探讨南宁市消费者对地理标志农产品的
保山地块位于滇西特提斯构造带,清水河花岗岩位于保山地块北部,主要由似斑状二云母花岗岩、似斑状含白云母花岗岩组成,Al_2O_3及铝过饱和指数A/CNK含量较高,其中A/CNK大>1.1,标准矿物CIPW计算结果中含有大于1%的刚玉分子,为钙碱性强过铝质花岗岩,均富集Pb和Rb、K等大离子亲石元素,相对亏损高场强元素,稀土元素/球粒陨石模式图显示出明显的负Eu异常;似斑状二云母花岗岩岩浆结晶年
研究目的:初步探讨近端胃癌根治术中的一种消化道重建术式一一腹腔镜双通路消化道重建在临床应用中的可行性及安全性。研究方法:本论文采用回顾性队列研究的方法。选取2016-01-01至2019-01-01在山东大学第二医院胃肠外科及部分外院收治的近端胃癌患者23例,此23例患者均在腹腔镜下完成双通路消化道重建。手术方式:规范的近端胃癌切除+淋巴结清扫后,距Trcitz韧带15~20cm离断空肠,白结肠后
受电弓与接触网是两个相互独立的弹性系统,列车在高速运行时,受电弓滑板与接触线的接触部分由于振动作用而产生波,波在遇到吊弦、定位器时会发生折射和反射,使得加载到受电弓
癌症是一种高度异质性的疾病,由不同细胞类型和组织的失调引起,本质上是有组织细胞差异表达引起的疾病。然而,不同的癌症可能有共同的发病机制。识别与癌症的产生和发展有关的基因是至关重要的,并且对多种癌症的联合分析可能有助于发现不同癌症之间的重叠发病机制。同时基因表达数据具有低样本数量高维度的特点,传统的特征选择算法无法高效的处理这类数据,但是癌症通常只由几个关键的基因突变导致,因此如何剔除数据集中的无关
目的:系统评价超声内镜(EUS)与CT、经腹US、MRI等其他影像学检查相比对小胰腺病变(≤2cm)诊断的优势。方法:通过检索中国期刊全文数据库(CNKI)、万方数据库、维普数据库(VIP)、Pubmed、Embase数据库、Cochrane Library等相关数据库,按照纳入标准、排除标准进行文献检索,筛选符合标准的文献,用QOADAS量表对纳入文献进行质量评价,Revman5.3软件进行统计