论文部分内容阅读
“服务”与“制造”的融合是当前汽车行业的发展趋势,为庞大的汽车保有量市场提供更深入、更细粒度的服务是获取汽车行业新的增长点和利润源的必然途径。而获取客户对各项服务全面的情感体验是服务质量改进与提升的前提和关键,客户全面的情感体验既有非左即右“粗粒度”的情感,也应包含具体、清晰的“细粒度”的情感。随着市场竞争的日益增大、客户个性化需求满足的重要性日益凸显,过去粗粒度的情感评价方法难以捕捉客户具体的个性化需求的缺陷愈加明显。客户对服务质量清晰、具体的细粒度情感体验的获取成为当前汽车服务企业的迫切需求,也是服务企业有针对性地提供服务的重要依据。为此,本文围绕国家重点研发计划课题“分布式资源巨系统及资源协同理论”(课题编号:2017YFB1400301)中的第三方“基于ASP/SaaS的制造业产业价值链协同平台”(以下简称平台)的近10年汽车服务企业的售前、售中、售后服务业务客户评价数据,以平台积累的客户主观情感的非结构化文本数据为支撑,重点研究汽车服务质量细粒度情感评价方法。本文的主要工作包括:(1)分析了平台服务企业服务质量评价现状,根据平台存在的数据片面化导致的用户意见不完整,及分析结论的粒度粗等问题,在对现有面向文本评价数据的情感获取方法研究的基础上,提出了由文本预处理、两阶段情感元素抽取和情感元素去重三大部分组成的细粒度情感分析方案。(2)根据用户评价文本数据描述随意性大,数据混杂、不规范的问题,以及中文文本连续不间断字、词排列描述的特点,分别通过无效文本过滤技术、中文分词方法及word2vec模型对平台的评价文本进行了预处理,为后续情感抽取提供数据质量的保证和文本数据的形式化支持。(3)根据平台文本数据未形成用户评价的标签化知识的现状及现有情感元素抽取方法特点,提出基于句法规则匹配以及基于深度语义和文字距离的两阶段情感元素抽取方法,其中第一阶段基于依存语法和主谓关系的算法在无标签文本数据集上进行无监督学习,得到初步的评价对象与观点,并将之形成标签化知识数据集;第二阶段基于深度语义和文字距离的抽取匹配算法以第一阶段形成的标签化知识数据集为基础,进行深度循环网络和语义特征融合的训练学习,进一步抽取较为精确的情感;针对抽取结果含多个评价对象和观点表达待匹配的问题,提出基于最小文字间隔距离的评价对象和观点表达匹配算法进行两两匹配,完成了第二阶段精确抽取任务。通过实验验证该方法的有效性。(4)针对两阶段算法存在的部分实验结论中存在的同义词、近义词重复造成的情感冗余问题,提出基于正则化自编码器的K-means情感元素语义去重方法完成情感元素的去重,以获取更精确、清晰的细粒度情感元素,并通过实验验证了该方法。基于以上方法,完成了本文评价文本的细粒度情感的抽取。