面向客服对话文本的意见挖掘研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:lovesyb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
企业客服作为客户进行信息反馈的重要渠道之一,蕴含着大量有价值的信息,对服务质量监控、用户需求挖掘和产品改进有着重要的意义。以往由于语音识别技术不足,客服语音的分析主要依赖于人工监听,存在成本高和覆盖范围不足的问题。随着语音识别技术的发展,客服语音识别后的数据变得更可靠。本文针对客服语音识别后的文本进行意见挖掘中的命名实体识别、评价要素抽取和评价搭配关系识别三个方面进行研究。在命名实体识别方面,本文针对客服对话文本存在音近错误和标注数据少的问题,在条件随机场的框架下,引入了无声调拼音和方言混淆拼音两种模糊音特征,并利用已有领域知识构建部分标注数据,高模型在较少完全标注数据下的性能。通过实验证明,引入模糊音特征和部分标注数据均能高命名实体识别模型的性能,其中产品名识别的F1值达到79%,机构名识别的F1值达到84%。在评价要素抽取方面,本文基于双向传播框架,先后对外部语料和客服对话文本语料进行评价要素的抽取。其中,针对外部语料较为规范的特点,本文设计了11种依存句法关系规则;针对客服对话文本噪音多的特点,本文加入基于窗口和词性的规则和支持度阈值来抽取关系词对,迭代识别得到候选评价要素集合,再通过词频过滤和词向量相似度取准确评价要素。通过实验证明,引入外部语料的评价要素和基于词向量相似度的低频词取方法,均能升客服对话文本语料中评价要素抽取的性能。在评价搭配关系识别方面,本文从候选搭配组合的合理性和搭配上下文两个角度来设计特征,在支持向量机模型下,对所有候选搭配进行关系识别。通过实验证明,同时结合两个角度的特征能有效地高评价搭配关系识别模型的性能。
其他文献
<正>【要点】故意伤害(致死)与过失致人死亡的区分是审判实践中经常遇到而在具体案件中又较难解决的问题。判断被告人的行为构成故意伤害罪(致死)还是过失致人死亡罪,要看被
液态铝合金中的氢直接影响到铸件和铸锭质量。阐述了液态铝合金中氢的来源及其影响因素,探讨了铝液去氢方法。通过研究Al-Li合金真空精炼与除氢规律,使Al-Li合金中氢的含量降至0.1&#215;10-6左右
21世纪是新媒体时代,新媒体成为人们舆论的主要平台,传统媒体的舆论监督功能逐渐退化,广播舆论监督类节目遇到很大挑战。本文从新媒体时代的特点出发,通过分析新媒体时代广播
<正>血液中的一部分蛋白在通过肾脏时会被过滤进入原尿液,但在近曲小管95%被重新吸收进入血液中。当肾脏的机能正常时,在尿液中会出现极微量的蛋白质,但是当肾小球或肾小管或
色彩,是大自然赐予人类最美妙的礼物之一。马克思曾经说过:“色彩的感觉是一般美感中最大众化的形式。”作为一种先声夺人的艺术语言,色彩能以每秒30万千米的光速映入我们的
采用高脂饮食建立肥胖菌群人源化(HFA)小鼠模型,研究高脂饮食对HFA小鼠肠道微生态结构的影响,探讨肥胖、饮食与肠道菌群之间的关系。将20只无菌小鼠接种健康人志愿者的粪便悬
<正>尿潴留是临床上一种较为常见的产后并发症,主要以产后产妇膀胱胀痛、无法自主排尿等为主要的临床表现,尿潴留严重影响了产妇的子宫收缩,并且大大增加了患者产后出血的概
<正>圆猪猪:喜欢在试验室(厨房)里折腾,喜欢拿家里的小白鼠(丈夫)做试验。婚后几年来通过网络自学了不少的美食知识,也结识了很多美食爱好者及专业人士。网络丰富了生活,也丰
朊蛋白基因(PRNP)不仅与动物传染性海绵样脑病(TSEs)密切相关,还与反刍家畜的表型性状密切相关。已有研究表明:牛、水牛、牦牛、绵羊、山羊等反刍家畜PRNP基因具有丰富的多态性,同
为研究油炸过程中大豆油、山茶油、棕榈油品质的变化,用国标法测定酸价和过氧化值,并利用高极性色谱柱CP-Sil 88对植物油中脂肪酸,特别是反式脂肪酸(TFA)组分和含量的变化进