一种针对中国移动客服文本的分词方法

来源 :现代信息科技 | 被引量 : 0次 | 上传用户:maqianjin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提升客户服务的效率,快速分析和解决客户问题,并将客户述求和投诉充分转换为中国移动发展的动力和资源;提出了一种针对移动客服聊天记录的数据分词框架,针对客服聊天文本的特点,制定了结合文本纠错、停用词扩充、关键词提取、词性分析这几个方面的数据预处理步骤。依靠这样的框架,提升了文本数据分词的质量,使用字典映射的方式,纠正出文本数据中存在的共性的错误。
其他文献
一位年轻的同事说,我们现在跟你们那时候不一样了,除了工作,还有更多的自己的生活。但据我观察,他所说的"不一样",其实就是对待工作认真的态度和职业精神不一样了。
提出了一种基于数学形态学的局部多重分形指数特征来描述图像中的纹理信息,并构造了基于图像四叉树的多尺度分割算法来实现遥感图像的粗分割。形态学多重分形指数能够准确而全面的刻画纹理的局部尺度特性,而多尺度分割算法可以在保持分割精度的前提下大大降低时间复杂度。在遥感图像上进行的对比实验表明,该算法在分割的效果和效率上都优于使用其他纹理特征的分割算法。
为研究不同栽种规格的甘薯间作糯玉米模式和发掘高产高效间作模式.本实验对甘薯净作、糯玉米净作和15种甘薯间作糯玉米模式进行了鲜薯产量和经济效益的研究。结果表明:甘薯间作
用C57BL/3J小鼠29只,分成运动组(12只),对照组(12只)和青年组(5只)三组。运动组从第6个月起隔天跑转笼2小时,对照组不跑转笼。当这两组小鼠死亡总数达50%时(经过16个月零8天),将两组余下的小鼠(22月龄)全部杀死,到出脊
我不想说当谈到中国的黄金时,主流的分析师们“都傻了”,但事实的确如此。例如有一份报告称,黄金需求在中国下降了,因为人民币下跌,使黄金在中国变得更昂贵。听起来很合理,而且确有
以11年‘金煌’芒果树为试验材料,通过人工疏果处理,研究‘金煌’芒疏果处理对单株产量和果实品质的影响。结果表明:结果母枝疏留果3个处理产量最高;不同处理平均单果重大果与
目前市场上白木香种苗主要为种子苗,由于缺乏系统选育,结香性状不稳定,因此,发展优良白木香嫁接无性系种苗具有重要的现实意义。‘热科2号’是一个前期筛选的优良白木香无性
为探索香菇菌渣在马铃薯栽培上的应用,完善与丰富其栽培模式。试验采用室内分析与田间试验法,分析香菇菌渣的营养成分,研究香菇菌渣施用量对马铃薯产量和品质的影响。结果表
SSD方法是目前为止主要的目标检测算法之一。针对该方法处理小目标物体检测时精度不高的问题,文章在对SSD卷积神经网络的网络结构进行分析的基础上,在使用原有多层卷积特征图结构的前提下通过特征增强的方法来改善网络结构,构建了一种新的小目标物体检测算法模型。将该模型在PASCAL VOC 2012目标检测数据集上进行精度检测,检测结果与原始的SSD网络相比有了较好的提升。