论文部分内容阅读
随着大量的运营商客户热线语音能够被智能识别形成文本文件,如何有效利用这些文本信息,进行有效的分类管理,发挥潜在的数据价值,是目前大数据整合的关注问题.本文采用文本分类技术进行建模,将中文分词、特征提取、分类算法、分层抽样等方法综合应用到客户文本的自动分类中.文中描述了如何通过模型进行优化调整,达到了良好的自动分类准确率.