基于Hadoop的客服运维文本聚类算法研究

来源 :青岛大学学报(工程技术版) | 被引量 : 0次 | 上传用户:liming10060651088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为快速准确地提取和挖掘信息系统运维服务过程中的关键咨询问题,本文利用分布式技术,基于Hadoop的客服运维文本聚类算法,对海量文本数据进行聚类研究。给出了基于Hadoop的运维数据分布式并行计算模型,并在Hadoop框架中对系统中所有运维数据进行分析处理。同时,给出了分布式文本聚类算法,并以10万余条电力信息系统运维数据为数据源,对设计的分布式聚类算法和传统聚类算法进行分析对比。实验结果表明,本文设计的分布式聚类算法所需时间低于传统聚类算法,不仅解决了传统聚类算法在处理海量数据方面由于数据规模过大引起的速度慢、效率低的问题,而且还借助大数据中蕴含的价值和动力,提升了企业运维服务水平。该研究具有较高的实用价值和理论意义。
其他文献
对固原县上黄试区柠条林地土壤酶(脲酶,碱性磷酸酶,蔗糖酶)的活性进行测试分析,分析比较不同坡向、不同坡位、不同林龄和不同剖面深度条件下酶活性的变化。结果表明:坡向对土壤
宋应星《天工开物》说:"天有五气,是生五味。……独食盐,禁戒旬日,则缚鸡胜匹,倦怠恹然。岂非‘天一生水’,而此味为生人生气之源哉?"[1]正是从这层意义上讲,任乃强先生提出"食盐
目的探讨干扰素联合利巴韦林治疗慢性丙型肝炎(chronic hepatitis C,CHC)的临床疗效及对肝功能和肝纤维化指标的影响。方法将滨州市人民医院2011年3月~2012年3月收治的88例CH
<正>科学技术的进步使信息化渗入到档案学领域。现代信息技术的发展使信息技术与档案学的关系变的越来越密切。档案载体的变化、档案传输的及时性与无纸化办公的实现等都离不
明朝是我国古代商业出版事业最为发达繁荣的重要历史时期之一,书业广告随之兴盛繁荣,成为我国古代书业广告最为繁荣的时期。明朝书业广告的内容有征集稿件、宣传续作、宣传图
职业教育学课程建设经过多年的发展,逐渐成熟,并形成了一定的个性特色。在发展的过程中,独立设置的职业技术师范院校与综合的职业技术教育学院的课程目标、课程内容、课程师
本报讯(记者吴铎思 通讯员陈立烽 曾昭辉)“法官通过网上公布‘老赖’信息、司法拍卖等措施及时为我们追回了欠薪,非常感谢。”8月2日,在福建省长汀县人民法院执行局,来自贵州的农
报纸
随着上海经济的发展和国际航运中心的建设,口岸环境得到改善,航运生产要素向上海聚集,航运市场走向规范有序,航运集散中心正逐步形成。但经济和贸易的发展促使进出口货物的增
跨文化交流中最难消除的障碍之一,是人类无法共享一种通用的符号系统,而交流符号的"异质性"是跨文化沟通的天然屏障。所以,如何实现不同文化背景下人与人之间、民族与民族之
房地产投资信托基金(REITs)于1961年在美国诞生。在这50多年的发展历程中,REITs经历了几次衰退与繁荣,从不被重视到逐渐在市场中找到自己的合理定位,成为了拓宽房地产企业、