基于MapReduce的改进k-means文本聚类算法

来源 :信息技术 | 被引量 : 0次 | 上传用户:yulinfeng93
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统k-means文本聚类算法在处理大规模文本数据时扩展性不足的问题,提出了基于MapReduce编程模型的并行k - means文本聚类算法.通过删除离群点和采用高效的初始质心选择策略提高k - means聚类效果,并设计基于MapReduce框架的大规模文本并行聚类模型提高算法的可扩展性.实验证明,该算法在大规模文本聚类中具有良好的聚类效果和可扩展性.
其他文献
目的:研究分析乳腺肿瘤术后开展疼痛护理干预的临床应用效果。方法:研究开展实验性研究,筛选2016年1月—2018年12月收治的乳腺肿瘤手术治疗的患者96例,按照数字随机法分成两
目的了解临床护士对查对制度的认知情况,为促进临床核对制度的有效落实提供有效依据。方法采取自行设计的《一般人口学资料调查表》及《护士对查对制度的认知现状调查问卷》对
目的:分析不同剂量右美托咪定辅助低位硬膜外麻醉在骨科下肢手术中的应用价值。方法:以2018年1月至2018年12月在本院骨科实施下肢手术的86例患者为研究对象,结合其麻醉剂量的
在夜间低照度情况下,应用于智能交通的目标检测与跟踪算法性能急剧下降,不能满足实际需求。为此提出一种夜间低照度彩色图像增强方法,提高图像的视觉效果,使智能交通系统全时工作成为可能。采用RGB三通道联合增强的方式,从亮度和对比度两方面协同改善图像质量;打破伽玛校正用于对比度增强的惯例,利用伽玛校正进行亮度调节并联合对比度增强函数来实现图像增强;通过对图像质量整体评价自适应计算变换参数。实验结果表明:算
在研究蚁群算法、任务分配和资源调度的基础上,提出了一种改进的蚁群资源调度算法。首先通过引入节点可信度机制在一定程度上增强了云计算资源的搜索能力和节点完成任务的成
目的: 分析在老年患者手术中分别应用瑞芬太尼与芬太尼静脉麻醉的临床效果。方法 选取 2016 年 11 月至 2018 年 11 月进入本院接受手术治疗的 老年患者共 70 例,将其随机分
近些年,胆石症在临床消化科较为常见,发病率较高。本文主要对胆石症的相关知识(包括危险因素、病因、形成机制、治疗方式等方面)进行介绍和 知识宣讲,让人们更加全面的了解胆
目的:分析在小儿口腔治疗之前以口服或灌肠方式给药水合氯醛的临床效果。方法:选择我院2017年1月至2018年6月收治口腔治疗患儿计76例,按照水合氯醛给药方式不同分为口服给药
【正】 一中国人民政治协商会议是我国统一战线长期发展的必然产物,它将在国家政治生活中越来越显示其重大作用。这是周恩来人民政协思想中的一个重要内容。首先,周恩来认为
目的:探讨二甲双胍联合胰岛素治疗小儿糖尿病的临床效果。方法:选取 2016 年 2 月至 2018 年 10 月收治的 72 例小儿糖尿病患儿为研究对象,随 机数字表法分为对照组与观察组